分类目录专业评论

开放科学与开放创新——中国图书情报机构的责任(访谈)

以下是《竞争情报》杂志在SCIF&ICSTI2019(2019竞争情报上海论坛(SCIF) 暨国际科学技术信息理事会(ICSTI)年会)会议前夕对我进行的访谈初稿。

问:这次论坛的主题是“开放科学与开放创新”,前者和后者的主要区别是什么,他们之间又有怎样的联系?请问主办方希望通过这个主题向与会者传达怎样的理念?

答:开放科学是指科学研究的各个环节和科学交流越来越向公众开放的一种趋势,是一种科研方法和模式的变化。其动力一方面来自科研本身:科研事业越来越复杂,当前已进入“第四范式”阶段,即数据驱动型科研阶段,各个过程环节的成本越来越高,越来越需要协作。另一方面也来自社会:科学门类越分越细、越来越专门化之后距离大众生活越来越远,科研事业一直是依靠公共资金推动的,需要更多的宣传和普及,才有可能获得更大的支持。开放能够吸引更广泛的参与者,更利于推进科研过程,成果数据也更容易被发现和交流,并能降低获取成本,这是它带来的直接好处。通常认为,开放科学它包括开放数据、开放代码、开放方法、开放同行评审、开放存取和开放教育资源等各相关领域的开放运动,伴随有一整套原则和做法。其中开放存取(开放出版)、开放数据(及方法可验证)和大众科学(众包模式)是近年来谈论较多的主题。

开放创新则是指企业或机构组织有目的地利用各种知识流入和流出的方式加速创新的各种做法,相比于过去出于竞争的考虑,创新一般只能在企业和组织内部进行,而现在越来越强调利用外部资源或内外结合开展创新,这样常常更有利于企业创新速度和能力的提高。这一方面是因为单一企业越来越难以承受创新的成本和其它压力,另一方面也是因为创新所要求的知识技能乃至特定的资源不太可能在机构内部获得。合作多赢的策略能够加速创新,对企业和整个社会来说具有更大的创新规模,能带来最大的好处。

开放科学与开放创新是针对不同领域的两个不同概念,前者是科研领域,后者主要应用于产业界和社会组织。但它们都是方法论创新甚至是对旧有模式的颠覆,都在更大范围内寻求资源和合作,都需要依靠科技进步,特别是在当今大数据、物联网和人工智能时代,用到最新的信息技术。另外这两者有一定的方法论体系。

除了作用领域不同之外,不同还在于:第一,他们的影响范围也不同:开放科学是指整个科研过程的开放,开放创新可以认为只是一种方法论的创新。第二,他们的衡量指标不同:科学研究历来使用都是公共资金,它通常以整个社会的效益最大化为目标,而开放创新常常是企业组织自身的要求,最终以获取多少利益为衡量标准。第三,他们所采用的基本方法也有所不同:开放科学采用的方法是非常全面的,与科研过程的不同阶段都有关系,随着科研第四范式的普及,基于数据的研究(数据密集型研究)已成为影响所有学科和整个研究过程的最大挑战,各门科学的研究都需要尽快转型和适应;而开放创新虽然有多种模式,但总体上都遵循Henry Chesbrough 在2003年提出的基本模式,即“走出去请进来”。

开放科学和开放创新两者又是密切相关的,有人说科研是将金钱转化为知识的过程,而创新则是将知识变现为金钱的过程。本次会议以这两个概念为主题,是想传达一个明确的理念,即我们现在已经进入一个全面开放的时代,推动社会进步的最重要的两个发动机——科技和商业——都必须依靠开放,获取进一步的发展动力。科学本身就是一项需要不断创新的事业,采用了开放创新理念的科学研究就是开放科学。而且,开放科学的成果不一定就是论文,而可以是各类创新成果,成果的交流方式也已不再是线性的、阶段式的,而是交织的、渐进融合式的。同时,创新本身也是需要有科学方法支持的,开放科学包括很多分领域,如开放数据、开放出版、开放合作(包括开放方法和开放源代码)、开放教育等等,对开放创新也是一种思想方法的来源。评价科学进展和创新成果的方式与指标体系应该与传统方式不同,这方面也需要体现开放性和创新性。

问:谈及开放科学,人们往往能想到开放获取、开放数据、开放同行评审、开放教育资源等,其中开放数据是开放科学的重点,也是图书馆界实践开放科学的主要方向,正如您在大会上的主旨报告标题“开放数据与知识服务——图书馆助力科研转型”,在这方面图书馆有何举措和创新?

答:当我们说到数据,不同的人想到的是不同的东西,可能是文本、表格、图像、照片、公式、分子式、基因结构、科学图谱等等,科研成果中包括大量的此类数据,科研成果的主要形式——论文和报告,其实就是一种数据的集合,其本身也是数据。所有这些数据主要沉淀于图书情报机构的各类知识仓储中,这些又都是进一步开展科学研究的素材,也是开放科学首先需要开放的内容。

当今我们所说的数据,与计算机已经密不可分,大多需要通过计算机来编码、解码、解析、表示、表达、分享、引用、操作,以获得其含义并发挥其功能,所以它通常具有一定的“格式”,有时不能脱离其环境而得到解释(即解码或实现功能),其中蕴涵了我们对大千世界的认识,可以认为是一种模拟(即第三范式)。数据是未来计算机处理信息的主要形式,是企业机构知识资产的主要存在形态,也是科学研究第四范式(即数据密集型/驱动型科研)研究对象的存在形式和基本单位。随着计算机技术的进步和大数据时代的到来,机器处理的对象越来越高阶化、语义化、模型化,直接对现实世界进行模拟,而数据就是现实状态的映射。正如马云所言,数据技术就是IT技术的另一种新的名称。开放科学就是对新环境和新创新模式的一种适应,开放的对象主要就是数据,教育资源也是一种数据,代码也是一种数据,其他都是围绕这些数据的工具、方式、过程、模式等。

图书情报机构以提供知识服务为己任,在纸张时代是通过文献服务的方式实现职能,而到了大数据时代,则主要形式是数据服务了。图书馆最早的知识服务是以书目或文献数据库形式提供的,它们一直是科研数据的基础形式,也是最早的开放数据形式。但仅仅是书目或文献数据是远远不够的,随着数据技术的进步,提供深入到文献内容的内容数据,才能直接介入科研和创新过程,为科研和创新服务。开放数据之所以成为未来图书馆服务的重点,一是因为它与图书馆自身的转型有关,图书馆必须突破文献的藩篱,利用数据技术建立数据服务平台,从数字图书馆进一步转型为“数据图书馆”,这是未来图书馆服务的应有之义;二是因为它体现了未来图书馆的存在价值:必须为开放科学和开放创新服务,通过自身的服务,促成科研的范式转型,从而实现其自身的价值。应该说图书情报机构一直在努力,但实现这两个方面都不容易。

图书情报机构通过自身的数字化转型而助力科研转型的路径大致是这样的:首先在资源建设中根据用户需求突出数字化资源,使得数字资源占据更高的比例;然后通过各种技术平台和工具尽可能提供基于数据的服务,例如在数字人文和数据出版领域广泛采用的关联数据技术等;在此基础上通过各种分析挖掘技术使服务平台更加“智慧”,对图书馆而言就是智慧图书馆建设;与此同时升级检索发现平台为真正的服务平台,融入科研人员的科研和创新过程,并赋予开放科学和开放创新的要素和工具。整个转型过程需要图书情报机构不断进行流程再造和服务创新,例如探索增设新的部门和学科馆员、数据馆员、数字人文馆员等一线服务岗位。转型的过程不是一蹴而就的,需要咬定目标不断调整和探索。

问:除了开放数据之外,图情机构还可以做哪些开放科学相关的实践?

答:图书情报机构支持开放科学运动有很多方式,其中开放存取是最为主要的。机构知识库可以认为是开放存取运动的一部分,其他还有建立或维护学术交流平台,支持自出版、开放出版等,图书馆在其中都有用武之地,图书馆应该成为开放科学和开放创新环境生态的一个重要组成部分。

另外图书情报机构开设创新/创客空间,普及科学知识,消除信息鸿沟,培育信息素养,涉及开放软件(源代码)、开放硬件等等方面,都可以有所作为,还可以在大众科学方面贡献力量,目前许多图书馆自身的工作(如知识组织、分类标注等)也开始采用众包方式,让更多的人参与进来。可以说图书馆就是开放科学和开放创新的普及和实践基地。从这个角度看,各类图书情报机构都可以为开放科学和开放创新做贡献。

问:开放创新以企业实践为主,比如宝洁、谷歌、特斯拉、海尔等都是开放创新的实践者,在企业实践的主阵地,情报可以发挥怎样的作用?

答:科技情报机构和一部分研究型图书馆通常需要承担为企业创新提供服务的职能。作为一种公共服务,帮助中小企业或初创企业获取信息,科技资源、数据、专利、标准、研究报告,各类技能培训尤其是IT(信息化)能力培训等,提供法律和金融信息服务等,乃至作为创业培训基地,都是目前很多图书情报机构正在做的,未来这些工作可以更多引入开放创新的理念与做法,加入到开放创新的洪流中去。

上海图书馆(上海科学技术情报所)陈超馆所长认为,图书馆转型提供创新创业服务的立意和站位应该更加高远,把自己作为创新创业生态系统的重要组成,也即创新创业基础设施的重要组成部分,为创新创业活动提供便利条件。他进一步认为,公共图情机构通常是处在创新链、创业链的起点,可以与市场主体运营的创客空间、联合办公空间、孵化器、风险基金、产业园区等合作联动,成为营商环境的重要元素。公共图情机构完全可以最大限度发挥自身优势,主动积极地去服务“大众创业,万众创新”。

问:图情机构的开放科学与应用与政府部门、商业机构的有何不同?作为国内唯一一家以图情合一为特色的机构,上海图书馆(上海科学技术情报研究所)在实现“开放科学与开放创新”会议中传达的一些理念能发挥怎样的作用?

答:图书情报机构的主要任务是提供对知识的保存、组织和存取服务,帮助研究人员管理知识和创造知识,尤其是应对大数据时代对知识生命周期进行管理的各种挑战,也就从事全方位的知识服务。因此图书情报机构主要还是开放科学与开放创新的使能者,真正的主体应该是政府部门、科研组织和商业机构。

政府倡导开放是应有之义,首先政府信息公开就是一种必须。企业提倡开放是为了更大的发展。开放首先是一种态度,走向开放首先要从改变文化做起,改变目前以成果为导向的科研价值观,多管齐下,还应该注重培养兴趣、吸引参与、宣传推广、普及知识等,包括要关注基础和环境建设及系统性的政策制定,这些都是政府部门和商业机构可以做的。

上海图书馆(上海科学技术情报所)作为国内首家图书情报联合体,承担了全方位的信息服务,几乎包括了各种载体和所有方式,而且不仅为大众服务,同时也为科研和企业服务,因此开放科学和开放创新都是其密切关注的领域。上图情报所主持召开这次会议,以开放科学和开放创新为主题,主要是希望向与会者乃至整个社会传达这样一种理念:即面对未来一切未知的挑战,首先需要确立开放的心态,只有开放才能汇聚所有人的智慧,才能应对无限的可能性。图书情报机构作为知识的集散地、创新的使能者,也是所有开放运动能够依靠的智慧源泉,我们必须首先使自身开放,以开放理念和开放服务,融入到开放科学和开放创新的过程中去,反过来促成自身的彻底变革。

近期图书馆技术趋势

  1. 移动化:关注并尽可能提供移动服务
  2. 电子书借阅:尽早开展数字阅读,并统一服务政策,数字资源服务纳入绩效考核
  3. 数字馆藏建设:地方或特色数字资源建设
  4. 统一的资源发现:取代OPAC,把电子书及其它数字内容纳入到馆藏揭示体系中
  5. 逐步放弃传统的集成管理系统:采用基于云服务的管理系统
  6. 追身服务:学科馆员,随时随地
  7. 作为空间的图书馆:讲座会议展览沙龙培训diy创客创新活动空间
  8. 图书馆建筑布局:再一次藏用分离的趋势
又要讲趋势了。总结了上述八项,欢迎板砖。

在Springer电子书与图书馆馆藏发展论坛上的致辞

在Springer电子书与图书馆馆藏发展论坛上的致辞
20130418
众所周知,现代图书发端于1450年前后的德国。数百年来,它带来了知识的平民化,推动了人类记忆的存续,点燃了文艺复兴的火种,促进了科技的创新和两次工业革命,奠定了现代社会形态的基础,使科技能不断站在巨人肩膀上发展,使人类社会以一种不断迭代方式积累知识、创造财富。今天,我们越来越多的人相信,这种传统的、以纸张作为介质的图书正在走向它生命的终点,图书所负载的灵魂正在以数字化虚无缥缈的形式无所不在,而当你需要时候能够瞬间出现在你的眼前。
我们很高兴地看到,同样来自德国的Springer出版公司在全球顶尖的科技出版领域引领着这场变革。凭借其1842年创立的近两百年基业,以先知般的睿智和超越同侪的勇气,于上世纪末率先涉足网络出版,这其实是一场自我革命。可喜的是迄今已取得非常好的效果,在这场颠覆性的变革中继续稳坐钓鱼台。
现代图书馆是现代出版的受益者,同时也是整个出版生态中不可或缺的一环,肩负着为人找书、为书找人的永恒的职责。面对数字化变革的浪潮,图书馆行业虽能先知先觉、上下求索,为继续履行其天堂般的职责而奔走呼号,但却碍于其公益性质,势单力薄、步履艰难。在图书馆最需要与上游行业协力共进的时候,有很多出版社却设定了违背图书馆职业理念的所谓新模式,他们忘了,图书馆和出版社,既是利益分享、风险共担的伙伴,更是患难与共、唇齿相依的兄弟。
Spinger在这方面树立了一贯的楷模,它在获取商业利益、实现自身企业价值的同时,既帮助图书馆实现各项职能,又充分尊重图书馆倡导知识自由、信息无障碍以及人类知识的永久保存理念。它的电子书支持购买模式而不是只能租用,允许馆际互借,无复本限制,甚至无DRM,还提供完整的MARC记录供图书馆进行数据整合,它让图书馆真正感到得道多助、德者不孤。
今天Springer在这里发布又一款数字图书新产品,再一次把历史的厚重带到这浅阅读和碎片化阅读时代。我们怀着满腔的热情和极大的期待,祝愿Springer取得圆满成功!

本市公共图书馆服务体系的定位与问题

公共图书馆服务体系是一个城市公共文化服务体系的重要组成部分。从我们的角度来看,有两个定位,

第一个定位:它是公共文化服务的最重要和最稳定的基础设施。它具有专业性和职业性。它的基础性反映在人口覆盖率、地理覆盖上和服务性质上。在国外称得上国际化大都市的中心城市,公共图书馆服务的人口覆盖率大约在60%-80%,地理覆盖有一个概念,叫15分钟生活圈。服务性质是普遍均等的保障性基本服务,一年365天,面向360行,同时它既是一个场所,又可以提供基于网络的不打烊的服务。体现了一种政府向人民群众提供的文化保障。

第二个定位:它是“开展全民阅读活动”的主力军。十八大报告第一次把“开展全民阅读活动”写入了党的工作报告中。图书馆生来就是提供阅读服务的,它的四大职能(保存、教育、信息、休闲)也主要是通过阅读来实现。它的阅读,包括老百姓的大众化阅读,以及为决策者和研究人员提供的专业性阅读服务。它通过阅读,也为社会的和谐稳定做出了贡献。很多人在其中寻找精神寄托,包括失业的,以及特殊人群。

据调查,目前国民阅读率大约是每年4.5本,而本市图书馆的持卡读者每年大约借阅图书近30本,凸显了图书馆的作用。

公共图书馆目前存在三方面的问题:

1、服务能级问题

上海市中心图书馆260多家分馆联网,全市有图书馆员2000多名,年流通量3700万册次,服务能力接近极限。但距离全市人民的要求还有距离。目前的办卡率8%,近200万读者,虽然全国第一,但还有提升空间。现在我们致力于数字阅读,希望实现转型发展。对上图而言最大的瓶颈在上图目前设施的老化和IT系统的陈旧,造成业务指标难有突破,阅读率难以提升。

2、可持续性问题

从长远看,体制制约和人才制约是两个绕不过去的坎。体制:目前仅仅从业务上的共建共享是不可持续的,行政体制上的总分馆制是行业的发展趋势,应可以逐步试点。

3、多元化服务问题。

作为研究型图书馆,必须提出更高的目标和要求,满足全市社会、经济、文化各方面各层次的情报需求,目前还只是满足共性的和大众化阅读的需求,研究型图书馆的功能还需要拓展。

 

再谈数字阅读的未来

去年9月24日,美国图书馆协会当选主席Maureen Sullivan曾公开致信美国出版界,就出版行业在电子书方面拒绝向图书馆供货、或以完全不同于印刷图书的模式高价向图书馆售卖电子书、或附加很多其它限制的做法,进行了苛责。

我曾在这里贴出这封信,并进行了简单的点评。
对这封公开信,美国出版商协会第二天就进行了解释和反驳,显示了这个行业已经无法依靠自身的力量得到转型和发展。传统出版已经是个腐朽的夕阳工业,它必须死掉,才能在其机体上长出新的生命。
对于出版商的不识时务,图书馆完全可以采取两种策略:
1、打不过它,就成为它的一部分。这个策略,图书馆自己做出版商也可以;或者积极支持、乃至投身于OA,特别在STM领域推进OA。这些措施都能痛击出版商,或者在他们的背上压上重重稻草。
2、 引入更多形式的内容,而不局限于所谓的“电子书”。例如多媒体图书、原生数字图书、流式图书等。网上大量的免费内容和UGC绝对可以也应该成为图书馆服务 的资源,一位孟加拉小孩开发了一个软件能把博客on-the-fly地转成epub和mobi格式,供电子书阅读器下载。其实从长远看全媒体出版必然改变 人们的“阅读”方式,目前脱胎于印本图书的“电子书”必然会退缩到一个很狭小的利基市场,目前的出版界如果不能发展成媒体公司,或者被其它媒体公司甚至互 联网公司吞并,他们根本是微不足道的。当前出版商的合并潮,正说明了他们已经有生存危机,不得不抱团取暖。

去除IT应用的浮华

曾有一段时间常常写一些简短的文字,就 IT 在图书情报届的应用发一些小小的感慨或议论,有些内容似乎至今仍有意义。文章总觉得自己的好,有了博客这种形式,就想陆续整理出来给更多的人看到,也当作一种广而告之吧。

去除IT应用的浮华

写于 2001 年 6 月

从专业刊物看我国图书情报界的计算机应用水平实在是不低,某些领域几乎是处于同一水平线上,甚至美国刚发芽,中国已开花。随手举几个例子:网上虚拟参考工作,美国国会图书馆和OCLC20012月刚开完会,国内已有动作;网上资源导航、元数据应用、知识管理、数字资源整合、电子期刊利用等问题,是近期国际专业会议上的热门话题,也开始看到国内专业杂志上有所讨论。这应该说是一个好现象。

然而,我们身处实际工作中的图书馆员们似乎并没有感到这些新东西扑面而来,更没有享受到新技术带来的好处,读者就更无法奢望了。20015月底在清华大学召开的NIT2001数 字图书馆国际会议可以明显看出在应用项目上与国外的差距。就学科建设而言这种现象依然是前些年照搬其他学科概念的翻版,国内除了少数一流的图书馆正在扎扎 实实进行图书馆工作”转型”之外,大多还处在一种看热闹的状态,有些图书情报机构甚至面临大好机遇而不自知,或无所事事,或肆意挥霍,坐失良机。

图书情报机构能否借助IT技术而融入信息产业,图谋凤凰涅磐呢?这需要一些有战略思考、懂IT技术的馆长所长们,进行一些实实在在的开发、研究和应用。

数图演义- –

一位编辑约稿,关于中外数字图书馆研究进展综述,想尝试一种新的写法,包含内容如下,不知是否会得到首肯。

  • NSF 对数图的清算:知识在信息中迷失
  • Google 奇迹:敲掉谁的饭碗?
  • 狐狸先生的”金木水火土”数字图书馆五行学说
  • DLI 前朝遗少: DSpace 和 Fedora
  • Ian Witten 为”绿石”( Greenstone )鼓与呼
  • DCMI “讣告”:涅磐与重生
  • 张晓林:只有元数据能救数字图书馆?
  • 数字图书馆梦圆国图二期