机器时代的人文主义:谁能评价?

机器时代的人文主义:谁能评价?

外在与本质

2017年10月25日,在沙特首都利雅得举行的“未来投资倡议”大会上,由香港汉森机器人技术公司(Hanson Robotics)制造的机器人索菲娅(Sophia)被沙特政府授予了公民身份,成为世界上第一个受到政府认可的机器公民。这个看似作秀的举动其实蕴涵了一个巨大的跨越,必将成为一个标志性事件,标志着人与机器之间的界限正在被打破。是否意味着源自启蒙运动的“人类中心主义”价值观受到了冲击?人类主体的范围是否应该重新界定?这些问题虽然还有待观察,但已经提上议事日程。

由此看来,对于数字人文而言,定义其为数字技术在人文研究中的应用(或交叉领域)已经远远不够了,人文学科的数字化发展只是其表象,人类数字活动的学科化研究才是其本质。循此方向发展下去,它不仅在颠覆传统人文,而且在创新数字人文。我们现在所认识按传统学科划分的数字人文,难道就是未来数字人文的最终形式?当一个异形的种子刚刚被注入人类体内的时候,你建立怎样的体检标准(即评价体系)都是荒谬和无济于事的。

载体与内容

当我们谈论数字人文的时候,我们通常谈论的是数字方法应用于人文研究,很少谈论人文研究对象本身的数字化形态,印刷时代的人文研究给我们造成一种错觉:似乎文本或文献就是所有人文科学的研究对象。

例如,哲学,研究的应该是思想观念,而不是概念文本;历史学,研究的是历史事实,而不是历史文献;文学,可以算是内容与形式统一的范例,但它并不是语言学;语言学,也不只是文本,而是音形义的交互作用。

这就造成一个奇特的现象:所有的人文学科在外人看来都是研究文本或文献的,而不是其所宣称的真实的研究对象。人文学者在研究时,需要把文本抽象还原成其研究对象本来的状态,这是在人文学者大脑中进行的动作,人脑就是他们的反应器,人脑的记忆衰减、任意联想以及不确定的多巴胺造成人文学者极端的浪漫性,而比较缺乏的就是科学性。这可以看成是印刷技术的局限。要知道传统的自然科学家除了看书之外,不对进行实验研究是不可能得到同行承认的,这也是爱因斯坦并没有因为其最伟大的发现—-相对论理论而获得诺贝尔奖的原因。而人文学者完全不必有此顾虑,这是所有人文学科、中国传统理论和民科都享受到的好处。

而当数字技术参与其中之时,情况就完全不同了。数字技术是可以把研究对象及其现象还原为真实对象甚至真实场景的,是可以基于数据进行实验的。这类似于人类发明了火之后,食物的种类大大增加,因为烧煮过程减轻了人类消化系统的负担,等于体外消化了大部分材料,于是人能够一举跃上了食物链的顶端。对于数字人文来说,不同学科的研究材料就产生了很大的不同,大家不仅烧煮的食物不同,连锅碗瓢盆过程方法都是不同的,你一看就知道哲学家可以用一种叫操作N-Gram的蒸锅进行观念史研究,而历史学家在调试各种佐料的刺激程度以获得不同的中心度指标,来取得人物之间的聚类关系。。。等等,从一开始他们的装备和本领就是不同的,因此到了数字人文时代,可以给不同学科的研究者设计不同的制服,王涛老师可以穿蓝大褂,如果他要经常走访遗址的话;而陈静老师更合适穿汉服或芭蕾舞裙,因为这样她的艺术研究更能激发人的想象。当然这些激动人心的丰富性也会给评价带来难以估量的困难。

模型与镜像

数字技术可以让我们在虚拟世界再造一个人文环境,跨越时空,以不同角度和粒度进行观察、模拟甚至操控。这其实是眼下最时髦的一项技术,所谓“数字孪生”,我觉得它在数字人文领域具有广阔的应用前景,一定能大有作为。

“数字孪生”能够给人文研究带来极大的好处,它并不只是让我们能够通过操控和实验,获得细致入微的因果规律,利用机器的“显宏”能力写出史景迁《王氏之死》这类史学小说,或者黄仁宇《万历十五年》这类远读的历史切片,或者帮胡适续完《中国哲学史大纲》;它同时也带来了很大的困惑,究竟怎样的模型(粒度与视角)才能满足不同学科的实验要求?同样的素材可以提取多种对象,每个对象也可以有不同的形态和版本。

这里正好有个例子。昨天我们吃晚饭【喝茅台】的时候有个会议正在举行:“用方法表达思想,历史书写的可能性”,不去说这样刻意的用词营造出一种模糊而暧昧的氛围,(的确能够勾起人们一探究竟的好奇心,虽然网络时代的标题党早已不这样操作。不去管他,)我们就来分析一下用什么方法能够表达思想?可以说我们当今的时代正在发展各种方法,不仅仅是印刷文本了。数字文本可以表达,数字图像可以表达,各种对象关系模型及其系统实现可以表达,任何信息媒体只要受信端能正确(或故意正确)地解码,都算是从认识论层面或多或少表达了思想,书写历史也是一种表达,不同粒度、不同角度、不同分面,尽管认识的模糊性必然导致表达或书写的模糊性,但这不属于本文的讨论范围。

我不知道历史学家或人文学者意识到当今数字技术所具有的能力没有?我们现在当然还没有做到大规模建模,为人文学者创造一个可以赖以实验的数字孪生出来,我们偶尔会受到指责,说我们的模型根本不是那么回事;我们也会指责回去,认为他们根本没有弄清楚自己在做什么,以及是怎么做的,这是无法建立一个清晰的模型的。当然,是不是机器学习可以不必打开人文学者研究过程的黑箱,而直接模拟得出结论,有待于计算机技术的进一步突破。

对于评价来说,这种情况下我们如何评价,成果的取得是由于模型的精准、人文学者的顿悟还是机器算法的高超?现在都不知道。

现状与未来

我们可以做一个思想实验:当机器时代最终到来,所有的研究素材、对象、方法、过程、工具,都数字化了,我们的人文研究,还有必要冠以“数字”人文吗?

我们正处在大数据和人工智能时代,当所有的人文活动、素材和方法都依赖于计算机和网络之后,其实就无所谓数字人文了。就像纸媒时代我们不会说纸张人文一样。人文就是人文,它可能会改变形态,但本质永远是人性。普适的标签终究会失去意义。我们可以借助纸本文献研究传统人文,也可以借助数字媒体研究数字人文,或者用数字方法研究传统人文,这些都是数字人文作为学科的表现形态。而人文现象作为其研究对象,已经与数字技术融为一体,难分彼此了。

那么,我们数字人文的评价体系,到底是评价什么呢?

前提与假设

本次会议的主题是“数字人文的学术评价体系:定义与规范构建”

从主题中很容易看出出题者的雄心和先验假设。

雄心是:数字人文作为一种学术活动,目前尚未建立适当的学术评价体系,尤其是定义数字人文,并为数字人文构建学术规范。既然没有人做,那我们来做。

假设是:数字人文是一种学术活动,学术活动需要评价体系,数字人文作为一个学术领域是可以被定义的,也是可以建立学术规范的。

真是这样吗?

我有我的答案,但在这里我不想说。希望与大家进行开放式讨论之后我能思考得更加深入,因为评价的前提是需要建立一个领域知识的全景图。这里我只想对我们可能要进行评价的概念进行一些讨论。

定义与规范

什么是人文,什么是人文主义、人文精神、人文科学、人文学科,这些概念其实都没有得到清晰的解释,也没有形成共同的理解。这对于数字人文的界定和精确化是不利的。我们对这些概念进行过一些简单的探讨,今天时间有限,请参见我们的文章《数字人文的理论化趋势前瞻》。

关于什么是数字人文学科,人民大学曾下过一个迄今为止最大胆和清晰的定义,也是我最推崇的。

它说:

数字人文是计算机学科和人文学科交叉研究所衍生的一个新领域,它以涉及针对计算工具与所有文化产品的交叉领域为研究对象, 系统地研究数字与人文相结合的普遍规律和应用方法。具体来说,数字人文学科 以人文科学的基本问题为研究对象,以不断发展进步的信息技术和数字技术等为 主要工具,以数字资源构建、信息资源管理等数据基础设施建设为基础,以计算 分析和案例分析方法等为主要研究手段,通过建立描述学术活动理论、方法和功 能的框架以及各种类型的项目实践,探讨数字技术与人文科学跨学科对话中的方法、过程、特征和相互关系,以及数字人文作为一个整体与社会环境之间的互动与关联,并从中探索、归纳和总结出获得成效、提高效率的一般理论、方法和规 律,以推动知识创新和服务。

当下与终极

虽然我不认为当下有必要甚至有可能建立一个数字人文的学术评价体系,并为其建立学术研究规范,现在还为时尚早,理论体系尚无踪影,领域边界也未形成,学术团体此起彼伏,对话还不充分,学术共同体也在飘摇之中;评价对象、评价方法、评价目的都不确定,过早的评价可能限制其发展,而不能达到我们促进领域发展的目的。但我并不反对这样的探索,更不反对这样的会议能够开诚布公地把问题提出来,进行争鸣。网络时代制造热点通常也是一种很好的促进。

讨论什么不是数字人文以及什么是好的数字人文都是有积极意义的,能够起到引导作用;讨论人文性与研究难度是有一定难度的,但可以把问题引向深入。数字人文区别于传统人文应该保持概念的一致性和精确性,而且在寻求评价方法的同时自身就应该重视指标的可度量性。

当然学术评价如果剔除管理和功利的目的,其终极目的是促进学术发展,最终还是一个定性的事情,同行评议可能是不好的方法当中最好的方法。社会人文科学的任何定量模型,其最初量化数值的获取,都是模拟的、定性的。

启蒙与赋权

数字人文可能而且应该成为又一次人文启蒙运动,以数字工具的兴起为契机,以机器语言为共同语言,引导人们走出模拟时代的蒙昧、盲从、无知、教条、权威崇拜、奴性,以重塑更为普遍的人性、道德、美的理解和思想体系,为未来人类的生活方式和社会形态提供解决框架。

数字时代应该进一步研究何为人性、何为人文,在面临数字技术的冲击下,哪些是解放人类并促进全面发展的必然趋势,哪些又是被别有用心的政客利用来奴役和控制别人的主张。其实评价本身也是一种特权。

数字人文的研究,必然带来后人文时代即数字主义和兴起。

我们当下所有评价的宗旨,是发展数字人文。而数字人文的最终目的,是赋予数字以人性,并因此而保障平等的数字权利。我们未来不仅生产数字,消费数字,因数字而喜乐,用数字获得财富,而且也会困于数字、累于数字,甚至被数字毁灭。

无论如何,现在已到了这样一个新的时代,我们可以喊出这样的口号:天赋数权。

“后疫情时代”图书馆需要怎样的人才

1

非常高兴参加此次会议。

习总书记曾说我们正处在“百年未有之大变局”,疫情加上国际关系,恐怕应如李鸿章所言“三千年未有之大变局“。

很多人认为这次新冠疫情是按下了暂停键,原有的迅猛发展嘎然而止,我们再也回不去了;也有人觉得是按下了快进键,认为这次疫情只是一个催化剂,加速了原本就开始的趋势。比尔·盖茨就曾经警告过疫情的大爆发,现在很多美国人还在用阴谋论来诋毁他。

2

我今天想利用30分钟左右的时间,讲一下我们对当下形势的判断,以及对我们这个职业将如何发展,如何培养合适的人才应对未来的局势。

我的报告分四个部分。

第一部分回顾一下此次疫情是在什么形势下发展起来的;

第二部分想跟大家一起做个复盘,回顾一下此次我们是怎么样对付这场新冠疫情的。

第三部分推演一下未来的发展趋势以及它的影响。

最后第四部分探讨一下我们这个职业和学科面临怎样的挑战,应对挑战需要培养怎样的人才,以及怎样培养人才。

3

虽然我们是幸运的,已经可以讨论“后疫情时代”了。但这场瘟疫远未结束,还没有到达顶峰的迹象,甚至还没有减缓的趋势。我们还不能置身事外。

现在(9月10日)全球已经2800万人确诊,90万人死亡,死亡率3.6%(万人口死1人)。(https://www.worldometers.info/coronavirus/)每天新增4-5万人确诊,一千多人死亡。

4

美国迄今已确诊655万,死亡19.5万人。

我们作为起始国,总共8.5万人确诊,4634人死亡(占5.5%的死亡率,百万人口3人死亡),与人口只是我们百分之一不到(千分之7)的瑞典大致相当(1千万人口8.4万确诊5783人死亡)。在总确诊人数中我们不到0.4%,死亡占0.6%,国际上都承认我们已经基本上控制了疫情,取得了成功。

所以我们感觉是很好的,应该尽快恢复正常,而不太能想到(或接受)新常态。

5

可以说我们是这场瘟疫中表现最好的优等生,我们与韩国等少数几个国家或地区一样,完全是因为采用了现代科技的结果,一个是大规模快速检测,然后就是数字技术普遍应用社会管理,例如跟踪人流,跟踪接触者,精准定位患者,大规模收治(方舱医院),健康情况/危险程度标示,社会动员和强制隔离等等。

6

从政治、经济、人文社会和技术的四个方面(即采用PEST分析法)来看,这次疫情的发生,正好是处在全球化的逆流(即去全球化)刚刚开始时突然爆发。

从地缘政治角度来看:正值美国大规模退群,去全球化全面启动,去全球化首先表现为去中国化,因为中国的崛起带来美国的极度不适应。

从经济贸易角度来看:中美贸易摩擦升级为新冷战,隐藏危机。经济又开始有新的摩擦,暗藏危机,前些年又发生了好几次金融危机,这个经济的形势也开始产生周期性的波动,进入到低谷阶段。

从社会人文角度来看:人类在欲望驱使下高速无序发展,正在打开潘多拉魔盒,带来人文主义危机。

从技术进步角度来看:我们正处于新一轮技术革命阶段,大数据、物联网、人工智能、基因技术继续迅猛发展,一往无前。

7

情是在上述背景下突发的。

应该说我们现在还远未进入“后疫情时代”,但站在中国的立场上,确实有资格讨论后疫情时代的问题。

后疫情应该成为一个新的开始

8

重大变革常常很难彻底摧毁什么,倒是会加速正在发生的。

浪潮退去马上能发现谁在裸泳。

1)数字化转型走过了中点线,但后半程愈发艰苦。又在向智慧图书馆进发。此次疫情对谁是机遇?迪斯尼电影频道,订阅人数翻番;网易丁丁和超星虚拟课堂。而

2)继续受信息技术发展带来的阅读方式和信息行为变化的冲击,行业呈现被边缘化的生存危机

3)作为一门应用型交叉边缘学科,在技术和需求变革的冲击下继续迷失

4)缺乏理论创新,引入数据科学、数字人文等新内容反而动摇了根基

9

初步检索,cnki中以“图书馆”and “抗疫”为主题的文章一共44篇,

《内蒙古图书馆工作》刊出了十几篇本区图书馆抗疫行动的文章专刊。

抗疫工作总结

危机应对,守望相助;传播知识,网络服务;常态制度,有序开馆。停课不停工(教学)服务不打烊(但效果如何呢?)

自身抗疫(关爱员工,调整工作)和服务抗疫两个方面,自救是为了服务。

服务抗疫有:网络服务(包括微服务,讲座视频,电子书推荐),疫情通报(专业辟谣),知识普及,心理疏导,数字阅读,阅读推广,信息推送,制度消杀,无接触服务,预约到馆。资源建设(及保存文献(抗疫记忆),如上海图书馆抗疫手稿收藏和展览)

10

IFLA 主席克里斯汀·麦肯锡和秘书长杰拉德·莱特内于2020 年 3 月 23 日发表了关于新型冠状病毒疫情对全球图书馆界影响的声明:

肯定各国图书馆为 控制疫情选择暂时关闭或缩减服务的做法

鼓励图书馆扩展数字馆藏,为人们获取在线资源以及疫情相关信息提供更多支持

呼吁各国图书馆协会为会员提供疫 情防控资源、在线培训和决策支持

鼓励各馆讲述自己的 故事,提供新冠肺炎疫情相关文献的开放获取,支持学术出版物和文章的远程访问

IFLA在行动:

推出“IFLA 与 COVID-19”常见问题解答网页;

“COVID-19 与全球图书馆界”网页,频繁发布各国图书馆闭馆情况和疫情期间服务情况。

11

整个行业的应急响应堪称优秀,专业服务的跟进也是非常及时的。但是对我们的服务能力实际上做了一次考验。

这次疫情当中也是有很多的行业,一方面受到了冲击,有一些行业异军突起。例如相关阅读网站、cnki等都推出相应服务,效果比图书馆好。迪斯尼的影视服务在疫情期间的注册量翻了一番。疫情来了之后,使符合发展趋势的业务一下子取得了突飞猛进的跨越式的发展。我们国家像网络会议、在线教育等也增长不少。

而来自于图书馆的数字服务其实就是堪堪可用。高校图书馆相对好一些,公共图书馆其实还没准备好,从资源建设到服务,都有点捉襟见肘、仓促应战。

所以总体的结论是:数字图书馆转型尚未成功,目标不明确,服务不成熟,效果不明显,现在又面临智慧化图书馆的新一轮发展。

12

13

把握不确定性,情景规划成为一种重要能力。把对未来的预测

不确定性像国外最近有很多MBA课程,他们从911之后非常重视复苏力(Resilience)这个概念,就是通过多样性来抵御突如其来的灾难。不确定性非常强的情况下,我们怎么样做出预测、做出判断,那就需要灵敏,需要敏捷,需要身段柔软,需要增强复苏力,为变化做好准备。他们有一整套的方法论,应该成为我们专业教育课程的一部分,也是数字素养的一部分,也是领导力的一种体现。特别是对馆长的培养,就是要培养在不确定性情况下,怎么样做决策。

14

ALA年初做了一个趋势调研,按照STEEPED框架总结了42个趋势,每一个趋势对图书馆都有一定影响。

其中很多是我们没有注意到的。

15

职业的问题来自于专业的疲软。

1.图书馆学的去职业化是必须的(吴丹的论文),否则学科理论很难建立起来。但图书馆要不要去职业化?取决于图书馆实践有没有特殊性。职业是社会分工,专业是科研和教学的学科门类,职业不等于专业,图书馆的职业培训并不是以图书馆学的存在为前提的,没有图书馆学照样可以有图书馆职业培训。图书馆职业需要的知识技能是综合性的,目前这些知识技能越来越没有特殊性,所以图书馆学教育就开始迷失,图书馆实践可以不要图书馆学专业的毕业生,图书馆专业毕业生也希望就业面更加宽泛。

2.因此我们现在谈论更多的并不是图书馆作为一个职业的问题,而是图书馆学作为一个专业的问题。图书馆从一开始作为一个专业的基础就是不牢固的,现在就更不牢固了。这里主要原因是作为图书馆学学科立论基础的基础理论一直没有确立起来,不能解释图书馆活动和现象,不能明确图书馆的核心内容和核心能力,不回答为什么的问题,以及怎么看在数字时代的图书馆的问题,而只关注怎么做的问题,很多图书馆学院是把技术、方法、技能作为主要内容进行教育的,特别是成为信息管理学科之后,这就走偏了,图书馆自然就找不到安身立命之地了。图书馆有没有专业性也应该是图书馆学理论要回答的重要问题。

3.这样就很清楚了。图书馆不需要图书馆学专业的毕业生,并不是图书馆的问题,根本还是图书馆学的原因,这是之所以我很赞成程焕文教授认为图书馆学教育应该回归本源,但大学及研究生教育毕竟不是职业培训,这个本源已不是过去的本源,必须透过现象看本质,这个本质是知识的传播,而不是文献的管理,其载体形态和方式发生了深刻彻底的变化,我们不能死守着传统图书馆那些东西,不适应环境也是会死翘翘的,所以图书馆学应该高瞻远瞩,这个高瞻远瞩包括了解决指导图书馆向何处去的问题。

4.图书馆学相关专业改名本来并不是很大的事,专业与职业是不同的,专业名称怎么改,职业也是可以适应的。但中国有重视名教的传统,还有教育行政管理部门一刀切和资源分配的逻辑对专业发展的决定性问题(学科目录和学科建制),带了很多感情色彩,这就把问题复杂化了。我们有很多年轻学者过于看重所谓的学科地位和职业前景,对于专业的讨论“烟火气”太重,这也是需要注意的(西北大学陶俊)。

吴丹, 徐爽, 李秀园, 董晶, 樊舒, 桂丹云. 近十年我国图书馆学研究中的理论使用分析[J].图书与情报, 2019(06): 041-051.

16

对于学科发展趋势,我有以下四个判断:

知识服务:从载体到渠道都在变化

专业的危机我觉得我们做的远远的不够,主要是你要看到我们这个专业,它的对象是文献,当然肯定不是图书了,文献已经很古老了。那么现在又说是数据了,这个行业的变化,实际上就像以前这个马车行业,你认为它是交通运输行业,还是器具生产的行业。你如果认为它是交通运输行业的话,那么自然就会过渡到以汽车为主的交通运输。就是你要透过现象看本质,那么我们实际上要和知识捆绑,我们知识服务这个角度来看,从载体到渠道都在变化,我们从载体,因为文献它是记录有知识的一切载体,那么我们都统称为文献。那么文献它是知识和载体不可分割的。

媒体变化:融媒体运营成为必然趋势。现在越来越多的人听书,那些办卡的人一年还要花钱,我们免费都没人看,他们为什么会去办卡?实际上他就是方便,他偷懒。他就觉得

听书听一刻钟到20分钟就把一本书听完了,然后他觉得有价值,他再去买一本,买回去他可能永远不会看,但是这样就增加了这个图书的销量。融媒体、多媒体的运营将来肯定是必然趋势。视频和音频的接受程度,特别是5G来了之后,图书馆传统的以文本为基础的服务,以文本为基础的一整套的产业生态和产业链,都是面临挑战,都是会变化的。所以这个问题非常严重,我们在5G时代怎么样创新我们的服务很成问题。

阅读推广:不得不为而大有可为。这是我们学科和职业的一个新的生长点。

能力培养:专业教育与职业需求相背离。所以我们需要更多的素养培育。

17

我很想把华东师范大学黄纯元老师的两段话在这里再跟大家回顾一下,第一段是1984年说的,第二段话是1996年说的,已经过去几十年了,但是我们现在还没有走出这个怪圈,还处在这样一个过度的变化的状态当中。实际上第一段话他就揭示了,当时我们刚开始进入新的时代,1984年十一届三中全会之后改革开放,当时市场经济开始提出,然后他说知识就呈现两种矛盾的状态,一种是知识很有价值,我们搞知识的人就应该发财,但是同时我们又很失落,我们“受到与未来相碰撞的震荡,也许我们将踏着浪潮迈进,也许我们被消解、分解、替代”,他当时就是这样说的,实际上我们现在还处在这个过程当中。

然后第二段他说信息化、技术,这里我觉得有两个提示是非常有意思的,因为当时华东师范大学提出“社会知识交流论”,希望通过这个理论来解释我们图书馆的这些现象,在数字时代怎么样做得更好。那么他就提出了“从文化制度功能上来分析图书馆的本质,避免早期功能主义的交流理论蜕变为技术决定主义,反对用求解代替求知的急功近利的研究风气”。其实他提出的这些问题,我们实际上都掉到这坑里去了。

18

未来领导者的必备能力

未来领导者的必备能力我觉得不光是我们这个学科的,就是经过了这次疫情之后,更加就提醒我们需要:

多元化、复苏力和敏捷性

(2)预测并应对变化的性质和速度 

(3)领导力、协同力和复苏力 

(4)在复杂、混沌和混乱中游刃有余 

(5)激励他人树立愿景并迎接挑战的能力

其实就很早就有人说了,网络时代变化太快了,我们教授知识不如教授能力,但是我们的教育还是以教授知识为主。

19

培养五大能力掌握四大技能

作为信管学科或者作为图书情报档案一级学科,我们的核心能力应该体现在四大能力和四大技能的培养方面

搜索和学习能力;

批判思维、计算思维和设计思维能力;

预测变化与情景规划的能力;情景规划是一种战略方法,他就是把现在的一些变量和未来的可能性相挂钩的一种能力,它有一整套的培养方法。

知识变现/赋能的能力。我们图书馆是赋能的。

那么四大技能就是这里是提的4个问题:

(1)如何引入并管理变革?

(2)如何形成共识和并培养责任感?

(3)如何培养技术理解力并发挥最大潜能?

(4) 如何在数字孪生中领导与协同?

数字孪生就是两个世界,同样的物质世界、同样的数字世界,有一个同样的世界,在两个世界当中都要互相参照,然后在那里模拟,然后影响这里的决策等等,都要能够领导和协同。

20

“后疫情时代”是一个挑战大于机遇、变化多于确定、物竞天择适者生存的时代,原本的趋势将加速变现,原本的裸泳将最终现行。

图书馆学需要尽快找到自己的内核,更多地与实践相结合,以职业的使能者而不是革命者姿态出现,最终通过与知识内容的捆绑而不是与载体形式的捆绑,获得持久的复苏力。赋能社会是学科和事业长久立足的关键价值。

Transcript of the webinar speech on May 13, 2020

Recorded video can be found at: https://v.qq.com/x/page/a0966dw612b.html and https://vimeopro.com/ebsco1/supporting-your-institutions-as-they-move-online/video/418175693

Hello everyone!

Thank you Meghan and Ethen for having us to the Webinar. 

Let me begin with wishing you all safety and health during this COVID-19 Pandemic Period. Our library has not been back to normal from the end of February. Now we are only open for half a day everyday.

Today we are very happy to share with you our thoughts and plan for implementation FOLIO in Shanghai Library, as well as to promote FOLIO application and awareness in China.

I am Keven Liu, the deputy director of Shanghai library. Today with me will be two of my colleagues, Zhou Gang and Chen Xiaoyang, 

I am going to give you an overview on the consideration of FOLIO implementation in Shanghai Library, and why we are going to promote the FOLIO application in China. Mr. Zhou Gang will be on the Program of our developing and migration plan in more detail. And Chen Xiaoyang will talk about the FOLIO community activities we have done in the past and will be doing in the near future in China.

At first, I would like to give you a little bit about the background of my library and my city.

As you may know, Shanghai is one of the biggest city in China. And Shanghai Library is the biggest public library in China. The population of Shanghai is 23 million. About a quarter of them (that is about 5.1 million) had a reader’s card issued from the Shanghai library system. 

Generally Shanghai Library has three faces to the public: a stand-alone public and research library, a central library for the Shanghai library consortia which is consists of 256 member and branch libraries, and a professional research institute, which has a name of Institute of Scientific and Technological Information of Shanghai (ISTIS).

The main building of Shanghai library has 83 thousand square meters (that is about 900,000 square feet). The total collection has 55 million items, including a huge collection of special materials such as ancient books, old newspapers and magazines, genealogy, rubbings, maps, diaries and letters of celebrities and so on so forth. We have more than 800 librarians and staffs working in the library everyday.

The circulation transaction number is 66 million a year. There are more than 3 million people visited my library every year. There are about 800 thousand readers checked out more than 30 million books each year from the whole city library system. 

The present Shanghai Library building opened to the public in 1996. With the economic development, the budget of Shanghai Library has been from around 30 million USD in 1996 to around 70 million USD last year.

We are now having a new building under construction, located in the new city center of Pudong area, where it is always pretend to be the center of the universe in Hollywood movies. The overall design is from SHL, a company from Denmark. The new building has 115 thousand square meters of floor space (that is about 1.2 million square feet). It will open to public on Dec. 2021 (the end of next year).

As I just mentioned, Shanghai Library has a second face as the central library of the whole city library consortia, which contains 256 libraries in three tiers by now, and will be expand to around two thousand libraries in four tiers in the next few years. We are now using only one integrated library system for the whole consortia, that is the Horizon System from SirsiDynix. 

We have been running it from 1996.

I am sure some of you are familiar with the interfaces. It’s a magnificent powerful Integrated Library System once upon the time. In the recently issued Library System Report by Marshall Breeding, there are still hundreds of libraries using Horizon for nowadays. 

After running it for more than two decades, as you can see obviously, the system can no longer meet our needs. we are facing with a giant leap and mega-migration for Shanghai Library and the whole Shanghai Library Consortia.

Our requirements are very clear.

We need a service platform not only for Shanghai Library, but for tens of branch libraries, which have their own library branches, in total maybe thousands of them as an integrated consortia.

We should support up to 100 million circulation transaction a year.

We should look after all kinds of activities by up to 15 million registered users in the next few years.

It should provide SaaS ecology with diversified multiple extension modules by all kinds of local vendors, to provide smart library services, reserving services, reading list services, activity management services, 24-hour services, data analytics services, etc.

It should help member and branch libraries to transform and redefine themselves to a more digital world, and re-engineering their workflow to meet new and unknown requirements in the future.

After  keeping track of the library system market for quite a few years, we found nothing can fulfill such requirements above, till we learn the existence of FOLIO. 

We valued the open and sharing spirit of FOLIO, it is perfectly matching the ideas of the Public Libraries.

I agree with the idea that the future of library platform should be open sourced and act as an operation system for libraries.  As a platform it should have an open market for all kinds of stakeholders. And then libraries can choose applications what ever they want to run. 

We libraries should play a key role in the self-serviced environment, which has a spirit can be stated as: “by the community, with the community and for the community”.  

We think it is a breakthrough in the library history which is like no other. And we are very happy to see the most part of FOLIO has been realized in recent years. It has been successfully implemented in Chalmers University in Sweden last September, and will go live in several university libraries this year. 

FOLIO is a future platform with a lot of potentials and promises. FOLIO community has been doing a fantastic job to make the dream come true. 

There is no such a platform better than FOLIO by now, has the capacity to accomplish the countless and agnostic requirements for libraries to go into the future.

But the future of libraries is a moving target. We don’t have a crystal ball that allows us to see the future clearly. The only thing we know is that there will be no future if we just sit there and do nothing instead of actively addressing the disruptive digital challenges.

So we need the new service platform to be flexible enough to adapt all kinds of new technologies and meet all possible requirements. Here has some concerns from Shanghai library. It can also be seen as the critical difficulties to implement FOLIO in Shanghai Library.

•In a library as large and complex as the Shanghai Library, FOLIO is relatively less mature and less sophisticated. We need to do some strengthening and localization.

•Extensive modules are immediate required to meet local needs.

•Multi-tenant has higher priority to support large consortia.

•Market place has higher priority to accommodate diversified requirements and support new business model innovation.

•Robustness, performance and scalability issues need to be fully considered.

We believe that, if FOLIO can be successfully applied in Shanghai library, FOLIO will be decisively invincible and has a very bright future in the library system market around the world. But we need a lot of helps first from the whole FOLIO community, to address such key difficulties above. 

Our goals are also very clear:

•To provide a breakthrough LSP to integrate and upgrade our service capacity for Shanghai Central Library Consortia.

•To curate a lightweight version of open sourced LSP for all kinds of libraries in China.

•To maintain an active community consists of libraries and venders in China.

•To foster an ecosystem by establish an open market and encourage open innovation.

•To explore and incubate new business model for library and information service industry in China. 

As Shanghai Library has a research group under the name of Digital Culture Research Base by the China Ministry of Culture and Tourism. We are regularly present research reports for their reference. So we are not doing things just for Shanghai Library itself, but for the whole library industry in China, especially in the information technology implementation aspect.

That’s why we are willing to curate a FOLIO Chinese version, and to contribute on maintaining an active FOLIO community consists of libraries and venders in China. 

I’m very happy to announce that, with the great help from EBSCO and Jiatu Company, we are now having Mrs. Lucy Liu to join us as a PO (Product Owner) for FOLIO local development and implementation. 

The library market in China consists mainly of public libraries and university libraries. Of course there are many school libraries and other kinds, but I have no statistics of them. So I just take the main two to give you a rough picture.

•The total annual budget of public libraries is around 13 billion RMB in 2015 (ie. about 2 billion USD). 

•The annual budget excluding staff costs for university libraries is about 6.5 billion RMB (about 1 billion USD).

•The collection development costs around 10 billion RMB (public lib has 45%, university lib 55%), of which less than half is for digital resources.

•IT funding is difficult to keep track, usually for hardware, software and services together in total, is around 1.5 billion RMB. Rough estimate of software system is about 400-500 million RMB a year.

As for Library System Market in China, 

•We are now having less than 10 local active venders in total.

•Most of them show great interest in FOLIO and very possible to join the FOLIO alliance, some of them are already the member of CALIS Alliance or Shanghai Alliance.

•But some of them will still develop and maintain their own products. The real competition will be among 3-4 competitors.

•So it’s very important for FOLIO to have a competitive market strategy.

•FOLIO is based on the library community. That’s why the interest from libraries are most important. A lot of libraries are currently very eager to learn about the new LSP.

•If full fledged, FOLIO will be able to capture a large portion of the Chinese market share we believe.

To summarize, we like to provide a very brief SWOT analysis for the  FOLIO application in China, as follows


the Strengths are:

•It is an Open Source Software

•It developed with Micro-services architecture, but there is already a product from another company in the Chinese market that uses spring cloud microservices solution.

•It is community-based self-serviced and vender independent 

•It consists of plug-n-play Web apps

•It provide format agnostic feature and support multiple Knowledge bases.

the Weaknesses are:

•Risk of development delays which is always going to happen in Open Source software development.

•Weak on service support as OSS

•Need powerful community stewardship and governance

•Relatively long learning curve to handle for some libraries

the Opportunities are

•Libraries are Longing for adopt next generation technologies

•Applications can be embedded in users’ mobile and smart environment

•It can facilitate open innovation for venders and libraries

the Threats are

•New Business Model has not emerged and should be mixed with resources, software and maintenance support services.

•Fierce market competition still exists.

•Open Source Software has sustainable issue.

•The risk of unfulfilled expectations brings poor word-of-mouth credibility 

I would like to propose a strategic plan for promoting FOLIO applications in China. 

We at Shanghai Library are committed to support the domestic FOLIO alliance and strive to play a key role in it.

•We should keep schedule and speed up the localization modules development for Shanghai Library, as the first successful implementation example.

•We should Increase satisfaction of early adopters and pay attention to word-of-mouth marketing.

•We should help to strengthen the governance and stewardship of the OLF and local community.

•We should release service specifications and best practices when necessary to keep awareness.

•We should implement library-centric and service-oriented modules development. 

•We should recruit library and developer alliances to build a sustainable ecology.

•We should encourage to develop more Web Apps that are compatible and interoperable with the FOLIO architecture, to form a comprehensive application environment as soon as possible.

Finally, I would like to express my sincere appreciation to those who give us a lot of help on the FOLIO development for Shanghai Library. They are CALIS, 嘉图Jiatu, ILAS, 凯勤Kelkin, 仰格Younger, 上海阿法迪Shanghai RFID, 睿计Ruiji, 蔚运Wewin, 杭州麦达Hangzhou MetaData, 以及图创软件and TCSoft,

Especially many thanks to EBSCO, a lot of friends from EBSCO lead us to the right and bright path into the future.

That’s the end of my talk.

The next speaker will be my colleague, Mr. Zhou Gang, on the FOLIO modules and migration plans by our Shanghai Library FOLIO team.

阅读的未来

能不能告诉我,你最近一次去图书馆是在什么时候?

中学?大学?某次路过?

没关系,不用为没去过图书馆而感到内疚,你可能根本就找不到它。目前在中国每 47 万个人才有一个公共图书馆。如果你碰巧还有一张「读者证」的话,那么真的要恭喜你了,你属于「百里挑一」:每 130 个人当中才有一个。

全民阅读调查统计显示,我国每个识字公民年购书经费约在 30-40 元,除去教科书教辅书,其中真正购买「图书」的花费不足 10 元;被调查者自述年阅读图书一般在 4-5 本。从图书馆方面来统计,全国公共图书馆人均年购书经费 0.5 元;全国 2762 个县级以上公共图书馆收藏了 4.8 亿册图书,人均 0.39 册;服务了总人口的 0.8%,即 1062 万持卡读者;年借阅图书 2.03 亿册次(2005 年),平均每个读者每年看书 19.11 本。

而美国,每三个公民就有两个是图书馆的持卡读者,平均每人每年去图书馆7次(年接待人数 22 亿),图书流通率相当于美国人口的近五倍(14 亿册件)。在英国,每一万人就有一所图书馆。

这些数字说明,我国远远算不上一个图书馆大国或者读书大国,但图书馆的读者却都是读书狂人。公共图书馆成了极少一部分自己买不起书,却酷爱读书的公民的乐园,它用了极少的社会投入,获得了极大的社会效益。

与此同时,我们所处的时代又是一个信息泛滥的时代,人们每天一睁眼,就被「信息污染」包围,始终处于「被阅读」、「被轰炸」的状态。书店里坐卧横斜人满为患,地铁里嘻哈一族捧着 PSP、手机看小说,「起点中文网」的崛起标志着网络阅读财源滚滚,出版界为 Kindle、电纸书而疯狂,手机报正在兴起,3G 厂商也已推出多媒体阅读概念……,未被「娱乐至死」的电视媒体所终结的印刷王朝,几乎已经无法在数码网络时代继续苟延残喘。

这一切说明人们并非不喜欢阅读,社会也并非不需要阅读,而是阅读正在转型,阅读也需要重新定义。

在这个过程中,传统的图书馆正在 OUT。

数字图书馆正在兴起。

数字图书馆:不再有「书」的图书馆

前国家领导人李岚清在 1998 年 10 月 2 日视察国家图书馆时指出:「数字图书馆是图书馆的未来」。这当然不是他本人的研究成果,而是自上世纪九十年代开始,随着美国国家科学基金会(NSF)、国防部高级研究署(DARPA)和美国航空航天局(NASA)巨额资助数字图书馆研发之后,国内连续数年不断学习、消化、试验、讨论,形成的一定程度上的共识。

然而,对于什么是数字图书馆,可以说至今还没有给出能够得到大家公认的定义,或许我们只能让「数字图书馆」的未来发展自己来定义。

什么不是数字图书馆,倒是得到了一定程度的公认,这种公认与人们的常识有一定距离:通常认为的「数字图书馆」,一般是指印刷的图书经过扫描数字化、变成「电子书」之后,在网上提供在线阅览或下载服务的网站。这恰恰不是「数字图书馆」的主流,至少不是数字图书馆的理想形式,最多只是一种形式而已。电脑科学家甚至认为「数字图书馆」与现在的图书馆没有多少关系,它只是因特网上海量信息的一种结构化存在形式。

不过目前这种「山寨」数字图书馆概念充斥了主流媒体,从而在人们的大脑中形成了认知惯性。这应该都是「图书」这个名称惹的祸。2006 年美国 OCLC 的调查表明,社会大众对于「图书馆」的认知,是与「图书」这种形式紧紧捆绑的,这种捆绑有利有弊,「利」在于赋予了图书馆一种实在、永恒的特性,一想到图书馆,总是巍峨的大厦,无尽的书架和人类所有的知识;「弊」也显而易见,随着传统「图书」的消亡,图书馆也将无可避免地走入历史。数字时代,一切皆有可能。

其实图书馆只是通过「图书」,最终与「知识」达成捆绑。「图书」(包括期刊、报纸等传统纸媒读物)这种载体形态及其所造成的阅读习惯是印刷时代的产物,知识一旦数字化之后,内容与载体就彻底分离,编码与形式得以彼此独立,任何内容、任何媒体,还原为电脑可处理的 0 和 1,一下子就「人人平等」。对于图书馆来说,只是知识的载体形态发生了变化,知识的内容并无发生改变,图书馆收藏、保存、传播知识的职能并未发生变化。

因此,从上世纪九十年代以来,图书馆开始收藏光盘,后来是越来越多的文摘索引数据库和全文数据库,数字媒体在图书馆的采购比例越来越高。目前,国内外一些研究型图书馆采购数字资源的比重最高可达订购经费的 80%。由于检索、传递和使用的方便性,数字资源的利用率更是远远超过传统资源。

资源的数字化对图书馆的业务流程和服务方式造成了重大影响,对图书馆员的素质要求和工作内容也产生了巨大变化。一个直接的影响就是,图书馆员必须自己首先具有相当的电脑技能,克服「信息鸿沟」,才能帮助读者,提供必需的服务。目前我们正处于由传统图书馆向数字图书馆过渡的时期,「复合型图书馆」就是为在这个特定时期、传统资源与数字资源混合的业务和管理模式提出的一个新的概念。

「图书」等传统载体形态,随着出版行业的彻底的「数字化」,成为数字化信息内容的一种输出形式。因为将来的绝大多数信息都是「Born Digital」的,先有数字形式,再有物质形态,而不是相反的先有传统出版,再进行数字化。而且由于传统图书的材料消耗和工艺流程所造成的高额成本(相对于数字拷贝而言),「印刷」将成为一种「贵族」消费。现在的图书必然是将来的「古籍」和艺术品,按需打印的图书也会进入奢侈品的行列。

数字图书馆就像一台大熔炉,所有的数字信息都可以在其中煅烧、冶炼,然后水银泻地一般,通过覆盖世界各个角落的互联网传播开去。大众阅读将彻底碎片化、多媒体化、动态化,任何手持设备都能够显示内容,电脑可以在任何时间、地点、瞬间将任何内容,在全球范围内,以任何载体、形态、格式和体验传输给任何需要它的「读者」。

这就是未来的数字图书馆。

数字图书馆:时势造英雄

与「图书」捆绑的图书馆最终将会为图书陪葬,与「知识」捆绑的图书馆,才能独立于知识形态和载体的变化,不论信息技术风云变幻,继续实践图书馆「收集保存、有序组织、知识交流、休闲娱乐」的社会职能。图书馆的社会职能可能会随着社会分工变化和替代行业的出现而发生重点的转移,但是无论如何,作为一种保障民众获取知识与信息的公平权利、消除知识鸿沟和信息鸿沟的公益性社会机构,无论是实体的还是虚拟的,纸张的还是数字的,其职能是永恒的。

如果我们把「无纸社会」作为传统媒体向数字媒体过渡的一种象征的话,真正的「无纸社会」只是一个无限逼近的目标。历史上媒体的变迁很少有直接替代的情况发生,更多的是由于功能被新的媒体所替代而造成使用方式和习惯的迁移,老的媒体通常能发掘出新的用途,或者以前的次要功能发展成主要功能。

美国伊利诺伊州大学厄本那—香槟分校的兰开斯特教授分别在 1978 年和 1982 年写过两本关于未来图书馆和图书馆员的书,预言无纸化社会将在上世纪末到来。1999 年他老人家对他的预言进行了反省,提醒人们技术的发展会带来对人的忽视。其实技术的发展总有个过程,电脑科学和网络技术一直在向更加人性化的方向发展,可视化、虚拟现实、穿戴电脑等都是近年来最前沿的技术,上世纪七十年代兴起的人工智能研究虽然是失败了,但记载了科学家的努力,Web2.0、语义万维网更是技术以人为本的证明。技术到底还是为人服务的。人的贪婪总是会对技术提出越来越高的要求,归咎于技术,只能是人的无能和无知,也是把技术异化了的表征。有人根据兰老的反省仿佛见证了兰老的愚蠢,认为他的预言的破产就是信息技术的破产,并举例说「无纸社会」实际上用纸更多了。

真是这样吗?预言家们只不过性急了一点,无纸社会尚未到来,但纸张作为一种印刷媒介和信息载体,已经不再具有主流媒体和知识传播的作用,不再具有大众媒体的地位,而逐渐退出历史舞台;取而代之的,数字媒体、网络传播将成为主导方式。

印刷取代手抄,报纸取代公文,电视取代广播,电话取代电报,电邮取代信件……历史上这样的故事发生过多次,但是当前的数字化浪潮恐怕只有印刷术能够相比。我们正在经历一场由信息技术革命带来的人类社会的整体变革。能源、生物、材料和信息四大决定人类未来的发动机中,到目前为止,还只有信息革命率先取得了突破。

目前全球的网民已超过 16 亿,我国约占五分之一,更有手机上网用户1.55 亿。这个媒体迁移过程,随着我们一两代人的更替,可以自然完成。现在的网络一代,眼不离屏幕,手不离键盘,一天可以泡网十几个小时,出门也不忘带着上网手机。网络就是他们的江湖。对他们而言,任何东西,只要网上没有,就不存在。书本基本上是个负担:书包是每天的负担,买书有金钱的负担,读书更是扼杀青春的负担。偶尔街头买一张小报,或时尚杂志,一般是为了心理需要,或者可以当个坐垫。

如果我们把人类历史的坐标尺度放大,自上世纪下半叶开始的信息技术革命已经是快如闪电了。我们生活在一个一切都按照指数级发展的时代,现代人一年中所获得的信息量,是 19 世纪一个英国普通人一生所获信息量的总和,而目前每年新增的信息量,又是过去 5000 年人类信息的总和。历史上还没有哪次新技术革命,能够给人的生活,在一个人有限的一生中带来如此剧烈的变化。

工业文明的印刷技术带来了图书馆的第一次复兴,数字时代必将带来下一次复兴。人类探索世界、追求理性的天性赋予图书馆以基本精神,这些精神随着知识的丰富和理性的进化而不断发展,即存在于图书馆收藏和整理的知识中,也浓缩和积淀于图书馆的精神和理念中,归纳起来,图书馆的基本精神就是知识自由的精神,图书馆的服务理念就是平等无差别和免费服务。现代图书馆的贫民化和开放运动、美国钢铁大王卡内基对公共图书馆的塑造、当前学术领域的开放存取运动等等,这些东西不会随着技术的进步、服务手段的提高以及图书馆形态的变化而变化的。这些理念和精神是永恒的。

这就是现在图书馆行业面临的信息环境,也是数字图书馆应运而生的土壤。图书馆的理念、价值和运作模式独立于它的形态和内容,就像印度图书馆学家阮冈那赞所说的,图书馆是一个不断发展的有机体。其最大特点就是适应性,在任何环境下,都能够调整自己,复制自己,发展自己。

数字图书馆:存取人类所有知识

1849 年,英国考古学家莱尔德发掘了迄今确知的最早的图书馆——亚述巴尼拔图书馆,发掘出近三万块泥版文书。这座公元前六世纪的图书馆却不是最有名的,只是由于泥版文书的特殊性,使其免于战火,保存至今。而大大有名的,只限于文献记载的、比它晚 400 年的古埃及亚历山大图书馆,却成了一个永恒的传奇。

以羊皮书和纸莎卷为主要收藏的亚历山大图书馆命多劫难,两次毁于战火,以至于其宏富的收藏和辉煌的历史只能散见于文献,据说其最多时收藏有 50 万卷各类手稿,是由数百位「誊写员」(当时的图书馆员)日夜不停地抄写得来的。最使这座图书馆文明的是它的收藏理念:穷尽人类的所有知识。

从这一点来讲,谷歌就是现代的亚历山大图书馆。谷歌昭告天下的使命是:「整合全球范围的信息,使人人皆可访问并从中受益」(To organize the world’s information and make it universally accessible and useful),这与 2001 年 2 月美国信息技术咨询委员会(PITAC)向布什总统提出的报告《数字图书馆:实现对人类知识的普遍访问》(Digital Libraries: Universal Access to Human Knowledge)如出一辙,甚至可以认为,谷歌就是在干未来图书馆的活。

谷歌与图书馆和出版商合作的谷歌 图书搜索计划目前已提供 700 万种数字化图书的在线服务,很快会达到 1000 万种。这批图书最早来源于五家图书馆:密西根、斯坦福、哈佛、牛津 Bodleian 四个大学图书馆和纽约公共图书馆,仅这五家图书馆的藏书就高达 1500 万种。谷歌打算投资两亿美元,在 2014 年前完成这个数字化项目,据估计最后可能远远不止。据说人类目前保存的图书总数一共也就一亿种左右,对于谷歌来说,把它们全部储存起来似乎不是什么遥不可及的事情。

随着 2008 年 10 月谷歌就其扫描的绝版书与美国出版商协会和美国作家协会达成赔偿 1.25 亿美元的和解协议,谷歌几乎就是拿到了合法的扫描人类所有图书的执照。即便该和解协议覆盖范围极其有限,这个模式也为将来处理同类纠纷提供了参考。当然没有多少人能够出得起谷歌开出的价码。谷歌建立了一个无比巨大的图书分销零售平台,凭借其所向披靡的搜索引擎和其它技术优势,将内容重新标注、索引、组合,并扩展到期刊、报告、会议录等传统学术出版产业中,甚至可以进一步与新闻、多媒体行业进行整合,而在整个内容产业中攻城略地,依靠其平台和商务模式,左右整个内容产业链。

现在谷歌的战略布局虽然初现端倪,已经很难有实质性抵抗了。由Internet  Archive、微软、雅虎等组成的开放内容联盟曾经也想在这个领域分一杯羹,但在扫描了 75 万册图书之后,微软还是放弃了该计划。当初微软的决策似乎是出于与谷歌竞争的冲动,与 Internet Archive 的合作也使其变成纯粹烧钱商务模式。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模上和技术上不能跟谷歌图书搜索计划相比,只能算是实验性或示范性项目。

当然一家通吃的局面是很难出现的,亚马逊公司凭借其 Kindle 阅读器一鸣惊人,通过终端的标准化,打通整个产业链,打造出一个电子书零售市场,其商务模式有模仿苹果公司 iTunes / iPod 之嫌,但依然取得了巨大的成功。该领域还有索尼等公司加入战团,实力不可小觑。

与「数字内容」的生产、组织、发布、服务相关的公司还有一类,就是像「盛大文学网」这种原生数字内容平台公司,他们与传统出版行业的竞争看起来是最激烈的,互相渗透,抢夺地盘,但是这个战场最多只是局域性的,而且其商务模式目光短浅,很难打造起真正的行业平台。真正具有战略意义的,能够左右整个数字内容产业的应该是谷歌、亚马逊这类野心和实力并举、掌握了各类数字内容分销平台和渠道的公司。

图书馆在这场大战中尽可以采取坐山观虎斗的策略,谁赢谁输都没有坏处,行业整合了、科技进步了,图书馆可以更好地实现其固有的职能。要知道任何企业都是有其生命周期的,据说目前存世的最长寿的企业,是传了 40 代,已有 1400 多年历史的日本大阪寺庙建筑企业金刚组,西方最古老的企业为法国葡萄酒世家 Château de Goulaine,已超过千岁了。然而正如前文所述,图书馆至少已有 2600 多年的历史,再强大的企业,存续再久的企业,也无法跟一项公益性的事业相比,尽管可能干了与图书馆相同的工作。

图书馆作为知识中介的功能,可能会被商业化的服务逐步取代,然而图书馆作为保障知识自由和平等获取的机构,其真正覆盖的应该是无法获得商业化服务的人群,任何时代都有这样的人群,以逐利为目的的企业总有服务的盲区。另外,图书馆尚有「保存、组织、交流、娱乐」四大职能,是任何私有企业无法完全覆盖的。

数字图书馆的前景风光无限。

未来的图书馆:随需而变,无所不在

图书馆事业的不可取代性,并不是图书馆可以不思进取的理由。行业的兴衰成败,背后可能的原因比企业的开停并转要复杂很多,但并不是没有前车之鉴。图书馆不管有多少职能,只要不能继续吸引读者,它的前景就堪忧。因此图书馆面临的挑战还是十分巨大的。

建设数字图书馆并非不要场地,不要空间。自古以来,图书馆都是人们交际聚会的场所,近年来更有「城市的起居室」、「市民的书房」等称谓。数字图书馆只是指它的资源是数字化的,设施是围绕数字化资源所配备的,从功能上说,它依旧是城市或社区的信息中心。

图书馆发展「信息共享空间」和「学习共享空间」,甚至「Idea Shop」,正在成为公共图书馆和高校图书馆的潮流。你如果去一个社区图书馆,可能看不到成排的书架、报栏,倒是有不少沙发、茶几,以及零星的电脑和散落各处。这种「共享空间」的理念就是,综合图书馆的各种资源、设施和能力,以人为本,向读者提供所有可能的服务。每一个「共享空间」可能都是个性化的,就像每一所星巴克的布局都不一样,但他们提供的服务和体验是一样的。

将来你可能会见到环境优雅,音乐幽幽,提供咖啡茶点,可以免费上网的社区图书馆;或者接受专题资料预约,提供投影等会议设施,到处都能无线上网的图书馆阅览室供您在需要的时段使用;如果需要专业的参考馆员陪伴协助,也可以预约。

当前制约图书馆提供数字资源服务的还有一个重要障碍,就是版权。传统图书馆提供纸本图书、期刊和其它馆藏资源的借阅、复印,有行业规范(例如每次复印不超过一本书的三分之一之类),属于「合理使用」范围。但数字资源由于拷贝和传播的便利性,一下子就无法「合理使用」了,许多限制不能充分发挥数字资源的优势,使得许多公共图书馆在数字资源的服务和提供方面十分被动,利用率很低。

图书馆的存在本来就是对于版权制度的一种调节和弥补,是平等获取知识的一种保障。从经济价值上来考量,目前图书馆购买力大约能够占到全部出版市场的 5% 左右,虽然不是举足轻重,也能算相当可观。本来这一部分投入就是应用于没有能力购买出版品的广大「长尾」读者,他们是出版市场的无效用户,这些没有市场价值的用户的阅读需求由图书馆这种制度设计来满足,公共资金(或捐助资金)购买的资源或服务实际上对于出版市场来说是额外的收入。数字出版其实也是如此,当然长尾用户的需求不一定通过图书馆来满足,但是图书馆肯定是一个拾遗补缺的、不可替代的渠道。对于如果数字资源不能通过公共图书馆进行提供,其就会丧失保障信息获取自由的职能,走向「博物馆化」就是个时间问题了。对于研究型图书馆和大学图书馆来说,一般对于开放存取具有本能的冲动,因为本身其所属机构就是学术出版的最大生产者,自己生产的知识,再通过商人的渠道,附加很多利润,再卖给自己,本身的商务模式就有许多荒谬之处,这些机构的联合所形成的购买力也是一个谈判筹码。相信进过不屑的努力,图书馆在数字资源的合理使用方面能够探索一些新的模式。

大学图书馆和研究型图书馆在向数字图书馆的过渡方面更有积极性,欧美国家已经认识到图书馆在数字时代亦然是教育和科研的基础设施,因此花巨资研究数字仓储、数字资源的保存、组织和利用问题。数字图书馆通常有两张面孔,除了现实中的古典庄重巍峨的大厦之外,通常在虚拟世界里也具有「课件中心」、「数据中心」、「学术信息中心」及「交流中心」等职能。无纸图书馆(E-Only)将在这两类图书馆中率先实现。不仅如此,这类数字图书馆将利用各种技术,将资源入口和服务「嵌入」到用户(通常是教授、研究人员和学生)的信息环境中(例如做成桌面工具、浏览器插件、工具条等),从而更加虚拟化而真正「无所不在」。

十年内可以弯折的电子纸应该能够得到商用,电子墨水技术在灰度级别和色彩深度方面已经能够超出普通人的需求,翻转速度能够应用于基本的视频播放。「电子书包」(即存储有所有教科书和教辅书的可写电脑)的普及可能会更快一些,电子书会也像 MP3 一样大行其道,这些载体在感官舒适度方面甚至会超过目前的普通纸张。所有这些变化将给新闻和出版行业全盘数字化提供巨大的市场动力,人们获取新闻和学习知识的习惯也会发生重大变化。

图书馆作为一种实体空间的作用和作为一种虚拟知识传播机构的功能将会彻底分开,实体机构的图书馆依旧作为公民知识生活的中心,而虚拟的知识传播通过各类渠道和设备(例如利用无所不在的「云计算」环境)而变得「泛在」,图书馆通过网络提供大量的信息服务,但是你可能丝毫都感觉不到它的存在。

由于数字化造成的媒体融合,许多大型的图书馆或图书馆联盟同时会扮演出版商和资源服务商的角色,向产业上下游同时挺进,特别是那些有独特资源或者能够提供深度信息咨询服务的图书馆(如议会图书馆和研究型图书馆等),一方面成为知识的出版者和发布者,另一方面依靠新型电子报纸、电子书或手持设备,提供更为专指的内容分发业务,因而也可能兼具一定的媒体角色,但是这类图书馆可能为数很少。

图书馆行业现在正处于历史上独一无二的阶段,原先的产业链已经松动、断裂,新的链条尚未建立、成型。图书馆在社会中所承担的职能虽然没有本质的变化,但角色已经发生了重大变化,图书馆不再仅仅是伫立于街角等待别人上门的一栋大楼或者几个房间,而是人们电脑桌面的一个图标,手机上的几个应用,Kindle 上的一个帐号,等等。图书馆的服务流程与人们的学习生活密切相关,同时图书馆事业作为一个整体,依旧支撑着人类所有的知识记忆。

英国哲学家波普尔曾经做过一个著名的「思想实验」:如果地球遭到毁灭,我们可以依靠图书馆中保存的人类记忆,花费一两代人的时间,重建整个人类的文明。而如果图书馆也遭到毁灭了,人类将重新进入一个漫长的文明重建时期。我由此推理,由于数字图书馆的存在,我们重建人类文明的时间将大大缩短,甚至就像恢复备份一样容易。

(本文写于2010年初,Apple4.us约稿,目前该网站已不可考)

初学者关于数字人文的五个提问

1.近年来,国内外数字人文研究取得了哪些实绩与进展?
1)领域或学科已经得到公认确立。2004年为界前后两个时期
2)学会、期刊、教育都已经建立起来
3)国际和区域性学术交流会议非常活跃
4)学科正在繁荣,各相关学科都有一些成果,虽然没有特别眼睛一亮的成果,但有不少项目也算有影响。国外已有近千种专著,台湾也有20种,但大陆只有翻译的。期刊论文国内每年也有近200篇。
5)范式转型已经开始,但还远没有到位(dark side:晋升、评价等)


2.未来的数字人文研究应该注意哪些问题?或者说要坚持什么原则?
1)“大帐篷”原则,多学科融合,促进交流。目前很不平衡。
2)注重学科建设和理论研究,从教育培训入手。目前刚刚开始。
3)重视基础设施建设,基金进入,项目导向。
4)注重数字人文的本土性和民族特色,价值观引领,传承优秀中华文化非常有必要。

3.数字人文研究,具体会给传统研究范式、方法、视角带来怎样影响和变化?
影响是颠覆性的。两个方面:
1)不同程度改变原有人文社会科学
2)产生很多新的问题,带来交叉边缘领域,甚至创造新学科 不仅仅是方法方面的革新,就像试验设备的提高带来自然科学的进步一样,会造就新的内容。 数字人文也是数据科学的一种实践领域。

4.目前中华优秀传统文化的发展在您看来存在怎样的困境或者问题呢?
1)中华优秀文化的传播需要有两个基础要素:载体和形式,文献典籍文物遗产是载体,数字人文提供新形式。目前这两方面都准备不充分,基础设施、人才培养、工具方法都存在不足。
2)目前的最大问题有两个:源头上无法界定精华和糟粕;传播上缺乏吸引新一代并代表未来的方式方法手段
3)观念上重视、理念上面向未来面向国际,大力投入加强教育和基础设施建设,同时需要有一套指标体系和评价方法

5.如果存在问题,那么数字人文在哪些方面可以有所帮助呢?
简单而言:中国的数字人文一定是基于中国优秀的传统文化才有生命力,中国优秀的传统文化需要借助于数字人文才有未来。

未来已来!拥抱一个全新的开放平台时代

本文为《中国图书馆学报》2020年第一期“FOLIO专辑”主持人语

图书馆行业从来没有像今天这样接近自己的理想,也从来没有像今天这样面临巨大的挑战。

1931年阮冈纳赞提出图书馆学五定律,指出“书有其用”、“人有其书“、”书有其人”、“节省时间”,以及“图书馆是一个生长的有机体”。这充满理想主义的五条原则,是博尔赫斯“图书馆是天堂模样”的最好诠释,然而它其实一直是一个梦想,直到信息技术高度发展的今天,才有了实现的可能。

如果不是大数据和机器学习技术,我们不可能突破二八定律为长尾图书找到小众读者,不可能实现信息资源的精准推送,也不可能通过用户参与而优化采购,通过数据驱动型知识服务而实现图书馆向“数据馆”和“知识库”转型。所有这一切都有赖于一个全媒体、全流程、全网域系统平台的支持,有赖于突破传统系统只专注于图书馆自身业务,而忽略读者和用户的多样化需求和越来越高的体验要求。

当今一个理想的图书馆平台,绝不能只有采访编目流通等几个模块,而应该提供一个应用生态,任何图书馆的功能需求都有相应的app得到满足。其中甚至不局限于图书馆行业,而成为博物馆、美术馆、档案馆、文化馆等人类记忆机构通用或共享的服务。就像智能手机有应用商店一样,只要有需求,就能找到相应的app,通过建立一套技术标准规范,就能使大众的创造力得到充分发挥,并把公共文化机构的服务潜能充分挖掘出来。

这样的应用生态只有开放的平台才能够做到,而且是图书馆行业主导的开放平台,图书馆对自己的系统、业务和数据具有完全的掌控。这个平台让人人都可以开发app,这样图书馆所需要的所有功能,才有可能有足够多的商家提供服务;不同商家开发的app,才可能相互替换,并且随时挂接或插拔;图书馆的各类数据和模块,才能当然地互联互通。于是图书馆将不再依赖于个别的系统供应商,图书馆的数据安全也得到充分的保障:它只属于图书馆,或者读者自己。

这个平台现在已经诞生,它就是FOLIO,即“未来的图书馆是开放的(Future Of Library Is Open)!”

本期专辑汇集了四篇论文,是上海图书馆FOLIO应用团队对这套全新的图书馆开放平台进行初步研究的成果。上海图书馆23年前引进了当时最先进的C/S结构系统,现已经历了B/S和移动互联网两代的发展,直接进入基于微服务的开放平台架构。现已打算应用这套平台。

  • 周纲 和孙宇的《开创性的下一代图书馆服务平台解决方案》一文全面介绍了FOLIO的技术架构和生态环境,对其如何解决长期困扰图书馆运营的实践问题,如云模式、性价比、功能自主性、安全可控性、系统开放性和服务可靠性等进行了较为深入的探讨,重点分析了Folio技术架构和生态环境等方面的优势以及可能碰到的问题。
  • 郭利敏和张磊的《Folio专题_Folio的技术选型与运营模式研究》结合微服务技术介绍了FOLIO平台技术选型的原因,讨论了FOLIO的社区组织和商业模式之间的关系,对FOLIO在国内的落地提供了相关方案和思考。
  • 许磊和夏翠娟的《第三代图书馆服务平台的元数据管理》着重研究了FOLIO独具特色的底层数据管理架构Codex,认为Codex作为FOLIO中核心的元数据管理域,被设计成Folio的资源链接中心、规范数据中心和跨域的全媒体资源管理入口,能够通过模型中的抽象实体揭示资源间关系,其源自于BIBFRAME的抽象数据模型、最小化的元数据方案、统一的分层描述原则等考虑都远远领先于目前所有的图书馆管理系统,具有足够的灵活性支持第三代图书馆或类似机构各类实体对象的描述与组织。
  • 孙宇和周纲的《Folio专题_基于微服务架构的资源发现系统平台的构建研究》
  • 则重点研究了FOLIO中的资源发现模块,介绍了基于微服务架构的新一代资源发现系统的架构和组成,该系统架构融合了数据收割和联邦检索技术,加强了开源元数据的应用,可以真正实现馆藏所有资源的统一发现和获取,文章还展现了发现系统的本地化应用场景和服务模式。

随着今年年底FOLIO在瑞典Chalmers大学的成功部署,一个开放的、自生长的、由图书馆主导的应用生态将正式落地,真正的下一代系统正在到来!技术将成为图书馆服务创新最大的使能者和推进器。未来已来,让我们拥抱一个全新的开放平台时代!

作为数字人文基础设施的图书馆:从不可或缺到无可替代

本文为为《图书馆论坛》2020年数字人文栏目组稿的一期专辑主持人语。

根据CNKI的数据,国内迄今发表的近700篇以”数字人文“为主题的论文中,来自图书情报档案领域的文章大约超过60%。对比国外,Web of Science (Core Collection)收录了1590篇以“digital humanities”为topic的论文,Inforamtion Science Library Science领域的文章约为300篇,占比不到20%。这两组数据显示了国内外数字人文研究学科来源的巨大差异。

这说明了什么呢?虽然我们并不认为国外的比例就是数字人文知识版图的“完美”配方,但我们的比例一定是不合理的。人文学科的数字疆域,第一批居民主要来自图书情报领域,怎么说都不能让人服气。

这其中固然有国内图书情报学者更喜欢追新的原因,也是国内人文领域的学者尚未觉醒、尚未充分准备好的结果。就像当初旧金山发现了金矿,涌入的首批淘金者并没有赚到钱,而各类服务业却异军突起。图书馆行业作为历史文献的主要保留地,由于数字图书馆带来先知先觉,理所当然地成为数字人文最早的基础设施建设者。

传统的文献考据和现代的文献计量学都为数字人文作为一个整体的跨学科研究领域提供了方法论借鉴,书目控制带来的规范控制借助于语义技术,天然地为知识的形式化组织(采用本体技术)和知识服务提供了可信的编码基础,也为机器学习和人工智能的发展提供了宝贵的标注语料库。如果说不了解目录之学就无法窥知传统学术门径的话,不懂得以文献计量为代表的统计分析方法就无法真正从事数字人文研究。当然,当今数字人文的方法体系已经得到了极大拓展,统计分析的对象从文献深入到了语词文本、社会关系、时空关系乃至经过模型化之后的各类关系。但无论多么复杂,数据永远是基础,拥有大量数据的图书馆永远是人文研究的可靠伙伴。

图书馆要提供基于知识的服务还需要在数字图书馆的基础上不断提升水平,包括提升资源加工的语义化水平和提供分析统计及可视化工具。上海图书馆在国内属于对数字人文的先知先觉者之一,借助于20多年前开始的持续不断的数字化,大量的传统文献和特色文献已经搬运到了数字世界,一旦数字人文的研究方法和相关技术得以成熟,很自然地占据了有利的跑道。

本辑的四篇文章虽然反映不了上海图书馆在数字人文领域积极开拓的全貌,但包含了一些新的思考。图书馆这类人类记忆机构在数字人文的发展过程中,固然由于其资源收藏而不可或缺,但真正使其无可替代的,并不是这些馆藏资源,而是其服务能力。在当今以ABCD(人工智能、区块链、云计算和大数据)为特征的数字时代,“知识作为一种服务(KaaS)”才是图书馆的立身之本。本专辑反映了数字人文平台建设的两大趋势:边服务边建设的开放众包思想,和从数字图书馆到数据图书馆的必要升级。这两者是“后数字图书馆时代”我们在面向数据驱动型或数据密集型研究进行转型时必须首先实现和超越的。

  • 贺晨芝和张磊的《图书馆数字人文众包项目实践、分析与思考》重点介绍了数字人文领域的众包应用现状,以及上海图书馆自2016年以来的实践经验。上海图书馆开发了两个独立的众包应用,即抄录平台和验证码应用,都可以以SaaS方式开放给同行使用。
  • 刘倩倩和夏翠娟的《家谱知识服务平台众包模式的设计与实现》针对上海图书馆的家谱特藏,在原来提供基本查询和关联功能的数字人文平台基础上,开发了上传家谱、在线识谱、在线修谱等功能,尝试引入众包模式不断优化系统,并与用户社区积极互动密切合作,使用户不仅作为数据的消费者,同时也作为贡献者。
  • 朱武信和夏翠娟的《命名实体识别在数字人文中的应用—基于ETL的实现》介绍了一种借助于专门词典、批量自动进行名称实体识别的方法(即ETL方法),该方法在上海图书馆的数字人文平台建设中已普遍采用,取得了良好的效果。其原理是将文本中有意义的名称(例如人物、地点、时间、事件、专有概念等)利用程序进行自动析取,经过判断之后进行数据数据化转换(通常是加上URI),并提供丰富的语义关系。
  • 张喆昱和张磊的《记忆机构开放数据建设及数据化转型模式研究》触及了两个关键性主题:数据化和开放服务,试图将上海图书馆的实践进行一般化和通用化,分析了如何通过数据化更加贴近人文学者的需求,让系统更加人性化,然后通过开放服务引入外部资源,反过来促进系统的数据化。

上海图书馆希望通过自己的实践,为人文研究的赛百基础设施建设提供一个参考样本。发表这些做法,并不是说我们的做法有多先进,而只是一种不揣浅陋的抛砖引玉。我们深知,国内的数字人文目前还处于起步阶段,争论大于共识、口水多于实践,但只要大家参与,未来就前景可期。数字人文迄今为止形成的最大共识,就是大家都同意它是一个人人都受欢迎从而能各得其所的“大帐篷”。愿这个大帐篷使我们各门人文学科都得到繁荣兴旺!