分类目录人工智能

机器时代的人文主义:谁能评价?

外在与本质

2017年10月25日,在沙特首都利雅得举行的“未来投资倡议”大会上,由香港汉森机器人技术公司(Hanson Robotics)制造的机器人索菲娅(Sophia)被沙特政府授予了公民身份,成为世界上第一个受到政府认可的机器公民。这个看似作秀的举动其实蕴涵了一个巨大的跨越,必将成为一个标志性事件,标志着人与机器之间的界限正在被打破。是否意味着源自启蒙运动的“人类中心主义”价值观受到了冲击?人类主体的范围是否应该重新界定?这些问题虽然还有待观察,但已经提上议事日程。

由此看来,对于数字人文而言,定义其为数字技术在人文研究中的应用(或交叉领域)已经远远不够了,人文学科的数字化发展只是其表象,人类数字活动的学科化研究才是其本质。循此方向发展下去,它不仅在颠覆传统人文,而且在创新数字人文。我们现在所认识按传统学科划分的数字人文,难道就是未来数字人文的最终形式?当一个异形的种子刚刚被注入人类体内的时候,你建立怎样的体检标准(即评价体系)都是荒谬和无济于事的。

载体与内容

当我们谈论数字人文的时候,我们通常谈论的是数字方法应用于人文研究,很少谈论人文研究对象本身的数字化形态,印刷时代的人文研究给我们造成一种错觉:似乎文本或文献就是所有人文科学的研究对象。

例如,哲学,研究的应该是思想观念,而不是概念文本;历史学,研究的是历史事实,而不是历史文献;文学,可以算是内容与形式统一的范例,但它并不是语言学;语言学,也不只是文本,而是音形义的交互作用。

这就造成一个奇特的现象:所有的人文学科在外人看来都是研究文本或文献的,而不是其所宣称的真实的研究对象。人文学者在研究时,需要把文本抽象还原成其研究对象本来的状态,这是在人文学者大脑中进行的动作,人脑就是他们的反应器,人脑的记忆衰减、任意联想以及不确定的多巴胺造成人文学者极端的浪漫性,而比较缺乏的就是科学性。这可以看成是印刷技术的局限。要知道传统的自然科学家除了看书之外,不对进行实验研究是不可能得到同行承认的,这也是爱因斯坦并没有因为其最伟大的发现—-相对论理论而获得诺贝尔奖的原因。而人文学者完全不必有此顾虑,这是所有人文学科、中国传统理论和民科都享受到的好处。

而当数字技术参与其中之时,情况就完全不同了。数字技术是可以把研究对象及其现象还原为真实对象甚至真实场景的,是可以基于数据进行实验的。这类似于人类发明了火之后,食物的种类大大增加,因为烧煮过程减轻了人类消化系统的负担,等于体外消化了大部分材料,于是人能够一举跃上了食物链的顶端。对于数字人文来说,不同学科的研究材料就产生了很大的不同,大家不仅烧煮的食物不同,连锅碗瓢盆过程方法都是不同的,你一看就知道哲学家可以用一种叫操作N-Gram的蒸锅进行观念史研究,而历史学家在调试各种佐料的刺激程度以获得不同的中心度指标,来取得人物之间的聚类关系。。。等等,从一开始他们的装备和本领就是不同的,因此到了数字人文时代,可以给不同学科的研究者设计不同的制服,王涛老师可以穿蓝大褂,如果他要经常走访遗址的话;而陈静老师更合适穿汉服或芭蕾舞裙,因为这样她的艺术研究更能激发人的想象。当然这些激动人心的丰富性也会给评价带来难以估量的困难。

模型与镜像

数字技术可以让我们在虚拟世界再造一个人文环境,跨越时空,以不同角度和粒度进行观察、模拟甚至操控。这其实是眼下最时髦的一项技术,所谓“数字孪生”,我觉得它在数字人文领域具有广阔的应用前景,一定能大有作为。

“数字孪生”能够给人文研究带来极大的好处,它并不只是让我们能够通过操控和实验,获得细致入微的因果规律,利用机器的“显宏”能力写出史景迁《王氏之死》这类史学小说,或者黄仁宇《万历十五年》这类远读的历史切片,或者帮胡适续完《中国哲学史大纲》;它同时也带来了很大的困惑,究竟怎样的模型(粒度与视角)才能满足不同学科的实验要求?同样的素材可以提取多种对象,每个对象也可以有不同的形态和版本。

这里正好有个例子。昨天我们吃晚饭【喝茅台】的时候有个会议正在举行:“用方法表达思想,历史书写的可能性”,不去说这样刻意的用词营造出一种模糊而暧昧的氛围,(的确能够勾起人们一探究竟的好奇心,虽然网络时代的标题党早已不这样操作。不去管他,)我们就来分析一下用什么方法能够表达思想?可以说我们当今的时代正在发展各种方法,不仅仅是印刷文本了。数字文本可以表达,数字图像可以表达,各种对象关系模型及其系统实现可以表达,任何信息媒体只要受信端能正确(或故意正确)地解码,都算是从认识论层面或多或少表达了思想,书写历史也是一种表达,不同粒度、不同角度、不同分面,尽管认识的模糊性必然导致表达或书写的模糊性,但这不属于本文的讨论范围。

我不知道历史学家或人文学者意识到当今数字技术所具有的能力没有?我们现在当然还没有做到大规模建模,为人文学者创造一个可以赖以实验的数字孪生出来,我们偶尔会受到指责,说我们的模型根本不是那么回事;我们也会指责回去,认为他们根本没有弄清楚自己在做什么,以及是怎么做的,这是无法建立一个清晰的模型的。当然,是不是机器学习可以不必打开人文学者研究过程的黑箱,而直接模拟得出结论,有待于计算机技术的进一步突破。

对于评价来说,这种情况下我们如何评价,成果的取得是由于模型的精准、人文学者的顿悟还是机器算法的高超?现在都不知道。

现状与未来

我们可以做一个思想实验:当机器时代最终到来,所有的研究素材、对象、方法、过程、工具,都数字化了,我们的人文研究,还有必要冠以“数字”人文吗?

我们正处在大数据和人工智能时代,当所有的人文活动、素材和方法都依赖于计算机和网络之后,其实就无所谓数字人文了。就像纸媒时代我们不会说纸张人文一样。人文就是人文,它可能会改变形态,但本质永远是人性。普适的标签终究会失去意义。我们可以借助纸本文献研究传统人文,也可以借助数字媒体研究数字人文,或者用数字方法研究传统人文,这些都是数字人文作为学科的表现形态。而人文现象作为其研究对象,已经与数字技术融为一体,难分彼此了。

那么,我们数字人文的评价体系,到底是评价什么呢?

前提与假设

本次会议的主题是“数字人文的学术评价体系:定义与规范构建”

从主题中很容易看出出题者的雄心和先验假设。

雄心是:数字人文作为一种学术活动,目前尚未建立适当的学术评价体系,尤其是定义数字人文,并为数字人文构建学术规范。既然没有人做,那我们来做。

假设是:数字人文是一种学术活动,学术活动需要评价体系,数字人文作为一个学术领域是可以被定义的,也是可以建立学术规范的。

真是这样吗?

我有我的答案,但在这里我不想说。希望与大家进行开放式讨论之后我能思考得更加深入,因为评价的前提是需要建立一个领域知识的全景图。这里我只想对我们可能要进行评价的概念进行一些讨论。

定义与规范

什么是人文,什么是人文主义、人文精神、人文科学、人文学科,这些概念其实都没有得到清晰的解释,也没有形成共同的理解。这对于数字人文的界定和精确化是不利的。我们对这些概念进行过一些简单的探讨,今天时间有限,请参见我们的文章《数字人文的理论化趋势前瞻》。

关于什么是数字人文学科,人民大学曾下过一个迄今为止最大胆和清晰的定义,也是我最推崇的。

它说:

数字人文是计算机学科和人文学科交叉研究所衍生的一个新领域,它以涉及针对计算工具与所有文化产品的交叉领域为研究对象, 系统地研究数字与人文相结合的普遍规律和应用方法。具体来说,数字人文学科 以人文科学的基本问题为研究对象,以不断发展进步的信息技术和数字技术等为 主要工具,以数字资源构建、信息资源管理等数据基础设施建设为基础,以计算 分析和案例分析方法等为主要研究手段,通过建立描述学术活动理论、方法和功 能的框架以及各种类型的项目实践,探讨数字技术与人文科学跨学科对话中的方法、过程、特征和相互关系,以及数字人文作为一个整体与社会环境之间的互动与关联,并从中探索、归纳和总结出获得成效、提高效率的一般理论、方法和规 律,以推动知识创新和服务。

当下与终极

虽然我不认为当下有必要甚至有可能建立一个数字人文的学术评价体系,并为其建立学术研究规范,现在还为时尚早,理论体系尚无踪影,领域边界也未形成,学术团体此起彼伏,对话还不充分,学术共同体也在飘摇之中;评价对象、评价方法、评价目的都不确定,过早的评价可能限制其发展,而不能达到我们促进领域发展的目的。但我并不反对这样的探索,更不反对这样的会议能够开诚布公地把问题提出来,进行争鸣。网络时代制造热点通常也是一种很好的促进。

讨论什么不是数字人文以及什么是好的数字人文都是有积极意义的,能够起到引导作用;讨论人文性与研究难度是有一定难度的,但可以把问题引向深入。数字人文区别于传统人文应该保持概念的一致性和精确性,而且在寻求评价方法的同时自身就应该重视指标的可度量性。

当然学术评价如果剔除管理和功利的目的,其终极目的是促进学术发展,最终还是一个定性的事情,同行评议可能是不好的方法当中最好的方法。社会人文科学的任何定量模型,其最初量化数值的获取,都是模拟的、定性的。

启蒙与赋权

数字人文可能而且应该成为又一次人文启蒙运动,以数字工具的兴起为契机,以机器语言为共同语言,引导人们走出模拟时代的蒙昧、盲从、无知、教条、权威崇拜、奴性,以重塑更为普遍的人性、道德、美的理解和思想体系,为未来人类的生活方式和社会形态提供解决框架。

数字时代应该进一步研究何为人性、何为人文,在面临数字技术的冲击下,哪些是解放人类并促进全面发展的必然趋势,哪些又是被别有用心的政客利用来奴役和控制别人的主张。其实评价本身也是一种特权。

数字人文的研究,必然带来后人文时代即数字主义和兴起。

我们当下所有评价的宗旨,是发展数字人文。而数字人文的最终目的,是赋予数字以人性,并因此而保障平等的数字权利。我们未来不仅生产数字,消费数字,因数字而喜乐,用数字获得财富,而且也会困于数字、累于数字,甚至被数字毁灭。

无论如何,现在已到了这样一个新的时代,我们可以喊出这样的口号:天赋数权。

“后疫情时代”图书馆需要怎样的人才

1

非常高兴参加此次会议。

习总书记曾说我们正处在“百年未有之大变局”,疫情加上国际关系,恐怕应如李鸿章所言“三千年未有之大变局“。

很多人认为这次新冠疫情是按下了暂停键,原有的迅猛发展嘎然而止,我们再也回不去了;也有人觉得是按下了快进键,认为这次疫情只是一个催化剂,加速了原本就开始的趋势。比尔·盖茨就曾经警告过疫情的大爆发,现在很多美国人还在用阴谋论来诋毁他。

2

我今天想利用30分钟左右的时间,讲一下我们对当下形势的判断,以及对我们这个职业将如何发展,如何培养合适的人才应对未来的局势。

我的报告分四个部分。

第一部分回顾一下此次疫情是在什么形势下发展起来的;

第二部分想跟大家一起做个复盘,回顾一下此次我们是怎么样对付这场新冠疫情的。

第三部分推演一下未来的发展趋势以及它的影响。

最后第四部分探讨一下我们这个职业和学科面临怎样的挑战,应对挑战需要培养怎样的人才,以及怎样培养人才。

3

虽然我们是幸运的,已经可以讨论“后疫情时代”了。但这场瘟疫远未结束,还没有到达顶峰的迹象,甚至还没有减缓的趋势。我们还不能置身事外。

现在(9月10日)全球已经2800万人确诊,90万人死亡,死亡率3.6%(万人口死1人)。(https://www.worldometers.info/coronavirus/)每天新增4-5万人确诊,一千多人死亡。

4

美国迄今已确诊655万,死亡19.5万人。

我们作为起始国,总共8.5万人确诊,4634人死亡(占5.5%的死亡率,百万人口3人死亡),与人口只是我们百分之一不到(千分之7)的瑞典大致相当(1千万人口8.4万确诊5783人死亡)。在总确诊人数中我们不到0.4%,死亡占0.6%,国际上都承认我们已经基本上控制了疫情,取得了成功。

所以我们感觉是很好的,应该尽快恢复正常,而不太能想到(或接受)新常态。

5

可以说我们是这场瘟疫中表现最好的优等生,我们与韩国等少数几个国家或地区一样,完全是因为采用了现代科技的结果,一个是大规模快速检测,然后就是数字技术普遍应用社会管理,例如跟踪人流,跟踪接触者,精准定位患者,大规模收治(方舱医院),健康情况/危险程度标示,社会动员和强制隔离等等。

6

从政治、经济、人文社会和技术的四个方面(即采用PEST分析法)来看,这次疫情的发生,正好是处在全球化的逆流(即去全球化)刚刚开始时突然爆发。

从地缘政治角度来看:正值美国大规模退群,去全球化全面启动,去全球化首先表现为去中国化,因为中国的崛起带来美国的极度不适应。

从经济贸易角度来看:中美贸易摩擦升级为新冷战,隐藏危机。经济又开始有新的摩擦,暗藏危机,前些年又发生了好几次金融危机,这个经济的形势也开始产生周期性的波动,进入到低谷阶段。

从社会人文角度来看:人类在欲望驱使下高速无序发展,正在打开潘多拉魔盒,带来人文主义危机。

从技术进步角度来看:我们正处于新一轮技术革命阶段,大数据、物联网、人工智能、基因技术继续迅猛发展,一往无前。

7

情是在上述背景下突发的。

应该说我们现在还远未进入“后疫情时代”,但站在中国的立场上,确实有资格讨论后疫情时代的问题。

后疫情应该成为一个新的开始

8

重大变革常常很难彻底摧毁什么,倒是会加速正在发生的。

浪潮退去马上能发现谁在裸泳。

1)数字化转型走过了中点线,但后半程愈发艰苦。又在向智慧图书馆进发。此次疫情对谁是机遇?迪斯尼电影频道,订阅人数翻番;网易丁丁和超星虚拟课堂。而

2)继续受信息技术发展带来的阅读方式和信息行为变化的冲击,行业呈现被边缘化的生存危机

3)作为一门应用型交叉边缘学科,在技术和需求变革的冲击下继续迷失

4)缺乏理论创新,引入数据科学、数字人文等新内容反而动摇了根基

9

初步检索,cnki中以“图书馆”and “抗疫”为主题的文章一共44篇,

《内蒙古图书馆工作》刊出了十几篇本区图书馆抗疫行动的文章专刊。

抗疫工作总结

危机应对,守望相助;传播知识,网络服务;常态制度,有序开馆。停课不停工(教学)服务不打烊(但效果如何呢?)

自身抗疫(关爱员工,调整工作)和服务抗疫两个方面,自救是为了服务。

服务抗疫有:网络服务(包括微服务,讲座视频,电子书推荐),疫情通报(专业辟谣),知识普及,心理疏导,数字阅读,阅读推广,信息推送,制度消杀,无接触服务,预约到馆。资源建设(及保存文献(抗疫记忆),如上海图书馆抗疫手稿收藏和展览)

10

IFLA 主席克里斯汀·麦肯锡和秘书长杰拉德·莱特内于2020 年 3 月 23 日发表了关于新型冠状病毒疫情对全球图书馆界影响的声明:

肯定各国图书馆为 控制疫情选择暂时关闭或缩减服务的做法

鼓励图书馆扩展数字馆藏,为人们获取在线资源以及疫情相关信息提供更多支持

呼吁各国图书馆协会为会员提供疫 情防控资源、在线培训和决策支持

鼓励各馆讲述自己的 故事,提供新冠肺炎疫情相关文献的开放获取,支持学术出版物和文章的远程访问

IFLA在行动:

推出“IFLA 与 COVID-19”常见问题解答网页;

“COVID-19 与全球图书馆界”网页,频繁发布各国图书馆闭馆情况和疫情期间服务情况。

11

整个行业的应急响应堪称优秀,专业服务的跟进也是非常及时的。但是对我们的服务能力实际上做了一次考验。

这次疫情当中也是有很多的行业,一方面受到了冲击,有一些行业异军突起。例如相关阅读网站、cnki等都推出相应服务,效果比图书馆好。迪斯尼的影视服务在疫情期间的注册量翻了一番。疫情来了之后,使符合发展趋势的业务一下子取得了突飞猛进的跨越式的发展。我们国家像网络会议、在线教育等也增长不少。

而来自于图书馆的数字服务其实就是堪堪可用。高校图书馆相对好一些,公共图书馆其实还没准备好,从资源建设到服务,都有点捉襟见肘、仓促应战。

所以总体的结论是:数字图书馆转型尚未成功,目标不明确,服务不成熟,效果不明显,现在又面临智慧化图书馆的新一轮发展。

12

13

把握不确定性,情景规划成为一种重要能力。把对未来的预测

不确定性像国外最近有很多MBA课程,他们从911之后非常重视复苏力(Resilience)这个概念,就是通过多样性来抵御突如其来的灾难。不确定性非常强的情况下,我们怎么样做出预测、做出判断,那就需要灵敏,需要敏捷,需要身段柔软,需要增强复苏力,为变化做好准备。他们有一整套的方法论,应该成为我们专业教育课程的一部分,也是数字素养的一部分,也是领导力的一种体现。特别是对馆长的培养,就是要培养在不确定性情况下,怎么样做决策。

14

ALA年初做了一个趋势调研,按照STEEPED框架总结了42个趋势,每一个趋势对图书馆都有一定影响。

其中很多是我们没有注意到的。

15

职业的问题来自于专业的疲软。

1.图书馆学的去职业化是必须的(吴丹的论文),否则学科理论很难建立起来。但图书馆要不要去职业化?取决于图书馆实践有没有特殊性。职业是社会分工,专业是科研和教学的学科门类,职业不等于专业,图书馆的职业培训并不是以图书馆学的存在为前提的,没有图书馆学照样可以有图书馆职业培训。图书馆职业需要的知识技能是综合性的,目前这些知识技能越来越没有特殊性,所以图书馆学教育就开始迷失,图书馆实践可以不要图书馆学专业的毕业生,图书馆专业毕业生也希望就业面更加宽泛。

2.因此我们现在谈论更多的并不是图书馆作为一个职业的问题,而是图书馆学作为一个专业的问题。图书馆从一开始作为一个专业的基础就是不牢固的,现在就更不牢固了。这里主要原因是作为图书馆学学科立论基础的基础理论一直没有确立起来,不能解释图书馆活动和现象,不能明确图书馆的核心内容和核心能力,不回答为什么的问题,以及怎么看在数字时代的图书馆的问题,而只关注怎么做的问题,很多图书馆学院是把技术、方法、技能作为主要内容进行教育的,特别是成为信息管理学科之后,这就走偏了,图书馆自然就找不到安身立命之地了。图书馆有没有专业性也应该是图书馆学理论要回答的重要问题。

3.这样就很清楚了。图书馆不需要图书馆学专业的毕业生,并不是图书馆的问题,根本还是图书馆学的原因,这是之所以我很赞成程焕文教授认为图书馆学教育应该回归本源,但大学及研究生教育毕竟不是职业培训,这个本源已不是过去的本源,必须透过现象看本质,这个本质是知识的传播,而不是文献的管理,其载体形态和方式发生了深刻彻底的变化,我们不能死守着传统图书馆那些东西,不适应环境也是会死翘翘的,所以图书馆学应该高瞻远瞩,这个高瞻远瞩包括了解决指导图书馆向何处去的问题。

4.图书馆学相关专业改名本来并不是很大的事,专业与职业是不同的,专业名称怎么改,职业也是可以适应的。但中国有重视名教的传统,还有教育行政管理部门一刀切和资源分配的逻辑对专业发展的决定性问题(学科目录和学科建制),带了很多感情色彩,这就把问题复杂化了。我们有很多年轻学者过于看重所谓的学科地位和职业前景,对于专业的讨论“烟火气”太重,这也是需要注意的(西北大学陶俊)。

吴丹, 徐爽, 李秀园, 董晶, 樊舒, 桂丹云. 近十年我国图书馆学研究中的理论使用分析[J].图书与情报, 2019(06): 041-051.

16

对于学科发展趋势,我有以下四个判断:

知识服务:从载体到渠道都在变化

专业的危机我觉得我们做的远远的不够,主要是你要看到我们这个专业,它的对象是文献,当然肯定不是图书了,文献已经很古老了。那么现在又说是数据了,这个行业的变化,实际上就像以前这个马车行业,你认为它是交通运输行业,还是器具生产的行业。你如果认为它是交通运输行业的话,那么自然就会过渡到以汽车为主的交通运输。就是你要透过现象看本质,那么我们实际上要和知识捆绑,我们知识服务这个角度来看,从载体到渠道都在变化,我们从载体,因为文献它是记录有知识的一切载体,那么我们都统称为文献。那么文献它是知识和载体不可分割的。

媒体变化:融媒体运营成为必然趋势。现在越来越多的人听书,那些办卡的人一年还要花钱,我们免费都没人看,他们为什么会去办卡?实际上他就是方便,他偷懒。他就觉得

听书听一刻钟到20分钟就把一本书听完了,然后他觉得有价值,他再去买一本,买回去他可能永远不会看,但是这样就增加了这个图书的销量。融媒体、多媒体的运营将来肯定是必然趋势。视频和音频的接受程度,特别是5G来了之后,图书馆传统的以文本为基础的服务,以文本为基础的一整套的产业生态和产业链,都是面临挑战,都是会变化的。所以这个问题非常严重,我们在5G时代怎么样创新我们的服务很成问题。

阅读推广:不得不为而大有可为。这是我们学科和职业的一个新的生长点。

能力培养:专业教育与职业需求相背离。所以我们需要更多的素养培育。

17

我很想把华东师范大学黄纯元老师的两段话在这里再跟大家回顾一下,第一段是1984年说的,第二段话是1996年说的,已经过去几十年了,但是我们现在还没有走出这个怪圈,还处在这样一个过度的变化的状态当中。实际上第一段话他就揭示了,当时我们刚开始进入新的时代,1984年十一届三中全会之后改革开放,当时市场经济开始提出,然后他说知识就呈现两种矛盾的状态,一种是知识很有价值,我们搞知识的人就应该发财,但是同时我们又很失落,我们“受到与未来相碰撞的震荡,也许我们将踏着浪潮迈进,也许我们被消解、分解、替代”,他当时就是这样说的,实际上我们现在还处在这个过程当中。

然后第二段他说信息化、技术,这里我觉得有两个提示是非常有意思的,因为当时华东师范大学提出“社会知识交流论”,希望通过这个理论来解释我们图书馆的这些现象,在数字时代怎么样做得更好。那么他就提出了“从文化制度功能上来分析图书馆的本质,避免早期功能主义的交流理论蜕变为技术决定主义,反对用求解代替求知的急功近利的研究风气”。其实他提出的这些问题,我们实际上都掉到这坑里去了。

18

未来领导者的必备能力

未来领导者的必备能力我觉得不光是我们这个学科的,就是经过了这次疫情之后,更加就提醒我们需要:

多元化、复苏力和敏捷性

(2)预测并应对变化的性质和速度 

(3)领导力、协同力和复苏力 

(4)在复杂、混沌和混乱中游刃有余 

(5)激励他人树立愿景并迎接挑战的能力

其实就很早就有人说了,网络时代变化太快了,我们教授知识不如教授能力,但是我们的教育还是以教授知识为主。

19

培养五大能力掌握四大技能

作为信管学科或者作为图书情报档案一级学科,我们的核心能力应该体现在四大能力和四大技能的培养方面

搜索和学习能力;

批判思维、计算思维和设计思维能力;

预测变化与情景规划的能力;情景规划是一种战略方法,他就是把现在的一些变量和未来的可能性相挂钩的一种能力,它有一整套的培养方法。

知识变现/赋能的能力。我们图书馆是赋能的。

那么四大技能就是这里是提的4个问题:

(1)如何引入并管理变革?

(2)如何形成共识和并培养责任感?

(3)如何培养技术理解力并发挥最大潜能?

(4) 如何在数字孪生中领导与协同?

数字孪生就是两个世界,同样的物质世界、同样的数字世界,有一个同样的世界,在两个世界当中都要互相参照,然后在那里模拟,然后影响这里的决策等等,都要能够领导和协同。

20

“后疫情时代”是一个挑战大于机遇、变化多于确定、物竞天择适者生存的时代,原本的趋势将加速变现,原本的裸泳将最终现行。

图书馆学需要尽快找到自己的内核,更多地与实践相结合,以职业的使能者而不是革命者姿态出现,最终通过与知识内容的捆绑而不是与载体形式的捆绑,获得持久的复苏力。赋能社会是学科和事业长久立足的关键价值。

初学者关于数字人文的五个提问

1.近年来,国内外数字人文研究取得了哪些实绩与进展?
1)领域或学科已经得到公认确立。2004年为界前后两个时期
2)学会、期刊、教育都已经建立起来
3)国际和区域性学术交流会议非常活跃
4)学科正在繁荣,各相关学科都有一些成果,虽然没有特别眼睛一亮的成果,但有不少项目也算有影响。国外已有近千种专著,台湾也有20种,但大陆只有翻译的。期刊论文国内每年也有近200篇。
5)范式转型已经开始,但还远没有到位(dark side:晋升、评价等)


2.未来的数字人文研究应该注意哪些问题?或者说要坚持什么原则?
1)“大帐篷”原则,多学科融合,促进交流。目前很不平衡。
2)注重学科建设和理论研究,从教育培训入手。目前刚刚开始。
3)重视基础设施建设,基金进入,项目导向。
4)注重数字人文的本土性和民族特色,价值观引领,传承优秀中华文化非常有必要。

3.数字人文研究,具体会给传统研究范式、方法、视角带来怎样影响和变化?
影响是颠覆性的。两个方面:
1)不同程度改变原有人文社会科学
2)产生很多新的问题,带来交叉边缘领域,甚至创造新学科 不仅仅是方法方面的革新,就像试验设备的提高带来自然科学的进步一样,会造就新的内容。 数字人文也是数据科学的一种实践领域。

4.目前中华优秀传统文化的发展在您看来存在怎样的困境或者问题呢?
1)中华优秀文化的传播需要有两个基础要素:载体和形式,文献典籍文物遗产是载体,数字人文提供新形式。目前这两方面都准备不充分,基础设施、人才培养、工具方法都存在不足。
2)目前的最大问题有两个:源头上无法界定精华和糟粕;传播上缺乏吸引新一代并代表未来的方式方法手段
3)观念上重视、理念上面向未来面向国际,大力投入加强教育和基础设施建设,同时需要有一套指标体系和评价方法

5.如果存在问题,那么数字人文在哪些方面可以有所帮助呢?
简单而言:中国的数字人文一定是基于中国优秀的传统文化才有生命力,中国优秀的传统文化需要借助于数字人文才有未来。

未来已来!拥抱一个全新的开放平台时代

本文为《中国图书馆学报》2020年第一期“FOLIO专辑”主持人语

图书馆行业从来没有像今天这样接近自己的理想,也从来没有像今天这样面临巨大的挑战。

1931年阮冈纳赞提出图书馆学五定律,指出“书有其用”、“人有其书“、”书有其人”、“节省时间”,以及“图书馆是一个生长的有机体”。这充满理想主义的五条原则,是博尔赫斯“图书馆是天堂模样”的最好诠释,然而它其实一直是一个梦想,直到信息技术高度发展的今天,才有了实现的可能。

如果不是大数据和机器学习技术,我们不可能突破二八定律为长尾图书找到小众读者,不可能实现信息资源的精准推送,也不可能通过用户参与而优化采购,通过数据驱动型知识服务而实现图书馆向“数据馆”和“知识库”转型。所有这一切都有赖于一个全媒体、全流程、全网域系统平台的支持,有赖于突破传统系统只专注于图书馆自身业务,而忽略读者和用户的多样化需求和越来越高的体验要求。

当今一个理想的图书馆平台,绝不能只有采访编目流通等几个模块,而应该提供一个应用生态,任何图书馆的功能需求都有相应的app得到满足。其中甚至不局限于图书馆行业,而成为博物馆、美术馆、档案馆、文化馆等人类记忆机构通用或共享的服务。就像智能手机有应用商店一样,只要有需求,就能找到相应的app,通过建立一套技术标准规范,就能使大众的创造力得到充分发挥,并把公共文化机构的服务潜能充分挖掘出来。

这样的应用生态只有开放的平台才能够做到,而且是图书馆行业主导的开放平台,图书馆对自己的系统、业务和数据具有完全的掌控。这个平台让人人都可以开发app,这样图书馆所需要的所有功能,才有可能有足够多的商家提供服务;不同商家开发的app,才可能相互替换,并且随时挂接或插拔;图书馆的各类数据和模块,才能当然地互联互通。于是图书馆将不再依赖于个别的系统供应商,图书馆的数据安全也得到充分的保障:它只属于图书馆,或者读者自己。

这个平台现在已经诞生,它就是FOLIO,即“未来的图书馆是开放的(Future Of Library Is Open)!”

本期专辑汇集了四篇论文,是上海图书馆FOLIO应用团队对这套全新的图书馆开放平台进行初步研究的成果。上海图书馆23年前引进了当时最先进的C/S结构系统,现已经历了B/S和移动互联网两代的发展,直接进入基于微服务的开放平台架构。现已打算应用这套平台。

  • 周纲 和孙宇的《开创性的下一代图书馆服务平台解决方案》一文全面介绍了FOLIO的技术架构和生态环境,对其如何解决长期困扰图书馆运营的实践问题,如云模式、性价比、功能自主性、安全可控性、系统开放性和服务可靠性等进行了较为深入的探讨,重点分析了Folio技术架构和生态环境等方面的优势以及可能碰到的问题。
  • 郭利敏和张磊的《Folio专题_Folio的技术选型与运营模式研究》结合微服务技术介绍了FOLIO平台技术选型的原因,讨论了FOLIO的社区组织和商业模式之间的关系,对FOLIO在国内的落地提供了相关方案和思考。
  • 许磊和夏翠娟的《第三代图书馆服务平台的元数据管理》着重研究了FOLIO独具特色的底层数据管理架构Codex,认为Codex作为FOLIO中核心的元数据管理域,被设计成Folio的资源链接中心、规范数据中心和跨域的全媒体资源管理入口,能够通过模型中的抽象实体揭示资源间关系,其源自于BIBFRAME的抽象数据模型、最小化的元数据方案、统一的分层描述原则等考虑都远远领先于目前所有的图书馆管理系统,具有足够的灵活性支持第三代图书馆或类似机构各类实体对象的描述与组织。
  • 孙宇和周纲的《Folio专题_基于微服务架构的资源发现系统平台的构建研究》
  • 则重点研究了FOLIO中的资源发现模块,介绍了基于微服务架构的新一代资源发现系统的架构和组成,该系统架构融合了数据收割和联邦检索技术,加强了开源元数据的应用,可以真正实现馆藏所有资源的统一发现和获取,文章还展现了发现系统的本地化应用场景和服务模式。

随着今年年底FOLIO在瑞典Chalmers大学的成功部署,一个开放的、自生长的、由图书馆主导的应用生态将正式落地,真正的下一代系统正在到来!技术将成为图书馆服务创新最大的使能者和推进器。未来已来,让我们拥抱一个全新的开放平台时代!

作为数字人文基础设施的图书馆:从不可或缺到无可替代

本文为为《图书馆论坛》2020年数字人文栏目组稿的一期专辑主持人语。

根据CNKI的数据,国内迄今发表的近700篇以”数字人文“为主题的论文中,来自图书情报档案领域的文章大约超过60%。对比国外,Web of Science (Core Collection)收录了1590篇以“digital humanities”为topic的论文,Inforamtion Science Library Science领域的文章约为300篇,占比不到20%。这两组数据显示了国内外数字人文研究学科来源的巨大差异。

这说明了什么呢?虽然我们并不认为国外的比例就是数字人文知识版图的“完美”配方,但我们的比例一定是不合理的。人文学科的数字疆域,第一批居民主要来自图书情报领域,怎么说都不能让人服气。

这其中固然有国内图书情报学者更喜欢追新的原因,也是国内人文领域的学者尚未觉醒、尚未充分准备好的结果。就像当初旧金山发现了金矿,涌入的首批淘金者并没有赚到钱,而各类服务业却异军突起。图书馆行业作为历史文献的主要保留地,由于数字图书馆带来先知先觉,理所当然地成为数字人文最早的基础设施建设者。

传统的文献考据和现代的文献计量学都为数字人文作为一个整体的跨学科研究领域提供了方法论借鉴,书目控制带来的规范控制借助于语义技术,天然地为知识的形式化组织(采用本体技术)和知识服务提供了可信的编码基础,也为机器学习和人工智能的发展提供了宝贵的标注语料库。如果说不了解目录之学就无法窥知传统学术门径的话,不懂得以文献计量为代表的统计分析方法就无法真正从事数字人文研究。当然,当今数字人文的方法体系已经得到了极大拓展,统计分析的对象从文献深入到了语词文本、社会关系、时空关系乃至经过模型化之后的各类关系。但无论多么复杂,数据永远是基础,拥有大量数据的图书馆永远是人文研究的可靠伙伴。

图书馆要提供基于知识的服务还需要在数字图书馆的基础上不断提升水平,包括提升资源加工的语义化水平和提供分析统计及可视化工具。上海图书馆在国内属于对数字人文的先知先觉者之一,借助于20多年前开始的持续不断的数字化,大量的传统文献和特色文献已经搬运到了数字世界,一旦数字人文的研究方法和相关技术得以成熟,很自然地占据了有利的跑道。

本辑的四篇文章虽然反映不了上海图书馆在数字人文领域积极开拓的全貌,但包含了一些新的思考。图书馆这类人类记忆机构在数字人文的发展过程中,固然由于其资源收藏而不可或缺,但真正使其无可替代的,并不是这些馆藏资源,而是其服务能力。在当今以ABCD(人工智能、区块链、云计算和大数据)为特征的数字时代,“知识作为一种服务(KaaS)”才是图书馆的立身之本。本专辑反映了数字人文平台建设的两大趋势:边服务边建设的开放众包思想,和从数字图书馆到数据图书馆的必要升级。这两者是“后数字图书馆时代”我们在面向数据驱动型或数据密集型研究进行转型时必须首先实现和超越的。

  • 贺晨芝和张磊的《图书馆数字人文众包项目实践、分析与思考》重点介绍了数字人文领域的众包应用现状,以及上海图书馆自2016年以来的实践经验。上海图书馆开发了两个独立的众包应用,即抄录平台和验证码应用,都可以以SaaS方式开放给同行使用。
  • 刘倩倩和夏翠娟的《家谱知识服务平台众包模式的设计与实现》针对上海图书馆的家谱特藏,在原来提供基本查询和关联功能的数字人文平台基础上,开发了上传家谱、在线识谱、在线修谱等功能,尝试引入众包模式不断优化系统,并与用户社区积极互动密切合作,使用户不仅作为数据的消费者,同时也作为贡献者。
  • 朱武信和夏翠娟的《命名实体识别在数字人文中的应用—基于ETL的实现》介绍了一种借助于专门词典、批量自动进行名称实体识别的方法(即ETL方法),该方法在上海图书馆的数字人文平台建设中已普遍采用,取得了良好的效果。其原理是将文本中有意义的名称(例如人物、地点、时间、事件、专有概念等)利用程序进行自动析取,经过判断之后进行数据数据化转换(通常是加上URI),并提供丰富的语义关系。
  • 张喆昱和张磊的《记忆机构开放数据建设及数据化转型模式研究》触及了两个关键性主题:数据化和开放服务,试图将上海图书馆的实践进行一般化和通用化,分析了如何通过数据化更加贴近人文学者的需求,让系统更加人性化,然后通过开放服务引入外部资源,反过来促进系统的数据化。

上海图书馆希望通过自己的实践,为人文研究的赛百基础设施建设提供一个参考样本。发表这些做法,并不是说我们的做法有多先进,而只是一种不揣浅陋的抛砖引玉。我们深知,国内的数字人文目前还处于起步阶段,争论大于共识、口水多于实践,但只要大家参与,未来就前景可期。数字人文迄今为止形成的最大共识,就是大家都同意它是一个人人都受欢迎从而能各得其所的“大帐篷”。愿这个大帐篷使我们各门人文学科都得到繁荣兴旺!

WOLFcon2020大会发言

It’s been with great pleasure for me to come a long way across the planet, to join you in the big family, to celebrate the ongoing birth of our future platform, especially in the very special Chinese Lunar New Year. So Let me say Happy New Year to you once again! Happy the Rat Year!

The year of the Rat is a beginning of a new round of China Zodiac circle. Usually it means a brand new beginning. That’s what we hope for the FOLIO to bring us with: A New Beginning. 

This is my home town, Shanghai, a city always attracts Hollywood shooting Sci-fi movies, showing the post-mordern future society of our mankind. It is full of exciting things and opportunities. It is a perfect place to announce the final release of FOLIO I think.

This is Shanghai Library, the biggest city library in China, maybe the biggest of its kind around the world. The population of Shanghai city is 23 million. About a quarter had a reader’s card issued from my library. More than 3 million people visited my library and checked out nearly 30 million books every year. The peak circulation transaction number is 66 million in a year. But the circulation is not accomplished only by my library, we’ve got more than 250 libraries in a three-tier library system. We don’t belong to each other, but use only one integrated library system. We are a consortium.

The present Shanghai Library has opened to public in 1996. With the economic development, the budget of Shanghai Library has been increased from around 30 million USD in 1996 to 70 million USD last year. But the service capacity and key indicators have not been improved at the same time. We are not satisfied with the accessibility of our resources and the quality of our services, as well as the realization of the core values as a public library.

Our magnificent powerful Integrated Library System is Horizon, as you may know, it is from SirsiDynix. After running for more than two decades, when we set higher goals to serve more people and construct a new library building with 115,000 square meters, and expand our consortium to more than two thousand community libraries and service points, the Horizon system has no longer been able to meet our needs. At first, We decided to choose a safer way to upgrade our system to the Symphony, which is also from Sirsidynix, so as to have their services. But when the company notified us that they were no longer fulfilling the contract, returned the money and withdraw from China, I knew it was the darkest day in my career. 

Lucky enough we met FOLIO just in time.  We fell in love with FOLIO at the first sight. The open and sharing spirit of FOLIO perfectly matches the ideas of the Library. It is just what we are looking for for many years. Honestly, this step is a little bit bold, but we think it is worth to take the risk. I love the ideas which Sebastian Hammer stated in his speech “Library as a platform” at ELAG2016 conference that the FOLIO should be fully open sourced and act as an operation system for the library, and it will have an App Store for libraries to choose whatever applications they want to run.  He also pictured an amazing “by the community, with the community and for the community” vision of FOLIO.  These ideas are major breakthroughs in the library history I think. And we are very happy to see most of them have been realized in the next few years. 

We think the future shape of the library is a moving target. The service platform should be flexible enough to adapt all kinds of new technologies and requirements into the platform. From this point there is no such a platform better than FOLIO to accomplish the countless and agnostic requirements for libraries in the future.

But now we have to realize some key requirements:

  • It should be a multi tenant platform not only for Shanghai Library, but tens of branch libraries, which have their own sub branches, as a whole consortium.
  • It should support to 100 million circulation transaction in a year.
  • It should look after all kinds of activities by up to 15 million registered users.
  • It should provide collection management solutions for all kinds of culture heritage resources.
  • It should provide SaaS ecology with multiple extension modules (eg. SoLoMo services, Data Analytics, etc) by multiple local vendors.
  • It would help libraries to redefine itself in a new environment and re-engineering its workflow to meet new requirements.

We start our journey to investigate, learn and develop with FOLIO at the end of 2018. This slide lists most of the companies and institutions involved.

Now we have a team of more than 50 people, consists of librarian as PO and developers from 10 company partners. I put their names here but I won’t read them, just want to give them a recognition before you in this world wide community. So can you give them a round of applause? I am sure they can hear and be encouraged.

They are from those companies and institutions above.

By the end of 2020, we focus on the development of the Resource Access/Circulation module, the Collection Management/Inventory module and the System Management module. We also have partners working on the Acquisition/Order module and the Reading Promotion modules. 

We established the Shanghai FOLIO Alliance to joint efforts on the FOLIO implementation among Shanghai Central Library Consortium. The Alliance is under the supervision of the Shanghai Society of Libraries. It can prevent its member library to apply non FOLIO compatible module before FOLIO implementation. There are eight companies and 17 libraries as first members to join the Alliance.

The Chinese library community has been paying great attention to FOLIO from the beginning, and we also try to attract them into the FOLIO community, to popularize the concept of open source and expand our influence. 

We now have a loose national community led by CALIS (China Academic Library and Information System). We plan to upgrade to a semi-formal national alliance to advance the following community work:

  • Translating, including interfaces, documents and all kinds of materials when necessary
  • Chinese Natural Language Processing supporting, such as segmentation, sequencing…etc.
  • Local Knowledge Organization System supporting, like Chinese Library Classification, etc.
  • Developing and Maintaining the FOLIO Chinese version align with the international version, and maintaining local Knowledge Base.
  • Joining the development to contribute to new ideas such as data lake, linked data, machine learning, blockchain etc.
  • Module Compatibility Testing and Evaluating, and running a local App Store.
  • Issueing  Specifications and Best Practices, Outreaching and promotion, training, help implementing or migration, …etc.

We don’t want Chinese FOLIO application to be another information island. There would be no future if Chinese FOLIO community isolated from the international community. So we need a lot of help from you.

  • We need to know more about the whole architecture and backend technology.
  • We have to deal with local needs as a large central public library, such as massive concurrent processing, response performance, scalability, ease of use and user experiences.
  • We should provide multi-tenant environment to meet the different needs of different libraries in a large consortium.
  • We would encourage local teams to develop extensive modules to meet local needs
  • And we are going to establish Chinese application marketplace after you set up of FOLIO App Store

As the demands from China are so intense that the community decided to hire a PO who has the capability of bilingual, knowledgeable of software engineering and library business, to help us to communicate and coordinate with the international Community. After several months of recruiting, when we almost have no hope for such a panda position, Cate found one for us. The recruitment is  underway. It’s amazing.

We can’t wait for so many good ideas from FOLIO to come true, so we could make our contribution as much as possible.

As a small contribution to this conference, we made badges based on FOLIO’s logo and brought them to everyone here. So don’t forget to get one from my colleagues in the lobby (around the corner/by the door of the meeting room).

We are very appreciated for your efforts on developing FOLIO. We are very glad to see the growth of the  community. I truly understand the engagement of the community is the key for the success of FOLIO. I think It is far from enough by now. So we are very glad to be a part of it and to make contribution. There are 3000 public libraries and 1200 college libraries in China, which are eager to see a new library platform and waiting for FOLIO. We would like to invite you to hold a WolfCon or FOLIO Show in China in 2021 when the new Shanghai Library East Building has a grand opening. Let Shanghai library be your host.

Thank you very much.

人工智能与科技情报工作

本文为《竞争情报》杂志2018年5月的一次访谈内容,最终版本请参阅该刊。

问:在SCIP2017年的年会上,美国人工智能研究所(AiAi)主席Al Naqvi先生提及了这样一个观点“人工智能属于战略部门而非技术部门”,您如何看待这个提法?

答:这种认识在当下有一定的道理。对于一些颠覆性技术,首先需要把握它的宏观战略影响,才能制定合理的措施加以应对。但是对人工智能必须认识到它既有战略层面的影响,又需要有战术层面的布局。就像工业化的起步,一开始的影响并不是全方位的,而只是在某些行业领域、或一些行业的某些环节带来颠覆,然后再扩展到整个产业链,乃至人类社会生活的各个方面。

不懂得AI的战略意义,就无法从10万米高度看清形势,无法做到及时转型和布局;不懂得操作层面的影响,就不知道从何入手,战略决策也将成为空中楼阁。对于情报工作而言,人工智能带来的战略影响是全局性和根本性的,因为情报工作本身就是一种信息过程,从情报的搜集、处理、归纳、分析、整理,在一定的框架内得出结论或提出建议,指导决策或带来行动,无一不是一种智力劳动的结果,人工智能从原理上来说,除了带有情感的、需要人情练达或创意审美的“创造”还无法做到之外,只要是客观的、“科学的”和可重复的过程,假以时日,应该都能解决。从战术层面来说,目前还处在弱人工智能(Artificial Narrow Intelligence,简称ANI)的发展阶段,情报过程的局部过程或部分工作交给机器来完成,已经毫无问题。当前计算机视觉、自然语言处理、自动翻译、语音识别、数据挖掘、文本处理与分析、名称实体识别、自动摘要和报道、自动舆情监控等相关技术已日趋成熟,完全能够应用于情报工作,极大地节省人力并提高效率。

问:管理层通常只愿意为当下的利益买单,设想如果您是一家尚未真正开始考虑人工智能的机构中的战略或情报专家,您如何说服管理层更多地考虑人工智能对公司的影响,并及早对此作出应对?

答:当前的智能化浪潮很容易让人联想起20多年前开始的信息化浪潮,情形十分相似。当时有个说法:企业不信息化(如采用ERP+CRM)要死,而(不合适的)信息化可能死得更快。当时针对普遍采用的ERP(企业全资源管理系统),产业界有人提出一个“三分论”,即三分之一的ERP能用,三分之一修修改改勉强能用,还有三分之一是彻底失败。当初上马一套ERP系统的平均成本是数千万到数亿美元!失败导致的后果常常是一蹶不振甚至最终黯然离场。主流经济学理论对信息化的解释都认为其本身并不具备很好的投资回报率(ROI),但当大家都开始用信息技术进行流程再造时,不进行信息化肯定死路一条。当前智能化浪潮正席卷而来,如果把工业化当作人类体力的延伸的话,智能化才是真正的人脑延伸,当初的信息化还只是智能化的前奏。

对于如何说服管理层,我觉得可以有三条道路:一是多学习AI,了解其能力,通过原理和案例来说服管理者。我们可以看到由于智能分析系统的进步,使得法律助理和证券分析行业已经几乎完全被人工智能所取代,同声传译行业也正在发生同样的事情,这类行业受到人工智能的直接冲击,就是由于相关技术的成熟而直接导致,他们其实都是情报工作的近亲。二是开始着手尝试AI的应用,在搜索查询、跟踪、清洗、建库、编辑、撰写、发布、交流等情报工作流程中各个可能的环节中尝试AI的应用,让事实来说话。一开始肯定会有一定成本,甚至会走一些弯路,但对整个行业来说趋势是明显的,必然会应用到人工智能,享受到巨大的好处。如果管理层实在顽冥不化,则可以祭出终极武器:跳槽到应用了AI的机构里去。

问:人工智能会先影响某个行业吗?还是人工智能将同时为所有行业带来变革性的影响?

答:新技术的开端从来都是不均衡的,人工智能一定会在某些行业,或者某个行业的某些“工种”得到应用,然后再波及整个生态或产业链。科幻作家威廉吉布森(WilliamGibson)曾有一句名言:“未来已来,只是尚未流行而已”。人工智能就是一种“弥漫性”、“基础性”技术,它的影响不是局部性和行业性的,它甚至会对人类社会产生根本性的影响,已经引发关于对人类未来命运产生影响的哲学性思考。

当前人工智能取得重大进展,各类投资蜂拥而来,有人认为我们已经彻底告别了曾经经历了两次的“人工智能之冬”。无论这种乐观是否有足够的依据,我们都必须清醒地认识到,当前人工智能的突破并不是全方位和无条件的,而只是由于在计算机硬件性能得到高速发展和移动网络应用造就大数据随处可得的背景下,以深度学习为代表的人工神经网络取得了实质性的突破,带来计算机视觉、语音识别、机器翻译等认知计算领域的突破,至于为什么会造成如此突破,计算机科学家也莫衷一是,目前还被认为是一个“黑箱”,缺乏让人信服的理论解释。计算机科学家还在寻找机器学习的终极“圣杯”,这个过程应该不是短期内所能完成的。

在可能受到人工智能直接影响的行业中间,情报工作是一个很有意思的实践领域,它一方面由于其“尖兵”和“耳目”的作用历来被高度重视,另一方面由于内容领域的广泛性和方法工具的动态复杂性而一直“找不到北”,一直徘徊于许多相关理论和学科的边缘或末梢,唯一的应对措施是必须尽快地适应。这也可能是它的宿命。当前在人工智能背景下“智慧情报”的概念被适时地提出,即要求情报工作更多地采用基于大数据的分析过程,并在工作流程上更多地应用群体智慧、团队协同,以及自动跟踪、处理、预警和报告的方式,建立数据驱动/数据密集型的情报过程,并发挥模型、工具和算法的优势,是“智慧情报”的两个关键环节。这就不是过去以个人或小团队的作坊式的工作方式,以及基于不完全情报的“顿悟”过程所能够实现,这也使得情报工作有了更高的门槛。当然这个过程也不是一蹴而就的,过去的情报经验在建立模型、开发工具和实现算法方面需要发挥重要作用,并且会经历不断实践和“试错”的过程。

问:您如何看待人工智能改变关于隐私的话题?您是否担忧这可能会成为一个问题?

答:关于隐私,李彦宏的一句话虽然无良但却真实:隐私可以换取便利。人工智能是建立在海量获取数据的基础上的,人的智慧也是建立在大量认知的基础上,未来的个性化医疗、精准化服务,无一不是建立在放弃一部分隐私基础上的,所以问题的关键并不在于隐私的使用,而在于隐私在使用过程中如何能够得到有效的保护,是否有严格的法律及监管体系,能否对于隐私侵犯行为施以严刑峻法,才是我们这个物欲过度、道德不足的跛足社会应该认真考虑的问题。

隐私问题的受害者是普通用户,然而现在却总是成为业界大佬们相互攻奸的利器,例如最近华为与腾讯为隐私实践而起的冲突,这本身就是一个非常不正常现象。法律和政策的制订者不能代表弱势的普通用户发声,不能为真正的受害者伸张正义,而沦为资本的代言人,就永远没有公正可言,隐私问题也将永远是个问题。

问:普华永道(PWC)的一份研究报告称,人工智能将在2035年之前将许多发达国家的经济增长率翻一番。您是否同意这些经济收益会使全球性的发达国家和发展中国家之间的不平等变得愈加严重?中国如何能在这场人工智能的变革中不落伍?

答:人工智能一方面使不发达国家的劳动力优势不复存在,另一方面也使国民素质对于经济发展的影响力降低,因此,在帮助发达国家发展经济的同时,AI也缩小了不发达国家在生产要素方面的劣势。究竟哪个因素起到更大的作用,目前还很难察觉和下结论。

中国迄今在人工智能领域虽然并不处于第一梯队,但进展还是可圈可点、并不落伍的,一方面有一流的互联网公司高度重视这个领域并大量投资,常常能招募到美国顶尖的人工智能专家和团队;另一方面有国家从战略高度政策扶持和产业倾斜。应该说在人才、资金、市场等方面都没有问题,最大的问题是观念的开放性和对研发规律的认识。

在开放观念方面,人工智能从长远看是一个赢者通吃的领域,因此大家除了在技术上尽快取得突破之外,一旦有了一定技术优势,都极尽全力把尽快占领市场看成是高于一切的竞争策略,而只有足够开放,例如充分利用开源,才能迅速聚集更多的第三方力量并最终获得最大的市场占有率。因此这个领域进行技术竞争时很重要的是必须放弃急功近利和零和思维。国内的人工智能公司在一个封闭的市场中往往表现得封闭和急功近利。

在对于人工智能研发的政策扶持方面,我们常常习惯于傍大款、服从马太效应而不是营造公平的竞争环境,政府在支持基础研究方面的角色也常常被忽视,而更多地把公共资金直接投入到所谓“有前景”的公司,使得这些公司不思进取,甚至起到了助纣为虐的作用。

人工智能是一项具有全局意义的颠覆性技术,与全球变暖和核武器技术一样,处理不好甚至会危及到人类自身的生存和发展,因此我们必须依靠全人类的合作才有赢的希望。就像习总书记所说,我们是同一个人类共同体中的成员,和则两利,斗则俱伤。