人工智能与科技情报工作

本文为《竞争情报》杂志2018年5月的一次访谈内容,最终版本请参阅该刊。

问:在SCIP2017年的年会上,美国人工智能研究所(AiAi)主席Al Naqvi先生提及了这样一个观点“人工智能属于战略部门而非技术部门”,您如何看待这个提法?

答:这种认识在当下有一定的道理。对于一些颠覆性技术,首先需要把握它的宏观战略影响,才能制定合理的措施加以应对。但是对人工智能必须认识到它既有战略层面的影响,又需要有战术层面的布局。就像工业化的起步,一开始的影响并不是全方位的,而只是在某些行业领域、或一些行业的某些环节带来颠覆,然后再扩展到整个产业链,乃至人类社会生活的各个方面。

不懂得AI的战略意义,就无法从10万米高度看清形势,无法做到及时转型和布局;不懂得操作层面的影响,就不知道从何入手,战略决策也将成为空中楼阁。对于情报工作而言,人工智能带来的战略影响是全局性和根本性的,因为情报工作本身就是一种信息过程,从情报的搜集、处理、归纳、分析、整理,在一定的框架内得出结论或提出建议,指导决策或带来行动,无一不是一种智力劳动的结果,人工智能从原理上来说,除了带有情感的、需要人情练达或创意审美的“创造”还无法做到之外,只要是客观的、“科学的”和可重复的过程,假以时日,应该都能解决。从战术层面来说,目前还处在弱人工智能(Artificial Narrow Intelligence,简称ANI)的发展阶段,情报过程的局部过程或部分工作交给机器来完成,已经毫无问题。当前计算机视觉、自然语言处理、自动翻译、语音识别、数据挖掘、文本处理与分析、名称实体识别、自动摘要和报道、自动舆情监控等相关技术已日趋成熟,完全能够应用于情报工作,极大地节省人力并提高效率。

问:管理层通常只愿意为当下的利益买单,设想如果您是一家尚未真正开始考虑人工智能的机构中的战略或情报专家,您如何说服管理层更多地考虑人工智能对公司的影响,并及早对此作出应对?

答:当前的智能化浪潮很容易让人联想起20多年前开始的信息化浪潮,情形十分相似。当时有个说法:企业不信息化(如采用ERP+CRM)要死,而(不合适的)信息化可能死得更快。当时针对普遍采用的ERP(企业全资源管理系统),产业界有人提出一个“三分论”,即三分之一的ERP能用,三分之一修修改改勉强能用,还有三分之一是彻底失败。当初上马一套ERP系统的平均成本是数千万到数亿美元!失败导致的后果常常是一蹶不振甚至最终黯然离场。主流经济学理论对信息化的解释都认为其本身并不具备很好的投资回报率(ROI),但当大家都开始用信息技术进行流程再造时,不进行信息化肯定死路一条。当前智能化浪潮正席卷而来,如果把工业化当作人类体力的延伸的话,智能化才是真正的人脑延伸,当初的信息化还只是智能化的前奏。

对于如何说服管理层,我觉得可以有三条道路:一是多学习AI,了解其能力,通过原理和案例来说服管理者。我们可以看到由于智能分析系统的进步,使得法律助理和证券分析行业已经几乎完全被人工智能所取代,同声传译行业也正在发生同样的事情,这类行业受到人工智能的直接冲击,就是由于相关技术的成熟而直接导致,他们其实都是情报工作的近亲。二是开始着手尝试AI的应用,在搜索查询、跟踪、清洗、建库、编辑、撰写、发布、交流等情报工作流程中各个可能的环节中尝试AI的应用,让事实来说话。一开始肯定会有一定成本,甚至会走一些弯路,但对整个行业来说趋势是明显的,必然会应用到人工智能,享受到巨大的好处。如果管理层实在顽冥不化,则可以祭出终极武器:跳槽到应用了AI的机构里去。

问:人工智能会先影响某个行业吗?还是人工智能将同时为所有行业带来变革性的影响?

答:新技术的开端从来都是不均衡的,人工智能一定会在某些行业,或者某个行业的某些“工种”得到应用,然后再波及整个生态或产业链。科幻作家威廉吉布森(WilliamGibson)曾有一句名言:“未来已来,只是尚未流行而已”。人工智能就是一种“弥漫性”、“基础性”技术,它的影响不是局部性和行业性的,它甚至会对人类社会产生根本性的影响,已经引发关于对人类未来命运产生影响的哲学性思考。

当前人工智能取得重大进展,各类投资蜂拥而来,有人认为我们已经彻底告别了曾经经历了两次的“人工智能之冬”。无论这种乐观是否有足够的依据,我们都必须清醒地认识到,当前人工智能的突破并不是全方位和无条件的,而只是由于在计算机硬件性能得到高速发展和移动网络应用造就大数据随处可得的背景下,以深度学习为代表的人工神经网络取得了实质性的突破,带来计算机视觉、语音识别、机器翻译等认知计算领域的突破,至于为什么会造成如此突破,计算机科学家也莫衷一是,目前还被认为是一个“黑箱”,缺乏让人信服的理论解释。计算机科学家还在寻找机器学习的终极“圣杯”,这个过程应该不是短期内所能完成的。

在可能受到人工智能直接影响的行业中间,情报工作是一个很有意思的实践领域,它一方面由于其“尖兵”和“耳目”的作用历来被高度重视,另一方面由于内容领域的广泛性和方法工具的动态复杂性而一直“找不到北”,一直徘徊于许多相关理论和学科的边缘或末梢,唯一的应对措施是必须尽快地适应。这也可能是它的宿命。当前在人工智能背景下“智慧情报”的概念被适时地提出,即要求情报工作更多地采用基于大数据的分析过程,并在工作流程上更多地应用群体智慧、团队协同,以及自动跟踪、处理、预警和报告的方式,建立数据驱动/数据密集型的情报过程,并发挥模型、工具和算法的优势,是“智慧情报”的两个关键环节。这就不是过去以个人或小团队的作坊式的工作方式,以及基于不完全情报的“顿悟”过程所能够实现,这也使得情报工作有了更高的门槛。当然这个过程也不是一蹴而就的,过去的情报经验在建立模型、开发工具和实现算法方面需要发挥重要作用,并且会经历不断实践和“试错”的过程。

问:您如何看待人工智能改变关于隐私的话题?您是否担忧这可能会成为一个问题?

答:关于隐私,李彦宏的一句话虽然无良但却真实:隐私可以换取便利。人工智能是建立在海量获取数据的基础上的,人的智慧也是建立在大量认知的基础上,未来的个性化医疗、精准化服务,无一不是建立在放弃一部分隐私基础上的,所以问题的关键并不在于隐私的使用,而在于隐私在使用过程中如何能够得到有效的保护,是否有严格的法律及监管体系,能否对于隐私侵犯行为施以严刑峻法,才是我们这个物欲过度、道德不足的跛足社会应该认真考虑的问题。

隐私问题的受害者是普通用户,然而现在却总是成为业界大佬们相互攻奸的利器,例如最近华为与腾讯为隐私实践而起的冲突,这本身就是一个非常不正常现象。法律和政策的制订者不能代表弱势的普通用户发声,不能为真正的受害者伸张正义,而沦为资本的代言人,就永远没有公正可言,隐私问题也将永远是个问题。

问:普华永道(PWC)的一份研究报告称,人工智能将在2035年之前将许多发达国家的经济增长率翻一番。您是否同意这些经济收益会使全球性的发达国家和发展中国家之间的不平等变得愈加严重?中国如何能在这场人工智能的变革中不落伍?

答:人工智能一方面使不发达国家的劳动力优势不复存在,另一方面也使国民素质对于经济发展的影响力降低,因此,在帮助发达国家发展经济的同时,AI也缩小了不发达国家在生产要素方面的劣势。究竟哪个因素起到更大的作用,目前还很难察觉和下结论。

中国迄今在人工智能领域虽然并不处于第一梯队,但进展还是可圈可点、并不落伍的,一方面有一流的互联网公司高度重视这个领域并大量投资,常常能招募到美国顶尖的人工智能专家和团队;另一方面有国家从战略高度政策扶持和产业倾斜。应该说在人才、资金、市场等方面都没有问题,最大的问题是观念的开放性和对研发规律的认识。

在开放观念方面,人工智能从长远看是一个赢者通吃的领域,因此大家除了在技术上尽快取得突破之外,一旦有了一定技术优势,都极尽全力把尽快占领市场看成是高于一切的竞争策略,而只有足够开放,例如充分利用开源,才能迅速聚集更多的第三方力量并最终获得最大的市场占有率。因此这个领域进行技术竞争时很重要的是必须放弃急功近利和零和思维。国内的人工智能公司在一个封闭的市场中往往表现得封闭和急功近利。

在对于人工智能研发的政策扶持方面,我们常常习惯于傍大款、服从马太效应而不是营造公平的竞争环境,政府在支持基础研究方面的角色也常常被忽视,而更多地把公共资金直接投入到所谓“有前景”的公司,使得这些公司不思进取,甚至起到了助纣为虐的作用。

人工智能是一项具有全局意义的颠覆性技术,与全球变暖和核武器技术一样,处理不好甚至会危及到人类自身的生存和发展,因此我们必须依靠全人类的合作才有赢的希望。就像习总书记所说,我们是同一个人类共同体中的成员,和则两利,斗则俱伤。

FOLIO年度进展回顾(视频)

1月最后一天FOLIO网络会议回顾了年度进展,2018年社区取得了很大的发展,开发者人数、活动参与人数都翻倍增长,发展势头良好。

以下嵌入视频,可以打开中文字幕(自动翻译)。

主持人:Laura Wright, University of Colorado Boulder
访谈嘉宾:Christopher Spalding (EBSCO),Michael Winkler (OLE)和Sebastian Hammer (Index Data)

21位DH学者谈数字人文

值得一看的一组视频,带中文字幕。需科学上网,工具自备。

My Digital Humanities – Part 1: https://www.youtube.com/watch?v=I8aRtHW3b6g

Stéfan Sinclair – McGill University, 
Geoffrey Rockwell – University of Alberta, 
Laura Mandell – Texas A&M University, 
Bryan Carter – University of Arizona, 
Claire Clivaz – Swiss Institute of Bioinformatics, 
Bill Endres – University of Oklahoma

My Digital Humanities – Part 2: https://www.youtube.com/watch?v=WdSTQwI5Qz4 

Toma Tasovac from the Belgrade Center for Digital Humanities who gives his own definition of Digital Humanities. In this video, Toma addresses both sides of the Digital Humanities coin. On the one hand, he argues that DH runs the risk of becoming a ‘decontextualiser of the traditional humanities turning everything into conveyor belt scholarship’. On the other hand, he believes that DH enables deeper and more meaningful engagements with our (digitised) cultural heritage in ways and forms that were not available before

My Digital Humanities – Part 3: https://www.youtube.com/watch?v=FAODJW5ytd0 

Kenneth Price (University of Nebraska), 
Elena Pierazzo (Université Grenoble Alpes), 
Elli Bleeker (University of Antwerp), 
Patricia Murrieta Flores (University of Chester), 
James Cumming (University of Oxford)

My Digital Humanities – Part 4: https://www.youtube.com/watch?v=iLqEkXvhPu8

Roderick Coover (Temple University),
Angel D. Nieves (Hamilton College), 
Kathryn Sutherland (University of Oxford), 
Marjorie Burghart (Centre National de la Recherche Scientifique),
Paul Eggert (Loyola University Chicago)

My Digital Humanities – Part 5: https://www.youtube.com/watch?v=4Pvi2J61P0g

Joris van Zundert (Huygens Institute for the History of the Netherlands)
Graeme Earl (University of Southampton/King’s College London)
Mathew Vincent (Bruno Kessler Foundation) 
Federico Meschini (Tuscia University).

系庆四十周年发言

非常感谢星主任的邀请,我正好有很多话要说。

但是昨天重感冒失了声,担心失礼,写了个书面发言,好在今天还行。

感谢母校感谢CCTV的话我就不多说了,大恩不言谢,谢是谢不完的。大学四年是人生中最重要的阶段,难忘的八十年代,我有不少同学在美丽的丽娃河畔一起度过了七年时光,“三观”就是这个期间形成的,七年足够决定一生。我们都是母系塑造的,可能有些人多些有人少些,但都是决定性的。

校园是铁打的营盘流水的兵,我们心中的母系既是现在的系,又不是这个系,校园中有让我们深深眷恋的,也有让我们感到陌生和失落的。比方现在来到校园看到一张张年轻靓丽的脸,我就感到青春的逝去,很失落。

这里有我们熟悉的建筑道路,花草树木,偶尔回来,我甚至会觉得那些熟悉的窗户后面依然有熟悉的身影,所有看到的东西与记忆叠加,都笼罩在当年的氛围中,我们是这里的主人,教室、机房、球场、食堂到处都是我们熟悉的脸庞,我们曾抗议食堂涨价,我们曾策划建立学生实验图书馆,办学生图书馆学杂志,我们同学间发生过很多恩怨暧昧。我们当年特别为日新月异的变化感到激动,我们觉得所有的变化都是一种成长,都在向上,都在进化,都会越来越好。我们坚信未来必然会大有不同。

四十年过去,我们发现进化不是progress而只是evolution,它的方向似乎并不符合任何人的想象,包括我们。这是一个各种因素交织的世界,技术、人文、启蒙、无知、精英、五毛,在一个新的即将到来的时代面前,在物质世界和意识时间的自然规律都在被揭示和掌握的时代,人类总体知识的积累达到前所未有的程度,另一方面人类个体知识的贫乏程度又发展到难以想象,知识的分布是多么的不均衡,图书馆于是显得多么重要,但同时又反衬出它是多么无助。这需要更多的智慧,碰巧这又是一个智慧时代,然而在这个时代的智慧似乎都是机器智慧,人类的智慧变得越来越稀少,也越来越奢侈。

我们现在依旧处在四十年前开启的那个“信息技术革命”的转型时期,应该已经进入到决战时刻。三十多年前我们系的两位智者说过这样的话:

“现在,我们又面临图书馆概念根本变革的一个新过程。传统规范的图书馆正在受着信息革命的挑战,这种挑战为我们提供了有关未来图书馆发展的两种奇特矛盾的反向景象:一边是知识和信息构成为社会的重要资源,如菽帛人人必取与之…信息革命、信息需求与图书馆发展呈现同步趋势;另一端却预示着图书馆前途的不确定性,因为它将受到“与未来相碰撞的震荡”,面临着未来发展的重大抉择,也许我们将踏着“浪潮”迈进,也许我们将被削弱、分解、替代。”

——宓浩 黄纯元 知识交流和交流的科学 1984.11

非常有意思的是,这两种“奇特矛盾的反向景象”自觉不自觉地成为我们系后来三十多年发展的一条主线:重商主义(与经济发展相结合,尽可能短平快地实现价值)和技术主义(也即功能主义),我们于是成为商学院底下主要以技术与方法立足的学科,虽然边缘交叉学科常常有无穷的创造力,然而在我们以行政主导学科发展的背景下,在各类评估指标的指挥棒下,我们有点非主流和边缘化,十分尴尬,在培育盆景为主要目的的苗圃中是不允许恣意生长的。

重商主义和技术主义也是四十年中国改革的一条主线,取得了巨大的成功,我们的毕业生一直很受人才市场的欢迎,说明了我们系在人才培养方面也很成功。这条主线其实是延续一百多年前自强运动/洋务运动,我本人也从毕业之后一直走技术路线,现在还在高举“技术酒徒”的大旗。

然而我们也必须清醒认识到,依靠功利和技术的成功是走不扎实的,也是走不远的,需要有理论的依托和指导,要有价值观的判断。这样我们才能培养理论自信和道路自信,我们技术酒徒的大旗才能举的持久。所以如果可以的话,我在这里对母系提三点希望,如果可能的话,我们相关的系友们一起努力,把我们系建的更好:

1.坚定地走自己的路。但要明白这是条什么路,要有理论的指引。所以就要进行理论研究,把我们前辈提出的社会知识交流论继续发扬光大。

2.志存高远又扎根实践。关注现实问题,培养实践人才。我们系目前在……等方面,理论联系实际,特色鲜明,都很不错。

3.开拓蓝海但不惧竞争,积极“入世”,占领高地、引领趋势并获得更多学术话语权。

非常欣喜的是我看到我们系也确实是这样发展着。

最后我想用22年前黄纯元先生的一段话做一个结尾,他说:

“十年过去了,信息化发展所派生出来的“虚拟环境”和市场经济的扭曲和泛化的双重冲击,正在不断地给我国图书馆学制造出越来越多的难以自拔的“理论陷阱”…宓浩的知识交流论只是提供了一种认识的架构,仍然还是一种假说…实质上是一种关于图书馆的社会学解释…从文化/制度功能上来分析图书馆本质问题,避免了早期功能主义的交流理论蜕变为技术决定主义…(也)反对用求解代替求知的急功近利的研究风气…(以及)在方法上沦为哲学的附庸。”

——黄纯元 追问图书馆的本质:对知识交流论的再思考(1996)

谢谢大家!

(2018年12月14日下午发言于华东师大)

馆员荐书

《人类简史》《未来简史》《今日简史》

点评:尤瓦尔·赫拉利的“简史”系列,以历史学家的视角思考了近百年来人类在哲学、科学、考古等方面的重大进展,尤其探讨了基因科学和人工智能对人类发展带来的巨大威胁。这些“简史”使尤瓦尔跻身当代“网红”思想家行列,成为现代人不可不读的著作。

《基因传:众生之源》 (The Gene:An Intimate History)【美】悉达多·慕克吉(Siddhartha Mukherjee) 著;马向涛 译;中信出版社·2018年1月

点评:整个20世纪科学的发展,使人们终于看到一个终极问题解决的希望:物质世界从粒子到生命的跃迁,与信息世界从比特到智能的质变,有望通过探究基因的奥秘而得到解答。自然进化最高级的成果——人类——不过是基因散播的载体而已。

《西方思想史》(The Passion of the Western Mind)【美】里查德·塔纳斯(Richard Tarnas)著;吴象婴,晏可佳,张光勇 译;上海社会科学院出版社·2017年3月

点评:思想是人文主义发端的第一道曙光,也是人类精神的源泉和支柱。现代人知识丰富能力超强,却大多争欲逐利无问西东活在当下。其实从轴心时代至今不过两千多年,我们的那点想法,古人早已有过。本书帮助你阅尽先贤智慧,理清思辨脉络,造就未来大智慧。

数字人文系统有没有“需求”?

问:基于自己对现有文献的了解,我有一个基本印象:数字人文的相关研究似乎更侧重在“技术”这件事本身,似乎学者们将研究的重心更多的放在如何去更好的用技术去成就事情。包括您昨天的课,很大程度上也在强调基础设施、平台、资源以及数字人文行为;但是是不是跳过了一个东西,那就是需求呢?所以我的问题是:(1)图书馆在建设关于数字人文相关平台的时候,是如何去权衡这个需求的?是根据人文学者的需求吗?还是图书馆觉得应该有这样一个平台?(2)图书馆建成这个平台后,人文学者的利用率高吗?是人文学者利用的更多,还是普通用户?最后用于人文的学术研究更多还是普及知识的作用更多呢?(3)昨天您也提到了,也是我想问的,图书馆如何去吸引和鼓励人文学者和其他用户使用相关基础设施的?

答:感谢来函提问,非常好的问题,就这个问题我的思考如下,仅供参考。

1.需求分析法是构建一个系统或平台所必须步骤,但却不是做一件创新的事情所必须步骤。科学研究和艺术创作最早完全是因为人类的好奇心使然,是一种娱人娱己,说句直白的话,人文基本上是人吃饱了饭没事干才想到的事情,所以并非所有的事情都由需求来驱动和引导的,那样就非常功利了,与动物就没啥两样了。
2.很多时候需求是创造和引导出来的。英国人喝茶完全是中国和印度带过去的,没有手机的时候怎么知道手机能不能卖掉?
3.图书馆建设数字人文平台时其实一开始是模拟人文学者传统的研究方式,比如检索、比较、统计,等等,用技术能够更快更精确更大范围地检索,就像电子书是对纸本书的模拟一样,一开始总是模仿,然后再有突破。你能够帮到他,那就是满足了他的需求,即便不是所有人都会用,但总有一批先行者,带动研究范式但转变。
4.在开发系统但时候必须要有需求分析的过程,系统设计的依据是需求设计,否则就无法开发出良好的系统。我们数字人文系统平台的研发通常有三类人参与:领域专家、图书馆员和软件开发人员,其中图书馆员往往充当需求设计者,他们把学者的研究行为转化为程序员能够看懂的说明书。
5.人文学者是不是利用率高,首先需要明确的是,未来的人文学者一定是基于数据进行研究的,当所有的素材都是原生数字资源的时候,他们别无选择。至于这个平台是不是图书馆来提供,这其实是不重要的,因为总要有人来做这个事情,目前因为图书馆有大量的人文内容是稀缺资源,是研究者不可或缺的。

爱迪生从来不是根据需求进行发明创造的,乔布斯也不会迎合需求而让自己的产品设计有所妥协,如果说有需求,他们自己就是需求者。一切开发源自需求是一个伪问题,尤其不能让这个问题禁锢思维和束缚手脚。系统好不好是可以迭代开发的,不好了可以推倒重来。

关于机器人在图书馆应用的几个问题

1、您如何看待机器人馆员的出现?这是大势所趋吗?
智能机器人正在许多行业取代人类的工作,这已经不是一种预测,而是正在上演。电话推销员、保险业务员、银行职员、股票分析师、法律事务助理等职业已经大规模沦陷。BBC曾有一个调查结论指出图书馆员有51.9%的可能性被机器人所取代,在被调查的365个职业中位居中游,不好不坏。就像机器革命曾经让大量产业工人失业一样,信息革命也正在带来脑力劳动者的转型,总体而言科技革命带来的产业转型一方面会消灭很多传统职业,另一方面也会创造大量新的职业,当前的各类服务业规模越来越大就是一个例证。
出现机器人馆员也不是什么大不了的事情。目前已经出现了两种类型的机器人馆员,一是智能问答机器人,可以辅助进行参考咨询工作,另一类是自动盘点机器人,能够在夜里不知疲倦地查找乱架的图书,未来会有更多的机器人出现在各类图书馆员的岗位上,甚至会有全能型机器人馆员。
上海图书馆的参考咨询机器人“图小灵”于2018年元旦正式上岗实习,主要在办证处和中文书刊外借室接受读者问询,目前每天工作四小时,还配备了专门的带教老师,收集机器人回答不了的问题,在机器人“下班后”帮助他学习改进,并完善背后的知识库系统。图小灵不仅能帮助读者解决一些无馆员职守时的业务问题,还可以帮助读者查询天气、路线,在图书馆的自助机器使用排队的时候,陪读者聊天打发时间。上图还打算引进日本软银的 Pepper 机器人,它能掌握四种语言,并具有更好的不同场景的适应能力和交互能力。
2、机器人馆员给图书馆服务工作带来了哪些便利?存在哪些问题?读者反响怎样?
目前机器人馆员还是一项新生事物,还谈不上给工作人员带来很多便利,相反还会带来很多负担——即围绕机器人进行许多额外工作。从原理上讲,机器人的引入能够减轻图书馆员的劳动强度、提高工作效率,降低对工作人员的要求等等,但目前由于技术还不成熟,这些便利都还未能成为现实,与人们的预期还有较大距离。
机器人是集成了感知、决策和行动多项尖端技术的一种综合性技术应用,具有很高的复杂性,目前发展非常快,但图书馆界应用大多数机器人还都不是应用了最前沿技术的产品,它们可能在实验室环境中已经具备了很高的智力,一旦离开实验室,到了人类社会的真实环境中,它们的感知、交互和行动能力都大打折扣,眼盲失聪低智的情况时有发生,这也是目前图书馆机器人存在的主要问题。
但有意思的是这些问题并不影响目前机器人馆员在图书馆受欢迎的程度。广大读者并不在乎机器人能回答多少问题,或者回答得准不准确,而只要图书馆有机器人,就能够吸引大量的读者,尤其是青少年读者。也就是说现在的机器人馆员已经成了图书馆进行机器人技术科普的一个工具,或者说玩具。但这当然也是图书馆存在的价值之一,仅凭这一点图书馆引入机器人就达到了目的,至少是吸引读者的目的。
3、机器人与真人馆员相比在具体工作中有哪些优势和劣势?
毋庸置疑,机器人具有超强的记忆能力、光一般的计算速度和不知疲倦的“体力”,这些特性是人类图书馆员远远不及的,因此对于那些重复性的机械劳动(这里指脑力劳动),或无需天赋,经由训练就可以掌握的工作,这些都是机器人的拿手好戏。而对于需要“情商”的工作,例如面对面交流能力、社交能力、协商能力,或需要具备同情心以及对他人真心实意的扶助和关切,以及需要创意和审美能力的工作,机器人就无能为力了。这样看来数字图书馆服务由机器人来做似乎更合适,而实体图书馆的传统服务则需要更加人性化的真人馆员来承担。
4、结合机器人馆员的应用现状,您认为还有哪些方面需要进一步完善?您最希望机器人馆员拥有何种技能?
目前几乎所有的机器人都可以说是过渡产品,它们在感知、决策和行为等各方面都远远达不到人类的水平。对于这样一个发展迅速的领域,很可能当前购买的机器人在两到三年内就会完全过时,有新的智能机器人完全碾压目前的玩具。有学者预测在2026年人工智能技术就会有突破性进展,机器人达到个体人类水平,这就是所谓的通用人工智能,那时图书馆的各个岗位上都可能活跃着一大批机器人馆员,因为他们什么事都会做。
5、在运用智能设备探索阅读服务新形式方面,贵馆还有哪些尝试?积累了哪些经验?
其实机器人的应用只是图书馆全面走向智慧图书馆的一个缩影。当前采用了大量信息技术的复合型图书馆正在向智慧图书馆发展,图书馆从智能建筑,到自动化管理,到智慧服务,各个环节都会大量用到大数据分析技术、个性化服务技术、机器学习技术、自动翻译及各类自动文本处理和分析技术等等,全面应用了智慧技术的图书馆最终结果是:整个图书馆就相当于一个能够提供给智慧型知识服务的机器人。上海图书馆正在浦东建设新馆,目前正在为将新馆建设成智慧型的第三代图书馆而进行大量的调研策划和开发,届时希望给大家呈现一个“智慧图书馆”的雏形。
6、随着科技的发展,智能机器人在图书馆中的应用场景会越来越多,请您设想一下未来图书馆的模样?
未来图书馆行业的趋势是,图书馆的形式更加多样化,甚至化为无形。一旦科学家所设想的超级人工智能得以实现,图书馆所保存的人类所有知识就可以通过知识胶囊的方式,或人脑界面的方式进行传递,未来社会将会产生大量的人与机器人的混合体,生物人与机器人你中有我我中有你,图书馆可以看成所有人脑共同构成的一个知识机器,继续以存续和发展人类的知识、探索宇宙奥秘并造福于人类自身为己任。

数字图书馆的前世今生

数字图书馆前世今生

 

 

数字图书馆是上世纪90年代初作为与“信息高速公路”配套的基础设施而提出的概念。基于“有路必有车”的认识,美国分别于1992年和1994年分两期投入上亿美元设立“数字图书馆先导计划(Digital Library Initiative)”,孵化了一大批项目,如谷歌搜索引擎算法、谷歌数字图书计划、都柏林核心元数据、互联网档案项目和美国公共数字图书馆(DPLA)等等,都直接源自于其项目成果,或有着千丝万缕的因果联系。

我国的数字图书馆建设起始于1996年,一个标志性事件是国家图书馆联合上海等六家公共图书馆共同发起了“中国国家试验型数字图书馆”项目,第二年该项目得到了国家计委的正式批准,成为国家级信息基础设施建设项目。该项目的研发带动了我国一大批相关标准规范的确立,澄清了许多关键性概念,促进了学界和业界对一个新兴领域的关注,也促使整个图书馆行业迈出向数字图书馆转型、建设“复合型图书馆”的第一步。

二十多年来信息技术飞速发展,经历了从传统互联网、Web2.0到移动互联网的三代变迁,目前正进入以物联网、云计算、大数据与人工智能为特征的智慧互联时代,人们早年寄希望于数字图书馆技术来解决海量、异构、非结构化、多媒体信息的管理、组织、传播和利用问题,随着大数据技术的进步早已不成问题,而数字图书馆本身也从一个以技术研发为特征的应用领域,发展为以数字知识的保存、提供、交流和服务为特征的数字文化设施。伴随着上游知识产业生态的剧烈变化,以及下游读者用户信息需求和行为方式的巨大变化,作为一种知识中介的图书馆也应需而变,呈现出三个发展趋势:

1、从数字化到数据化

早期的数字图书馆项目主要是利用扫描技术将传统的纸本资源数字化,通过对资源内容和其他特征进行描述,建立关系型数据库提供检索,这种数字图书馆相当于传统“物理”图书馆的翻版。随着全文搜索和OCR技术的进步,越来越多的扫描图像可以经过文本化处理而提供全文检索,加上目前越来越多的原生数字内容和多媒体资源的引入,目前的数字图书馆呈现出非常纷繁复杂和丰富多彩的形态。

如果不能解决基于知识的服务问题,就谈不上是好的数字图书馆。当前的数据技术特别是关联数据等语义技术已经提供了初步的解决方案,能够使数字图书馆的基本结构单元,从图像、文本、多媒体文件等机器无法理解的内容,转变为人、地、时、事、物等“数据”信息,即“数据化”,让计算机的管理对象突破文献的限制,而直接管理内容语义,从而使数字图书馆成为真实世界和领域知识的映射。这类基于数据的数字图书馆正在成为数据驱动型科学研究的基础设施,在数字人文、e-Science 以及数字出版等领域发挥着越来越重要的作用。

2、从标准化到个性化

图书馆行业的标准化肇始于上世纪六十年代 MARC 书目数据记录格式,这可能是唯一沿用至今的磁带记录格式,几乎所有图书馆都基于这一格式设计业务流程和服务模式,尽管各类 MARC 略有不同,但没有哪一个行业像图书馆这样重视并应用最前沿的技术标准。

然而越早采用信息技术也就意味着今天包袱越重。标准化是工业时代的理念,它能够带来合作和效率,但信息时代强调的是差异化带来的个性化体验。当前不同类型图书馆由于用户对象的不同和资源类型的不同而呈现完全不同的发展方向,老的业务规范已不再能涵盖所有图书馆,新扩展的子系统完全无法覆盖所有类型的图书馆,标准化已不再可能,新的差异化的业务模式正在建立,图书馆与图书馆将呈现越来越不相同的形态和模式。

目前看来,公共图书馆将继续承担起文化保存、信息交流和普遍均等无差别知识服务的职能,开展阅读普及、消除信息鸿沟、提供信息素养培育是其不可推卸的责任;高校图书馆则必须顺应数据驱动型科研和教学的转变,承担起科研数据生命周期完整过程的管理和提供,同时提供各类共享空间服务;研究型图书馆则完全依靠学科馆员和数据馆员,转型为提供智慧型数据服务为主的无纸图书馆和虚拟图书馆。

整个知识产业上下游融合的趋势日渐明显,内容产业大洗牌,互联网公司全面介入知识生产流通在所难免。在这个新的产业生态中,图书馆由于拥有大量的读者,以熟悉读者的需求、掌握用户行为大数据作为利基,介入开放存取运动,甚至参与学术出版也不是没有可能。

3、从信息化到智慧化

智慧型社会是未来社会的重要特征,也是当前各行各业激烈角逐的主要战场。得益于过去数十年来全社会对于信息化的巨大投入,产生的海量数据为目前人工智能的进步提供了丰富的食粮。图书馆从来是与数据打交道的,从服务的内容和对象来看,图书馆的服务也应该精准化和智能化,智慧图书馆也无疑是数字图书馆的发展方向。

图书馆行业很早就提出智慧图书馆的概念,目前也是数字图书馆研究的一个热点。就采用的技术来看,如下表所示,智慧图书馆的发展可以分为四个阶段,第一代智慧图书馆只是采用了无线射频(RFID)技术的无人图书馆,其实并无任何人工智能的采用。第二代是当前研发的重点,通过采用多种传感器实现各类数据的采集,从而能够提供基于位置的精准服务(或称为SoLoMo,即社会化的基于位置的移动服务)。目前的各类机器学习技术已经为第三代智慧图书馆提供了可能,将对于信息内容的加工处理和提供服务两方面全面实现智慧化。第四代“超智慧”有赖于超级人工智能的突破和应用,目前还是科学幻想,但引起的讨论颇能给人启发。

表:四种智慧图书馆

类型

说明

特征

举例

伪智慧

通过应用RFID等智能标签技术,感知与反馈结合,一定的行为引发一定的结果,“好像”有了一定的智慧。已经实现。

单向度(仅感知图书等实体)、单循环

无人图书馆

智慧图书馆

弱智慧

各类传感器(如iBeacon、WIFI、人脸识别)应用模型和算法综合应用,可进行推送等个性化服务,实现了按程序设计好的“智慧”。正在实现。

多条件,复杂,类似于专家系统,双向,预先设定

小i参考咨询机器人

SoLoMo

强智慧

人工智能和机器学习的普遍应用,动态实时地应对复杂情况,无须预先设定,智能响应。有可能实现。

交互性、随机性;

智能化、人性化

*第三代图书馆*

超智慧

图书馆能够像人一样思考,具有人类知识的总和,总能在你需要的时间和地点,提供需要的知识服务。

应用强人工智能,图书馆工作的许多岗位被机器取代

化于无形,无所不在,随处服务

综上所述,数字图书馆概念由于受到技术进步的强烈影响,一直在发展变化,然而万变不离其宗的是人们赋予它的永恒职能,即保存文化、开展教育、传递信息和终身学习。即便到了数字时代,变化的只有方式和手段,图书馆永远都是天堂一般的模样。