存档2019

人工智能与科技情报工作

本文为《竞争情报》杂志2018年5月的一次访谈内容,最终版本请参阅该刊。

问:在SCIP2017年的年会上,美国人工智能研究所(AiAi)主席Al Naqvi先生提及了这样一个观点“人工智能属于战略部门而非技术部门”,您如何看待这个提法?

答:这种认识在当下有一定的道理。对于一些颠覆性技术,首先需要把握它的宏观战略影响,才能制定合理的措施加以应对。但是对人工智能必须认识到它既有战略层面的影响,又需要有战术层面的布局。就像工业化的起步,一开始的影响并不是全方位的,而只是在某些行业领域、或一些行业的某些环节带来颠覆,然后再扩展到整个产业链,乃至人类社会生活的各个方面。

不懂得AI的战略意义,就无法从10万米高度看清形势,无法做到及时转型和布局;不懂得操作层面的影响,就不知道从何入手,战略决策也将成为空中楼阁。对于情报工作而言,人工智能带来的战略影响是全局性和根本性的,因为情报工作本身就是一种信息过程,从情报的搜集、处理、归纳、分析、整理,在一定的框架内得出结论或提出建议,指导决策或带来行动,无一不是一种智力劳动的结果,人工智能从原理上来说,除了带有情感的、需要人情练达或创意审美的“创造”还无法做到之外,只要是客观的、“科学的”和可重复的过程,假以时日,应该都能解决。从战术层面来说,目前还处在弱人工智能(Artificial Narrow Intelligence,简称ANI)的发展阶段,情报过程的局部过程或部分工作交给机器来完成,已经毫无问题。当前计算机视觉、自然语言处理、自动翻译、语音识别、数据挖掘、文本处理与分析、名称实体识别、自动摘要和报道、自动舆情监控等相关技术已日趋成熟,完全能够应用于情报工作,极大地节省人力并提高效率。

问:管理层通常只愿意为当下的利益买单,设想如果您是一家尚未真正开始考虑人工智能的机构中的战略或情报专家,您如何说服管理层更多地考虑人工智能对公司的影响,并及早对此作出应对?

答:当前的智能化浪潮很容易让人联想起20多年前开始的信息化浪潮,情形十分相似。当时有个说法:企业不信息化(如采用ERP+CRM)要死,而(不合适的)信息化可能死得更快。当时针对普遍采用的ERP(企业全资源管理系统),产业界有人提出一个“三分论”,即三分之一的ERP能用,三分之一修修改改勉强能用,还有三分之一是彻底失败。当初上马一套ERP系统的平均成本是数千万到数亿美元!失败导致的后果常常是一蹶不振甚至最终黯然离场。主流经济学理论对信息化的解释都认为其本身并不具备很好的投资回报率(ROI),但当大家都开始用信息技术进行流程再造时,不进行信息化肯定死路一条。当前智能化浪潮正席卷而来,如果把工业化当作人类体力的延伸的话,智能化才是真正的人脑延伸,当初的信息化还只是智能化的前奏。

对于如何说服管理层,我觉得可以有三条道路:一是多学习AI,了解其能力,通过原理和案例来说服管理者。我们可以看到由于智能分析系统的进步,使得法律助理和证券分析行业已经几乎完全被人工智能所取代,同声传译行业也正在发生同样的事情,这类行业受到人工智能的直接冲击,就是由于相关技术的成熟而直接导致,他们其实都是情报工作的近亲。二是开始着手尝试AI的应用,在搜索查询、跟踪、清洗、建库、编辑、撰写、发布、交流等情报工作流程中各个可能的环节中尝试AI的应用,让事实来说话。一开始肯定会有一定成本,甚至会走一些弯路,但对整个行业来说趋势是明显的,必然会应用到人工智能,享受到巨大的好处。如果管理层实在顽冥不化,则可以祭出终极武器:跳槽到应用了AI的机构里去。

问:人工智能会先影响某个行业吗?还是人工智能将同时为所有行业带来变革性的影响?

答:新技术的开端从来都是不均衡的,人工智能一定会在某些行业,或者某个行业的某些“工种”得到应用,然后再波及整个生态或产业链。科幻作家威廉吉布森(WilliamGibson)曾有一句名言:“未来已来,只是尚未流行而已”。人工智能就是一种“弥漫性”、“基础性”技术,它的影响不是局部性和行业性的,它甚至会对人类社会产生根本性的影响,已经引发关于对人类未来命运产生影响的哲学性思考。

当前人工智能取得重大进展,各类投资蜂拥而来,有人认为我们已经彻底告别了曾经经历了两次的“人工智能之冬”。无论这种乐观是否有足够的依据,我们都必须清醒地认识到,当前人工智能的突破并不是全方位和无条件的,而只是由于在计算机硬件性能得到高速发展和移动网络应用造就大数据随处可得的背景下,以深度学习为代表的人工神经网络取得了实质性的突破,带来计算机视觉、语音识别、机器翻译等认知计算领域的突破,至于为什么会造成如此突破,计算机科学家也莫衷一是,目前还被认为是一个“黑箱”,缺乏让人信服的理论解释。计算机科学家还在寻找机器学习的终极“圣杯”,这个过程应该不是短期内所能完成的。

在可能受到人工智能直接影响的行业中间,情报工作是一个很有意思的实践领域,它一方面由于其“尖兵”和“耳目”的作用历来被高度重视,另一方面由于内容领域的广泛性和方法工具的动态复杂性而一直“找不到北”,一直徘徊于许多相关理论和学科的边缘或末梢,唯一的应对措施是必须尽快地适应。这也可能是它的宿命。当前在人工智能背景下“智慧情报”的概念被适时地提出,即要求情报工作更多地采用基于大数据的分析过程,并在工作流程上更多地应用群体智慧、团队协同,以及自动跟踪、处理、预警和报告的方式,建立数据驱动/数据密集型的情报过程,并发挥模型、工具和算法的优势,是“智慧情报”的两个关键环节。这就不是过去以个人或小团队的作坊式的工作方式,以及基于不完全情报的“顿悟”过程所能够实现,这也使得情报工作有了更高的门槛。当然这个过程也不是一蹴而就的,过去的情报经验在建立模型、开发工具和实现算法方面需要发挥重要作用,并且会经历不断实践和“试错”的过程。

问:您如何看待人工智能改变关于隐私的话题?您是否担忧这可能会成为一个问题?

答:关于隐私,李彦宏的一句话虽然无良但却真实:隐私可以换取便利。人工智能是建立在海量获取数据的基础上的,人的智慧也是建立在大量认知的基础上,未来的个性化医疗、精准化服务,无一不是建立在放弃一部分隐私基础上的,所以问题的关键并不在于隐私的使用,而在于隐私在使用过程中如何能够得到有效的保护,是否有严格的法律及监管体系,能否对于隐私侵犯行为施以严刑峻法,才是我们这个物欲过度、道德不足的跛足社会应该认真考虑的问题。

隐私问题的受害者是普通用户,然而现在却总是成为业界大佬们相互攻奸的利器,例如最近华为与腾讯为隐私实践而起的冲突,这本身就是一个非常不正常现象。法律和政策的制订者不能代表弱势的普通用户发声,不能为真正的受害者伸张正义,而沦为资本的代言人,就永远没有公正可言,隐私问题也将永远是个问题。

问:普华永道(PWC)的一份研究报告称,人工智能将在2035年之前将许多发达国家的经济增长率翻一番。您是否同意这些经济收益会使全球性的发达国家和发展中国家之间的不平等变得愈加严重?中国如何能在这场人工智能的变革中不落伍?

答:人工智能一方面使不发达国家的劳动力优势不复存在,另一方面也使国民素质对于经济发展的影响力降低,因此,在帮助发达国家发展经济的同时,AI也缩小了不发达国家在生产要素方面的劣势。究竟哪个因素起到更大的作用,目前还很难察觉和下结论。

中国迄今在人工智能领域虽然并不处于第一梯队,但进展还是可圈可点、并不落伍的,一方面有一流的互联网公司高度重视这个领域并大量投资,常常能招募到美国顶尖的人工智能专家和团队;另一方面有国家从战略高度政策扶持和产业倾斜。应该说在人才、资金、市场等方面都没有问题,最大的问题是观念的开放性和对研发规律的认识。

在开放观念方面,人工智能从长远看是一个赢者通吃的领域,因此大家除了在技术上尽快取得突破之外,一旦有了一定技术优势,都极尽全力把尽快占领市场看成是高于一切的竞争策略,而只有足够开放,例如充分利用开源,才能迅速聚集更多的第三方力量并最终获得最大的市场占有率。因此这个领域进行技术竞争时很重要的是必须放弃急功近利和零和思维。国内的人工智能公司在一个封闭的市场中往往表现得封闭和急功近利。

在对于人工智能研发的政策扶持方面,我们常常习惯于傍大款、服从马太效应而不是营造公平的竞争环境,政府在支持基础研究方面的角色也常常被忽视,而更多地把公共资金直接投入到所谓“有前景”的公司,使得这些公司不思进取,甚至起到了助纣为虐的作用。

人工智能是一项具有全局意义的颠覆性技术,与全球变暖和核武器技术一样,处理不好甚至会危及到人类自身的生存和发展,因此我们必须依靠全人类的合作才有赢的希望。就像习总书记所说,我们是同一个人类共同体中的成员,和则两利,斗则俱伤。

FOLIO年度进展回顾(视频)

1月最后一天FOLIO网络会议回顾了年度进展,2018年社区取得了很大的发展,开发者人数、活动参与人数都翻倍增长,发展势头良好。

以下嵌入视频,可以打开中文字幕(自动翻译)。

主持人:Laura Wright, University of Colorado Boulder
访谈嘉宾:Christopher Spalding (EBSCO),Michael Winkler (OLE)和Sebastian Hammer (Index Data)

21位DH学者谈数字人文

值得一看的一组视频,带中文字幕。需科学上网,工具自备。

My Digital Humanities – Part 1: https://www.youtube.com/watch?v=I8aRtHW3b6g

Stéfan Sinclair – McGill University, 
Geoffrey Rockwell – University of Alberta, 
Laura Mandell – Texas A&M University, 
Bryan Carter – University of Arizona, 
Claire Clivaz – Swiss Institute of Bioinformatics, 
Bill Endres – University of Oklahoma

My Digital Humanities – Part 2: https://www.youtube.com/watch?v=WdSTQwI5Qz4 

Toma Tasovac from the Belgrade Center for Digital Humanities who gives his own definition of Digital Humanities. In this video, Toma addresses both sides of the Digital Humanities coin. On the one hand, he argues that DH runs the risk of becoming a ‘decontextualiser of the traditional humanities turning everything into conveyor belt scholarship’. On the other hand, he believes that DH enables deeper and more meaningful engagements with our (digitised) cultural heritage in ways and forms that were not available before

My Digital Humanities – Part 3: https://www.youtube.com/watch?v=FAODJW5ytd0 

Kenneth Price (University of Nebraska), 
Elena Pierazzo (Université Grenoble Alpes), 
Elli Bleeker (University of Antwerp), 
Patricia Murrieta Flores (University of Chester), 
James Cumming (University of Oxford)

My Digital Humanities – Part 4: https://www.youtube.com/watch?v=iLqEkXvhPu8

Roderick Coover (Temple University),
Angel D. Nieves (Hamilton College), 
Kathryn Sutherland (University of Oxford), 
Marjorie Burghart (Centre National de la Recherche Scientifique),
Paul Eggert (Loyola University Chicago)

My Digital Humanities – Part 5: https://www.youtube.com/watch?v=4Pvi2J61P0g

Joris van Zundert (Huygens Institute for the History of the Netherlands)
Graeme Earl (University of Southampton/King’s College London)
Mathew Vincent (Bruno Kessler Foundation) 
Federico Meschini (Tuscia University).

系庆四十周年发言

非常感谢星主任的邀请,我正好有很多话要说。

但是昨天重感冒失了声,担心失礼,写了个书面发言,好在今天还行。

感谢母校感谢CCTV的话我就不多说了,大恩不言谢,谢是谢不完的。大学四年是人生中最重要的阶段,难忘的八十年代,我有不少同学在美丽的丽娃河畔一起度过了七年时光,“三观”就是这个期间形成的,七年足够决定一生。我们都是母系塑造的,可能有些人多些有人少些,但都是决定性的。

校园是铁打的营盘流水的兵,我们心中的母系既是现在的系,又不是这个系,校园中有让我们深深眷恋的,也有让我们感到陌生和失落的。比方现在来到校园看到一张张年轻靓丽的脸,我就感到青春的逝去,很失落。

这里有我们熟悉的建筑道路,花草树木,偶尔回来,我甚至会觉得那些熟悉的窗户后面依然有熟悉的身影,所有看到的东西与记忆叠加,都笼罩在当年的氛围中,我们是这里的主人,教室、机房、球场、食堂到处都是我们熟悉的脸庞,我们曾抗议食堂涨价,我们曾策划建立学生实验图书馆,办学生图书馆学杂志,我们同学间发生过很多恩怨暧昧。我们当年特别为日新月异的变化感到激动,我们觉得所有的变化都是一种成长,都在向上,都在进化,都会越来越好。我们坚信未来必然会大有不同。

四十年过去,我们发现进化不是progress而只是evolution,它的方向似乎并不符合任何人的想象,包括我们。这是一个各种因素交织的世界,技术、人文、启蒙、无知、精英、五毛,在一个新的即将到来的时代面前,在物质世界和意识时间的自然规律都在被揭示和掌握的时代,人类总体知识的积累达到前所未有的程度,另一方面人类个体知识的贫乏程度又发展到难以想象,知识的分布是多么的不均衡,图书馆于是显得多么重要,但同时又反衬出它是多么无助。这需要更多的智慧,碰巧这又是一个智慧时代,然而在这个时代的智慧似乎都是机器智慧,人类的智慧变得越来越稀少,也越来越奢侈。

我们现在依旧处在四十年前开启的那个“信息技术革命”的转型时期,应该已经进入到决战时刻。三十多年前我们系的两位智者说过这样的话:

“现在,我们又面临图书馆概念根本变革的一个新过程。传统规范的图书馆正在受着信息革命的挑战,这种挑战为我们提供了有关未来图书馆发展的两种奇特矛盾的反向景象:一边是知识和信息构成为社会的重要资源,如菽帛人人必取与之…信息革命、信息需求与图书馆发展呈现同步趋势;另一端却预示着图书馆前途的不确定性,因为它将受到“与未来相碰撞的震荡”,面临着未来发展的重大抉择,也许我们将踏着“浪潮”迈进,也许我们将被削弱、分解、替代。”

——宓浩 黄纯元 知识交流和交流的科学 1984.11

非常有意思的是,这两种“奇特矛盾的反向景象”自觉不自觉地成为我们系后来三十多年发展的一条主线:重商主义(与经济发展相结合,尽可能短平快地实现价值)和技术主义(也即功能主义),我们于是成为商学院底下主要以技术与方法立足的学科,虽然边缘交叉学科常常有无穷的创造力,然而在我们以行政主导学科发展的背景下,在各类评估指标的指挥棒下,我们有点非主流和边缘化,十分尴尬,在培育盆景为主要目的的苗圃中是不允许恣意生长的。

重商主义和技术主义也是四十年中国改革的一条主线,取得了巨大的成功,我们的毕业生一直很受人才市场的欢迎,说明了我们系在人才培养方面也很成功。这条主线其实是延续一百多年前自强运动/洋务运动,我本人也从毕业之后一直走技术路线,现在还在高举“技术酒徒”的大旗。

然而我们也必须清醒认识到,依靠功利和技术的成功是走不扎实的,也是走不远的,需要有理论的依托和指导,要有价值观的判断。这样我们才能培养理论自信和道路自信,我们技术酒徒的大旗才能举的持久。所以如果可以的话,我在这里对母系提三点希望,如果可能的话,我们相关的系友们一起努力,把我们系建的更好:

1.坚定地走自己的路。但要明白这是条什么路,要有理论的指引。所以就要进行理论研究,把我们前辈提出的社会知识交流论继续发扬光大。

2.志存高远又扎根实践。关注现实问题,培养实践人才。我们系目前在……等方面,理论联系实际,特色鲜明,都很不错。

3.开拓蓝海但不惧竞争,积极“入世”,占领高地、引领趋势并获得更多学术话语权。

非常欣喜的是我看到我们系也确实是这样发展着。

最后我想用22年前黄纯元先生的一段话做一个结尾,他说:

“十年过去了,信息化发展所派生出来的“虚拟环境”和市场经济的扭曲和泛化的双重冲击,正在不断地给我国图书馆学制造出越来越多的难以自拔的“理论陷阱”…宓浩的知识交流论只是提供了一种认识的架构,仍然还是一种假说…实质上是一种关于图书馆的社会学解释…从文化/制度功能上来分析图书馆本质问题,避免了早期功能主义的交流理论蜕变为技术决定主义…(也)反对用求解代替求知的急功近利的研究风气…(以及)在方法上沦为哲学的附庸。”

——黄纯元 追问图书馆的本质:对知识交流论的再思考(1996)

谢谢大家!

(2018年12月14日下午发言于华东师大)

馆员荐书

《人类简史》《未来简史》《今日简史》

点评:尤瓦尔·赫拉利的“简史”系列,以历史学家的视角思考了近百年来人类在哲学、科学、考古等方面的重大进展,尤其探讨了基因科学和人工智能对人类发展带来的巨大威胁。这些“简史”使尤瓦尔跻身当代“网红”思想家行列,成为现代人不可不读的著作。

《基因传:众生之源》 (The Gene:An Intimate History)【美】悉达多·慕克吉(Siddhartha Mukherjee) 著;马向涛 译;中信出版社·2018年1月

点评:整个20世纪科学的发展,使人们终于看到一个终极问题解决的希望:物质世界从粒子到生命的跃迁,与信息世界从比特到智能的质变,有望通过探究基因的奥秘而得到解答。自然进化最高级的成果——人类——不过是基因散播的载体而已。

《西方思想史》(The Passion of the Western Mind)【美】里查德·塔纳斯(Richard Tarnas)著;吴象婴,晏可佳,张光勇 译;上海社会科学院出版社·2017年3月

点评:思想是人文主义发端的第一道曙光,也是人类精神的源泉和支柱。现代人知识丰富能力超强,却大多争欲逐利无问西东活在当下。其实从轴心时代至今不过两千多年,我们的那点想法,古人早已有过。本书帮助你阅尽先贤智慧,理清思辨脉络,造就未来大智慧。