分类目录人工智能

初学者关于数字人文的五个提问

1.近年来,国内外数字人文研究取得了哪些实绩与进展?
1)领域或学科已经得到公认确立。2004年为界前后两个时期
2)学会、期刊、教育都已经建立起来
3)国际和区域性学术交流会议非常活跃
4)学科正在繁荣,各相关学科都有一些成果,虽然没有特别眼睛一亮的成果,但有不少项目也算有影响。国外已有近千种专著,台湾也有20种,但大陆只有翻译的。期刊论文国内每年也有近200篇。
5)范式转型已经开始,但还远没有到位(dark side:晋升、评价等)


2.未来的数字人文研究应该注意哪些问题?或者说要坚持什么原则?
1)“大帐篷”原则,多学科融合,促进交流。目前很不平衡。
2)注重学科建设和理论研究,从教育培训入手。目前刚刚开始。
3)重视基础设施建设,基金进入,项目导向。
4)注重数字人文的本土性和民族特色,价值观引领,传承优秀中华文化非常有必要。

3.数字人文研究,具体会给传统研究范式、方法、视角带来怎样影响和变化?
影响是颠覆性的。两个方面:
1)不同程度改变原有人文社会科学
2)产生很多新的问题,带来交叉边缘领域,甚至创造新学科 不仅仅是方法方面的革新,就像试验设备的提高带来自然科学的进步一样,会造就新的内容。 数字人文也是数据科学的一种实践领域。

4.目前中华优秀传统文化的发展在您看来存在怎样的困境或者问题呢?
1)中华优秀文化的传播需要有两个基础要素:载体和形式,文献典籍文物遗产是载体,数字人文提供新形式。目前这两方面都准备不充分,基础设施、人才培养、工具方法都存在不足。
2)目前的最大问题有两个:源头上无法界定精华和糟粕;传播上缺乏吸引新一代并代表未来的方式方法手段
3)观念上重视、理念上面向未来面向国际,大力投入加强教育和基础设施建设,同时需要有一套指标体系和评价方法

5.如果存在问题,那么数字人文在哪些方面可以有所帮助呢?
简单而言:中国的数字人文一定是基于中国优秀的传统文化才有生命力,中国优秀的传统文化需要借助于数字人文才有未来。

未来已来!拥抱一个全新的开放平台时代

本文为《中国图书馆学报》2020年第一期“FOLIO专辑”主持人语

图书馆行业从来没有像今天这样接近自己的理想,也从来没有像今天这样面临巨大的挑战。

1931年阮冈纳赞提出图书馆学五定律,指出“书有其用”、“人有其书“、”书有其人”、“节省时间”,以及“图书馆是一个生长的有机体”。这充满理想主义的五条原则,是博尔赫斯“图书馆是天堂模样”的最好诠释,然而它其实一直是一个梦想,直到信息技术高度发展的今天,才有了实现的可能。

如果不是大数据和机器学习技术,我们不可能突破二八定律为长尾图书找到小众读者,不可能实现信息资源的精准推送,也不可能通过用户参与而优化采购,通过数据驱动型知识服务而实现图书馆向“数据馆”和“知识库”转型。所有这一切都有赖于一个全媒体、全流程、全网域系统平台的支持,有赖于突破传统系统只专注于图书馆自身业务,而忽略读者和用户的多样化需求和越来越高的体验要求。

当今一个理想的图书馆平台,绝不能只有采访编目流通等几个模块,而应该提供一个应用生态,任何图书馆的功能需求都有相应的app得到满足。其中甚至不局限于图书馆行业,而成为博物馆、美术馆、档案馆、文化馆等人类记忆机构通用或共享的服务。就像智能手机有应用商店一样,只要有需求,就能找到相应的app,通过建立一套技术标准规范,就能使大众的创造力得到充分发挥,并把公共文化机构的服务潜能充分挖掘出来。

这样的应用生态只有开放的平台才能够做到,而且是图书馆行业主导的开放平台,图书馆对自己的系统、业务和数据具有完全的掌控。这个平台让人人都可以开发app,这样图书馆所需要的所有功能,才有可能有足够多的商家提供服务;不同商家开发的app,才可能相互替换,并且随时挂接或插拔;图书馆的各类数据和模块,才能当然地互联互通。于是图书馆将不再依赖于个别的系统供应商,图书馆的数据安全也得到充分的保障:它只属于图书馆,或者读者自己。

这个平台现在已经诞生,它就是FOLIO,即“未来的图书馆是开放的(Future Of Library Is Open)!”

本期专辑汇集了四篇论文,是上海图书馆FOLIO应用团队对这套全新的图书馆开放平台进行初步研究的成果。上海图书馆23年前引进了当时最先进的C/S结构系统,现已经历了B/S和移动互联网两代的发展,直接进入基于微服务的开放平台架构。现已打算应用这套平台。

  • 周纲 和孙宇的《开创性的下一代图书馆服务平台解决方案》一文全面介绍了FOLIO的技术架构和生态环境,对其如何解决长期困扰图书馆运营的实践问题,如云模式、性价比、功能自主性、安全可控性、系统开放性和服务可靠性等进行了较为深入的探讨,重点分析了Folio技术架构和生态环境等方面的优势以及可能碰到的问题。
  • 郭利敏和张磊的《Folio专题_Folio的技术选型与运营模式研究》结合微服务技术介绍了FOLIO平台技术选型的原因,讨论了FOLIO的社区组织和商业模式之间的关系,对FOLIO在国内的落地提供了相关方案和思考。
  • 许磊和夏翠娟的《第三代图书馆服务平台的元数据管理》着重研究了FOLIO独具特色的底层数据管理架构Codex,认为Codex作为FOLIO中核心的元数据管理域,被设计成Folio的资源链接中心、规范数据中心和跨域的全媒体资源管理入口,能够通过模型中的抽象实体揭示资源间关系,其源自于BIBFRAME的抽象数据模型、最小化的元数据方案、统一的分层描述原则等考虑都远远领先于目前所有的图书馆管理系统,具有足够的灵活性支持第三代图书馆或类似机构各类实体对象的描述与组织。
  • 孙宇和周纲的《Folio专题_基于微服务架构的资源发现系统平台的构建研究》
  • 则重点研究了FOLIO中的资源发现模块,介绍了基于微服务架构的新一代资源发现系统的架构和组成,该系统架构融合了数据收割和联邦检索技术,加强了开源元数据的应用,可以真正实现馆藏所有资源的统一发现和获取,文章还展现了发现系统的本地化应用场景和服务模式。

随着今年年底FOLIO在瑞典Chalmers大学的成功部署,一个开放的、自生长的、由图书馆主导的应用生态将正式落地,真正的下一代系统正在到来!技术将成为图书馆服务创新最大的使能者和推进器。未来已来,让我们拥抱一个全新的开放平台时代!

作为数字人文基础设施的图书馆:从不可或缺到无可替代

本文为为《图书馆论坛》2020年数字人文栏目组稿的一期专辑主持人语。

根据CNKI的数据,国内迄今发表的近700篇以”数字人文“为主题的论文中,来自图书情报档案领域的文章大约超过60%。对比国外,Web of Science (Core Collection)收录了1590篇以“digital humanities”为topic的论文,Inforamtion Science Library Science领域的文章约为300篇,占比不到20%。这两组数据显示了国内外数字人文研究学科来源的巨大差异。

这说明了什么呢?虽然我们并不认为国外的比例就是数字人文知识版图的“完美”配方,但我们的比例一定是不合理的。人文学科的数字疆域,第一批居民主要来自图书情报领域,怎么说都不能让人服气。

这其中固然有国内图书情报学者更喜欢追新的原因,也是国内人文领域的学者尚未觉醒、尚未充分准备好的结果。就像当初旧金山发现了金矿,涌入的首批淘金者并没有赚到钱,而各类服务业却异军突起。图书馆行业作为历史文献的主要保留地,由于数字图书馆带来先知先觉,理所当然地成为数字人文最早的基础设施建设者。

传统的文献考据和现代的文献计量学都为数字人文作为一个整体的跨学科研究领域提供了方法论借鉴,书目控制带来的规范控制借助于语义技术,天然地为知识的形式化组织(采用本体技术)和知识服务提供了可信的编码基础,也为机器学习和人工智能的发展提供了宝贵的标注语料库。如果说不了解目录之学就无法窥知传统学术门径的话,不懂得以文献计量为代表的统计分析方法就无法真正从事数字人文研究。当然,当今数字人文的方法体系已经得到了极大拓展,统计分析的对象从文献深入到了语词文本、社会关系、时空关系乃至经过模型化之后的各类关系。但无论多么复杂,数据永远是基础,拥有大量数据的图书馆永远是人文研究的可靠伙伴。

图书馆要提供基于知识的服务还需要在数字图书馆的基础上不断提升水平,包括提升资源加工的语义化水平和提供分析统计及可视化工具。上海图书馆在国内属于对数字人文的先知先觉者之一,借助于20多年前开始的持续不断的数字化,大量的传统文献和特色文献已经搬运到了数字世界,一旦数字人文的研究方法和相关技术得以成熟,很自然地占据了有利的跑道。

本辑的四篇文章虽然反映不了上海图书馆在数字人文领域积极开拓的全貌,但包含了一些新的思考。图书馆这类人类记忆机构在数字人文的发展过程中,固然由于其资源收藏而不可或缺,但真正使其无可替代的,并不是这些馆藏资源,而是其服务能力。在当今以ABCD(人工智能、区块链、云计算和大数据)为特征的数字时代,“知识作为一种服务(KaaS)”才是图书馆的立身之本。本专辑反映了数字人文平台建设的两大趋势:边服务边建设的开放众包思想,和从数字图书馆到数据图书馆的必要升级。这两者是“后数字图书馆时代”我们在面向数据驱动型或数据密集型研究进行转型时必须首先实现和超越的。

  • 贺晨芝和张磊的《图书馆数字人文众包项目实践、分析与思考》重点介绍了数字人文领域的众包应用现状,以及上海图书馆自2016年以来的实践经验。上海图书馆开发了两个独立的众包应用,即抄录平台和验证码应用,都可以以SaaS方式开放给同行使用。
  • 刘倩倩和夏翠娟的《家谱知识服务平台众包模式的设计与实现》针对上海图书馆的家谱特藏,在原来提供基本查询和关联功能的数字人文平台基础上,开发了上传家谱、在线识谱、在线修谱等功能,尝试引入众包模式不断优化系统,并与用户社区积极互动密切合作,使用户不仅作为数据的消费者,同时也作为贡献者。
  • 朱武信和夏翠娟的《命名实体识别在数字人文中的应用—基于ETL的实现》介绍了一种借助于专门词典、批量自动进行名称实体识别的方法(即ETL方法),该方法在上海图书馆的数字人文平台建设中已普遍采用,取得了良好的效果。其原理是将文本中有意义的名称(例如人物、地点、时间、事件、专有概念等)利用程序进行自动析取,经过判断之后进行数据数据化转换(通常是加上URI),并提供丰富的语义关系。
  • 张喆昱和张磊的《记忆机构开放数据建设及数据化转型模式研究》触及了两个关键性主题:数据化和开放服务,试图将上海图书馆的实践进行一般化和通用化,分析了如何通过数据化更加贴近人文学者的需求,让系统更加人性化,然后通过开放服务引入外部资源,反过来促进系统的数据化。

上海图书馆希望通过自己的实践,为人文研究的赛百基础设施建设提供一个参考样本。发表这些做法,并不是说我们的做法有多先进,而只是一种不揣浅陋的抛砖引玉。我们深知,国内的数字人文目前还处于起步阶段,争论大于共识、口水多于实践,但只要大家参与,未来就前景可期。数字人文迄今为止形成的最大共识,就是大家都同意它是一个人人都受欢迎从而能各得其所的“大帐篷”。愿这个大帐篷使我们各门人文学科都得到繁荣兴旺!

WOLFcon2020大会发言

It’s been with great pleasure for me to come a long way across the planet, to join you in the big family, to celebrate the ongoing birth of our future platform, especially in the very special Chinese Lunar New Year. So Let me say Happy New Year to you once again! Happy the Rat Year!

The year of the Rat is a beginning of a new round of China Zodiac circle. Usually it means a brand new beginning. That’s what we hope for the FOLIO to bring us with: A New Beginning. 

This is my home town, Shanghai, a city always attracts Hollywood shooting Sci-fi movies, showing the post-mordern future society of our mankind. It is full of exciting things and opportunities. It is a perfect place to announce the final release of FOLIO I think.

This is Shanghai Library, the biggest city library in China, maybe the biggest of its kind around the world. The population of Shanghai city is 23 million. About a quarter had a reader’s card issued from my library. More than 3 million people visited my library and checked out nearly 30 million books every year. The peak circulation transaction number is 66 million in a year. But the circulation is not accomplished only by my library, we’ve got more than 250 libraries in a three-tier library system. We don’t belong to each other, but use only one integrated library system. We are a consortium.

The present Shanghai Library has opened to public in 1996. With the economic development, the budget of Shanghai Library has been increased from around 30 million USD in 1996 to 70 million USD last year. But the service capacity and key indicators have not been improved at the same time. We are not satisfied with the accessibility of our resources and the quality of our services, as well as the realization of the core values as a public library.

Our magnificent powerful Integrated Library System is Horizon, as you may know, it is from SirsiDynix. After running for more than two decades, when we set higher goals to serve more people and construct a new library building with 115,000 square meters, and expand our consortium to more than two thousand community libraries and service points, the Horizon system has no longer been able to meet our needs. At first, We decided to choose a safer way to upgrade our system to the Symphony, which is also from Sirsidynix, so as to have their services. But when the company notified us that they were no longer fulfilling the contract, returned the money and withdraw from China, I knew it was the darkest day in my career. 

Lucky enough we met FOLIO just in time.  We fell in love with FOLIO at the first sight. The open and sharing spirit of FOLIO perfectly matches the ideas of the Library. It is just what we are looking for for many years. Honestly, this step is a little bit bold, but we think it is worth to take the risk. I love the ideas which Sebastian Hammer stated in his speech “Library as a platform” at ELAG2016 conference that the FOLIO should be fully open sourced and act as an operation system for the library, and it will have an App Store for libraries to choose whatever applications they want to run.  He also pictured an amazing “by the community, with the community and for the community” vision of FOLIO.  These ideas are major breakthroughs in the library history I think. And we are very happy to see most of them have been realized in the next few years. 

We think the future shape of the library is a moving target. The service platform should be flexible enough to adapt all kinds of new technologies and requirements into the platform. From this point there is no such a platform better than FOLIO to accomplish the countless and agnostic requirements for libraries in the future.

But now we have to realize some key requirements:

  • It should be a multi tenant platform not only for Shanghai Library, but tens of branch libraries, which have their own sub branches, as a whole consortium.
  • It should support to 100 million circulation transaction in a year.
  • It should look after all kinds of activities by up to 15 million registered users.
  • It should provide collection management solutions for all kinds of culture heritage resources.
  • It should provide SaaS ecology with multiple extension modules (eg. SoLoMo services, Data Analytics, etc) by multiple local vendors.
  • It would help libraries to redefine itself in a new environment and re-engineering its workflow to meet new requirements.

We start our journey to investigate, learn and develop with FOLIO at the end of 2018. This slide lists most of the companies and institutions involved.

Now we have a team of more than 50 people, consists of librarian as PO and developers from 10 company partners. I put their names here but I won’t read them, just want to give them a recognition before you in this world wide community. So can you give them a round of applause? I am sure they can hear and be encouraged.

They are from those companies and institutions above.

By the end of 2020, we focus on the development of the Resource Access/Circulation module, the Collection Management/Inventory module and the System Management module. We also have partners working on the Acquisition/Order module and the Reading Promotion modules. 

We established the Shanghai FOLIO Alliance to joint efforts on the FOLIO implementation among Shanghai Central Library Consortium. The Alliance is under the supervision of the Shanghai Society of Libraries. It can prevent its member library to apply non FOLIO compatible module before FOLIO implementation. There are eight companies and 17 libraries as first members to join the Alliance.

The Chinese library community has been paying great attention to FOLIO from the beginning, and we also try to attract them into the FOLIO community, to popularize the concept of open source and expand our influence. 

We now have a loose national community led by CALIS (China Academic Library and Information System). We plan to upgrade to a semi-formal national alliance to advance the following community work:

  • Translating, including interfaces, documents and all kinds of materials when necessary
  • Chinese Natural Language Processing supporting, such as segmentation, sequencing…etc.
  • Local Knowledge Organization System supporting, like Chinese Library Classification, etc.
  • Developing and Maintaining the FOLIO Chinese version align with the international version, and maintaining local Knowledge Base.
  • Joining the development to contribute to new ideas such as data lake, linked data, machine learning, blockchain etc.
  • Module Compatibility Testing and Evaluating, and running a local App Store.
  • Issueing  Specifications and Best Practices, Outreaching and promotion, training, help implementing or migration, …etc.

We don’t want Chinese FOLIO application to be another information island. There would be no future if Chinese FOLIO community isolated from the international community. So we need a lot of help from you.

  • We need to know more about the whole architecture and backend technology.
  • We have to deal with local needs as a large central public library, such as massive concurrent processing, response performance, scalability, ease of use and user experiences.
  • We should provide multi-tenant environment to meet the different needs of different libraries in a large consortium.
  • We would encourage local teams to develop extensive modules to meet local needs
  • And we are going to establish Chinese application marketplace after you set up of FOLIO App Store

As the demands from China are so intense that the community decided to hire a PO who has the capability of bilingual, knowledgeable of software engineering and library business, to help us to communicate and coordinate with the international Community. After several months of recruiting, when we almost have no hope for such a panda position, Cate found one for us. The recruitment is  underway. It’s amazing.

We can’t wait for so many good ideas from FOLIO to come true, so we could make our contribution as much as possible.

As a small contribution to this conference, we made badges based on FOLIO’s logo and brought them to everyone here. So don’t forget to get one from my colleagues in the lobby (around the corner/by the door of the meeting room).

We are very appreciated for your efforts on developing FOLIO. We are very glad to see the growth of the  community. I truly understand the engagement of the community is the key for the success of FOLIO. I think It is far from enough by now. So we are very glad to be a part of it and to make contribution. There are 3000 public libraries and 1200 college libraries in China, which are eager to see a new library platform and waiting for FOLIO. We would like to invite you to hold a WolfCon or FOLIO Show in China in 2021 when the new Shanghai Library East Building has a grand opening. Let Shanghai library be your host.

Thank you very much.

人工智能与科技情报工作

本文为《竞争情报》杂志2018年5月的一次访谈内容,最终版本请参阅该刊。

问:在SCIP2017年的年会上,美国人工智能研究所(AiAi)主席Al Naqvi先生提及了这样一个观点“人工智能属于战略部门而非技术部门”,您如何看待这个提法?

答:这种认识在当下有一定的道理。对于一些颠覆性技术,首先需要把握它的宏观战略影响,才能制定合理的措施加以应对。但是对人工智能必须认识到它既有战略层面的影响,又需要有战术层面的布局。就像工业化的起步,一开始的影响并不是全方位的,而只是在某些行业领域、或一些行业的某些环节带来颠覆,然后再扩展到整个产业链,乃至人类社会生活的各个方面。

不懂得AI的战略意义,就无法从10万米高度看清形势,无法做到及时转型和布局;不懂得操作层面的影响,就不知道从何入手,战略决策也将成为空中楼阁。对于情报工作而言,人工智能带来的战略影响是全局性和根本性的,因为情报工作本身就是一种信息过程,从情报的搜集、处理、归纳、分析、整理,在一定的框架内得出结论或提出建议,指导决策或带来行动,无一不是一种智力劳动的结果,人工智能从原理上来说,除了带有情感的、需要人情练达或创意审美的“创造”还无法做到之外,只要是客观的、“科学的”和可重复的过程,假以时日,应该都能解决。从战术层面来说,目前还处在弱人工智能(Artificial Narrow Intelligence,简称ANI)的发展阶段,情报过程的局部过程或部分工作交给机器来完成,已经毫无问题。当前计算机视觉、自然语言处理、自动翻译、语音识别、数据挖掘、文本处理与分析、名称实体识别、自动摘要和报道、自动舆情监控等相关技术已日趋成熟,完全能够应用于情报工作,极大地节省人力并提高效率。

问:管理层通常只愿意为当下的利益买单,设想如果您是一家尚未真正开始考虑人工智能的机构中的战略或情报专家,您如何说服管理层更多地考虑人工智能对公司的影响,并及早对此作出应对?

答:当前的智能化浪潮很容易让人联想起20多年前开始的信息化浪潮,情形十分相似。当时有个说法:企业不信息化(如采用ERP+CRM)要死,而(不合适的)信息化可能死得更快。当时针对普遍采用的ERP(企业全资源管理系统),产业界有人提出一个“三分论”,即三分之一的ERP能用,三分之一修修改改勉强能用,还有三分之一是彻底失败。当初上马一套ERP系统的平均成本是数千万到数亿美元!失败导致的后果常常是一蹶不振甚至最终黯然离场。主流经济学理论对信息化的解释都认为其本身并不具备很好的投资回报率(ROI),但当大家都开始用信息技术进行流程再造时,不进行信息化肯定死路一条。当前智能化浪潮正席卷而来,如果把工业化当作人类体力的延伸的话,智能化才是真正的人脑延伸,当初的信息化还只是智能化的前奏。

对于如何说服管理层,我觉得可以有三条道路:一是多学习AI,了解其能力,通过原理和案例来说服管理者。我们可以看到由于智能分析系统的进步,使得法律助理和证券分析行业已经几乎完全被人工智能所取代,同声传译行业也正在发生同样的事情,这类行业受到人工智能的直接冲击,就是由于相关技术的成熟而直接导致,他们其实都是情报工作的近亲。二是开始着手尝试AI的应用,在搜索查询、跟踪、清洗、建库、编辑、撰写、发布、交流等情报工作流程中各个可能的环节中尝试AI的应用,让事实来说话。一开始肯定会有一定成本,甚至会走一些弯路,但对整个行业来说趋势是明显的,必然会应用到人工智能,享受到巨大的好处。如果管理层实在顽冥不化,则可以祭出终极武器:跳槽到应用了AI的机构里去。

问:人工智能会先影响某个行业吗?还是人工智能将同时为所有行业带来变革性的影响?

答:新技术的开端从来都是不均衡的,人工智能一定会在某些行业,或者某个行业的某些“工种”得到应用,然后再波及整个生态或产业链。科幻作家威廉吉布森(WilliamGibson)曾有一句名言:“未来已来,只是尚未流行而已”。人工智能就是一种“弥漫性”、“基础性”技术,它的影响不是局部性和行业性的,它甚至会对人类社会产生根本性的影响,已经引发关于对人类未来命运产生影响的哲学性思考。

当前人工智能取得重大进展,各类投资蜂拥而来,有人认为我们已经彻底告别了曾经经历了两次的“人工智能之冬”。无论这种乐观是否有足够的依据,我们都必须清醒地认识到,当前人工智能的突破并不是全方位和无条件的,而只是由于在计算机硬件性能得到高速发展和移动网络应用造就大数据随处可得的背景下,以深度学习为代表的人工神经网络取得了实质性的突破,带来计算机视觉、语音识别、机器翻译等认知计算领域的突破,至于为什么会造成如此突破,计算机科学家也莫衷一是,目前还被认为是一个“黑箱”,缺乏让人信服的理论解释。计算机科学家还在寻找机器学习的终极“圣杯”,这个过程应该不是短期内所能完成的。

在可能受到人工智能直接影响的行业中间,情报工作是一个很有意思的实践领域,它一方面由于其“尖兵”和“耳目”的作用历来被高度重视,另一方面由于内容领域的广泛性和方法工具的动态复杂性而一直“找不到北”,一直徘徊于许多相关理论和学科的边缘或末梢,唯一的应对措施是必须尽快地适应。这也可能是它的宿命。当前在人工智能背景下“智慧情报”的概念被适时地提出,即要求情报工作更多地采用基于大数据的分析过程,并在工作流程上更多地应用群体智慧、团队协同,以及自动跟踪、处理、预警和报告的方式,建立数据驱动/数据密集型的情报过程,并发挥模型、工具和算法的优势,是“智慧情报”的两个关键环节。这就不是过去以个人或小团队的作坊式的工作方式,以及基于不完全情报的“顿悟”过程所能够实现,这也使得情报工作有了更高的门槛。当然这个过程也不是一蹴而就的,过去的情报经验在建立模型、开发工具和实现算法方面需要发挥重要作用,并且会经历不断实践和“试错”的过程。

问:您如何看待人工智能改变关于隐私的话题?您是否担忧这可能会成为一个问题?

答:关于隐私,李彦宏的一句话虽然无良但却真实:隐私可以换取便利。人工智能是建立在海量获取数据的基础上的,人的智慧也是建立在大量认知的基础上,未来的个性化医疗、精准化服务,无一不是建立在放弃一部分隐私基础上的,所以问题的关键并不在于隐私的使用,而在于隐私在使用过程中如何能够得到有效的保护,是否有严格的法律及监管体系,能否对于隐私侵犯行为施以严刑峻法,才是我们这个物欲过度、道德不足的跛足社会应该认真考虑的问题。

隐私问题的受害者是普通用户,然而现在却总是成为业界大佬们相互攻奸的利器,例如最近华为与腾讯为隐私实践而起的冲突,这本身就是一个非常不正常现象。法律和政策的制订者不能代表弱势的普通用户发声,不能为真正的受害者伸张正义,而沦为资本的代言人,就永远没有公正可言,隐私问题也将永远是个问题。

问:普华永道(PWC)的一份研究报告称,人工智能将在2035年之前将许多发达国家的经济增长率翻一番。您是否同意这些经济收益会使全球性的发达国家和发展中国家之间的不平等变得愈加严重?中国如何能在这场人工智能的变革中不落伍?

答:人工智能一方面使不发达国家的劳动力优势不复存在,另一方面也使国民素质对于经济发展的影响力降低,因此,在帮助发达国家发展经济的同时,AI也缩小了不发达国家在生产要素方面的劣势。究竟哪个因素起到更大的作用,目前还很难察觉和下结论。

中国迄今在人工智能领域虽然并不处于第一梯队,但进展还是可圈可点、并不落伍的,一方面有一流的互联网公司高度重视这个领域并大量投资,常常能招募到美国顶尖的人工智能专家和团队;另一方面有国家从战略高度政策扶持和产业倾斜。应该说在人才、资金、市场等方面都没有问题,最大的问题是观念的开放性和对研发规律的认识。

在开放观念方面,人工智能从长远看是一个赢者通吃的领域,因此大家除了在技术上尽快取得突破之外,一旦有了一定技术优势,都极尽全力把尽快占领市场看成是高于一切的竞争策略,而只有足够开放,例如充分利用开源,才能迅速聚集更多的第三方力量并最终获得最大的市场占有率。因此这个领域进行技术竞争时很重要的是必须放弃急功近利和零和思维。国内的人工智能公司在一个封闭的市场中往往表现得封闭和急功近利。

在对于人工智能研发的政策扶持方面,我们常常习惯于傍大款、服从马太效应而不是营造公平的竞争环境,政府在支持基础研究方面的角色也常常被忽视,而更多地把公共资金直接投入到所谓“有前景”的公司,使得这些公司不思进取,甚至起到了助纣为虐的作用。

人工智能是一项具有全局意义的颠覆性技术,与全球变暖和核武器技术一样,处理不好甚至会危及到人类自身的生存和发展,因此我们必须依靠全人类的合作才有赢的希望。就像习总书记所说,我们是同一个人类共同体中的成员,和则两利,斗则俱伤。

关于机器人在图书馆应用的几个问题

1、您如何看待机器人馆员的出现?这是大势所趋吗?
智能机器人正在许多行业取代人类的工作,这已经不是一种预测,而是正在上演。电话推销员、保险业务员、银行职员、股票分析师、法律事务助理等职业已经大规模沦陷。BBC曾有一个调查结论指出图书馆员有51.9%的可能性被机器人所取代,在被调查的365个职业中位居中游,不好不坏。就像机器革命曾经让大量产业工人失业一样,信息革命也正在带来脑力劳动者的转型,总体而言科技革命带来的产业转型一方面会消灭很多传统职业,另一方面也会创造大量新的职业,当前的各类服务业规模越来越大就是一个例证。
出现机器人馆员也不是什么大不了的事情。目前已经出现了两种类型的机器人馆员,一是智能问答机器人,可以辅助进行参考咨询工作,另一类是自动盘点机器人,能够在夜里不知疲倦地查找乱架的图书,未来会有更多的机器人出现在各类图书馆员的岗位上,甚至会有全能型机器人馆员。
上海图书馆的参考咨询机器人“图小灵”于2018年元旦正式上岗实习,主要在办证处和中文书刊外借室接受读者问询,目前每天工作四小时,还配备了专门的带教老师,收集机器人回答不了的问题,在机器人“下班后”帮助他学习改进,并完善背后的知识库系统。图小灵不仅能帮助读者解决一些无馆员职守时的业务问题,还可以帮助读者查询天气、路线,在图书馆的自助机器使用排队的时候,陪读者聊天打发时间。上图还打算引进日本软银的 Pepper 机器人,它能掌握四种语言,并具有更好的不同场景的适应能力和交互能力。
2、机器人馆员给图书馆服务工作带来了哪些便利?存在哪些问题?读者反响怎样?
目前机器人馆员还是一项新生事物,还谈不上给工作人员带来很多便利,相反还会带来很多负担——即围绕机器人进行许多额外工作。从原理上讲,机器人的引入能够减轻图书馆员的劳动强度、提高工作效率,降低对工作人员的要求等等,但目前由于技术还不成熟,这些便利都还未能成为现实,与人们的预期还有较大距离。
机器人是集成了感知、决策和行动多项尖端技术的一种综合性技术应用,具有很高的复杂性,目前发展非常快,但图书馆界应用大多数机器人还都不是应用了最前沿技术的产品,它们可能在实验室环境中已经具备了很高的智力,一旦离开实验室,到了人类社会的真实环境中,它们的感知、交互和行动能力都大打折扣,眼盲失聪低智的情况时有发生,这也是目前图书馆机器人存在的主要问题。
但有意思的是这些问题并不影响目前机器人馆员在图书馆受欢迎的程度。广大读者并不在乎机器人能回答多少问题,或者回答得准不准确,而只要图书馆有机器人,就能够吸引大量的读者,尤其是青少年读者。也就是说现在的机器人馆员已经成了图书馆进行机器人技术科普的一个工具,或者说玩具。但这当然也是图书馆存在的价值之一,仅凭这一点图书馆引入机器人就达到了目的,至少是吸引读者的目的。
3、机器人与真人馆员相比在具体工作中有哪些优势和劣势?
毋庸置疑,机器人具有超强的记忆能力、光一般的计算速度和不知疲倦的“体力”,这些特性是人类图书馆员远远不及的,因此对于那些重复性的机械劳动(这里指脑力劳动),或无需天赋,经由训练就可以掌握的工作,这些都是机器人的拿手好戏。而对于需要“情商”的工作,例如面对面交流能力、社交能力、协商能力,或需要具备同情心以及对他人真心实意的扶助和关切,以及需要创意和审美能力的工作,机器人就无能为力了。这样看来数字图书馆服务由机器人来做似乎更合适,而实体图书馆的传统服务则需要更加人性化的真人馆员来承担。
4、结合机器人馆员的应用现状,您认为还有哪些方面需要进一步完善?您最希望机器人馆员拥有何种技能?
目前几乎所有的机器人都可以说是过渡产品,它们在感知、决策和行为等各方面都远远达不到人类的水平。对于这样一个发展迅速的领域,很可能当前购买的机器人在两到三年内就会完全过时,有新的智能机器人完全碾压目前的玩具。有学者预测在2026年人工智能技术就会有突破性进展,机器人达到个体人类水平,这就是所谓的通用人工智能,那时图书馆的各个岗位上都可能活跃着一大批机器人馆员,因为他们什么事都会做。
5、在运用智能设备探索阅读服务新形式方面,贵馆还有哪些尝试?积累了哪些经验?
其实机器人的应用只是图书馆全面走向智慧图书馆的一个缩影。当前采用了大量信息技术的复合型图书馆正在向智慧图书馆发展,图书馆从智能建筑,到自动化管理,到智慧服务,各个环节都会大量用到大数据分析技术、个性化服务技术、机器学习技术、自动翻译及各类自动文本处理和分析技术等等,全面应用了智慧技术的图书馆最终结果是:整个图书馆就相当于一个能够提供给智慧型知识服务的机器人。上海图书馆正在浦东建设新馆,目前正在为将新馆建设成智慧型的第三代图书馆而进行大量的调研策划和开发,届时希望给大家呈现一个“智慧图书馆”的雏形。
6、随着科技的发展,智能机器人在图书馆中的应用场景会越来越多,请您设想一下未来图书馆的模样?
未来图书馆行业的趋势是,图书馆的形式更加多样化,甚至化为无形。一旦科学家所设想的超级人工智能得以实现,图书馆所保存的人类所有知识就可以通过知识胶囊的方式,或人脑界面的方式进行传递,未来社会将会产生大量的人与机器人的混合体,生物人与机器人你中有我我中有你,图书馆可以看成所有人脑共同构成的一个知识机器,继续以存续和发展人类的知识、探索宇宙奥秘并造福于人类自身为己任。