Feed on Posts or Comments 19 April 2018

数字人文 keven on 30 三 2018

数字人文系统有没有“需求”?

问:基于自己对现有文献的了解,我有一个基本印象:数字人文的相关研究似乎更侧重在“技术”这件事本身,似乎学者们将研究的重心更多的放在如何去更好的用技术去成就事情。包括您昨天的课,很大程度上也在强调基础设施、平台、资源以及数字人文行为;但是是不是跳过了一个东西,那就是需求呢?所以我的问题是:(1)图书馆在建设关于数字人文相关平台的时候,是如何去权衡这个需求的?是根据人文学者的需求吗?还是图书馆觉得应该有这样一个平台?(2)图书馆建成这个平台后,人文学者的利用率高吗?是人文学者利用的更多,还是普通用户?最后用于人文的学术研究更多还是普及知识的作用更多呢?(3)昨天您也提到了,也是我想问的,图书馆如何去吸引和鼓励人文学者和其他用户使用相关基础设施的?

答:感谢来函提问,非常好的问题,就这个问题我的思考如下,仅供参考。

1.需求分析法是构建一个系统或平台所必须步骤,但却不是做一件创新的事情所必须步骤。科学研究和艺术创作最早完全是因为人类的好奇心使然,是一种娱人娱己,说句直白的话,人文基本上是人吃饱了饭没事干才想到的事情,所以并非所有的事情都由需求来驱动和引导的,那样就非常功利了,与动物就没啥两样了。
2.很多时候需求是创造和引导出来的。英国人喝茶完全是中国和印度带过去的,没有手机的时候怎么知道手机能不能卖掉?
3.图书馆建设数字人文平台时其实一开始是模拟人文学者传统的研究方式,比如检索、比较、统计,等等,用技术能够更快更精确更大范围地检索,就像电子书是对纸本书的模拟一样,一开始总是模仿,然后再有突破。你能够帮到他,那就是满足了他的需求,即便不是所有人都会用,但总有一批先行者,带动研究范式但转变。
4.在开发系统但时候必须要有需求分析的过程,系统设计的依据是需求设计,否则就无法开发出良好的系统。我们数字人文系统平台的研发通常有三类人参与:领域专家、图书馆员和软件开发人员,其中图书馆员往往充当需求设计者,他们把学者的研究行为转化为程序员能够看懂的说明书。
5.人文学者是不是利用率高,首先需要明确的是,未来的人文学者一定是基于数据进行研究的,当所有的素材都是原生数字资源的时候,他们别无选择。至于这个平台是不是图书馆来提供,这其实是不重要的,因为总要有人来做这个事情,目前因为图书馆有大量的人文内容是稀缺资源,是研究者不可或缺的。

爱迪生从来不是根据需求进行发明创造的,乔布斯也不会迎合需求而让自己的产品设计有所妥协,如果说有需求,他们自己就是需求者。一切开发源自需求是一个伪问题,尤其不能让这个问题禁锢思维和束缚手脚。系统好不好是可以迭代开发的,不好了可以推倒重来。

Uncategorized keven on 04 三 2018

关于机器人在图书馆应用的几个问题

1、您如何看待机器人馆员的出现?这是大势所趋吗?
智能机器人正在许多行业取代人类的工作,这已经不是一种预测,而是正在上演。电话推销员、保险业务员、银行职员、股票分析师、法律事务助理等职业已经大规模沦陷。BBC曾有一个调查结论指出图书馆员有51.9%的可能性被机器人所取代,在被调查的365个职业中位居中游,不好不坏。就像机器革命曾经让大量产业工人失业一样,信息革命也正在带来脑力劳动者的转型,总体而言科技革命带来的产业转型一方面会消灭很多传统职业,另一方面也会创造大量新的职业,当前的各类服务业规模越来越大就是一个例证。
出现机器人馆员也不是什么大不了的事情。目前已经出现了两种类型的机器人馆员,一是智能问答机器人,可以辅助进行参考咨询工作,另一类是自动盘点机器人,能够在夜里不知疲倦地查找乱架的图书,未来会有更多的机器人出现在各类图书馆员的岗位上,甚至会有全能型机器人馆员。
上海图书馆的参考咨询机器人“图小灵”于2018年元旦正式上岗实习,主要在办证处和中文书刊外借室接受读者问询,目前每天工作四小时,还配备了专门的带教老师,收集机器人回答不了的问题,在机器人“下班后”帮助他学习改进,并完善背后的知识库系统。图小灵不仅能帮助读者解决一些无馆员职守时的业务问题,还可以帮助读者查询天气、路线,在图书馆的自助机器使用排队的时候,陪读者聊天打发时间。上图还打算引进日本软银的 Pepper 机器人,它能掌握四种语言,并具有更好的不同场景的适应能力和交互能力。
2、机器人馆员给图书馆服务工作带来了哪些便利?存在哪些问题?读者反响怎样?
目前机器人馆员还是一项新生事物,还谈不上给工作人员带来很多便利,相反还会带来很多负担——即围绕机器人进行许多额外工作。从原理上讲,机器人的引入能够减轻图书馆员的劳动强度、提高工作效率,降低对工作人员的要求等等,但目前由于技术还不成熟,这些便利都还未能成为现实,与人们的预期还有较大距离。
机器人是集成了感知、决策和行动多项尖端技术的一种综合性技术应用,具有很高的复杂性,目前发展非常快,但图书馆界应用大多数机器人还都不是应用了最前沿技术的产品,它们可能在实验室环境中已经具备了很高的智力,一旦离开实验室,到了人类社会的真实环境中,它们的感知、交互和行动能力都大打折扣,眼盲失聪低智的情况时有发生,这也是目前图书馆机器人存在的主要问题。
但有意思的是这些问题并不影响目前机器人馆员在图书馆受欢迎的程度。广大读者并不在乎机器人能回答多少问题,或者回答得准不准确,而只要图书馆有机器人,就能够吸引大量的读者,尤其是青少年读者。也就是说现在的机器人馆员已经成了图书馆进行机器人技术科普的一个工具,或者说玩具。但这当然也是图书馆存在的价值之一,仅凭这一点图书馆引入机器人就达到了目的,至少是吸引读者的目的。
3、机器人与真人馆员相比在具体工作中有哪些优势和劣势?
毋庸置疑,机器人具有超强的记忆能力、光一般的计算速度和不知疲倦的“体力”,这些特性是人类图书馆员远远不及的,因此对于那些重复性的机械劳动(这里指脑力劳动),或无需天赋,经由训练就可以掌握的工作,这些都是机器人的拿手好戏。而对于需要“情商”的工作,例如面对面交流能力、社交能力、协商能力,或需要具备同情心以及对他人真心实意的扶助和关切,以及需要创意和审美能力的工作,机器人就无能为力了。这样看来数字图书馆服务由机器人来做似乎更合适,而实体图书馆的传统服务则需要更加人性化的真人馆员来承担。
4、结合机器人馆员的应用现状,您认为还有哪些方面需要进一步完善?您最希望机器人馆员拥有何种技能?
目前几乎所有的机器人都可以说是过渡产品,它们在感知、决策和行为等各方面都远远达不到人类的水平。对于这样一个发展迅速的领域,很可能当前购买的机器人在两到三年内就会完全过时,有新的智能机器人完全碾压目前的玩具。有学者预测在2026年人工智能技术就会有突破性进展,机器人达到个体人类水平,这就是所谓的通用人工智能,那时图书馆的各个岗位上都可能活跃着一大批机器人馆员,因为他们什么事都会做。
5、在运用智能设备探索阅读服务新形式方面,贵馆还有哪些尝试?积累了哪些经验?
其实机器人的应用只是图书馆全面走向智慧图书馆的一个缩影。当前采用了大量信息技术的复合型图书馆正在向智慧图书馆发展,图书馆从智能建筑,到自动化管理,到智慧服务,各个环节都会大量用到大数据分析技术、个性化服务技术、机器学习技术、自动翻译及各类自动文本处理和分析技术等等,全面应用了智慧技术的图书馆最终结果是:整个图书馆就相当于一个能够提供给智慧型知识服务的机器人。上海图书馆正在浦东建设新馆,目前正在为将新馆建设成智慧型的第三代图书馆而进行大量的调研策划和开发,届时希望给大家呈现一个“智慧图书馆”的雏形。
6、随着科技的发展,智能机器人在图书馆中的应用场景会越来越多,请您设想一下未来图书馆的模样?
未来图书馆行业的趋势是,图书馆的形式更加多样化,甚至化为无形。一旦科学家所设想的超级人工智能得以实现,图书馆所保存的人类所有知识就可以通过知识胶囊的方式,或人脑界面的方式进行传递,未来社会将会产生大量的人与机器人的混合体,生物人与机器人你中有我我中有你,图书馆可以看成所有人脑共同构成的一个知识机器,继续以存续和发展人类的知识、探索宇宙奥秘并造福于人类自身为己任。

数字图书馆 keven on 26 七 2017

数字图书馆的前世今生

数字图书馆前世今生

 

 

数字图书馆是上世纪90年代初作为与“信息高速公路”配套的基础设施而提出的概念。基于“有路必有车”的认识,美国分别于1992年和1994年分两期投入上亿美元设立“数字图书馆先导计划(Digital Library Initiative)”,孵化了一大批项目,如谷歌搜索引擎算法、谷歌数字图书计划、都柏林核心元数据、互联网档案项目和美国公共数字图书馆(DPLA)等等,都直接源自于其项目成果,或有着千丝万缕的因果联系。

我国的数字图书馆建设起始于1996年,一个标志性事件是国家图书馆联合上海等六家公共图书馆共同发起了“中国国家试验型数字图书馆”项目,第二年该项目得到了国家计委的正式批准,成为国家级信息基础设施建设项目。该项目的研发带动了我国一大批相关标准规范的确立,澄清了许多关键性概念,促进了学界和业界对一个新兴领域的关注,也促使整个图书馆行业迈出向数字图书馆转型、建设“复合型图书馆”的第一步。

二十多年来信息技术飞速发展,经历了从传统互联网、Web2.0到移动互联网的三代变迁,目前正进入以物联网、云计算、大数据与人工智能为特征的智慧互联时代,人们早年寄希望于数字图书馆技术来解决海量、异构、非结构化、多媒体信息的管理、组织、传播和利用问题,随着大数据技术的进步早已不成问题,而数字图书馆本身也从一个以技术研发为特征的应用领域,发展为以数字知识的保存、提供、交流和服务为特征的数字文化设施。伴随着上游知识产业生态的剧烈变化,以及下游读者用户信息需求和行为方式的巨大变化,作为一种知识中介的图书馆也应需而变,呈现出三个发展趋势:

1、从数字化到数据化

早期的数字图书馆项目主要是利用扫描技术将传统的纸本资源数字化,通过对资源内容和其他特征进行描述,建立关系型数据库提供检索,这种数字图书馆相当于传统“物理”图书馆的翻版。随着全文搜索和OCR技术的进步,越来越多的扫描图像可以经过文本化处理而提供全文检索,加上目前越来越多的原生数字内容和多媒体资源的引入,目前的数字图书馆呈现出非常纷繁复杂和丰富多彩的形态。

如果不能解决基于知识的服务问题,就谈不上是好的数字图书馆。当前的数据技术特别是关联数据等语义技术已经提供了初步的解决方案,能够使数字图书馆的基本结构单元,从图像、文本、多媒体文件等机器无法理解的内容,转变为人、地、时、事、物等“数据”信息,即“数据化”,让计算机的管理对象突破文献的限制,而直接管理内容语义,从而使数字图书馆成为真实世界和领域知识的映射。这类基于数据的数字图书馆正在成为数据驱动型科学研究的基础设施,在数字人文、e-Science 以及数字出版等领域发挥着越来越重要的作用。

2、从标准化到个性化

图书馆行业的标准化肇始于上世纪六十年代 MARC 书目数据记录格式,这可能是唯一沿用至今的磁带记录格式,几乎所有图书馆都基于这一格式设计业务流程和服务模式,尽管各类 MARC 略有不同,但没有哪一个行业像图书馆这样重视并应用最前沿的技术标准。

然而越早采用信息技术也就意味着今天包袱越重。标准化是工业时代的理念,它能够带来合作和效率,但信息时代强调的是差异化带来的个性化体验。当前不同类型图书馆由于用户对象的不同和资源类型的不同而呈现完全不同的发展方向,老的业务规范已不再能涵盖所有图书馆,新扩展的子系统完全无法覆盖所有类型的图书馆,标准化已不再可能,新的差异化的业务模式正在建立,图书馆与图书馆将呈现越来越不相同的形态和模式。

目前看来,公共图书馆将继续承担起文化保存、信息交流和普遍均等无差别知识服务的职能,开展阅读普及、消除信息鸿沟、提供信息素养培育是其不可推卸的责任;高校图书馆则必须顺应数据驱动型科研和教学的转变,承担起科研数据生命周期完整过程的管理和提供,同时提供各类共享空间服务;研究型图书馆则完全依靠学科馆员和数据馆员,转型为提供智慧型数据服务为主的无纸图书馆和虚拟图书馆。

整个知识产业上下游融合的趋势日渐明显,内容产业大洗牌,互联网公司全面介入知识生产流通在所难免。在这个新的产业生态中,图书馆由于拥有大量的读者,以熟悉读者的需求、掌握用户行为大数据作为利基,介入开放存取运动,甚至参与学术出版也不是没有可能。

3、从信息化到智慧化

智慧型社会是未来社会的重要特征,也是当前各行各业激烈角逐的主要战场。得益于过去数十年来全社会对于信息化的巨大投入,产生的海量数据为目前人工智能的进步提供了丰富的食粮。图书馆从来是与数据打交道的,从服务的内容和对象来看,图书馆的服务也应该精准化和智能化,智慧图书馆也无疑是数字图书馆的发展方向。

图书馆行业很早就提出智慧图书馆的概念,目前也是数字图书馆研究的一个热点。就采用的技术来看,如下表所示,智慧图书馆的发展可以分为四个阶段,第一代智慧图书馆只是采用了无线射频(RFID)技术的无人图书馆,其实并无任何人工智能的采用。第二代是当前研发的重点,通过采用多种传感器实现各类数据的采集,从而能够提供基于位置的精准服务(或称为SoLoMo,即社会化的基于位置的移动服务)。目前的各类机器学习技术已经为第三代智慧图书馆提供了可能,将对于信息内容的加工处理和提供服务两方面全面实现智慧化。第四代“超智慧”有赖于超级人工智能的突破和应用,目前还是科学幻想,但引起的讨论颇能给人启发。

表:四种智慧图书馆

类型

说明

特征

举例

伪智慧

通过应用RFID等智能标签技术,感知与反馈结合,一定的行为引发一定的结果,“好像”有了一定的智慧。已经实现。

单向度(仅感知图书等实体)、单循环

无人图书馆

智慧图书馆

弱智慧

各类传感器(如iBeacon、WIFI、人脸识别)应用模型和算法综合应用,可进行推送等个性化服务,实现了按程序设计好的“智慧”。正在实现。

多条件,复杂,类似于专家系统,双向,预先设定

小i参考咨询机器人

SoLoMo

强智慧

人工智能和机器学习的普遍应用,动态实时地应对复杂情况,无须预先设定,智能响应。有可能实现。

交互性、随机性;

智能化、人性化

*第三代图书馆*

超智慧

图书馆能够像人一样思考,具有人类知识的总和,总能在你需要的时间和地点,提供需要的知识服务。

应用强人工智能,图书馆工作的许多岗位被机器取代

化于无形,无所不在,随处服务

综上所述,数字图书馆概念由于受到技术进步的强烈影响,一直在发展变化,然而万变不离其宗的是人们赋予它的永恒职能,即保存文化、开展教育、传递信息和终身学习。即便到了数字时代,变化的只有方式和手段,图书馆永远都是天堂一般的模样。

 

读网 keven on 16 八 2014

Robin Williams的人生感悟10则

一个天才的演员能够将角色塑造成自己,他演过几个角色,就活过几个人生。罗宾的每一个人生都给我们留下了深刻的印象,不论是智者、谐星、保姆、总统、诗人还是启蒙者。我们都是你的追随者!

罗宾是幸运的,虽然只活了63个春秋,但他比这个世界上的所有人都长寿!
  • No matter what people tell you, words and ideas can change the world. 无论别人怎么说你,你要相信,言语和思想是能够改变世界的。
  • You are only given a little spark of madness. You mustn’t lose it. 你只有一星点疯狂,你要珍惜它!
  • What’s right is what’s left if you do everything else wrong. 如果你弄砸了所有的事情,你要记住,剩下的都是正确的!
  • Spring is nature’s way of saying, Let’s party! 这是发春的季节!让我们欢唱吧!
  • I used to think the worst thing in life was to end up all alone, it’s not. The worst thing in life is to end up with people that make you feel alone. 我曾经以为孤独是人生中最可耻的事情,不是的!最可耻的是,正是你周遭的人事让你陷入真正的孤独。
  • Comedy is acting out optimism. 喜剧,就是表演出乐观
  • She is not perfect. You are not perfect. The question is whether or not you are perfect for each other. 她不完美,你不完美,问题是你们在一起能不能完美。
  • You will have bad times, but they will always wake you up to the stuff you weren’t paying attention to. 人总是会有走背运的时候,这倒没啥,可气的是他们总会不断地揭你的伤疤,让你回味!
  • Nobody takes a picture of something they want to forget. 无奈最是伤心处,有情宁不忆西园!
  • I believe in destiny. There must be a reason that I am as I am. There must be. 我相信命运,所以我相信我之所以成为现在这样一定是有原因的,一定的。。。
(以上本人翻译,文责自负)

专业评论 &感悟 &数字图书馆 keven on 16 八 2014

近期图书馆技术趋势

  1. 移动化:关注并尽可能提供移动服务
  2. 电子书借阅:尽早开展数字阅读,并统一服务政策,数字资源服务纳入绩效考核
  3. 数字馆藏建设:地方或特色数字资源建设
  4. 统一的资源发现:取代OPAC,把电子书及其它数字内容纳入到馆藏揭示体系中
  5. 逐步放弃传统的集成管理系统:采用基于云服务的管理系统
  6. 追身服务:学科馆员,随时随地
  7. 作为空间的图书馆:讲座会议展览沙龙培训diy创客创新活动空间
  8. 图书馆建筑布局:再一次藏用分离的趋势
又要讲趋势了。总结了上述八项,欢迎板砖。

下一页 »