2011数图研讨班参会收获与感想

上个月参加了“数字图书馆前沿问题高级研讨班”,去之前感觉今年不可能有太多新意,回来之后感到还有许多可以总结的东西。拖至今日,再不总结恐怕要淡忘了,特简记如下:

1、移动图书馆研究和实践渐成大潮。会上既有现状总结和成熟应用介绍,又有基于调查研究和前瞻性的技术指导,还有业务模式讨论。大家都认识到,为体现无所不在的服务、更好地担负起图书馆消除信息鸿沟的责任,我们必须提供数字资源的移动服务。会议涉及很多移动服务特有的、颇具创新的内容,例如:基于地点的服务(LBS)、社会性应用和基于用户体验的设计(我称之为“移动服务特征三要素”),移动阅读、新的服务流程设计、二维码应用等等,在大量的报告中都能找到相关内容。
2、图书馆自动化系统的发展趋势。张甲老师就这个主题带来了很好的报告。这么多年过去,张老师越来越具有敏锐性和洞察力,让人十分佩服。他总结了四个方向(如下),并对第一项中的后台管理和服务发现又做了详细的阐述。
  • 传统集成系统逐渐演化成按使用职能划分的后台管理和发现服务两大块
  • 本地安装的系统向远程代管过渡
  • 费用支付方式从购买转向租用
  • 软件开发采用商业和开源软件混合组配
3、图书馆的生存危机继续存在,且没有丝毫减缓的迹象。从OCLC新的调查(中文版已由《数字图书馆论坛》发布),到美国研究图书馆的调查,都说明这一点。图书馆根据类型的不同而在风格上不断分化将成为一种趋势,与此同时图书馆之间加强全方位更紧密的合作是外包、众包、内包的必然选择(例如2CUL模式)。图书馆界目前其实还不够积极,动作还太慢。这可能也是图书馆的职业特征吧。特别地,图书馆长的感觉与读者用户对图书馆的感觉存在反差,似乎馆长们还不愿承认我们已坐上了坦泰尼克号,必须对他们猛击一掌了。
4、图书馆知识组织的深化。图书馆服务在数字时代面临的一个巨大的挑战是如何深入到更细小的知识单元(如数据),进行组织、整理、“策管”(Curator,秦健教授的翻译)和服务,而不局限于电子书、期刊文章技术报告等。这一直是图书馆近年来研究的热点和核心内容,被认为是图书馆学和图书馆行业的核心竞争力。新的技术架构(包括关联数据、知识组织、云平台和移动技术等)让虚拟图书馆逐渐走向后台,隐形于各类网络服务之中,不一定要直接面向读者,而是作为一种基础服务(包括数据服务),成为赛百空间的基础设施之一。这种新的存在形式,真正能够体现数字图书馆的价值,特别是能够对科研、教育和医药卫生等方面提供持续的支持。
5、读者用户的体验(UX)开始引起高度重视。从广义上来讲图书馆的用户体验可以包括真实空间和虚拟空间两部分。物理空间的体验延续IC、LC、KC的发展路径,图书馆要给读者更多的空间。虚拟空间方面,读者驱动的购买(PDA)、网站界面及服务流程设计等方面,都要体现用户体验(对专业图书馆影响较大,例如JISC的VRE)。
会上很多业界明星(交大、清华、北大、中科图、国图以及东道主)都做了很有特色的报告,特别是交大,已形成了一套上升到理论的完整模式和做法,虽然不太可能一帆风顺,但值得借鉴的地方多多,值得关注。

平板电脑购买指南:十大必选因素

紧随iPad之后,越来越多的平板电脑奔入市场,预计今年的出货量超过5000万台。苹果公司开辟的新一代电脑物种,作为手机与笔电的后代,颇具杂交优势,连电子书阵营的帮主亚马逊也宣布要来插一脚,将来一定姐妹众多,枝繁叶茂。
虽然iPad亮丽异常,但跟所有苹果家族的产品一样,都有让人爱之深痛之切的地方,例如兼容性,例如输入输出,等等。其实iPad并非你的必然之选,以本博主事事尝鲜的经验,这里就告诉你十个必须考虑的因素(参考外媒):

1、跑的是什么操作系统?
最有名的当然是iOS,当然只有苹果家族的iPad(包括iPad 2,iPhone和iPod Touch)。
其 次是谷狗的安卓系统,蜂巢(andriod 3.0)最好,但据说需要双核才带得动(如三星的Galaxy Tab 10.1、摩托罗拉的Xoom等),因此目前大部分只能用姜饼(2.2,2.3)(如三星Galaxy Tab 7)。免费的东西人人喜欢,大多数“其它”公司(如Dell的Streak,HTC的Flyer等)都采用。
黑莓的Playbook(RIM生产)有自己的系统Tablet OS。
HP把手掌机的鼻祖PALM买下来之后沿用了WebOS操作系统,据说在界面和体验上与苹果有的一拼,希望能够跨越销量的临界点才不至于完败。
另 外当然是昔日的廉颇视窗系统了,可惜他的8.0还没出,诺基亚同志应该等急了吧?Windows Phone 7严格说不是平板操作系统,因此放在这里说有点勉强。而一些台湾公司山寨的平板(例如View Sonic(优派)10s和Acer Iconia W500)干脆直接用Win7,混个脸熟,其它倒没什么,只是这耗电实在受不了
目前大致就这些。

2、面子有多大?
说平板电脑介于智能手机和笔记本电脑之间,主要指大小,而平板的大小主要由屏幕的大小决定。
现在智能手机4.*寸的屏幕已经很普遍了,因此平板的屏幕至少是5寸,一般是7寸到10.*寸,再大就没有多少便携优势了。
面子还有分辨率和最高亮度的因素需要考虑。这方面苹果的视网膜屏应该是最好的,当然也有说还有比它更好的屏,苹果当然也不甘示弱要推出iPad HD,同样尺寸下分辨率翻番!

3、心脏强不强?
所有平板电脑的CPU都是基于ARM的处理器技术,只是各家有各家的版本,以及有些是单核,有些是双核。例如苹果的叫做A5,而安卓系统通常跑在Nvidia的Tegra2上。

4、不要3G行不行?
凡平板必有WiFi,但是WiFi毕竟没有3G方便,要享受随时随地无时无刻不联网的便利,非3G莫属。其中当然是移动网点最多(可惜几乎没有平板直接支持TD-SCDMA),电信发展最快,联通在偏远地区几乎就是聋子的耳朵。上述结论为前不久本人川西之行实测所得。
当然3G需要额外的通信费用,十分可气的是,这些国营垄断的电信公司提供的数据SIM卡都不允许打电话,天底下哪有这个道理!

5、眼睛(摄像头)有几个?
带前后两个摄像头几乎成了平板的标配了,让你可以进行视频通话、聊天,并且可以拍照拍摄像等,摄像甚至能支持720p准高清标准。只是很多平板的摄像头素质并不高,购买时需注意。

6、应用多不多?
前不久iPad专属的应用据说已经超过10万个了,安卓系统的应用要少得多,大约只有几千个吧,不过常用的也都有了,基本上苹果平台著名的软件,都会被很快移植到安卓平台上。除了两个平台,其它平台的专用软件寥寥可数。

7、肚量大不大?
平板电脑自带的内存从几个GB到几十个GB不等,除非看视频和安装效果惊人的游戏,一般用用完全够了,而且除了苹果之外,其它都可以随意插卡扩展。

8、能不能外接显示器?
很多平板电脑可以音视频输出(如三星Galaxy Tab 7)或HTMI外接显示,有的自带输出接口(如Xoom),有的需要购买转换接头,还有的甚至可以外接VGA(如iPad)。

9、胖搜如何,体重几何?
iPad2只有8.8毫米的厚度(9.7寸)重601克,与厚两毫米的三星10.1寸重量大致相当,黑莓的Playbook厚9.7毫米但只有400克重,相比Xoom的730克的重量来说要轻便多了。
身材很重要。俺现在天天拿个680克的iPad手快残疾了,于是换了个七寸的三星,除了个别应用(如Zaker)不能用之外,其它还真没什么不方便的。

10、电池续航能力强不强?
这曾经是笔电最让人诟病的地方,iPad出来后超过8小时的续航能力让人喜出望外,于是成了考验平板的基本标准之一。目前除了山寨机之外,大厂品牌基本都能做到5小时以上(一般应用,如果Wifi、蓝牙及多媒体都开着,亮度调到最大,恐怕达不到标称时长),基本能满足需要了。

很多人在充分享受了平板的便利性的同时,对它提出了更高的要求:希望平板能够取代笔电。出门带两个东西毕竟还是一种不方便。然而目前看来平板在真刀真枪地干活方面距离笔电还是有差距的,最不方便的就是输入,效率很低。因此尽管苹果在iPad上开发的办公三件套功能超强,而且现在各大系统上跑的软件都全面支持文本编辑、图形处理、网站设计、视频动画制作等,从CPU、内存等方面来说平板还真能胜任(不比三年前的笔电差多少),但还少有人习惯在平板上办公的。这方面可能还有待于软件界面和用户体验的彻底改变吧。

因特网宣言

原文参见:http://powazek.com/posts/2842

  1. 因特网是中立的,无好无坏。人有动机,网络没有。The internet is neutral. It is neither good nor bad. People have motivations, the internet does not.
  2. 我们改变因特网更甚于因特网改变我们。人类也会改变,但是非常缓慢。We change the internet more than it changes us. Human motivations may change, but they change very slowly.
  3. 人类很江湖,人类发明的技术也很江湖。我们必须正视这一点。People are messy. The technology we invent is messy, too. Deal with it.
  4. 因特网不是传统媒体的敌人,它只是新成员。所有的媒体如果和平共处这个世界才会更美好。The internet is not in opposition to traditional media, it’s just more media. All media works better when it works together.
  5. 所有的现实都是虚拟的。思想也是虚拟的,并且将会永远如此。因特网使我们能够更好地实现“同一个梦想”。All reality is virtual. Thought is and has always been virtual. The internet enables us to think together.
  6. 技术并不是人性的敌人,发明和使用技术是造就我们人性的一个组成部分。Technology is not the opposite of humanity. Inventing and using technology is one of the defining characteristics of being human.
  7. 因特网可用来行善或者作恶,但它终究是这个网络世界的一个积极的力量,因为它把我们联系在一起。The internet can be used for good or bad, but it is a net positive force in the world, because it connects us to each other.
  8. 信息的增加总是好过信息的不足。人类相互之间进行自由的交往是一项基本人权。More information is better than less. Freedom to connect to others is a fundamental human right.
  9. 访问因特网开拓了视野,倾听别人的故事使我们更加聪明,更富于同情心。Access to the internet broadens horizons. Hearing other people’s stories makes us more empathetic, smarter.
  10. 因特网是人创造的,如果你不满意,你可以使它更好。People make the internet what it is. If you don’t like it, make it better.

Our Choice,一种“不过如此”的革命

当年一种叫“电纸书”的阅读器甫一上市,我就预言这东西无法长久,或者说无法得到真正的普及。当今时代,人们已被信息技术宠坏了,屏幕上处处灯红酒绿活色生香,仅仅依靠“像纸一样”,就如同现代人吃所谓“窝窝头”一样,只能有一时的新鲜,不能长久。

最近iPad/iPhone版的Our Choice问世,几乎为“电纸书”的盖棺定论,又钉上了非常关键的一颗钉子。

那 么这本“电子书”究竟与以往的电子书电子杂志有何不同呢?以前不是也有过大量图文并茂、媒体纷呈的电子杂志和电子书?仔细推敲起来,其实Our Choice从任何角度讲都没有什么“革命”性的变化,但是这本书却从整体上给人带来了革命性的“震撼”。就像几乎所有苹果的产品一样。所有的技术都是现 成的,所有的需求都不是不可取代的,但是iPod席卷MP3、iPhone狂扫智能手机、iPad创造了平板电脑市场,现在这些苹果的应用又开始攻城略地。你只要比别人多坚持一点点,这个世界就是你的。

从形式上讲,现在所有的“电子书”都在模拟纸本图书,不管是硬件还是软件。这本Our Choice也在内容呈现及导航方式方面可以看成是印刷品的复制件。是因为人们已经完全习惯于“书本”阅读,还是开发人员从根本上还是缺乏想象力?或者不敢走得太远?

这本书有什么特点呢?看来看去,有这么几条(其实都是陈词滥调):
  1. 全媒体:文本照片音视频资料及动画,戈尔的解说随处可见;
  2. 专业性:更加顺滑,排版专业;
  3. 交互性:地图、游戏、图表的呈现。
应该说它并没有发挥数字媒体的所有优势,如:
  1. 缺乏参与性。连搜索都没有,也无法跟帖、评论;
  2. 开放性不够,基本上只是一个封闭的内容系统,内外链接都缺乏;
  3. 内容是“死”的,无法根据读者的不同(如残障、语言、教育程度等)而改变内容和形式,这点似乎要求高了,但是眼下很多类似的“电子教材”都具有这种功能;
  4. 不支持mashup,内容无法搬运和重用。
  5. ……
然而这本书的出现让很多人欢呼,它的开发者甚至登上了TED讲坛,Youtube上的介绍视频被人火热点击,人们趋之若鹜,呈现另一种“洛阳纸贵”。

这不禁让人们担心另一种数字鸿沟:有没有苹果的设备成了一种鸿沟,图书馆是否会为了弥补这个鸿沟,而免费出借iPad呢?

未来的电子书一定是多种类型、丰富多彩的,Our Choice只是给出了一个例子,说明了一种可能性。未来是无穷的,现在只是刚刚开始,好戏还在后头!

W3C LLD(关联数据孵化小组)近期进展

感谢曾蕾老师邀请,28日中午参加了一场关联数据的网络会议(Agenda在此http://lists.w3.org/Archives/Public/public-xg-lld/2011Apr/0066.html),会议采用的工具以及整个过程挺有趣,此记录之。

网络采用的平台是W3C的IRC实时文本+电话会议方式,平台有两个机器人(Zakim和RRSAgent)可以掌控发言角色,安排顺序,最重要的是能自动生成会议记录,并发布在W3C的网站上。比如这次会议的记录会后马上就经过整理,发布在此:http://www.w3.org/2011/04/28-lld-minutes.html (IRC的记录:http://www.w3.org/2011/04/28-lld-irc)。

因为不舍得拨打国际长途,我通过曾老师用Skype转播参与了会议全过程,通过IRC的文字交谈功能算是参加了讨论和互动。会议时间控制得很好,原计划一个小时,基本上到点就结束了。参加会议的成员来自世界各地,美洲的正值午夜,亚洲的正午,欧洲的还在凌晨。会前大家都必须做好准备,用这种形式推动课题进展,效率极高。

Tom Baker作为DCMI技术应用方向的实际领路人,一直很看重W3C,很有W3C情结。近十年来DCMI的元数据运动离图书馆行业越走越远,随着万维网由技术导向向内容导向的转变,DCMI越来越走向万维网,成为Web语义化和知识化的核心内容之一。这个方向我认为是完全正确的,也是图书馆界的专业知识贡献于网络社会,在万维网上寻求类似定位的必由之路。老Tom在W3C中仍然要扛起图书馆大旗,于去年5月21日牵头成立图书馆关联数据应用的孵化小组(LLD:http://www.w3.org/2005/Incubator/lld/),联合图书馆、博物馆、档案馆等相关领域的关联数据先锋,共同探讨关联数据应用的可能性和巨大潜力,并努力为人们指明方向。。

这个小组凝聚了相关业界(图情博档)的技术精英,然而大家其实都是志愿者,每人都有自己的工作,平时相隔万里,托信息技术和网络社会的恩赐,把大家紧密联系在一起。据曾蕾老师说,基本上每周都召开课题组会议,所有计划、过程、进展、内容、成果都以一定方式在网上公布,其采用的技术工具也并非十分先进,甚至可以看成是网络应用的古董,不外是邮件列表、IRC、电话会议、wiki之类,我们上次召开上图学会第二届图书馆前沿技术论坛(关联数据)还用了非常先进的Cisco公司的WebEx会议系统,这类人士通常只把注意力集中在要做的事情上,对工具的选择有一些基本原则,例如一定要是开源(免得有知识产权等相关法律问题)、足够简单(方便绝大多数人使用)、功能够用并以提高效率为主要目的(额外工作例如后续加工工作尽可能用程序来完成)等等,对于花拳绣腿的功能一般都很漠视。

看起来这个小组的各项研究任务正按计划进行,已经取得了不少进展,然而距离其雄心勃勃的目标,看来还是有相当的挑战。根据其目前的研究框架(下述),点到为止是基本上没有问题的,但是能不能非常准确地拿捏到位,深浅适度且带来共识,还要看最后的结果。但是无论如何,这应该是图书馆相关领域技术应用前沿近年来最重要的进展了,希望不久的将来能够看到其成果集成应用到相应的解决方案中去。

目前的研究框架大致如下:

  1. 界定本课题的涉猎范围和主要内容,主要对一些基本概念进行界定,例如什么是本研究中所称的“图书馆”。对每一项研究而言概念界定往往是基础工作,是最重要的,尤其要在参与研究的成员之间达成共识,这样才能避免大家自说自话,最后再回头调整,出来的东西以其昏昏使人昭昭。
  2. 阐述应用关联数据技术能够带来的好处(主要向业界同行和“利益相关者”宣示),因为技术的隔阂和对于行业的职能作用及其未来前景的认识的不同。现在看起来这部分很难写,是最具有挑战性的。目前的做法似乎是从几个角度同时展开,从应用领域(图书馆、档案馆、博物馆、网络资源等)、用户角色(研究人员、教授、学生、开发者、机构、客户等)、技术方面的进步以及从用例中总结出来的好处。
  3. 现有的词表和数据集。曾蕾老师就主要牵头这部分内容。现在看来好像就这部分内容还比较成熟和确定,梳理得较为完整,但内容和很庞杂,看起来博大精深,选择和介绍到什么程度是个问题。目前似乎分两部分:属性(关系)元素所成的各类模式(元数据集),以及各类取值词表(包括领域模型中的各类实体),前者可以编码为OWL本体,后者可以以SKOS形式发布。
  4. 相关实现技术。这也是个挑战,因为关联数据本身是一个Web架构的问题,不是任何具体的技术问题,要实现这个架构可以有多种方式,实现的程度也不一样。具体而言,涉及到数据的转换、重新发布、与内容管理平台的结合、链接的管理维护、OWL等各类编码的实现、与关系数据库的关系、海量三元组存储库的管理、效率问题、SPARQL端点的实现、嵌入HTML(RDFa)的方式和工具等等,这部分目前看起来还很初级,但这部分内容涉及对技术方案的总结和梳理,提到了很多目前普遍采用的工具或方法(如D2RQ),值得尝试。