“最先进的”图书馆系统

马上要开云计算会了,一业界朋友认同云计算肯定是发展趋势,但不认同跟图书馆有什么关系。同时提出这么一个问题:你认为现在“最先进”的图书馆系统有哪些?为什么贵国就这么落后?而且不思进取,越来越落后?

对于云计算我已经没什么好说的了,既然已经是发展趋势,将来图书馆管理系统的解决方案都会采用云计算,应该毫不奇怪。

对于第二个问题,最近倒是有必要再跟踪一下,看看是不是已经或者准备采用云计算,不就可以用“铁的事实”说服广大不明真相的群众?也算是对我《建设2.0版的图书馆集成管理系统》(载《数字图书馆论坛》2007年4月)的更新补充吧。

粗看一下,下面这几个系统可以作为调研的候选:

  • TALIS(博大精深啊)
  • OLE(开放系统,开发中,需求设计已经让人惊异,竞争对手颇有微词,在看热闹)
  • OCLC Web Services
  • URM(Ex Libris)
  • …… (名单增加中)

从这个列表中你就可以看出,下一代的ILS将与过去全然不同!他们不再是单纯的一种“软件产品”,而是综合了在线服务、SOA理念、Web Services、2.0思想以及云计算等多种东西的怪胎。

从这里你就可以知道国内的一些行业软件公司是怎样的了。不进行招摇撞骗,他们能活吗?

上面这项研究我想做成开放式的,时间大约3-4个月,目的是全面调研,总结出代表ILS新技术趋势的结论。希望能有几位合作者。我的承诺:保证核心期刊发表(可能不止一篇,需要根据贡献由我来排名),本人保证绝不侵吞别人的研究成果。其中中间调研过程的材料(如有关数据或翻译资料)将结集置于网上共享。对于参加翻译或资料整理工作同仁,我将酌情致酬,不低于国家规定的稿费标准。任何有兴趣参与的人士(包括有兴趣的相关专业研究生)都可以跟我联系:kevenlw at gmail.com。谢谢!

讲座预告:张甲告诉你图书馆自动化系统的未来

更新:张甲老师的讲座ppt下载:在此

更新:会议通知在此

下周一下午,国内图书馆界所熟悉的、美国霍普金斯大学的张甲老师,将来上海图书馆给大家做一场讲座:未来的图书馆系统(Future Library System)。(目前暂定3月16日下午2点,上海图书馆5205学术会议室,欢迎参加)。

这个题目是我所关心的,因为曾经写过一篇《建设2.0的图书馆自动化系统》(载《数字图书馆论坛》2007.4.1-7)。两年过去了,技术环境已发生明显变化:云计算出来了(取代了网格?),SaaS和SOA更加深入人心,基于数据(而不是文档)的网络成为潮流,数据保藏(Curation)越来越引起重视,语义Web的各项技术正在走向主流,无所不在的电脑(电子书等手持设备)如火如荼。下面这些问题是我希望张甲老师答疑解惑的:

  • 数字仓储、复合集成、链接管理、读者社区、嵌入环境、自助借还、物流配套、区域合作、OpenID等,面对多样化的需求,自动化系统如何满足?
  • 哪些新功能最有可能成为下一代ILS的标准功能?
  • 图书馆目前的操作模式正在发生哪些变化?威胁到ILS了吗?
  • 开源ILS有几成胜算?
  • 集中编目/联合编目/合作编目/在版编目/外包编目是不是发展方向?
  • FRBR的实现重要吗?
  • 网络版的自动化系统(基于云计算)可能吗?
  • 电子书/google books等项目,将如何影响图书馆业务,乃至ILS?
  • ……

先就想到这些,恐怕够张甲老师讲一周的了吧?嘿嘿。

面向未来的编目平台:biblios.net

开发图书馆自动化开源软件KohaLiblime新近推出了一个网络编目平台:https://biblios.net/,不仅让人耳目一新,简直就是醍醐灌顶。什么是未来的编目?这就是!(当然,它还需要支持RDA编目——虽然它已经支持多种MARC、DC、ONYX等目录格式了,同时应该支持更简单的“傻瓜式”编目)。

Koha的编目模块也叫Biblios,但是这个biblios.net是完全不同的东西。可以将它看成是一个基于Web的合作/联合编目平台,同时是个共享书目数据的平台。支持z39.50访问,而且似乎内嵌了z39.50自动寻址的工具(如何实现的还不是太清楚,好像利用了IRSpy的z39.50注册表),甚至不需要知道z服务器的参数,就能寻址。由于编目工作的专业性和复杂性,它还应用了大量的Ajax,尤其是还支持客户自定义宏,让人叹为观止。

Jonathan Rochkind在这里有一个很好的介绍。他说,Biblios.net有这样一些特点:

1、放宽编目权限(Policy on changes):馆长总是以为只有编目员才能保证编目质量,实际上MARC数据的质量有多差只有你当了编目员才心知肚明。biblios.net相信Wikipedia的模式,数据允许人修改,才会越来越好。

2、开放读写API(Read and Write APIs):2.0嘛,当然要开放API啦。而且这提供了一种合作更新数据的机制:保证了你的数据能获得不断的更新——如果有修改的话。

3、开放存取(Open Access):很简单,所有数据都是开放存取的。你上传数据不给你钱,下载数据也不问你要钱。这也是一种2.0模式。能不能行得通只能走着瞧了。说不定公益性的图书馆比商人更势利,也未可知。当然,如果你需要Liblime寄存你的馆藏数据,整合到你的ILS里头,或者提供其它服务,还是要付钱的。这是服务嘛,天经地义。

4、支持多种格式(Multi-Format):前面已经说了,MARC(MARCXML自然不在话下)、DC、ONYX,甚至说RDA的XML都支持,不过恐怕很多开发还正在进行中吧?

5、挑战权威(The Elephant in the Room):OCLC要紧张了,虽然现在看来Biblios.net并不记录馆藏信息,从而并不是一个联合目录,不会与OWC的Local竞争,但是它至少已经有部分OWC的合作/联合编目功能,它对于Open Data协议的支持也会让OCLC出一身冷汗,看起来OCLC想要修改的数据使用协议可能就是针对这种趋势的呢!不知道OCLC在推迟新协议的生效之后,会有什么具体动作:是更加严格,还是从善如流?

更多的权威内容,请看Liblime.net的主创人员Nicole Engard向广大编目同行的公告:http://www.web2learning.net/archives/2522

前不久王松林老师建议研究合作编目未来的发展,相信Biblios.net已经给出了一个很好的案例。

p.s. 还记得编目精灵介绍过的Yacpac吗?就是那个有趣的OPAC?也是这家公司做的。

ILS可以同时支持多个知识组织体系吗?

上周在“书商为什么不用图书分类法”讨论了传统的图书馆分类法不适用的原因。其实除了书店之外,对于网络环境中的数字资源,传统的分类法或者主题法也大有改进的必要。

记得在以前的博文中曾说过,元数据实际上是原物的某一个侧面的指代物:一个替身或化身,如果把分类体系看成一张知识的大网,每本书赋予一个分类号,在这张大网中就找到了这本书的一个位置,也就是一个指代。主题词也是这样,标签也是这样。之所以要找一个替身,根本原因在于被代表的资源是实物载体,不可能被实际放在某个位置,又同时出现在另一个位置。

而数字资源就有所不同了,可以方便地拷贝、挪移,可以同时出现在各个知识体系中,不需要“替身”,自己就可以走来走去。并且可以通过“计算”,将整个数字对象作为一个整体,而不抽取任何只表达局部的片面的“关键词”,来赋予一个数字对象一个唯一的向量值,代表这个数字对象的属性,进行特征匹配。

因此,在一个知识库中,按照多个不同的知识体系组织所有的知识单元是完全可行的和必要的,以此来看,一个图书馆的图书分类法为什么只能用一种呢?主题词为什么也只能用一种呢?为什么不能同时用多种知识组织方式安排整个馆藏呢?这实际上是OPAC2.0本质的与众不同之处。

那天在武汉与图创演示InterLib的王先生谈到ILS对多个知识组织体系的同时支持问题,他似乎还没有完全明白我的意思。

这当然会造成我们的自动化系统的不适应,以及MARC格式的不适应。这也是我们要从根本上改变MARC格式和图书馆自动化系统的原因之一。

Karen Schneider这篇文章 给了我们两个正在变革的实例:亚利桑那州Maricopa 县图书馆凤凰城公共图书馆,当然还没有上述那么超前的变革,但是已经开是一种大胆变革了:从废弃杜威分类法,采用书商的主题标目BISAC开始。令人奇怪的是ALA的官方网站居然也对这种异端邪说大开绿灯,而且后面的30多个留言中大多数表示了支持,并且有许多发人深省的讨论。看来(美国的)图书馆界也并不保守,(美国的)图书馆员很有一种开放和追求变革的心态。

胡侃图书软件市场风云变幻群雄并起

下午收到领导的一个妹儿,要了解一下图书馆软件市场的情况,于是拉拉杂杂写了许多,虽然孤陋寡闻,但也觉得光给领导看有点浪费,也害怕误导了 领导,所以也贴出来给同志们看看,群众的眼睛雪亮,如果有不同看法或意见正好可以纠正,让我有机会大家学习。各位产商代表如果看了不高兴,也欢迎留言批判。上周在杭州曾被储树青馆长问及类似问题,只是简单回答 了一下,很不全面,如果储馆长能够看到这个帖子甚好。


近几年图书馆自动化系统 (LAS, 又称图书馆集成管理系统LIS: Library IntegratedSystem)面临对数字图书馆需求的冲击。传统上以书目为中心的业务管理流程首先受到以读者为中心理念的冲击,书目的查询由专门的客户端程序向支持浏览器的方向转变,接着增加了许多基于Web的在线用户服务功能,比如在线续借、预约等,这就要求强化用户管理,支持更为广泛的用户身份认证(一卡通)。图书馆的内部业务流程也开始重视面向工作人员的”界面友好”,区域协作更加强化了对集中Z39.50支持、联合编目、馆际互借、多MARC格式以及多库的分布式管理功能,以及类似于中心图书馆的”LibraryConsortia”。这都是对传统图书馆自动化系统功能提出了更高的要求。在这些方面,国内的系统似乎没有”全能型”的,已经开始有点顾此失彼,难以应付了。

数字图书馆建设的要求首先是要将数字资源的采选订藏编目管理发布服务结合进来。虽然还没有形成固定的运行模式,但是国 外的相关研究开发已经不少,有一些系统已经考虑到相应的功能。利用MARC的856字段加入链接从而支持电子资源全文获取是一个基本应用,进而随着OpenURL开放链接标准的成型为图书馆的电子资源管理提供了一种基于”链接”的标准方法,国外的一些大型系统( Endeavor / Ex Libris / Sirsi + Dynix / Innovative )都有支持开放链接的产品,甚至与数字资源出版/发行商合作,提供”软件+资源”的服务模式。OAI也是正在兴起的一种电子资源整合检索标准,但属于相对独立的开放标准,还没有哪家图书馆软件系统提供商作为他们的软件产品或服务选件。现在国内许多公司把数字化管理系统、数字参考工作、电子阅览室管理、甚至办公自动化也作为图书馆集成系统的选件。但是应该说图书馆还没有一揽子交钥匙的、很好的”数字资源”的集成管理服务方案,因而也还没有传统与”数字资源”结合的、功能全面的”图书馆集成管理系统”产品获解决方案。数字资源基本上是独立系统,各自为政,图书馆基本上采取分门别类个案解决的办法,例如加州数字图书馆提出开放”裸”数据的购买要求,或者比较大的、有开发能力的图书馆自行开发特定中间件,国内外目前基于页面分析技术进行Web资源整合也是一种流行的通用方法。目前这些方法都有明显的缺点。

市场上可以购买到的产品方面,就我 所知,国外产品主要有ExLibris的ALEPH500及系列产品,SirsiDynix的Unicorn系列和Horizon系列产品,Innovative的Millennium产品在国内较活跃(由于Sirsi和Dynix的合并,现在变成3家公司4种产品),产品成熟度、功能性相差无几,而从媒体的报道和用户的口碑而言,ExLibris的系统可能由于起步晚而在设计上较为先进,而且由于是以色列产品而更为”国际化”一些,对多语种的支持可能更好一些,而且有较为完整的产品线,例如其SFX专利产品是最早支持数字资源的开放链接的产品,可能也是由于技术上稍稍领先一些,其价格也是最贵的,听说光是核心的ALEPH500(传统的图书馆自动化集成管理系统)就不低于***万人民币,如果是大馆,起码要**个许可,总价不会低于***万-***万。Dynix虽然几经转卖、易主或兼并,但其技术在市场上却一直是不甘落后,虽然承诺的新功能总是推迟推出,但给人留下了深刻印象。相信与Sirsi公司的兼并又有助于Sirsi提高技术,共同拓展市场。当然这些公司在技术方面的领先并不是难以超越,其它跟随公司往往不久也都掌握了类似的技术、开发出类似的产品(见表二,分数字图书馆解决方案、开放链接解决方案和元搜索方案三个方面的附加产品)。由于Dynix与Sirsi的合并(传言是被兼并),使Dynix的Horizon变得前景不甚明朗,给原本在新产品中承诺的许多新技术将如何发展,SirsiDynix的两条产品线如何向用户提供同等的技术支持等都成了疑问,因此有不少想买系统、换系统客户都在犹豫,老客户也在观望。但是不论如何Sirsi自己的Unicorn和Innovative的Millennium几乎不相上下,还是有得一拼。这两个产品的最终总价(包括几十个许可证)应该在**万美金左右可以拿下。国外尚有许多企业未进入国内市场,例如很有竞争力的Endeavor公司,特别是面向低端市场的海外中小图书馆软件企业几乎是空白。

国内的图书馆自动化系统现在也是水涨船高。大约十几万人民币到**万人民币应该可以拿下。现在恐怕已经没有几万元的系统了(除非应用于中小学市场的)。目前比较有市场竞争力的恐怕也就南京的汇文系统、深圳的ILAS-II、北邮的MELINET了,另外还有北京的丹诚Datatrans、博菲特、金盘系统等等(见表三),由于没有使用或”近距离考察”过这些系统,恐怕无法评论好坏。从211高校的使用情况(见下表一),汇文口碑是不错的,装机量也最大,ILAS其次,但是由于公司近年来的重点在dIlas系统的开发,该产品至今尚未投放市场,目前市场占有率下降也属无奈,dIlas还未定价,据称定价不会低,不知其具体的市场定位如何,其开发思路给人的感觉是比较传统,希望市场策略方面能够有所创新,如果这个老牌产品不打组合拳,结合资源或者服务,在市场营销方面拿出一些新的手段,很让人担心这个产品的前途(本人也实在衷心希望有一个凝聚众人力量的民族品牌能够在国内占领市场,起码是中低端市场,造福图书馆界,从而造福广大读者,啊啊)。北邮的系统近来也没有听说新的市场拓展。这些软件主要实现的是图书馆传统核心功能,还没有国外大型产品的技术思路(例如支持Web Services以及RSS等)和完整的产品线,如果加上定制开发数字图书馆部分,虽然国内目前没有很成熟的公司(最成熟的可能要数参加CALIS数字图书馆认证的一些公司了,当然不排除还有数家不屑于参加CALIS认证的公司),但对新的功能要价都不低,杂七杂八加起来最少也需要**万左右。国内图书馆界一直存在喜欢自行开发的现象,这个趋势可能还会维持下去,国际上现在有用开源软件的趋势,特别是DLI1和DLI2遗留下大量的成果,当然这需要图书馆有一定的软件人才,或者合作伙伴能够提供技术支持作为前提条件。在一些老牌软件厂商创新乏力、服务下滑的情况下。一些新开发的厂商极有可能成为新星,在国产软件不合用而国外软件价太高的夹缝中寻找生路。东莞图书馆采用的新系统就是一家新兴企业开发的产品,最近这个产品又在黑龙江省图书馆的招标中中标,就是一个值得注意的现象。

以上比较主观,仅供参考。欢迎批评指正。

表一

公司名称

产品名称

2001

2002

2003

2004

安装总数

Sirsi

Unicorn

117

207

124

134

1719

Dynix

Horizon

126

114

168

193

1481

Endeavor

Voyager

50

44

35

22

1304

Innovative

Millennium

157

136

144

119

1160

Ex Libris

ALEPH 500

80

58

51

53

923

见:杨思洛”美国图书馆自动化系统市场管窥”(《图书馆杂志》2005/?)引Marshall Breeding. Gradual Evolution-Automated System Marketplace 2005. http://www.libraryjournal.com/article/CA512267

表二

厂商名称

DIGITAL LIBRARY SYSTEM

卖出数量

LINK RESOLVER

卖出数量

METASEARCH INTERFACE

卖出数量

Dynix

Horizon Digital Library

3

Horizon Link Resolver

1

Webfeat

36

Endeavor

ENCompass for Digital Collections

489

LinkFinderPlus

302

ENCompass for Resource Access

17

Exlibris

DigiTool

11

SFX

220

MetaLib

153

Sirsi

Sirsi Hyperion Digital Media Archive

16

Sirsi Resolver

36

Sirsi SingleSearch

52

VTLS

VITAL

6

VSolver

0

VECTORS

2

Innovative*

Electronic Resource Management

不详

WebBridge

不详

MetaFind

不详

见:杨思洛”美国图书馆自动化系统市场管窥”(《图书馆杂志》2005/?)引自国外报道

*感谢编目精灵(http://catwizard.bokee.com/)提供Innovative的相关产品信息。


系统名称

用户数

所占百分比

百分比合并

国外

UNICORN

7

7.36%

23.16%

INNOPAC

6

6.31%

HORIZON

6

6.31%

ALEPH

2

2.10%

VINTAGE

1

1.05%

国内

汇文系统

31

32.63%

76.84%

ILAS

18

18.94%

MELINET

11

11.57%

DATATRANS

2

2.10%

博菲特系统

3

3.15%

MILINS

3

3.15%

金盘系统

2

2.10%

NLIS

1

1.05%

SULCMIS

1

1.05%

图腾系统

1

1.05%



原文注:数据来源:《现代图书情报技术》2004年第3期(原文统计数据略有误差,本数据为最新数据)



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=629351




Technorati :