2008图林十大技术进展(下)
6、John Blyberg推出SOPAC2.0
08十大图林开源将由暨大小钟隆重推出,不过由于SOPAC2.0太有影响,在技术进展中不得不说。John Blyberg离开Ann Arbor另谋高就之后,把“社会性开放公共查询目录(Social OPAC)”的开发也带到了新东家:Darien Public Library,2008年9月,随着Darien新馆的建成开放,SOPAC2.0也闪亮登场。
由于书目系统对于传统图书馆极为特殊的重要性,OPAC2.0可以说是图书馆2.0中最重要的技术内容,而目前商业系统还不可能提供2.0解决方案,于是涌现出一批开源OPAC,其中SOPAC和Scriblio是其中的代表,他们分别基于著名的开源内容管理软件:Drupal和Wordpress。进一步介绍请参见这里,这里和这里。
7、亚马逊的云计算
你还以为亚马逊是那个卖东西的网站吗?那就大错特错了,亚马逊正在成为提供计算能力、存储空间、软件构建和应用模块的“赛百基础设施”公司了。试想,将来你只要注册一个用户,编写数行代码,上传部分资源,你就可以让全球用户享用你的服务,而不用考虑任何机房、服务器、带宽、开发平台等凡人琐事。而且你还只需要按照用户使用的次数或时间付费,没人买账你也没有成本!这是多么惊人的事情!网络成了真正的基础设施,即插即用。与之相比,网格、SaaS、Web服务等太原始,太IT了!
这一切如何实现?当然是“云计算”!当然其实现也需要基于上述的早期技术。站在巨人的肩上,才能更为高远。
爆炒云计算的公司几乎囊括了所有IT界叫得出名儿的腕儿(Amazon、Google、Microsoft、SUN、IBM、Oracle、EMC甚至阿里巴巴之流),亚马逊之所以被偶慧眼识中脱颖而出,是因为其对于云计算的清晰解读,以及2008年10月23日转正了2006年8月推出的测试版。
如果你一直有个疑问:云计算跟图林技术什么关系?俺只能告诉你俺也不知道。要是k知道的话,它就应该排在“十大进展”之首,而不是之七了。
关于亚马逊及各家云计算大厂的进一步介绍解读,可以参阅这里。
8、电子纸首次大规模应用
电子书Kindle是个划时代的产品,但已经是旧闻了,本祈望今年新版Kindle可以作个大新闻,但脱期了,倒是电子纸爆出了一个里程碑式的事件:美国Esquire(“老爷”,又译“君子”)杂志庆祝75岁生日,于08年10月号推出电子纸专号,售价仅5.99美元,大卖10万册(详见数字出版在线报道,以及视频)。这种模式会不会大行其道,现在还很难定论,但不管怎么说,这“第一本”的确让《老爷》大出风头,奇妙的是张嵌入封面的电子纸,在三个月的电池寿命中还能通过网络改变内容,科幻电影中的情境真的到来了!国内图书馆不知道哪家有订?或者赶紧抢一本回来!
9、ATM自助图书借还机
借助于RFID技术而兴起的ATM自助图书借还机的确让不少馆长Hi了一把,但这种模式能不能三个代表俺一直很困惑,这么昂贵的成本,这么几本图书,新技术是这么用的吗?干嘛不直接提供电子书?老百姓读书真的成奢侈品了。相比较而言,这个东东倒还实用些。不过也不要把俺的话当真,俺的预测向来不准,发展才是硬道理。
10、应用了FRBR的RDA草案正式推出
最后再来一条跟游园撞车的,本想避开,但实在太重要,不得不说。希游园见谅!
RDA(Resource Description and Access)的完整草案在推迟数次之后,终于完成,已然发布。前不久听说美国三大国家图书馆也达成一致(参见声明),将认真考虑对RDA进行评估。这个态度显然比去年底“书目控制未来”会议上传出的“暂停”RDA支持FRBR的态度(原文是“暂停RDA中与FRBR相关的工作”,参见编目精灵博文)有所不同,着实让人虚惊一场。
FRBR固然有许多问题,然而却是我们图书馆人要把书目控制理论扩展到数字世界的一个有益的尝试,目前可能还是唯一的图林“原创”模型。这个模型的不足也正在被克服,例如FRBRoo。
俺对RDA有一个私心,认为它其实已经宣布了MARC的安乐死:RDA不像AACR2,将不再依赖于MARC,不再以MARC作为其应用成果的唯一编码形式,而只是作为对资源进行内容描述的标准。而且RDA也正在考虑采用DCMI的抽象模型,这也意味着DC的另一场巨大胜利。这方面偶有很多话可说,在此打住,以后再说。关于RDA与DC,也可参考秋声博文。
总结上述十大技术进展非常不易,头发掉了不少,说明了技术救图之十分不易。本博文还没有完成就被斋主指定为老槐四大护法之一,老槐也已留言,称护法远不止四个。不管几个,这个帽子俺就带上了,先遮一遮日渐稀疏的额头吧。
其它认真考察过的技术进展罗列如下,属于买一送一,敬请笑纳。
Surfacing,blyberg‘s toy,照片在此。
CoINs in Wordpress。
RDFa和Microformat的应用。
Yahoo Searchmonkey。
万方的DOI服务与国图的DOI方案。
信息共享空间在中国(高校)的普及。
RFID在国内图书馆界的普及。
国图书目数据进入WorldCat。
liblime的koha
evergreen
(上述最后两个交给小钟)。
参考资源:
Disruptive Library Technology Jester
stephen的2008年30项图书馆技术预测
ALA TechSource
Popularity: 51% [?]
Tags: 2008, 专业评论, 进展Related posts
2008图林十大技术进展(上)
据说数字世界的一年相当于现实中的七年,所以有那么多的技术让人不懂。不懂归不懂,新事物丝毫没有放慢脚步,依然一边雷着人一边高速向我们袭来,作为技术酒徒,我们可以迎击、躲闪、或逃避,但不能动摇、折腾和懈怠。
盘点一晃而过的2008,可能因为速度太快而看不真切,可能因为距离太近而以偏概全,可能因为时间太短而长幼不分,可能因为人品太差而夹带私货。总而言之,看得过眼您可以捧个人场,看不过去也敬请留言商榷,乃至单挑,俺都欢迎。
以下是俺经过深思熟虑,多方打听,旁征博引,胡拼乱凑的08图林十大年度技术进展:
1、OAI-ORE如期推出
10月17日开放存档先导计划(OAI)如期推出对象重用与交换标准(ORE), 相比较众多IT或图界项目如RDA之类总是推迟,实属不易。让人尤其敬佩Carl Lagoze和Herbert Van de Sompel两位行业领军人物,不仅技术好,而且项目管理得好。OAI-ORE是个意义甚至远远高于OAI-PMH的技术框架,对于建立数字世界统一的描 述和获取规范具有里程碑式的意义。牛排在这里 已经有了非常到位的解释和阐述,但好像还只是开了个头,希望国内有更多的研究课题开发项目出现,而不只是变相的翻译介绍。
2、LCSH的SKOS化
传统知识组织体系采用SKOS编码,是其网络化生存的一种重要形式,美国国会图书馆的试验项目在这方面迈出了重要的一步。具体的做法详见Ed Summers等人的论文《LCSH, SKOS and Linked Data》 ,我在这里也做了简单的介绍(文后曾蕾、秦健、Pinoke、牛排都有很好的讨论,pinoke还把讨论引到了cnlib20,另外在草长莺飞 这里也有讨论)。虽然如曾蕾老师所说,将LCSH转换成SKOS编码可能并不是一个很好的样本,不知道这是不是国会图书馆要求Ed关闭其lcsh.info服务的原因,不过也算是迈出了重要的一步。
类似的项目其实已经有很多,曾蕾老师和范伟对《中国分类主题词表》转换成SKOS也进行了深入的讨论和试验 ,论文(参见DC-2008论文集 )在DC-2008年会上还获得了最佳海报奖(详见本人会议报道博文)。这个领域必将成为今后几年图情领域研究开发的热点,值得密切关注。
3、OCLC推出术语服务
OCLC把规范词表的网络服务作为提高其核心竞争力的一个工具,恐怕是小瞧了术语服务的潜力。举例来说,如果说维基百科提供了给人参考的“术语服务”,而DBPedia就是同样内容的另一个版本——给机器参考的百科全书,可以为机器提供了大量的概念和概念之间关系的链接和解释。将来在Web上建立语义信息的“规范控制”,术语服务就是其实现基础之一。关于OCLC的术语服务,这里有一些简单的报道。
其实按照DCMI的想法,资源描述所需的属性元素及其“应用纲要(AP: Application Profile)”,就非常需要术语服务来提供语义说明、命名域参考、版本控制等,各类元素的取值也需要规定大量的“编码体系”,所有的KOS(受控或者半受控词表)都可以看成是规范的取值约束,都需要术语服务。OCLC开了个好头,就让我们走下去吧!
4、DCMES国家标准正式提交候审
虽然晚了,总比没有好。去年由国家图书馆牵头,上图、北大图书馆、清华图书馆和中科院文献情报中心等机构参与,启动了“都伯林核心元数据元素集”的国标申报项目,今年终于通过了专家审定,并完成了报批稿。具体内容参见DC中文网。据说接下去会有很多《我国数字图书馆标准规范建设》项目的成果都将陆续申报,估计过程将会非常艰苦,但开放总比封闭好,尝试总比放任好,期待着“真理越辩越明”。
5、以关联数据(Linked Data)形式提供书目数据的开放服务
随着2.0理念的普及,书目数据的开放越来越成为一种潮流,编目精灵在这里有过很好的论述。为什么要开放?实际上业界已经醒悟:为了生存。图书馆最引以自傲财富,正在被人弃之如敝屣,将很快变得无足轻重。然而书目数据如何开放?如何服务?如何嵌入用户系统?探索还远远没有结束。当LOC还在争论和观望、OCLC在偷偷做试验的时候(OCLC数据服务协议的更改似乎意味着什么),“瑞典联合目录”已经走出一条新路:采用语义Web的最新技术——关联数据Linked Data的架构,开放其200多个成员馆超过650万条书目记录,以及20万条规范档。详情参见这里,以及论文:Martin Malmsten “Making a Library Catalogue Part of the Semantic Web”(DC-2008会议录,ppt)。
(待续)
特别鸣谢:雨僧,远洋,大旗底下QQ群。
Popularity: 34% [?]
Tags: 2008, 专业评论, 进展Related posts
DC资源集合描述元数据应用纲要(DC CD AP)进展
Pete Johnston 对于 DC-2005 的总结给我们带来了DC CD AP工作组的最新信息,这些情况都反映在 Pete的ppt报告 中了:
DC CD AP过往一年最显著的进展可能要算是DC CD AP草案的推出,在DC-2005应用委员会的全体会议上”非正式”地讨论了这个草案,除了形式上的修改建议之外,对于存在的几个问题中的一个比较大的问题提出了指导性意见。这个问题是:
在资源集合描述时,如果需要同时用到元素及其元素修饰词,例如dc:relation/dcterms:isReferencedBy;dc:description/dcterms:abstract(dc:rights也会碰到),这两类term修饰的内容会发生矛盾。例如一个资源集合的dc:relation的值是另一个资源集合,而这个资源集合isReferencedBy另一本书;dc:description的值是这个资源集合的一般性描述而dcterms:abstract是其某个单元的摘要。应用委员会建议在这种情况下不能够复用dc:relation或dc:description(或dc:rights)而必须专门为资源集合描述寻找新的元素。
另一些正在讨论、尚未定论的问题(虽然在草案中已经有推荐的规定)是:
1、属性值作为字串还是作为引用(use a (value) URI or a (value) string)?编码体系syntaxencoding scheme/富结构rich representation如何用?相关描述(relateddescriptions)应该允许,但是DC CD AP应该保持术语无关。
2、 资源集合媒体类型(格式)的描述。功能需求提出必须能够描述资源集合中是否有提问所需的媒体格式,于是问题就变得很复杂。
3、 开放的时间段。对于资源集合来说,其内容的时间跨度常常是不可确定的。W3CDTF不支持时间范围的表述,ISO8601支持时间范围,但是不支持一头开放的时间范围,例如1949-?。这个问题需要DC Date WG工作组解决。
4、 资源集合的位置location和服务services分离是否有必要?如何分离?是否isLocatedAt/ isAccessedVia两个修饰词都需要?
DC定义的相关概念如下:
• Collection
- An aggregation of one or more items
• Location
- Aplace where a collection is held (Michael Heaney, Analytical Model)
• Service
-Asystem that provides one or more functions of value to the end-user.Examplesinclude: a photocopying service, a banking service, anauthentication service,interlibrary loans, a Z39.50 or Web server (DCMIType Vocabulary)
- Provided physically or digitally
- User may be human, organisation orsoftware application.
• (DCCD AP) Service
- A system that provides access to theItems within the Collection
来年的工作计划就围绕这些问题进行讨论、提出解决方案,并修订DC CD AP。
序号
工作内容
开始日期
结束日期
1
Revise in light of Usage Board review
2005-09
2005-11
2
Resolve item media-type issue
2005-09
2005-11
3
Finalise isLocatedIn/isAccessedVia properties
2005-11
2006-02
4
Work with DC Date WG on date range format
2005-09
2006-03?
5
Update DCAP
2006-01
2006-04
6
Syntax (based on work by DC Arch WG)
2006-05?
2006-09
7
Crosswalks
2006-05
2006-09
8
Usage Guidelines
2006-05
2006-09
9
Usage Board Review
2006-10
2006-10
DC-2005上资源集合工作组还交流了三篇报告:
来自University of Illinois at Urbana-Champaign的Sarah Shreeves 和Muriel Foulonneau通过网络视频会议形式报告了他们在 几个项目中使用资源集合描述 的情况。
英国博物馆、图书馆、档案馆联合委员会的Kate Fernie介绍了他们承担的 文化遗产资源集合项目 的情况。
大英图书馆的Bill Oldroyd简短地介绍了TEL (The European Library:欧洲图书馆)项目中采用资源集合描述的情况。
DC CD AP草案精简版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-ap-summary/2005-08-25/
草案完整版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623606
Popularity: 45% [?]
Tags: DC, 元数据, 应用纲要, 资源集合, 资源集合元数据, 进展