数字图书馆与数字出版
据报道,国家数字复合出版系统已作为《国家”十一五”时期文化发展规划纲要》头号工程,幸运的是陈源蒸老师还在为数字图书馆考虑这个事情,希望这个项目考虑到图书馆界的具体需求,从源头上照顾到整个出版产业链对资源描述和利用的共同需求,能够为数字图书馆做点事情,做一个理想化的系统。这是一件大好事,做好了能节约大量社会财富,惠及多个产业,造福后人。
当然我一直对嗜利如命的企业界能够甘心公益而心存疑虑,没有几个企业家会那么伟大,把社会责任置于企业利益之上。这时候就需要国家意志发挥作用,据说“有关部门”也确实这样考虑的,但是结果如何恐怕不容乐观。我们最缺乏一套可靠的制度保障,又没有诚信机制,事情做起来往往就会远离初衷了。所以好事能不能做好,很大程度上并不是技术层面的问题,而是制度层面的。
无论如何,这件事情作为一项研究课题,还是有许多内容值得探讨的。
首先碰到的问题是”数字出版”实际上是一个非常难界定的东西。从目前网络学习与网络出版的发展态势来看,特别是Web2.0的应用迅速席卷之后,未来的”出版”形态几乎无法预知,一切传统的流程、模式、方法都正在被颠覆。我们以”控制”和”集中”为主导的思维方式不可能提供一种具有生机活力的土壤,让一切富有创造力的新的形式自然生长出来,然后再来挑选、评判、规范、发展。
那么我们只有多多采用”思想实验”,从可能的角度,站在管理者(他们是stakeholder)的立场,考虑技术问题。有时很滑稽,或者很书呆子气,但这也是不得已而为之。
要规范数字出版,首先需要定义数字出版物。如下定义抛砖引玉:
[具有出版资质的单位(出版社)]以数字(指内容)或电子媒体(指载体)形式产生和发布的,具有独立标识或者能被唯一识别的出版物。
这个定义核心部分是清楚的,但是边界很模糊。例如什么东西不算”数字出版物”,例如网页算不算?可能需要”权威部门”提供”司法解释”。
这个定义还应该进一步明确”出版社”和”出版物”两个概念
有了这样一个可资参考的定义,就元数据标准规范来说,我们就可以开展下面的工作了:
1、界定主要的数字出版物类型;什么是数字
/电子图书?什么是数字/电子期刊?还有哪些其他类型? (例如课件、电子地图、游戏、软件甚至网站、资源集合等等算不算 ?) 2、考察元数据规范的功能需求:为什么要制订元数据方案
?制订了元数据方案是不是想解决的问题都能解决?还有哪些需求是 元数据方案所不能解决的,需要其它的规范(如编码规范、协议规范 )来解决? 3、所涉及的数字出版物对象的各类属性分析,结合功能需求
,详细考察哪些属性应该被纳入,哪些暂缓,为什么? 4、如果简单的元数据方案不敷使用,考察是否需要建立扩展机制和
应用模型,以体现元数据方案一定程度上的灵活性和可扩展性。 5、是否能建立一个数字出版物的概念模型和描述模型
?通过它来定义标准的书目记录以及各种转换方法。
接下去当然好考虑具体的“数字出版物格式”,这种格式最可能是一种定义的复合数字对象结构,开放地支持各种传统的与数字出版相关的文件格式(例如MS Word格式、Adobe pdf格式等),包括各类相关的国际标准格式。其开放性在于能够应用于任何开放和私有
数图资源整合与Web2.0
Update: 花了点时间,把俺2005年10月11日在Wordpress.com上的老帖子搬到这里,欢迎参考:Metasearch和OpenURL应用进展。
昨天去交大图书馆做了一次交流,题目是黄敏老师给的,“数字图书馆前沿技术”。我说这么大的题目讲不了,黄老师给了三个主题:“资源整合”、 “Web2.0”和“情报检索前沿技术”,主要讲“资源整合”。这三个主题也讲不了,郑馆长和潘卫说,你就随便讲吧。于是就七拼八凑,炒炒冷饭,弄了下面这个东东。就这样也准备了好几天,累了一身汗。
Google Presentation:
Slideshare.net:
| View | Upload your own
最近几年一直关注“元数据”和“2.0”了,资源整合没有持续跟踪,利用这个机会重新补了补课,发现这个主题的论文铺天盖地,一直是我们这个专业的研究重点,但真正的进展并不多。一些商用系统虽然大同小异,但由于可用性、运行效率以及服务方面的一点点口碑而越卖越好。
感觉上Web2.0带来的微结构化和数 据与应用融合(Mashup)趋势与目前数图领域的ORE(基于复合数字对象应用需求的标准化)、OpenURL和ZING的轻型化 (COinS/unAPI的提出和REST化)是一脉相承的,只是现在还处在技术应用的潜伏期,还不知道哪些技术将能够得到大规模采用,被图书馆2.0的 叫嚣盖过了风头,整个数图“前沿技术”显得比较沉闷。
由于此次交流是作为交大图书馆内部培训的,准备的材料中有大量非原创的介绍性内容,在这里就删去了。有兴趣的朋友可以前往这里下载。
数字图书馆内容管理的新特点
临时受邀参加一个内容管理的会议,恶补了一下最近一两年CMS方面的进展,打算对“数字图书馆的内容管理”,从三个方面谈一点想法:
1、基于永久保存的资源描述:也即参照OAIS模型的开放元数据描述,但是首先要界定“永久保存”并非真的永久,而是一个生命周期概念,而且与经济成本方面的可能性直接挂钩。
2、基于语义揭示的内容整合:强调人工元数据的必要性。否则图书馆员就没饭碗了。计算机可以起到很大的辅助作用,但是无法最终解决语义描述问题,不论是用户产生内容还是根据相关反馈,产生语义的“最后一公里”还是用户。当然,语义整合还有涉及很多东西。
3、基于社会性网络的发布与服务:与上述问题相关的,在发布和服务方面,要充分考虑和结合Web2.0的特点。
(Alex Yang正在作IBM CM最新进展介绍)
数字图书馆和图书馆2.0,啥关系啊?
晶晶问:数字图书馆和图书馆2.0究竟是啥关系?
自从搞上了图书馆2.0,咱也一直问个不休。
数字图书馆和图书馆2.0,两个概念都有太多的含义,要对它们进行比较,恐怕只能撮其要旨,分门别类进行探讨。
数字图书馆,一般定义为一类信息资源实体(Entity,即一定的组织、机构或集合体),通常其资源具有一定规模,其组织有一定秩序,且具有一定服务功能。 从技术的角度可以认为凡是上述“实体”所需要的技术,都属于数字图书馆技术。当然也有人不同意这种说法,有“核心技术”和“非核心技术”之分。
图 书馆2.0,“官方”定义为“Web2.0的技术或服务在图书馆信息服务中的应用”。Web2.0本来就是个大杂烩,造成图书馆2.0也是一锅什锦菜。你 可以从各个角度去认识它,认为它是一种理念、精神、技术、服务甚至资源。如果你愿意从服务的角度考察数字图书馆,认为一切数图技术或者数图建设目的都是为 了提供服务,那么这就很接近图书馆2.0了。
图书馆2.0的兴起可以说在一定程度上改变了数字图书馆的发展方向。图书馆2.0中所涉及到 的许多技术、理念都属于数字图书馆范畴,虽然大多集中于表现层和应用层,而不是架构层、存储曾或者互操作层的东西,但这些东西却是前所未有的,能够极大地 刺激数字图书馆的建设,丰富数字图书馆的应用,从而在一定程度上主导数字图书馆的发展。
具体说来,2.0时代的数字图书馆:
1、要支持用户创建资源、描述资源、组织资源;
2、要利用集体智慧,进行信息过滤,提供智能化的服务;
3、无所不在的微内容(数字图书馆的逻辑组成:数字对象);
4、无所不在的静态和动态本体,用于信息的结构化和“语义化”;
5、更加分布的服务,更加松散的应用耦合(mashup);
……
这些原本都是数字图书馆的内容,Web2.0带来了明确的进展。
当然数字图书馆是一个比图书馆2.0宽泛得多的概念,虽然它并不能完全包容后者(他们之间有一个交集),但却是一个比较恒定的概念,被党和国家领导人定性为“代表了图书馆的发展方向”。
超星的宿命
本想用twitter唠叨两句,但大家似乎都很重视这件事,先是图林老姜转贴报道,后来表哥发来消息,接着又看到Libnews转述还加了编者按,念在当初还去史超处参观学习过的份上,认认真真地写一段“悼词”吧。
超星走到这一步实际上一点都不奇怪,这是它的宿命。一方面可以用来诠释我们知识产权保护的伟光正到了相当的阶段,另一方面也说明任何新东西都不可能是本土的,只能是舶来的。
且不说超星的发迹有多少原罪,有原罪得远不止超星一个,有些至今还活得好好的。就眼下而言,为什么Google能做而超星不能?既然当初国图收手的时候超星没有收手,丫挺到现在,Google的所作所为应该对超星是绝大的利好,而它却在黎明前倒下了。正反映了我们相关法规和管理体制上的悲哀。
首先我们没有明确的信息公开、合理使用制度,在出版界的反对下这个制度似乎是建立不起来的,并且似乎任何法律都可以溯及以往。所以很奇怪我们一加入国际版权组织,一下子那些特殊历史时期国家投资的作品也全都自动地私有化了,找不到主人的东西也会有人认养。据此而论我们的数字图书馆是永远没有东西可以做滴。
其次我们也缺乏利益之外的中立机构,全都是利益相关者(stakeholder),或者全都在体制中有自己的代理人。于是不管是谁的东西,全都想来分一杯羹。就像公众利益常常会被人利用一样,知识产权保护也不一定就保护了先进生产力,助纣为虐的事情做得太多,以至于早就没有了公信。所以对数字图书馆来说你认为可以做做试试的东西也早晚都会被扼杀。
出版业向来以最大程度地占据他人的智力财富为己任,知识产权真正应该保护的“作者”向来被他们当成人质,即便是国家投资的作品也以各种名目据为己有,而且一谈判就狮子大开口。数字图书馆建设碰到的全是最厉害的钉子户,即使数字图书馆赔得起作者,也养不起出版商。因此完全合法的数字图书馆是根本不可能在中国建成滴。
只有一个可能:体制外变成体制内,那就成了出版业的内讧,可以内部解决。看来超星觉悟得太晚,想做的时候已经没有资源了。
所以,为超星默哀吧。
Powered by ScribeFire.

