数字图书馆与数字出版

据报道,国家数字复合出版系统已作为《国家”十一五”时期文化发展规划纲要》头号工程,幸运的是陈源蒸老师还在为数字图书馆考虑这个事情,希望这个项目考虑到图书馆界的具体需求,从源头上照顾到整个出版产业链对资源描述和利用的共同需求,能够为数字图书馆做点事情,做一个理想化的系统。这是一件大好事,做好了能节约大量社会财富,惠及多个产业,造福后人。

当然我一直对嗜利如命的企业界能够甘心公益而心存疑虑,没有几个企业家会那么伟大,把社会责任置于企业利益之上。这时候就需要国家意志发挥作用,据说“有关部门”也确实这样考虑的,但是结果如何恐怕不容乐观。我们最缺乏一套可靠的制度保障,又没有诚信机制,事情做起来往往就会远离初衷了。所以好事能不能做好,很大程度上并不是技术层面的问题,而是制度层面的。

无论如何,这件事情作为一项研究课题,还是有许多内容值得探讨的。

首先碰到的问题是”数字出版”实际上是一个非常难界定的东西。从目前网络学习与网络出版的发展态势来看,特别是Web2.0的应用迅速席卷之后,未来的”出版”形态几乎无法预知,一切传统的流程、模式、方法都正在被颠覆。我们以”控制”和”集中”为主导的思维方式不可能提供一种具有生机活力的土壤,让一切富有创造力的新的形式自然生长出来,然后再来挑选、评判、规范、发展。

那么我们只有多多采用”思想实验”,从可能的角度,站在管理者(他们是stakeholder)的立场,考虑技术问题。有时很滑稽,或者很书呆子气,但这也是不得已而为之。

要规范数字出版,首先需要定义数字出版物。如下定义抛砖引玉:

[具有出版资质的单位(出版社)]以数字(指内容)或电子媒体(指载体)形式产生和发布的,具有独立标识或者能被唯一识别的出版物。

这个定义核心部分是清楚的,但是边界很模糊。例如什么东西不算”数字出版物”,例如网页算不算?可能需要”权威部门”提供”司法解释”。

这个定义还应该进一步明确”出版社”和”出版物”两个概念,他们与元数据规范的管理和应用有关。其它的诸如”数字内容”、“电子媒体”、”独立标识”、”唯一识别”等概念都属于技术概念,定义起来很容易。

有了这样一个可资参考的定义,就元数据标准规范来说,我们就可以开展下面的工作了:

1、界定主要的数字出版物类型;什么是数字/电子图书?什么是数字/电子期刊?还有哪些其他类型?(例如课件、电子地图、游戏、软件甚至网站、资集合等等算不算?)

2、考察元数据规范的功能需求:为什么要制订元数据方案?制订了元数据方案是不是想解决的问题都能解决?还有哪些需求是元数据方案所不能解决的,需要其它的规范(如编码规范、协议规范)来解决?

3、所涉及的数字出版物对象的各类属性分析,结合功能需求,详细考察哪些属性应该被纳入,哪些暂缓,为什么?

4、如果简单的元数据方案不敷使用,考察是否需要建立扩展机制和应用模型,以体现元数据方案一定程度上的灵活性和可扩展性。

5、是否能建立一个数字出版物的概念模型和描述模型?通过它来定义标准的书目记录以及各种转换方法。

接下去当然好考虑具体的“数字出版物格式”,这种格式最可能是一种定义的复合数字对象结构,开放地支持各种传统的与数字出版相关的文件格式(例如MS Word格式、Adobe pdf格式等),包括各类相关的国际标准格式。其开放性在于能够应用于任何开放和私有的格式,能够支持内容与表现的分离,能够提供语义的不同阶段标注以及权威控制,以及开放的存取协议描述扩展等等。(如果我们建立标准的模型,以XML/RDF形式编码,就完全可能把元数据带到各种格式中去。目前很多新的格式(或者老的格式新的版本)都包含元数据和数字对象二进制编码两个部分,例如对于电子出版物标准我们可以制订一定的指南,用于PDF、JPEG2000、MPEG7甚至网络出版媒体、流媒体等各类数字格式中去)。

Leave a Reply




*