闯者来访

今上午闯者来访,晤谈甚欢,Leon坐陪,涉及以下主题,志以备忘:

1、中华字库、复合出版、知识资源数据库等工程的基本情况;

2、数字出版的资源描述及编码规范、标识体系、知识组织系统及应用展示层规范四大领域规范的全景图(感谢留下那份藏宝图);

3、本体与SKOS的现状与前景;

4、科技部和中科院目前正在进行的大项目的一些情况。

真人不露相,海量非酒徒,闯者不愧业中翘楚,对所有涉及技术之方方面面,宏观微观,均有恰当把握;平台架构,拿捏得当,言辞皆击中要害。彼离开图书馆,实乃图林一大损失也!

Popularity: 69% [?]

Tags: 专业评论, 感悟, 数字出版, 语义技术, 闯者

Related posts

数字出版的视野和野心

一直在关注陈源蒸老师近期的工作:参与“复合出版工程”有关标准交换格式的制订和讨论。具体的格式规范和细则十分琐碎,涉及到出版、发行、报业、媒体、图书馆等多个传统行业(实际上也涉及到现在的很多互联网甚至2.0企业),现在在征询意见。可以想见,大家都从自己的角度出发,仿佛数字风暴吹翻的只能是别人的小船,自己无需改变。因此如果都听从了大家,一个期望中的龙种生出来可能就要变成怪胎了。

征求相关行业的意见是必要的,但不能受其制约。乔布斯说,用户需求是需要被发现和引导的。媒体融合的时代,数字出版要有大视野,出版的形态在发生改变,人们传播和交流的方式也在发生变化,在这众多的变化之中,什么东西是不变的,什么东西是暂时的,什么东西是永恒的,值得方正这样的“数字毕升”好好思考,否则还会重蹈“排版系统”风光一时而不能风光一世的覆辙。

说到交换格式和技术标准,这不是一个十分困难的问题,只要系统提供可定制的灵活性和扩展性,架构设计得合理,任何现有的和未来的交换标准、协议都可以支持,但是这个“架构”却不是一两句话能讲清楚的,不能放任自负的技术人员来做,要讲政治(战略),这不仅仅是技术,这是核心竞争力。

中国的IT企业生存不易,练就褊狭人格,往往太聪明。殚精竭虑讨好资方,讨好用户,讨好政府,讨好上下游行业,满足于一时偶然的成功,没有主心骨,缺乏大智慧,难成大事业。

Popularity: 43% [?]

Tags: 专业评论, 北大方正, 复合出版工程, 数字出版, 陈源蒸

Related posts

数字图书馆与数字出版

据报道,国家数字复合出版系统已作为《国家”十一五”时期文化发展规划纲要》头号工程,幸运的是陈源蒸老师还在为数字图书馆考虑这个事情,希望这个项目考虑到图书馆界的具体需求,从源头上照顾到整个出版产业链对资源描述和利用的共同需求,能够为数字图书馆做点事情,做一个理想化的系统。这是一件大好事,做好了能节约大量社会财富,惠及多个产业,造福后人。

当然我一直对嗜利如命的企业界能够甘心公益而心存疑虑,没有几个企业家会那么伟大,把社会责任置于企业利益之上。这时候就需要国家意志发挥作用,据说“有关部门”也确实这样考虑的,但是结果如何恐怕不容乐观。我们最缺乏一套可靠的制度保障,又没有诚信机制,事情做起来往往就会远离初衷了。所以好事能不能做好,很大程度上并不是技术层面的问题,而是制度层面的。

无论如何,这件事情作为一项研究课题,还是有许多内容值得探讨的。

首先碰到的问题是”数字出版”实际上是一个非常难界定的东西。从目前网络学习与网络出版的发展态势来看,特别是Web2.0的应用迅速席卷之后,未来的”出版”形态几乎无法预知,一切传统的流程、模式、方法都正在被颠覆。我们以”控制”和”集中”为主导的思维方式不可能提供一种具有生机活力的土壤,让一切富有创造力的新的形式自然生长出来,然后再来挑选、评判、规范、发展。

那么我们只有多多采用”思想实验”,从可能的角度,站在管理者(他们是stakeholder)的立场,考虑技术问题。有时很滑稽,或者很书呆子气,但这也是不得已而为之。

要规范数字出版,首先需要定义数字出版物。如下定义抛砖引玉:

[具有出版资质的单位(出版社)]以数字(指内容)或电子媒体(指载体)形式产生和发布的,具有独立标识或者能被唯一识别的出版物。

这个定义核心部分是清楚的,但是边界很模糊。例如什么东西不算”数字出版物”,例如网页算不算?可能需要”权威部门”提供”司法解释”。

这个定义还应该进一步明确”出版社”和”出版物”两个概念,他们与元数据规范的管理和应用有关。其它的诸如”数字内容”、“电子媒体”、”独立标识”、”唯一识别”等概念都属于技术概念,定义起来很容易。

有了这样一个可资参考的定义,就元数据标准规范来说,我们就可以开展下面的工作了:

1、界定主要的数字出版物类型;什么是数字/电子图书?什么是数字/电子期刊?还有哪些其他类型?(例如课件、电子地图、游戏、软件甚至网站、资集合等等算不算?)

2、考察元数据规范的功能需求:为什么要制订元数据方案?制订了元数据方案是不是想解决的问题都能解决?还有哪些需求是元数据方案所不能解决的,需要其它的规范(如编码规范、协议规范)来解决?

3、所涉及的数字出版物对象的各类属性分析,结合功能需求,详细考察哪些属性应该被纳入,哪些暂缓,为什么?

4、如果简单的元数据方案不敷使用,考察是否需要建立扩展机制和应用模型,以体现元数据方案一定程度上的灵活性和可扩展性。

5、是否能建立一个数字出版物的概念模型和描述模型?通过它来定义标准的书目记录以及各种转换方法。

接下去当然好考虑具体的“数字出版物格式”,这种格式最可能是一种定义的复合数字对象结构,开放地支持各种传统的与数字出版相关的文件格式(例如MS Word格式、Adobe pdf格式等),包括各类相关的国际标准格式。其开放性在于能够应用于任何开放和私有的格式,能够支持内容与表现的分离,能够提供语义的不同阶段标注以及权威控制,以及开放的存取协议描述扩展等等。(如果我们建立标准的模型,以XML/RDF形式编码,就完全可能把元数据带到各种格式中去。目前很多新的格式(或者老的格式新的版本)都包含元数据和数字对象二进制编码两个部分,例如对于电子出版物标准我们可以制订一定的指南,用于PDF、JPEG2000、MPEG7甚至网络出版媒体、流媒体等各类数字格式中去)。

Popularity: 76% [?]

Tags: 元数据, 元数据方案, 数字出版, 数字图书馆, 数字图书馆, 标准规范

Related posts

超星的宿命

本想用twitter唠叨两句,但大家似乎都很重视这件事,先是图林老姜转贴报道,后来表哥发来消息,接着又看到Libnews转述还加了编者按,念在当初还去史超处参观学习过的份上,认认真真地写一段“悼词”吧。

超星走到这一步实际上一点都不奇怪,这是它的宿命。一方面可以用来诠释我们知识产权保护的伟光正到了相当的阶段,另一方面也说明任何新东西都不可能是本土的,只能是舶来的。

且不说超星的发迹有多少原罪,有原罪得远不止超星一个,有些至今还活得好好的。就眼下而言,为什么Google能做而超星不能?既然当初国图收手的时候超星没有收手,丫挺到现在,Google的所作所为应该对超星是绝大的利好,而它却在黎明前倒下了。正反映了我们相关法规和管理体制上的悲哀。

首先我们没有明确的信息公开、合理使用制度,在出版界的反对下这个制度似乎是建立不起来的,并且似乎任何法律都可以溯及以往。所以很奇怪我们一加入国际版权组织,一下子那些特殊历史时期国家投资的作品也全都自动地私有化了,找不到主人的东西也会有人认养。据此而论我们的数字图书馆是永远没有东西可以做滴。

其次我们也缺乏利益之外的中立机构,全都是利益相关者(stakeholder),或者全都在体制中有自己的代理人。于是不管是谁的东西,全都想来分一杯羹。就像公众利益常常会被人利用一样,知识产权保护也不一定就保护了先进生产力,助纣为虐的事情做得太多,以至于早就没有了公信。所以对数字图书馆来说你认为可以做做试试的东西也早晚都会被扼杀。

出版业向来以最大程度地占据他人的智力财富为己任,知识产权真正应该保护的“作者”向来被他们当成人质,即便是国家投资的作品也以各种名目据为己有,而且一谈判就狮子大开口。数字图书馆建设碰到的全是最厉害的钉子户,即使数字图书馆赔得起作者,也养不起出版商。因此完全合法的数字图书馆是根本不可能在中国建成滴。

只有一个可能:体制外变成体制内,那就成了出版业的内讧,可以内部解决。看来超星觉悟得太晚,想做的时候已经没有资源了。

所以,为超星默哀吧。

Powered by ScribeFire.

Popularity: 43% [?]

Tags: Uncategorized, 数字出版, 数字图书馆, 知识产权, 超星

Related posts