“新加坡框架(Singapore Framework)”

沃维克框架、堪培拉限定、芬兰终结……。DC元数据自诞生以来,留下许多里程碑式的成果,如今这些成果中又多了一个:新加坡框架(Singapore Framework)。

新加坡框架是指元数据应用纲要的一种规范形式。虽然应用纲要曾经是欧洲标准CWA14855,但那毕竟只是一个非常笼统、给人作参考的“指南”。DCMI认识到DC的应用一直无法大规模开展,与编码方面的规范一直不统一很有关系,编码的无标准可循造成元数据标准有等于无,各类应用的互操作还是无法进行。然而编码规范的统一是一件不可能的任务,在XML大行其道的今天,任何符合XML模式规范的DC编码,你都不能说它不规范,你也不可能让大家都采用一种XML的DC编码模式。同时专注于语义一致性描述的DCMI怎么可能推荐一种编码而排斥另一种呢?再说现在有RDF/OWL/N3等编码方式(甚至采用关系型数据库来描述和编码),将来还会出来种种新的方式,如何能预料得到呢?所以对于编码的标准化,必须依赖于一种编码模型的标准化。这就是近年来DCMI花大力气研究并反复讨论的“DC元数据抽象模型(DCAM)”。只有独立于语言的编码模型标准化了,才能建立一种标准的形式化编码规范,不论形式化语言用的是什么。

而领域应用中符合DC抽象模型的元数据的形式化方案的整体,就叫做DC元数据应用纲要(DC Metadata Application Profile)。 我们的“专门元数据方案”实际上都可以认为属于领域应用的“应用纲要”。

具体说来,新加坡框架指符合DC元数据抽象模型的元数据应用纲要,应该包含以下几个部分:

  • 功能需求说明(需要desirable)
  • 领域模型 (必需mandatory)
  • 元素集描述 (DSP: Description Set Prifile) (必需mandatory)
  • 应用指南 (可选)
  • 编码句法指南(可选)

 

对于每个部分是否必需Mandatory、需要Desirable还是可选Option,目前的意见还不统一,例如很多图书馆员认为功能需求说明应该是必需的,但是对于形式化的应用纲要,功能需求说明只是给人读的,不像领域模型(可用UML形式化)和元素集合描述等(DSP,用Schema等形式化),无法翻译成机器语言,对于机器来说并非必需。

为进一步说明应用纲要各个部分的关系,这里还有一个框架的图示(版权属于DCMI,本人拥有翻译版权,引用敬请声明),值得好好推敲和学习:

2004年本人在一篇论文中将数字图书馆的元数据描述方案定义为“语义结构(Semantic Architecture)”,并认为有如下几个部分组成:

  • Resource Analysis and Definition
  • Metadata Set Definition (Core and Extended)
  • Encoding and Mapping Rules
  • Guidelines and Best Practices
  • Metadata Registry, Ontologies and Authority Files

与这个“新加坡框架”颇有一些异曲同工呢!

DC2007总结

8月30日下午闭幕式上, Makx Dekkers进行了例行总结:

本次会议进行了4场培训,2场主题发言,3场大会论文发言(共计10篇论文),2场分会场论文发言(共计6篇论文),15场社区和工作组会议,3场特别会议,以及两场专题报告会。参加培训的共有113位代表,参加会议的正式注册代表约190位,分别来自33个国家和地区。

照例,Makx感谢了东道主十分专业的组织和接待工作,以及各方的赞助和参与,将这次会议办成又一次成功的大会,胜利的大会。最后Makx宣布明年的DC年会将移师德国柏林举行。

总体感觉,DC经过这许多年的发展,似乎仍然缺乏群众基础,参与者寡,也一直缺乏杀手级的成功应用。这应该与整个WEB标准规范(例如Semantic Web的RDF/OWL标准,以及Web Services标准等)近年来普及不利有关,与DCMI本身的组织形式也有关系。因此本届会议,虽然并不是参与人数最多的一次,但其成果应该足可以在DC历史上留下一笔。主要是两项成果:提出了“新加坡框架(Singapore Framework)”以及正式提出DCMI向实体化发展。由于8月30日我的出国期限已到,未能参加9月1号举行的内部会议(Advisory Board Meeting),其中的幕后细节和下一阶段的问题讨论我就不得而知,不能汇报给大家了,十分遗憾。

Stu点评张晓星主任的Keynote

早晨张主任的主旨发言向人们展示了来自中国的又一个巨大的数字图书馆,拥有58TB,遍及33个省,超过8000个网点。Juha向DCMI的同行调侃 到,又有了一个巨大的DC数据库了。张主任的发言尚未结束,坐在我身边的Stu就向我秀了他刚刚出笼的博文:中国数字文化的进化(Digital Cultural Evolution in China)(他没有用“Revolution”一词,呵呵)。

Stu也很客气地提到文化共享工程中DC元数据应用中的问题,他是这样说的:

Dublin Core mavens would find Dr. Zhang’s slides very familiar indeed, recapping ideas and principles argued and agreed over more than a decade of experimentation and wrangling (some of his screen shots of application profiles might yet provoke discussion among the architecture crowd). It is a genuine pleasure to see these efforts (and even some of the problems) echoed in a national effort such as this, with repercussions that can be expected to ramify widely in the countryside of Chinese society and culture, validating an awful lot of jetlag on the part of many people over the years. I wish our colleagues in China all success with this project.
DC老手们会对张博士的演示稿感到非常熟悉,许多想法和原则已经试验和争论了十多年(一些应用纲要的截屏可能会遭到“元数据架构”组的激烈讨论)。我发自 内心地感到高兴,这些努力能在这样一个国家级的项目(即使其中有一些问题)中带来反响,……[这部分写得很艺术,很难翻译]。我希望我的中国同行 在这个项目中取得成功。

看来张晓林主任的“元数据标准规范”项目任重而道远。联想到DCMI多年严格控制元素的扩展,我们的“横向扩展”和“纵向扩展”是否太轻易了一些?我们的 领域规范(即所谓“专门元数据方案”)是否太多了些(在我们对“应用纲要”的理解尚未达成共识、得到普及之前)?谁来管理这些Terms?如何管理?特别 是我们对于抽象模型的漠视、我们在编码方案最佳实践方面的缺失,造成研究到应用的断层,元数据工具和应用系统无法在共识的基础上开发,将使得我们现在的许 多努力得不到充分应用,达不到预期效果。

DCMI历来对组织形式和方法上的重视程度要高于对元数据标准规范的内容和结果的重视。一些基本原则(开放原则、民主原则等)只有通过组织形式和方法才能得到体现,才能保证标准规范的正确制定和执行。这是一个值得借鉴的很好的做法。

DCMI向实体化发展

29日早上刚到会场,就碰到昨天念叨的张晓星主任,聊了几句。张主任谈到,会议的组织者感到不可理解,元数据在中国应该也算一个热门话题,为什么参会的国内代表那么少。

找了一个有电源位置坐下来,发现桌上放了一份声明:“DCMI working towards incorporation in Singapore”。这实际上是近年来在DCMI内部讨论过多次的问题,作为一个虚拟的、以志愿者为主的学术实体,难免碰到资源有限、进展缓慢等问题, 虽然DCMI也开始引入了一定的项目激励机制,但“实体化”、“公司化”发展是大势所趋。

声明中说,DCMI将向一个在法律上独立的实体(Legal entity)方向发展,计划与新加坡国家图书馆局合作,在2008年中,成立成立非营利性公司(not-for-profit public company)。新加坡图书馆局将对这个法律实体提供行政管理上的支持(我的理解就是由新加坡图书馆局进行管理),以后几个月中将就达成目标的各项 法律问题,与OCLC、DCMI的会员以及法律专家进行磋商,确定这个“DC元数据公司”的法律地位、组织结构框架等细节问题。这表明新加坡在成为 DCMI的会员(Affiliation)之后不久,又有了更深层次的合作。反观我泱泱大国,富足丰饶,就是不知道在干些什么。

DC-2007开幕式

这几天开会,本人将在现场带给大家鲜活的报道。
有关会议程序 和参考资料,请大家参考会议网站 。会议日程安排 也可以在这里下载。
一般情况下,我会用skype进行实况转播,需要聆听实况的,请下载、安装skype,通过添加我的id:kevenlw告知我,我把你加入“会议室”。skype的会议室最多十人,不过我估计国内感兴趣的、又正好在“现场”的也不会超过十人。

上 午的开幕式,除了新加坡的两位年轻的部长(估计不到50岁)致辞,显示了新加坡政府的积极进取、干什么都要国际一流的雄心之外,缺乏可圈可点之处。 Keynote是联合国粮农组织(FAO)的一位项目主管Johannes Keizer所作,FAO一直在信息技术的应用方面非常领先,很早开展了元数据和本体的应用。但是FAO的演示只提供了宏观的介绍,缺乏细节,所以讲完之 后许多人都提了问题,但是回答没有任何特别之处,看来大家碰到的问题他们也没有很好地解决方案,只不过他们做了一个活生生的系统,但仅这一点也够让人pay respect的。Paper Session 1 Mr. Akira的报告介绍了一个“并列名称”的元数据描述想法,Paper2 是Nilsson的大作,介绍了一个基于Web、支持多种元数据schema的元数据著录网站/工具 ,与我们4-5年前的想法惊人相似。/sigh

一般DC年会有两个Keynote,星期四上午来自祖国的张晓星主任将作主旨发言,期待ing。(不过今天遍寻会场,没看到他,可能专门来作报告吧)