DC-Lib应用纲要错误一例

马上要召开DC-2008了,DC的邮件列表里又热闹起来。今天的一个帖子说到DC-Lib应用纲要的问题,让我想到最近有人建议尽快将DC修饰词和领域应用一并推向国标。愿望很好,但其实国内对DC元数据的应用还没有形成一种讨论的氛围,许多人都回避讨论,只想交给一些“伪精英们”(也算包括偶吧)制定出来执行就完了,其实这样是无法形成对一些问题的基本理解的,即便推出一个“正确”的国标,也恐怕会因为理解的不同而无法执行,何况对于我们来说做到“正确”是何其困难!前一阵与平台江和谢涛君的争论就很好,“我国数图标准规范研究”项目组内部不多的争论也很好,只是太少了。问题不摆到台面上公开讨论,就为以后大家阳奉阴违埋下伏笔,这是对标准化事业最大的伤害。

问题是这样的:在DC图书馆应用纲要中对于“格式(Format)”的修饰词“媒体(medium)”有一段说明:

Used to specify the medium of the physical carrier of a resource. Format without an element refinement qualifier should be used to specify the electronic format of the resource, using the encoding scheme IMT. Format should be repeated if both are applicable (e.g. a PDF file on CD).
用来特指资源物理载体的媒介类型。“格式”如果不带修饰词,则应该采用IMT(即MIME的格式词——keven注)的编码体系修饰词作为取值,特指资源的电子形式。如果即有电子格式又有物理类型(例如放置于CD上的PDF文件),则应该重复著录。

这段说明完全违反了DCAM(DC元数据抽象模型)所规定的1:1原则,因此是完全错误、应该被修正的。可惜DCMI许多文档的修订工作根本就跟不上。

Andy Powell对这个问题的回答很有意思:

Firstly, dc:format is a total mess. (I guess you knew that!)
Secondly, I think the library AP gets it wrong anyway
…….
Sigh… disclaimer, I chaired the original dc:format working group and hence share some/much of the blame for the mess – but I think it was a mess way before then anyway :-(

当然,Andy也给出了这个问题的解释:

dcterms:medium只能用于描述资源的物理形态(格式),这在抽象模型的domain-range中说得很清楚了。因此dcterms:IMT不能用于修饰dcterms:medium,只能修饰dc:format或dcterms:format。

据此,就不存在重复元素/子元素问题了(因为描述电子格式和物理格式的元素/子元素是不同的)。

, , ,

Powered by ScribeFire.

演讲:元数据抽象模型与新加坡框架

讲这个主题,因为感到有必要,似乎大家都知道,但是理解各不相同。

没有自己的东西,纯粹介绍。也不一定正确,仅供参考。

说明Update:可能slideshare在某些网络以及用某些浏览器无法访问(感谢远洋老师等提供信息),在这里提供ppt下载。

SlideShare | View | Upload your own