Web时代的“元数据方法”(二)

感谢雨师对上文的反馈:“高屋建瓴”。我可能总是把屋建得太高,让我慢慢落下来吧…

同样的世界,以不同的方法和角度去看,会呈现出完全不同的样子,不仅如此,甚至会看到完全不同的东西。由于计算机处理能力的提高和认识与技术的进步,人们越来越倾向于按照事物的本来面目去描述事物,只要能认识到这种“面目”。其中,面向对象(“搞对象“?)的方法被认为跟接近大千世界的本原(就不说“本体”了哈),也是当前计算机认识世界的主流方法,以前我们把万物仅仅看成是数字或文字,而世间万物都是相互独立而又普遍联系的,我们为什么不能在Web上建立真实世界的一种”面向对象”的虚拟镜像涅?

都柏林核心元数据抽象模型(DCAM )就提供了这样一种“面向对象”看待世界的方法。它是为了向计算机描述我们这个世界而提出的,你可以设想向一群外星人解释我们这个世界,你应该如何向他们描述才能让他们理解呢?亚里士多德把世界看成是几种元素,我们到达不了那个境界(深度),只能说:世界都是由“东西”组成的,每个东西都是独立的,东西和东西之间又都是有联系的,认识东西就是认识它的特点(属性),不同的人可能看到不同的特点,把特点说出来就是描述……。然后,外星人就懂了,说:“噢,我们那里也是这样的…”

DCAM是完全基于语义Web的基础RDF模型的,因此可以认为它是语义Web描述这个世界的一种基本方式。

当然,向外星人解释这个世界不应该要求所有人都能干,这样的话”数字图书馆员“也就没有“核心竞争力”了。所以现在DCMI这一帮人(以及爱好者,如本人和平台江 等),以及SW(SemanticWeb)的一大帮人都在日夜奋战,希望能够提供许多方便的工具、平台或环境,使得同志们在按照惯常的方式工作的同时,规范的、外星人能够看懂的语义 描述能够“自动”建立起来。让大量的人文烟鬼继续并且更好地坑蒙拐骗、欺压百姓。

上述的目标距离实现尚有很长的路要走。现在的重点工作,是基于DCAM,建立一整套面向应用的规范体系和架构。

新加坡框架 就是这样提出来的。其目的是为“元数据方案”(DCAP: Dublin Core Application Profile)提供一套理论:一套完整的描述应该包括哪些内容?分别的作用是什么?哪些是定理(例如”用户永远正确“),哪些可以通融…等等。其中最重要的,是有关DSP(Discription Set Profile:描述集方案)的定义和规定。

都柏林核心元数据(DCM)现在是什么东西呢?它以15个基本元素著名,但它早已不是那个东西了,它已经成为一套体系,包括一个模型 (DCAM:Dublin Core Abstract Model,包括)和一套词表(Vocabulary:其中除了元素,又包括子元素——针对属性词来说的;修饰词——针对取值来说的,修饰词还有编码体系修饰词和“取值”修饰词),以及诸多 正在完善中的规定(新加坡框架及其编码)。

欲知后事,且听下文。

2 Responses to “Web时代的“元数据方法”(二)”

  1. 坐在沙发上学习。

  2. 坐在板凳上吃我的周末盛宴~~

Leave a Reply




*