近期关于元数据的一些讨论

精灵就远洋对于众多元数据相关标准的分类给了一个图示,如下:

我没能完全理解,但就我的理解发表了一些理解:

1、元数据元素集是描述资源各个方面的属性词表;
2、元数据取值如果规定只能从某些词表中选取,这些词表就属于受控的规范词表;这属于元素取值的domain和range;
3、元数据应用纲要是为了领域应用而制订的元数据方案的一种表达形式,目前正在成为规范的,叫做“DC元数据应用纲要”,核心是符合DC抽象模型的元数据形式化表述(也就是一种机读形式),通常可以以RDF形式表达;
4、应用模型(规定应用领域的各类实体及其相互关系)、著录规则等文档,也可以成为元数据应用纲要的组成部分;
5、元数据注册系统可以作为元数据元素的命名域管理体系而存在,但命名域并非一定需要注册系统进行管理;
6、元数据元素词表,包括规定元数据取值的规范词表,都可以看成是一种人工语言,每个术语都应该被赋予唯一的URI,都可以通过注册系统进行管理;
7、元数据形式化的表达必须采用基于XML的RDF或OWL等的Schema,著录工作单当然可以通过完整表达元数据方案各种关系和约束的schema来自动生成,并进行校验。当然这需要一定的环境和软件工具来实现;
……
至于这几种元数据标准的分类,感觉在概念上有交叉,是从应用角度来分类,并不具有严格的意义。

前两天针对图林茶的困惑,也发表了一些看法(问题的陈述只是大致):

问题1:目前针对具体应用领域制订的元数据方案,其描述对象究竟为何?

1a、任何具体的元数据方案所描述的实体,都可能是一个复合的实体,并在整个生命周期中具有不同的表现。完善的元数据方案应该首先有一个应用模型(如FRBR)进行清晰的表达,这样才有可能使得具体的描述符合1:1原则。
1b、应用系统在具体开发实现的时候,可能无法保证模型关系的完整体现,这已经在元数据方案所能考虑的范围之外了。好的实现,应该能够以较少的代价(例如一条记录),反应更多的内容(例如两种实体之间的关系)。

问题2:元数据方案不都是“描述”资源的吗?

2、元数据就是关于数据相关属性的描述,虽然有描述性元数据、结构性元数据、管理性元数据等说法,这里的“描述”取了狭义的“内容描述”的含义。纯粹玩弄词藻,就不多言了。然而属性的取舍是元数据方案的关键,不“困惑”这个,制定元数据方案就基本上没有可以困惑的了。

问题3:元数据的“元素”与XML的“元素”,究竟是不是一回事?

3、不要把元数据元素和XML中的元素混为一谈,虽然前者可以用为后者,当然,也可应用为后者的“属性”,这是编码的问题。元素与修饰词在元数据方案中都 是“术语”,都应该慎重,作为一种“元数据应用纲要”来说,复用原则是第一位的,自己添加的术语需要明确定义,并给出命名域(作为课题来说,要给出建 议),否则方案就是不完整的。

细究下去,还有许多进一步的理解,希望这次到深圳参加数图十年会议,能有机会能跟大家沟通一下,并得到大家的批评指正。

Popularity: 49% [?]

Share and Enjoy:
  • Print this article!
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • BlinkList
  • Blogosphere News
  • co.mments
  • connotea
  • Diigo
  • E-mail this story to a friend!
  • Live
  • RSS
  • Socialogs
  • Yahoo! Bookmarks
Tags: Metadata, 元数据, 元数据

Related posts

3 Responses to “近期关于元数据的一些讨论”

  1. keven没能完全理解,就只能是我的理解有问题 :(

    Like or Dislike: Add rating0 Subtract rating0

    [回复]

  2. 不能这么说!远洋后来在她ning上的博客中有进一步解释。远洋的所言都是不错的,你的图示这样画也决不能说不对,只是我觉得这些分类关系因为有交叉重复,需要进一步文字说明才更准确。

    Like or Dislike: Add rating0 Subtract rating0

    [回复]

  3. 同意老K的说词。嘻嘻

    Like or Dislike: Add rating0 Subtract rating0

    [回复]

Leave a Reply