数据的万维网(The Web of Data)
近一段时间在鼓吹“关联数据(linked data)”,与以前的研究实际上是一脉相承的。数字图书馆随着技术的演进不断地在寻求更好的实现方式,元数据应用从98、99年就认为采用RDF是最Native的(RDF为此而诞生),至今没有很好的解决方案,现在总算来了一个LD:关联数据。
虽然不是W3C的嫡亲,但是李爵士毫不掩饰对LD的厚爱,认为它是当下实现“Web of Data”的最好方式。什么是Web of Data?这可是Web3.0的精髓。自从Web2.0大热之后,羞涩内敛的李爵士也勇敢地献身俗流,给阳春白雪的“语义万维网”贴上了Web3.0的标签。
有人说Web1.0是Web of Documents(文件的Web), Web2.0是Web of Persons(人的Web,语法正确吗?),Web3.0是 Web of Data(数据的Web)。
文件Web的特征是:
- 把互联网当成一个超大的文件系统;
- 供人使用而不是供机器使用(文件的内容不是机器可读的编码);
- 基本单元是文件;
- 链接的目标对象也是文件(或者文件的部分);
- 基本单元内部的结构化程度:非常低,不可度量;
- 内容和链接的语义:内隐(需要人脑的理解)。
数据Web的特征是:
- 把互联网当成一个超大的关系型数据库;
- 主要是供机器使用(理解),也可以供人使用(多重编码,既考虑到显示,又靠虑到机读);
- 基本单元是”资源“(或”对资源的描述“),资源可以是万事万物,只要有标识;
- 链接可以发生在任何”资源“之间;
- 资源的结构化程度:很高,随需而变;
- 内容和链接的语义:外显(必须描述出来,作为显性知识,且采用机器可识别的编码方式)。
什么数据最需要关联?虽然数据面前人人平等,但是能力有高下,社会有分工。可以说“开放的数据”最需要关联,规范数据最需要关联。当然,如果企业的数据不需要关联,可能关联数据技术会活不下去,所以除了以维基百科数据为主的Linked Open Data“已成为一场声势浩大的运动之外,Linked Enterprise Data也悄然兴起。
其实,数据量最大,最有价值,保存有最多人类文化遗产的数据并不是上面这些,而是…对了…MARC。看吧,随着LoC,OCLC等业界大佬的努力,Linked MARC Data将遍地开花,其中有没有中文数据呢?这就要看你我的努力了。很有可能将来我们又要疾呼:不能让西方文明占领数据万维网!
早你干嘛去了?!
Popularity: 37% [?]
Tags: linked data, Web of Data, Web3.0, 关联数据, 数据的Web, 语义技术
















hz Said on 五月 28th, 2009 at 11:07 上午 quote
k师节日还忙着布道,致敬!
Like or Dislike:
0
0
[回复]
keven Said on 五月 28th, 2009 at 11:10 上午 quote
谢惠子!彼此彼此,看来。嘿嘿
Like or Dislike:
0
0
[回复]