数据的万维网(The Web of Data)

近一段时间在鼓吹“关联数据(linked data)”,与以前的研究实际上是一脉相承的。数字图书馆随着技术的演进不断地在寻求更好的实现方式,元数据应用从98、99年就认为采用RDF是最Native的(RDF为此而诞生),至今没有很好的解决方案,现在总算来了一个LD:关联数据。

虽然不是W3C的嫡亲,但是李爵士毫不掩饰对LD的厚爱,认为它是当下实现“Web of Data”的最好方式。什么是Web of Data?这可是Web3.0的精髓。自从Web2.0大热之后,羞涩内敛的李爵士也勇敢地献身俗流,给阳春白雪的“语义万维网”贴上了Web3.0的标签。

有人说Web1.0是Web of Documents(文件的Web), Web2.0是Web of Persons(人的Web,语法正确吗?),Web3.0是 Web of Data(数据的Web)。

文件Web的特征是:

  • 把互联网当成一个超大的文件系统;
  • 供人使用而不是供机器使用(文件的内容不是机器可读的编码);
  • 基本单元是文件;
  • 链接的目标对象也是文件(或者文件的部分);
  • 基本单元内部的结构化程度:非常低,不可度量;
  • 内容和链接的语义:内隐(需要人脑的理解)。

数据Web的特征是:

  • 把互联网当成一个超大的关系型数据库;
  • 主要是供机器使用(理解),也可以供人使用(多重编码,既考虑到显示,又靠虑到机读);
  • 基本单元是”资源“(或”对资源的描述“),资源可以是万事万物,只要有标识;
  • 链接可以发生在任何”资源“之间;
  • 资源的结构化程度:很高,随需而变;
  • 内容和链接的语义:外显(必须描述出来,作为显性知识,且采用机器可识别的编码方式)。

什么数据最需要关联?虽然数据面前人人平等,但是能力有高下,社会有分工。可以说“开放的数据”最需要关联,规范数据最需要关联。当然,如果企业的数据不需要关联,可能关联数据技术会活不下去,所以除了以维基百科数据为主的Linked Open Data“已成为一场声势浩大的运动之外,Linked Enterprise Data也悄然兴起。

其实,数据量最大,最有价值,保存有最多人类文化遗产的数据并不是上面这些,而是…对了…MARC。看吧,随着LoC,OCLC等业界大佬的努力,Linked MARC Data将遍地开花,其中有没有中文数据呢?这就要看你我的努力了。很有可能将来我们又要疾呼:不能让西方文明占领数据万维网!

早你干嘛去了?!

Popularity: 28% [?]

Share and Enjoy:
  • Print this article!
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • BlinkList
  • Blogosphere News
  • co.mments
  • connotea
  • Diigo
  • E-mail this story to a friend!
  • Live
  • RSS
  • Socialogs
  • Yahoo! Bookmarks
Tags: linked data, Web of Data, Web3.0, 关联数据, 数据的Web, 语义技术

Related posts

2 Responses to “数据的万维网(The Web of Data)”

  1. k师节日还忙着布道,致敬!

    Like or Dislike: Add rating0 Subtract rating0

    [回复]

  2. 谢惠子!彼此彼此,看来。嘿嘿

    Like or Dislike: Add rating0 Subtract rating0

    [回复]

Leave a Reply