Archive for the 'Web3.0' Category
数据的万维网(The Web of Data)
近一段时间在鼓吹“关联数据(linked data)”,与以前的研究实际上是一脉相承的。数字图书馆随着技术的演进不断地在寻求更好的实现方式,元数据应用从98、99年就认为采用RDF是最Native的(RDF为此而诞生),至今没有很好的解决方案,现在总算来了一个LD:关联数据。
虽然不是W3C的嫡亲,但是李爵士毫不掩饰对LD的厚爱,认为它是当下实现“Web of Data”的最好方式。什么是Web of Data?这可是Web3.0的精髓。自从Web2.0大热之后,羞涩内敛的李爵士也勇敢地献身俗流,给阳春白雪的“语义万维网”贴上了Web3.0的标签。
有人说Web1.0是Web of Documents(文件的Web), Web2.0是Web of Persons(人的Web,语法正确吗?),Web3.0是 Web of Data(数据的Web)。
文件Web的特征是:
- 把互联网当成一个超大的文件系统;
- 供人使用而不是供机器使用(文件的内容不是机器可读的编码);
- 基本单元是文件;
- 链接的目标对象也是文件(或者文件的部分);
- 基本单元内部的结构化程度:非常低,不可度量;
- 内容和链接的语义:内隐(需要人脑的理解)。
数据Web的特征是:
- 把互联网当成一个超大的关系型数据库;
- 主要是供机器使用(理解),也可以供人使用(多重编码,既考虑到显示,又靠虑到机读);
- 基本单元是”资源“(或”对资源的描述“),资源可以是万事万物,只要有标识;
- 链接可以发生在任何”资源“之间;
- 资源的结构化程度:很高,随需而变;
- 内容和链接的语义:外显(必须描述出来,作为显性知识,且采用机器可识别的编码方式)。
什么数据最需要关联?虽然数据面前人人平等,但是能力有高下,社会有分工。可以说“开放的数据”最需要关联,规范数据最需要关联。当然,如果企业的数据不需要关联,可能关联数据技术会活不下去,所以除了以维基百科数据为主的Linked Open Data“已成为一场声势浩大的运动之外,Linked Enterprise Data也悄然兴起。
其实,数据量最大,最有价值,保存有最多人类文化遗产的数据并不是上面这些,而是…对了…MARC。看吧,随着LoC,OCLC等业界大佬的努力,Linked MARC Data将遍地开花,其中有没有中文数据呢?这就要看你我的努力了。很有可能将来我们又要疾呼:不能让西方文明占领数据万维网!
早你干嘛去了?!
什么是Web3.0?
去年12月间,《环球企业家》杂志记者Trailleo找我访谈,关于Web3.0。俺也就胡扯了一通。不过俺说的话看来只引了一句,内容也不像是俺的了(连俺的单位也弄成“数字图书研究所”),如果赵老师又看不过眼找俺商榷,俺不承认就是了。俩记者累了半天,越弄越糊涂,对于什么是Web3.0,还是巧妙地回避了,是不是好心给其他记者留口饭吃?如果还有杂志来找,俺可以继续解释,呵呵
文章在这里:http://www.gemag.com.cn/gemag/new/Picnew_content.asp?C_ID=1248,涉及正在发生的技术进展,值得推荐。
语义万维网经典图书/文献
信息更新update: 科学出版社今年3月出版一本《语义网原理与技术》(陆建江 张亚非 苗壮 周波 编著)相当不错,论述准确,在内容深度、组织编排和系统性方面比前两年出的《语义信息模型及应用》和《语义网简明教程》(目前都缺货)要略胜一筹, 作为教材和入门书非常好。
搞数字图书馆,包括元数据、本体、知识组织、资源集成,不懂一点语义万维网(Semantic Web)看来是不行的。语义万维网不仅将提供“可信的”知识/信息的平台,而且提供了技术方案、标准规范、工具…..等等,由于遇到发展瓶颈,被Web2.0抢了风头,现在不得不自称为“Web3.0”,寄予了人们很大的希望。我甚至认为,我们这个学科的核心知识,如果不与语义万维网(Web3.0)结合,就会绝后。
今天正好看到 Raw介绍几本核心读物,虽然比较偏向计算机科学(人工智能),也非常值得推介一下:
- Knowledge Representation, John Sowa的经典著作,我有一本机械工业出版社的影印版,不过有人说网上有电子版,您可以碰碰运气。
- Explorer’s guide to the semantic web,Tom Passin,也好像有电子版。
- Practical RDF, Shelley Powers,O’Reilly出的经典图书。
- Ontological Engineering: With Examples from the Areas of Knowledge Management, E-Commerce and the Semantic Web, 2nd edition, Asunción Gomez-Perez, Mariano Fernandez-Lopez, Oscar Corcho, Springer (2007), ISBN:1846283965,这本书出第二版了,真是太好了!
- Tim Berners-Lee’s Weaving the Web,这个是Web的老爸写的东西。
- Stuart Russell and Peter Norvig 的Artificial Intelligence : A Modern Approach搞技术或研究的不得不读的一本书。
另外,这里有个书单,列得很详细。
昨天我在饭否里贴了几个链接,是几篇比较好的入门文章:
