SKOS不是KOS,Linked Data不是Data
有些缩略语不能只看其表面用词,还需了解具体内容。有两个手边的例子:
- SKOS(Simple Knowledge Organization System)与NKOS(Networked Knowledge Organization System)长得很像,但他们全然不是一个东西。前者是用以编码KOS的一套基于RDF的扩展模式(RDF Schema),似乎称之为Simple Knowledge Organization Schema更确切些。而后者是指各类知识组织体系(分类法、叙词表等)在网络上的形态,可以用SKOS来编码NKOS。因此SKOS实际上不是知识组织 体系,只是一种编码方式而已。
- 关联数据Linked Data是发布RDF数据的一种简捷开放高效的方法(机制),是语义Web的一种实现,可以看成是Web上发布数据的一种标准的API(对于HTTP进行进一步的规定和扩展),而不是一种特殊的数据。
Popularity: 14% [?]
Tags: linked data, SKOS, 知识组织Related posts
几个概念:开放数据,关联数据,语义Web和Web3.0
针对童鞋们经常提问,以及本人根据网络资源和自己的理解整理如下:
开放数据(Open Data):
在网络上可以公开得到的数据,没有任何控制访问的措施(无需登录,否则只能是免费数据或其它名称)。
为了促进开放数据应用,模仿“创作共用”协议,好事者也提出了“开放数据共用协议”。
开放元数据是其中的一类。
项目举例:
- data.gov(美国)
- Open Data Network(德国)
- making public data public(英国)
关联数据(Linked Data):
一种数据访问(整合)技术,基本上都是以RDF方式表达,对于Http协议进行少量扩展(规定)而成。低成本,高可用性,整合简单。
开放链接数据(Linked Open Data)是关联数据的一项运动。
- 美国纽约时报项目,目前已经上载了5000个人物的主题表目,可以按照cc by协议开放使用。
- Linked Data Research Center
- GoodRelations:关于产品、价格和企业数据的规范词表
- oeGOV:应用于政府信息管理的本体词表
Web3.0:
Web2.0的热衷者或者搅局者提出的一个概念,作为下一代Web的一种趋势探讨,有人说就是语义Web,有人在语义Web基础上添加了P2P、各类无线应用甚至云计算等内容。
语义Web:
现有Web之上的、以数据资源为基本组成单位的Web,这些资源(数据)都标注有元数据描述,从而能够进行语义查询,以及数据整合,提供了互联网上实现语义互操作的技术平台。关联数据可以理解为语义Web的一种实现。
Web of Data是其另一别称。
Popularity: 18% [?]
Tags: linked data, Open Data, Web3.0, 关联数据, 语义Web, 语义技术Related posts
百思买开始发布关联数据
全球最大的专业零售商、世界500强之一的百思买,开始采用RDF/XML在网上发布其商品信息,包括其所有45万种商品,每种大约60个三元组(triple,相当于数据库字段),包括价格信息。数据每日更新。
虽然这个三元组库不是世界上最大的,但它的动态性目前还无人能比。Linked Open Data项目中的所有RDF库,还没有应用于动态商业产品信息的。因此,百思买能否成功,从某种程度上对于关联数据/语义网的应用具有示范效应。
三元组数据集在这里(可惜居然要翻墙,不知是何道理!):
语义地图: http://products.semweb.bestbuy.com/sitemap.xml
数据集:
a) 软件产品:http://products.semweb.bestbuy.com/products/8182593/semanticweb.rdf
b) 硬件(”Hardgoods”):http://products.semweb.bestbuy.com/products/8794691/semanticweb.rdf
c) 电影:http://products.semweb.bestbuy.com/products/7590289/semanticweb.rdf
d) 游戏产品:http://products.semweb.bestbuy.com/products/9223752/semanticweb.rdf
Popularity: 17% [?]
Tags: bestbuy, linked data, 关联数据, 百思买, 语义技术Related posts
关联数据浏览器
20090827update: 雨师对此已经做了详细解释,参见:http://www.linhq.net/archives/5。
20090826update: 在apache的httpd.conf文件中插入:AddType application/rdf+xml .rdf, AddType text/rdf+n3;charset=utf-8 .n3, AddType application/x-turtle .ttl。即解决了本帖中所遇到的问题(Firefox需安装Tabulator插件)。
最近一直在关注关联数据的实现问题。今天试验了这样几个浏览器(插件):
- Tabulator Browser (MIT, USA)
- Marbles (FU Berlin, DE)
- OpenLink RDF Browser (OpenLink, UK)
- Zitgist RDF Browser (Zitgist, USA)
- Disco Hyperdata Browser (FU Berlin, DE)
- Fenfire (DERI, Irland)
各有千秋。
好像Zitgist的适应性最好(见插图)。其它几个对于我的FOAF文件都不能正常显示。
后来参考《如何在网上发布关联数据》,发现是我的apache服务器的设置问题:不支持application/rdf+xml的MIME类型。
Popularity: 19% [?]
Tags: linked data, 关联数据, 语义技术Related posts
ALA2009 Linked Data Session
今年ALA年会的“草根分会场”有一个“关联数据”主题。看起来这些分会场都是事先申报,经过投票而选定的,过于小众的主题是选不上的。据说“关联数据”主题得到了118张选票。
本场主题共有四个报告:
- Eric Miller (Zepheira), “Linked Data and Libraries“;
- Diane Hillmann (Information Institute of Syracuse; Metadata Management Associates), “Are Libraries Ready for Linked Data?“;
- Jennifer Bowen (University of Rochester), “Defining Linked Data for the eXtensible Catalog (XC): Metadata on the Bleeding Edge“;
- Rebecca Guenther (Library of Congress), “Controlled Vocabularies as Linked Data on the Web“.
都相当精彩。点击链接可以下载。
Popularity: 19% [?]
Tags: linked data, 关联数据, 语义技术Related posts
关联数据:意义及其实现
关联数据(Linked Data),很简单的技术,却正在使万维网发生质的改变。
图书馆的MARC数据,规范记录,主题标目,…,正在开放成为任意互联的关联数据。
已经有20亿条传统网页上的数据(包括维基百科)被自动半自动地转换成了关联数据。
大型媒体公司,如BBC,纽约时报,已经把他们的海量数据转换成了关联数据。
英国首相咯噔布朗,已邀请李爵士为英国政府信息提供语义网(关联数据)支持。
……
关联数据正在成为数据上网的一种标准形式,使开放数据的API直接统一为HTTP协议,等于废除了任何私有的API。
其严格采用HTTP URI使真实世界全面映射到网络世界。
其全面支持RDF,使万维网资源描述得以完美模拟真实世界。
总之,这是语义网的一种初步实现。
难怪李爵士情不自禁地在TED大会上说:“这哈子歪脖总算干对了(The Web done right)!”
Popularity: 18% [?]
Tags: linked data, 关联数据, 语义技术Related posts
关联数据四原则
专文至此,以方便链接引用。
原文来自李爵士的报告:http://www.w3.org/DesignIssues/LinkedData.html
- 原则一:使用URI作为任何事物的标识名称;
Use URIs as names for things - 原则二:使用HTTP URI使任何人都可以访问这些标识名称;
Use HTTP URIs so that people can look up those names - 原则三:当有人访问某个标识名称时,提供有用的信息;
When someone looks up a name, provide useful information - 原则四:尽可能提供相关的URI,以使人们可以发现更多的事物。
Include links to other URIs so that they can discover more things
Popularity: 24% [?]
Tags: linked data, 关联数据, 四原则, 语义技术Related posts
数据的万维网(The Web of Data)
近一段时间在鼓吹“关联数据(linked data)”,与以前的研究实际上是一脉相承的。数字图书馆随着技术的演进不断地在寻求更好的实现方式,元数据应用从98、99年就认为采用RDF是最Native的(RDF为此而诞生),至今没有很好的解决方案,现在总算来了一个LD:关联数据。
虽然不是W3C的嫡亲,但是李爵士毫不掩饰对LD的厚爱,认为它是当下实现“Web of Data”的最好方式。什么是Web of Data?这可是Web3.0的精髓。自从Web2.0大热之后,羞涩内敛的李爵士也勇敢地献身俗流,给阳春白雪的“语义万维网”贴上了Web3.0的标签。
有人说Web1.0是Web of Documents(文件的Web), Web2.0是Web of Persons(人的Web,语法正确吗?),Web3.0是 Web of Data(数据的Web)。
文件Web的特征是:
- 把互联网当成一个超大的文件系统;
- 供人使用而不是供机器使用(文件的内容不是机器可读的编码);
- 基本单元是文件;
- 链接的目标对象也是文件(或者文件的部分);
- 基本单元内部的结构化程度:非常低,不可度量;
- 内容和链接的语义:内隐(需要人脑的理解)。
数据Web的特征是:
- 把互联网当成一个超大的关系型数据库;
- 主要是供机器使用(理解),也可以供人使用(多重编码,既考虑到显示,又靠虑到机读);
- 基本单元是”资源“(或”对资源的描述“),资源可以是万事万物,只要有标识;
- 链接可以发生在任何”资源“之间;
- 资源的结构化程度:很高,随需而变;
- 内容和链接的语义:外显(必须描述出来,作为显性知识,且采用机器可识别的编码方式)。
什么数据最需要关联?虽然数据面前人人平等,但是能力有高下,社会有分工。可以说“开放的数据”最需要关联,规范数据最需要关联。当然,如果企业的数据不需要关联,可能关联数据技术会活不下去,所以除了以维基百科数据为主的Linked Open Data“已成为一场声势浩大的运动之外,Linked Enterprise Data也悄然兴起。
其实,数据量最大,最有价值,保存有最多人类文化遗产的数据并不是上面这些,而是…对了…MARC。看吧,随着LoC,OCLC等业界大佬的努力,Linked MARC Data将遍地开花,其中有没有中文数据呢?这就要看你我的努力了。很有可能将来我们又要疾呼:不能让西方文明占领数据万维网!
早你干嘛去了?!
Popularity: 28% [?]
Tags: linked data, Web of Data, Web3.0, 关联数据, 数据的Web, 语义技术Related posts
李爵士介绍Web3.0
另一段视频,TED大会上的。
李爵士20年前发明了万维网,现在又在创建下一代Web:语义万维网(俗称Web3.0)。如果说Web1.0是超文本的Web,Web2.0是互动的Web,Web3.0就是数据的Web。
有人说李爵士的语速过快,口才不好,动作神经质,但丝毫遮掩不了其思想的伟大。而且,他的思想与历史上很多“伟大”的思想家不同,并不直接体现为一种人文关怀。
Popularity: 42% [?]
Tags: linked data, Semantic Web, tim burners-lee, Web3.0, 读网