SKOS不是KOS,Linked Data不是Data
有些缩略语不能只看其表面用词,还需了解具体内容。有两个手边的例子:
- SKOS(Simple Knowledge Organization System)与NKOS(Networked Knowledge Organization System)长得很像,但他们全然不是一个东西。前者是用以编码KOS的一套基于RDF的扩展模式(RDF Schema),似乎称之为Simple Knowledge Organization Schema更确切些。而后者是指各类知识组织体系(分类法、叙词表等)在网络上的形态,可以用SKOS来编码NKOS。因此SKOS实际上不是知识组织 体系,只是一种编码方式而已。
- 关联数据Linked Data是发布RDF数据的一种简捷开放高效的方法(机制),是语义Web的一种实现,可以看成是Web上发布数据的一种标准的API(对于HTTP进行进一步的规定和扩展),而不是一种特殊的数据。
Popularity: 13% [?]
Tags: linked data, SKOS, 知识组织Related posts
SKOS版的LCSH
DC-2008年会上Paul Miller的Keynotes(pdf)探讨了图书馆界在语义Web中可以承担的角色,并专门介绍了美国图书馆将其主题表(LCSH)以SKOS 编码的项目(参见http://lcsh.info/ )。
1、采用SKOS编码之后,整个LCSH成为“关联数据(Linked Data )”,即在Web上开放、共享、具有相互联系并且“可引”(with referenceable URI)的数据;
2、LCSH成为Linked Data之后为网络资源利用LCSH建立资源之间的直接联系、使主题数据机读化、Web化提供了一个很好的基础。这里LCSH可以看成是一种“学科主题本体”,能够为采用LCSH标引的任何信息资源的一种“主题视图”;
3、SKOS是W3C提出的、试图将传统的知识组织规范以RDF方式编码,提供“机器可读”能力的一种编码语言。虽然此次DC-2008会上曾蕾、范炜的 文章说明SKOS在对于汉语主题分类词表的编码方面还存在问题,但已经有越来越多的项目开始这方面的试验。要使SKOS的RDF数据人机共读,还必须借助 “Cool URI ”;
4、目前LCSH.INFO采用lccn(Library of Congress Control Number)#concept作为概念唯一标识,采用content negotiation 机制决定以下列何种方式传递信息:application/rdf+xml, text/n3, application/json;
5、LCSH.INFO还采用可视化的方式表达主题概念相互之间的关系:参见主题:Science 。
6、LCSH.INFO还提供了三种方式(Web工具):OpenLink、Disco、Zitgist,来显示SKOS数据及数据之间的关联,并提供SPARQL查询功能 ;
7、任何人可以下载LCSH.INFO的所有RDF三元组数据(这里 ),共计2,441,494条triple数据,31.34MB。也可以到 这里 搜索主题条目;
8、据LCSH.INFO说该项目是利用Bazaar将MARCXML的LCSH数据转成RDF,并在这里:http://inkdroid.org/bzr/lcsh提供Web服务;
9、希望不久看到《中国图书馆图书分类法》、《汉语主题词表》、《中国分类主题词表》或其他国内规范的知识组织体系,尽快成为网络资源可用的工具;
10、“有关单位”如果无暇顾及,不妨授权出来,让大家共同来做…
这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路。
Popularity: 50% [?]
Tags: LCSH, NKOS, SKOS, 主题表, 知识组织Related posts
几篇NKOS中文文献
书骨精把偶的个人计划都登出来了,压力很大很惊慌,而且不要版面费,心中很是不安,想到北京请他吃饭,可最近一直没有机会,就先做点功课吧,见了面兴许能捎带个小礼,不管人家看不看得上,礼轻情意重嘛。
知识组织是近年国内业界的热门话题,比较核心的,查NKOS,发现CNKI中论文并不多,下面一些仔细看了下,应该代表了国内目前的水平(如有重大遗漏,欢迎狗尾续貂,呵呵):
- 王茜,陶兰,王弼佐.语义Web中基于SKOS的知识组织模型《计算机工程与设计》2007.3.1441-1443
- 王一丁,王军.网络知识组织系统标识语言:SKOS《大学图书馆学报》2007.4.30-35
- 曾蕾.网络环境下的知识组织系统–编者的话《现代图书情报技术》2004.1.2-3
- 秦健.实践中的主题词表及其应用专辑:都柏林元数据年会论文选登(编者语)《现代图书情报技术》2006.1.1-2
- 牟冬梅,毕强.语义Web技术对知识组织理论和时间的影响研究《图书情报工作》2006.6.6-10,33
- 刘春艳,曹锦丹,李佳军.语义Web环境下知识组织体系SKOS应用研究《图书情报工作》2006.6.23-27
- 刘春艳,陈淑萍,伍玉成.基于SKOS的叙词表到本体的转换研究《现代图书情报技术》2007.5.32-35
- 邹瑾,张燕飞.主题标引的知识组织模型应用研究《图书馆理论与实践》2006.1.50-53
很多名家,让俺学了不少东西。其中曾蕾和秦健两位老师的文章是两期专辑的引言,点评高屋建瓴,也有参考价值。这些研究的重要贡献和价值就不多说了,大家可以自己看,以下对NKOS国内的研究,从总体上谈点不解渴的地方:
- 大都解其然不解其所以然。当然专业论文不是专著,不能把来龙去脉娓娓道来,然而仅仅介绍国外的进展和现状肯定是不够的,多问几个为什么,这些文章就捉襟见肘了;
- 大都(第一篇除外)不能跳出图情学的框框,而先验地认为以前的美味必然也是今天的佳肴,没想到时过境迁,过去的老屋子能够继续使用,可能是因为泥木砖瓦已经完全为钢筋水泥所取代。专业重构可以看成一种re-engineering,其重要原则之一,是推倒重来,然后再看有没有什么遗产能用,而不是先将就过去的东西新瓶装旧酒,炒炒冷饭;
- 虽然也有一些涉及案例,谈到怎样用的问题,但是难免琐碎,试验性,限于学术研究范围,看不到系统的、方法论层面的进展;
- 对技术性的进展眉毛胡子一把抓,不辨主次,难分轻重,使得一些研究在逻辑上的说服力不够。
国内近年KOS研究的成就是巨大滴,进步是显著滴。上面的评论总体上是以偏概全,主观上十分谬误,客观上造成不良影响,用心十分险恶,本人在此提前道歉。任何留言批判都是对偶的帮助,在此鞠躬,谨表谢意。
Popularity: 60% [?]
Tags: NKOS, SKOS, 知识组织Related posts
就建立“主题描述模型”与雨师的对话
Popularity: 64% [?]
Tags: OWL, SKOS, 主题描述, 知识组织, 语义技术Related posts
信息资源描述的“假设系统”
昨天雨师谈到,在远洋老师的FRSAR模型中,他希望研究一下在背后支持这个模型成立的“公理体系”。
时间无多,未及深入探讨。但这肯定是一个很有意思的问题。雨师提到我应该继续完善那个贸贸然提出的信息资源描述“同一场论”(原来是数字图书馆同一场论,实际上是一套为了解决数字图书馆语义互操作的体系框架,信息资源描述在其中居于核心位置),直觉告诉我,与雨师这个“公理体系”有很大关系。
回来之后想了一下,可以有以下基本假设(不成体系,更不是公理,只是一种理解。持续完善中…):
1.可标识是可描述的前提条件。任何事物,不论是物理的、抽象的或者概念的,作为认识和交流的对象,首先必须能够以某种方式(有意义或无意义,能解析或不能解析,需调度或无需调度)进行标识,才能够进行描述。
2.任何数字对象至少具有“标识符”属性。标识体系是任何描述系统首先需要确立的系统,不论是有形的、无形的,具体的、抽象的。
3.任何一个标识体系,都可以(构建/看成)是一个封闭系统(复杂性可控)。
4.数字图书馆是数字对象的集合,其中的数字对象可以以不同的标识体系进行标识,以不同的元数据方案进行描述。因此数字对象是数字图书馆的组织基础,元数据是数字图书馆(数字对象)的结构基础。
5.元数据提供了数字图书馆的微观结构,领域本体提供了数字图书馆的宏观结构。
6.任何描述(不是陈述),最后都能够简化为“主体、谓词、客体”的一阶谓词逻辑(或其可控的扩展)形式的组合(即RDF(作为一种模型而不是语言)形式)。
7.所谓元数据元素,实际上就是描述信息资源的谓词(属性)词表(包括各类结构限定和取值限定)而已。
8.微内容是一类由微格式(包括RDFa)表示的数字对象,通常具有可共享、可重用、结构化和规范化的特性。
9.SKOS是一套用以表达数字对象的“主题”属性(或aboutness)的微格式,由一套属性词表(表现为RDFS)和形式化描述规范构成。
10.作为主题属性标识的SKOS和作为领域本体的知识组织系统具有完全不同的功能,不可同日而语。
Popularity: 66% [?]
Tags: SKOS, 数图统一场, 知识组织, 语义技术