SKOS不是KOS,Linked Data不是Data

有些缩略语不能只看其表面用词,还需了解具体内容。有两个手边的例子:

  1. SKOS(Simple Knowledge Organization System)与NKOS(Networked Knowledge Organization System)长得很像,但他们全然不是一个东西。前者是用以编码KOS的一套基于RDF的扩展模式(RDF Schema),似乎称之为Simple Knowledge Organization Schema更确切些。而后者是指各类知识组织体系(分类法、叙词表等)在网络上的形态,可以用SKOS来编码NKOS。因此SKOS实际上不是知识组织 体系,只是一种编码方式而已。
  2. 关联数据Linked Data是发布RDF数据的一种简捷开放高效的方法(机制),是语义Web的一种实现,可以看成是Web上发布数据的一种标准的API(对于HTTP进行进一步的规定和扩展),而不是一种特殊的数据。

Popularity: 13% [?]

Tags: linked data, SKOS, 知识组织

Related posts

SKOS版的LCSH

DC-2008年会上Paul Miller的Keynotes(pdf)探讨了图书馆界在语义Web中可以承担的角色,并专门介绍了美国图书馆将其主题表(LCSH)以SKOS 编码的项目(参见http://lcsh.info/ )。

1、采用SKOS编码之后,整个LCSH成为“关联数据(Linked Data )”,即在Web上开放、共享、具有相互联系并且“可引”(with referenceable URI)的数据;

2、LCSH成为Linked Data之后为网络资源利用LCSH建立资源之间的直接联系、使主题数据机读化、Web化提供了一个很好的基础。这里LCSH可以看成是一种“学科主题本体”,能够为采用LCSH标引的任何信息资源的一种“主题视图”;

3、SKOS是W3C提出的、试图将传统的知识组织规范以RDF方式编码,提供“机器可读”能力的一种编码语言。虽然此次DC-2008会上曾蕾、范炜的 文章说明SKOS在对于汉语主题分类词表的编码方面还存在问题,但已经有越来越多的项目开始这方面的试验。要使SKOS的RDF数据人机共读,还必须借助 “Cool URI ”;

4、目前LCSH.INFO采用lccn(Library of Congress Control Number)#concept作为概念唯一标识,采用content negotiation 机制决定以下列何种方式传递信息:application/rdf+xml, text/n3, application/json;

5、LCSH.INFO还采用可视化的方式表达主题概念相互之间的关系:参见主题:Science

6、LCSH.INFO还提供了三种方式(Web工具):OpenLink、Disco、Zitgist,来显示SKOS数据及数据之间的关联,并提供SPARQL查询功能

7、任何人可以下载LCSH.INFO的所有RDF三元组数据(这里 ),共计2,441,494条triple数据,31.34MB。也可以到 这里 搜索主题条目;

8、据LCSH.INFO说该项目是利用BazaarMARCXML的LCSH数据转成RDF,并在这里:http://inkdroid.org/bzr/lcsh提供Web服务;

9、希望不久看到《中国图书馆图书分类法》、《汉语主题词表》、《中国分类主题词表》或其他国内规范的知识组织体系,尽快成为网络资源可用的工具;

10、“有关单位”如果无暇顾及,不妨授权出来,让大家共同来做…

这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路。

Popularity: 50% [?]

Tags: LCSH, NKOS, SKOS, 主题表, 知识组织

Related posts

几篇NKOS中文文献

书骨精把偶的个人计划都登出来了,压力很大很惊慌,而且不要版面费,心中很是不安,想到北京请他吃饭,可最近一直没有机会,就先做点功课吧,见了面兴许能捎带个小礼,不管人家看不看得上,礼轻情意重嘛。

知识组织是近年国内业界的热门话题,比较核心的,查NKOS,发现CNKI中论文并不多,下面一些仔细看了下,应该代表了国内目前的水平(如有重大遗漏,欢迎狗尾续貂,呵呵):

  • 王茜,陶兰,王弼佐.语义Web中基于SKOS的知识组织模型《计算机工程与设计》2007.3.1441-1443
  • 王一丁,王军.网络知识组织系统标识语言:SKOS《大学图书馆学报》2007.4.30-35
  • 曾蕾.网络环境下的知识组织系统–编者的话《现代图书情报技术》2004.1.2-3
  • 秦健.实践中的主题词表及其应用专辑:都柏林元数据年会论文选登(编者语)《现代图书情报技术》2006.1.1-2
  • 牟冬梅,毕强.语义Web技术对知识组织理论和时间的影响研究《图书情报工作》2006.6.6-10,33
  • 刘春艳,曹锦丹,李佳军.语义Web环境下知识组织体系SKOS应用研究《图书情报工作》2006.6.23-27
  • 刘春艳,陈淑萍,伍玉成.基于SKOS的叙词表到本体的转换研究《现代图书情报技术》2007.5.32-35
  • 邹瑾,张燕飞.主题标引的知识组织模型应用研究《图书馆理论与实践》2006.1.50-53

很多名家,让俺学了不少东西。其中曾蕾和秦健两位老师的文章是两期专辑的引言,点评高屋建瓴,也有参考价值。这些研究的重要贡献和价值就不多说了,大家可以自己看,以下对NKOS国内的研究,从总体上谈点不解渴的地方:

  • 大都解其然不解其所以然。当然专业论文不是专著,不能把来龙去脉娓娓道来,然而仅仅介绍国外的进展和现状肯定是不够的,多问几个为什么,这些文章就捉襟见肘了;
  • 大都(第一篇除外)不能跳出图情学的框框,而先验地认为以前的美味必然也是今天的佳肴,没想到时过境迁,过去的老屋子能够继续使用,可能是因为泥木砖瓦已经完全为钢筋水泥所取代。专业重构可以看成一种re-engineering,其重要原则之一,是推倒重来,然后再看有没有什么遗产能用,而不是先将就过去的东西新瓶装旧酒,炒炒冷饭;
  • 虽然也有一些涉及案例,谈到怎样用的问题,但是难免琐碎,试验性,限于学术研究范围,看不到系统的、方法论层面的进展;
  • 对技术性的进展眉毛胡子一把抓,不辨主次,难分轻重,使得一些研究在逻辑上的说服力不够。

国内近年KOS研究的成就是巨大滴,进步是显著滴。上面的评论总体上是以偏概全,主观上十分谬误,客观上造成不良影响,用心十分险恶,本人在此提前道歉。任何留言批判都是对偶的帮助,在此鞠躬,谨表谢意。

Popularity: 60% [?]

Tags: NKOS, SKOS, 知识组织

Related posts

就建立“主题描述模型”与雨师的对话

9:06 Rainzen: Hi Keven,忙吗?
博文拜读了几遍
正在写感想
9:08 : 雨师好!
哈哈,不必当真,敬请狠批
9:10 我的假设体系和您的公理体系可能不是一回事,所以请您尽快写出来,让我们从不同角度阐释、补充完善
Rainzen: 有点不同
9:11 : 是,那天您只谈了一点点
Rainzen: 但是,K师给出了一个总体的功能需求
9:12 我的所谓公理体系是指一个抽象的逻辑层
: 我觉得曾师的thema-nomen解决的也是一个主题描述背后的假设
9:13 Rainzen: 我将知识组织体系分解成三个层面
9:14 : 即所有表达为术语的概念,就是指概念,而非指术语的形式。这是一个前提假说
Rainzen: 逻辑层、内容层(语义)和表达层(格式)
是的
我完全同意
9:15 : 然后skos的重点可以放在术语体系的构建和功能需求的实现上了
就把任何对于术语是否反映概念的质疑 挡回去
Rainzen: 是的
: 您的三个层次如何建立,愿闻其详
Rainzen: 好的,我正在写
9:16 : 好的,等待中…不打扰了
Rainzen: 我想回避术语和概念而只用语义单元
9:17 : 是的,这个问题扯起来没底而且是哲学认识论的问题
与计算机实现没有很大关系
Rainzen: 一个词可以语义单元
一个术语是一个语义单元
一个符号也是
9:18 逻辑层就是界定这些语义单元的相互关系
和推理规则
9:19 在内容层或语义层,
9:20 任何东西都可以是语义单元
不一定局限于术语、词表等等
: 您是想提供一套主题定义的一般规则(如RDFS)呢,还是什么
9:21 Rainzen: 但约束条件是遵循逻辑层的限定
: 听起来像是语义网layered cake的子集
就是那个阶梯状的图
Rainzen: 是的,
有点接近
: 那个图就是您的想法,哈哈,异曲同工,英雄所见
开个玩笑哈
9:22 Rainzen: RDFS只是在表达层
体现出来
9:23 我所谓的逻辑层主要是形式化关系
9:24 : 基于rdfs的owl具有很强的逻辑表达能力
9:25 当然,只是描述逻辑(description logic)
Rainzen: 是的,但我觉得应用到信息组织或知识组织领域
我们没有建立一个很好的应用领域的逻辑层面
9:26 所以应用领域和RDFS和OWL只见好像隔了一层
: skos在表达传统的主题概念关系方面,也扩展了很多术语
9:27 skos和owl都可以看成rdfs术语的扩展
都是rdfs
Rainzen: 是的,我其实是想将这些属于内在的东西抽取出来
形成一个逻辑的抽象层面
9:28 : 看看哪些东西需要抽取太具体了就可以用skos,太一般了就是owl了,我的理解
Rainzen: 举个例子而言
有人为主题词表建本体
9:29 我一直有个疑问
: 是,很多
对于owl来说,这是小菜一碟
9:30 Rainzen: 主题词表的内在逻辑关系是否符合owl的内在假设?
9:31 如果对建成的本体进行推理,是否能够实现我们的预期目标?
9:32 另一方面,我们定义太多的术语是否合理?
: 我的理解,主题词表的逻辑相对来说还是比较简单的,至少主题词表可以表达出来(explicit)的逻辑,用owl应该没有问题
Rainzen: 我正在寻找例子,找了几篇文章
: 之所以这样,就是希望尽可能重用 owl和skos已经定义的术语
9:33 Rainzen: 我设想应该定义一组核心术语
其他术语可以从这个核心种推演出来
9:34 : 用主题词表进行推理,实际上已经超出了传统主题词表,甚至skos的功能需求了,这是本体的功能
这也是我为什么提到第10条的理由
9:35 Rainzen: 是的,如果不能推理,价值就大打则扣了
: skos的use case写的还是比较清楚、低调的
9:36 罗马的归罗马,凯撒的归凯撒,推理还是交给本体吧
9:37 不要让着眼于与传统kos兼容的skos做那么多事情
当然,您的模型是可以建立的
Rainzen: 是的,但在建立模型时,应该超脱SKOS
: 因为这个模型并不是单为skos而立的。我同意
9:38 Rainzen: SKOS只是表达层
我的看法
9:39 : 是,同意。现在的难点是,主题表达所需要的推理功能或其它功能,有什么方面需要比owl更具体化?或者超出owl的考虑范围
9:40 这个可能需要具体考察
Rainzen: 是的,这是个难点,我觉得回避比较好
9:41 也许可以将OWL看成常量
9:42 : ?
9:43 Rainzen: 也就是说,我们为OWL量身定做
9:44 : 这是有可能的
owl有三个版本
Rainzen: OWL是工具
: 是
9:45 可以剪裁
领域应用
Rainzen: 是的,形成一个应用子集
: 可以叫做:主题描述的OWLS
OWL Schema
: 是这样的
这其实是owl的设计目标
关键是,我们的主题描述要确立领域需求
9:47 Rainzen: 是的,我以前写学位论文时,就想在元数据领域做这些
: 真是太好了
希望尽快看到您的博文
9:51 另外,把今天我们的对话可以贴出来
Rainzen: 讨论过后思路清晰了
好的,贴在你的博克里
: 好的,谢谢啦

Popularity: 64% [?]

Tags: OWL, SKOS, 主题描述, 知识组织, 语义技术

Related posts

信息资源描述的“假设系统”

昨天雨师谈到,在远洋老师的FRSAR模型中,他希望研究一下在背后支持这个模型成立的“公理体系”。

时间无多,未及深入探讨。但这肯定是一个很有意思的问题。雨师提到我应该继续完善那个贸贸然提出的信息资源描述“同一场论”(原来是数字图书馆同一场论,实际上是一套为了解决数字图书馆语义互操作的体系框架,信息资源描述在其中居于核心位置),直觉告诉我,与雨师这个“公理体系”有很大关系。

回来之后想了一下,可以有以下基本假设(不成体系,更不是公理,只是一种理解。持续完善中…):

1.可标识是可描述的前提条件。任何事物,不论是物理的、抽象的或者概念的,作为认识和交流的对象,首先必须能够以某种方式(有意义或无意义,能解析或不能解析,需调度或无需调度)进行标识,才能够进行描述。
2.任何数字对象至少具有“标识符”属性。标识体系是任何描述系统首先需要确立的系统,不论是有形的、无形的,具体的、抽象的。
3.任何一个标识体系,都可以(构建/看成)是一个封闭系统(复杂性可控)。
4.数字图书馆是数字对象的集合,其中的数字对象可以以不同的标识体系进行标识,以不同的元数据方案进行描述。因此数字对象是数字图书馆的组织基础,元数据是数字图书馆(数字对象)的结构基础。
5.元数据提供了数字图书馆的微观结构,领域本体提供了数字图书馆的宏观结构。
6.任何描述(不是陈述),最后都能够简化为“主体、谓词、客体”的一阶谓词逻辑(或其可控的扩展)形式的组合(即RDF(作为一种模型而不是语言)形式)。
7.所谓元数据元素,实际上就是描述信息资源的谓词(属性)词表(包括各类结构限定和取值限定)而已。
8.微内容是一类由微格式(包括RDFa)表示的数字对象,通常具有可共享、可重用、结构化和规范化的特性。
9.SKOS是一套用以表达数字对象的“主题”属性(或aboutness)的微格式,由一套属性词表(表现为RDFS)和形式化描述规范构成。
10.作为主题属性标识的SKOS和作为领域本体的知识组织系统具有完全不同的功能,不可同日而语。

Popularity: 66% [?]

Tags: SKOS, 数图统一场, 知识组织, 语义技术

Related posts