SKOS版的LCSH
DC-2008年会上Paul Miller的Keynotes(pdf)探讨了图书馆界在语义Web中可以承担的角色,并专门介绍了美国图书馆将其主题表(LCSH)以SKOS 编码的项目(参见http://lcsh.info/ )。
1、采用SKOS编码之后,整个LCSH成为“关联数据(Linked Data )”,即在Web上开放、共享、具有相互联系并且“可引”(with referenceable URI)的数据;
2、LCSH成为Linked Data之后为网络资源利用LCSH建立资源之间的直接联系、使主题数据机读化、Web化提供了一个很好的基础。这里LCSH可以看成是一种“学科主题本体”,能够为采用LCSH标引的任何信息资源的一种“主题视图”;
3、SKOS是W3C提出的、试图将传统的知识组织规范以RDF方式编码,提供“机器可读”能力的一种编码语言。虽然此次DC-2008会上曾蕾、范炜的 文章说明SKOS在对于汉语主题分类词表的编码方面还存在问题,但已经有越来越多的项目开始这方面的试验。要使SKOS的RDF数据人机共读,还必须借助 “Cool URI ”;
4、目前LCSH.INFO采用lccn(Library of Congress Control Number)#concept作为概念唯一标识,采用content negotiation 机制决定以下列何种方式传递信息:application/rdf+xml, text/n3, application/json;
5、LCSH.INFO还采用可视化的方式表达主题概念相互之间的关系:参见主题:Science 。
6、LCSH.INFO还提供了三种方式(Web工具):OpenLink、Disco、Zitgist,来显示SKOS数据及数据之间的关联,并提供SPARQL查询功能 ;
7、任何人可以下载LCSH.INFO的所有RDF三元组数据(这里 ),共计2,441,494条triple数据,31.34MB。也可以到 这里 搜索主题条目;
8、据LCSH.INFO说该项目是利用Bazaar将MARCXML的LCSH数据转成RDF,并在这里:http://inkdroid.org/bzr/lcsh提供Web服务;
9、希望不久看到《中国图书馆图书分类法》、《汉语主题词表》、《中国分类主题词表》或其他国内规范的知识组织体系,尽快成为网络资源可用的工具;
10、“有关单位”如果无暇顾及,不妨授权出来,让大家共同来做…
这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路。
Popularity: 53% [?]
Tags: LCSH, NKOS, SKOS, 主题表, 知识组织
















雨僧 Said on 十月 3rd, 2008 at 10:40 上午 quote
先踩个脚印,仔细消化
Like or Dislike:
0
0
[回复]
平台江 Said on 十月 3rd, 2008 at 5:47 下午 quote
10、“有关单位”如果无暇顾及,不妨授权出来,让大家共同来做…
呼吁的人多了,声音就大了.可能”有关单位”就能听见了.
Like or Dislike:
0
0
[回复]
qj Said on 十月 3rd, 2008 at 8:12 下午 quote
上海图书馆何不先拿一个domain来做一个试验,从encoding 做起,一直到系统实施和使用检验。也许可以和老槐那儿一起合作申请一个国家项目,因为和教育科研挂钩也许机会更大。
Like or Dislike:
0
0
[回复]
keven Said on 十月 3rd, 2008 at 9:20 下午 quote
上图不是科研单位,拿一个domain做一些试验,如果将来无法应用,馆长的兴趣恐怕不大。况且这样的系统做起来光靠上图的力量是不够的,熟悉这些新东西的人在上海都很难找。而如果要应用,必须解决词表的“版权”问题,所以我们数字图书馆的版权实际上并非都在出版界,自己的问题实际上都解决不好。我们虽然很希望在国家/行业标准的基础上做一些开发,然而“基础不牢,地动山摇”。一个切实可行的做法是cc授权,非商业应用。再严格一点可以弄一两个格式协议,这样可以简化问题。只有这样,才能百花齐放。
Like or Dislike:
0
0
[回复]
keven Said on 十月 4th, 2008 at 10:52 上午 quote
Pinoke在 这里 有重要补充,请参考。
Like or Dislike:
0
0
[回复]
远洋过客 Said on 十月 5th, 2008 at 8:42 上午 quote
LCSH的进展参见Ed Summit最近在DC的NKOS Workshop上的ppt:
SKOS: New Dimensions in Interoperability (Ed Summers, Library of Congress) and Jon Phipps (Cornell Univ.) (pdf)
http://nkos.slis.kent.edu/2008workshop/EdSummers.pdf
很可惜LCSH自己不争气,因为是从下往上发展的,缺什么词就加什么词,没有系统, 所以等级关系也很混乱,SKOS化后被发现无数不合逻辑的关系, 十分尴尬。本来LCSH就不是叙词表,原来只有 See also, 后来套用了叙词表的符号(BT,NT, RT) 处理词间关系,但是没有根本上改变。所以形式上LCSH是可以像Ed做的这样了,但其本身的很多语义关系问题还没法解决。
国会馆正在将其其它的规范词汇SKOS化,例如语言表、国家表等。本月底在ASIS会上LC的Rebecca Guenther会具体介绍,Session 为“Web Service-based Applications: Optimizing Indexing, Searching, and Terminology Services“, 请继续关注。
Like or Dislike:
0
0
[回复]
pinoke Said on 十月 5th, 2008 at 3:26 下午 quote
远洋老师说得一针见血,太过瘾了!继续关注LC对SKOS的研究
Like or Dislike:
0
0
[回复]
远洋过客 Said on 十月 5th, 2008 at 8:58 下午 quote
Keven说“这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路”更是一针见血。
做术语服务(TS)的目的,不仅是要将词表什么的用不同的格式存取和服务,更重要的是使之成为语义网(Semantic Web = Web of Data) 中的数据资源(data/resource); 不仅是词表将作为一个整体资源存在,更重要的是表达概念的词汇、体系、概念之间的关系都成为数据资源。
Like or Dislike:
0
0
[回复]
pinoke Said on 十月 5th, 2008 at 10:28 下午 quote
非常赞同,对传统KOS本身的发展有了较明确的定位。在我参阅相关报告时指出的那样,词表作为信息组织方法和工具用来组织网络信息资源的研究已经非常普遍了,然而对于词表本身作为一种Web资源(即词表中的术语和关系都成为web资源),融入语义网环境,成为起交流共享资源的一部分。Linked Data理念要在我们这里大谈特谈,呵呵~!
Like or Dislike:
0
0
[回复]
beefsteak Said on 十月 7th, 2008 at 7:59 上午 quote
百花齐放是个熟悉的好词。有好的土才能有的花啊。
Like or Dislike:
0
0
[回复]
pinoke Said on 十二月 28th, 2008 at 8:01 下午 quote
国会图书馆近期要求Ed Summer关闭lcsh.info网站,真是可惜了!!
不过这确实是一个实验SKOS和Linked Data的好项目,其价值绝对值得肯定!
Like or Dislike:
0
0
[回复]