SKOS版的LCSH
DC-2008年会上Paul Miller的Keynotes(pdf)探讨了图书馆界在语义Web中可以承担的角色,并专门介绍了美国图书馆将其主题表(LCSH)以SKOS 编码的项目(参见http://lcsh.info/ )。
1、采用SKOS编码之后,整个LCSH成为“关联数据(Linked Data )”,即在Web上开放、共享、具有相互联系并且“可引”(with referenceable URI)的数据;
2、LCSH成为Linked Data之后为网络资源利用LCSH建立资源之间的直接联系、使主题数据机读化、Web化提供了一个很好的基础。这里LCSH可以看成是一种“学科主题本体”,能够为采用LCSH标引的任何信息资源的一种“主题视图”;
3、SKOS是W3C提出的、试图将传统的知识组织规范以RDF方式编码,提供“机器可读”能力的一种编码语言。虽然此次DC-2008会上曾蕾、范炜的 文章说明SKOS在对于汉语主题分类词表的编码方面还存在问题,但已经有越来越多的项目开始这方面的试验。要使SKOS的RDF数据人机共读,还必须借助 “Cool URI ”;
4、目前LCSH.INFO采用lccn(Library of Congress Control Number)#concept作为概念唯一标识,采用content negotiation 机制决定以下列何种方式传递信息:application/rdf+xml, text/n3, application/json;
5、LCSH.INFO还采用可视化的方式表达主题概念相互之间的关系:参见主题:Science 。
6、LCSH.INFO还提供了三种方式(Web工具):OpenLink、Disco、Zitgist,来显示SKOS数据及数据之间的关联,并提供SPARQL查询功能 ;
7、任何人可以下载LCSH.INFO的所有RDF三元组数据(这里 ),共计2,441,494条triple数据,31.34MB。也可以到 这里 搜索主题条目;
8、据LCSH.INFO说该项目是利用Bazaar将MARCXML的LCSH数据转成RDF,并在这里:http://inkdroid.org/bzr/lcsh提供Web服务;
9、希望不久看到《中国图书馆图书分类法》、《汉语主题词表》、《中国分类主题词表》或其他国内规范的知识组织体系,尽快成为网络资源可用的工具;
10、“有关单位”如果无暇顾及,不妨授权出来,让大家共同来做…
这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路。
Popularity: 53% [?]
Tags: LCSH, NKOS, SKOS, 主题表, 知识组织Related posts
OCLC的术语服务进展
顺着秦健老师的博文和曾蕾老师的链接,得知9-11在美国华盛顿特区召开了一次精彩的会议,名为“知识组织系统的新疆界(New Dimensions in Knowledge Organization Systems)”,由世界银行承办,作为NKOS和CENDI的联合会议。顺着链接,立即下载了全部文档,并专门向曾蕾老师索要了下载目录中缺失的一个文档:OCLC Diane Vizine-Goetz关于OCLC术语服务新进展的报告。
之所以对“术语服务”感兴趣,一直以为这是元数据/本体从研究探索走向实际应用的一个关节点。元数据/本体固然能在各类领域应用的系统内部实现许多功能,但这并不是它最有价值和最为可观之处,如果能在整个”大Web”上发挥作用,使信息资源从内容语义上互联互通互操作,才算真正发挥了”潜能”(to its full potential),使它无可替代、无所不在。
也正因为这种认识,前一阵为SILF2008会议向牛排约了一篇稿子。牛排觉得“术语服务”对我们来说可能还过于超前,目前还难以驾驭,先来了一篇《元数据注册MDR的再发现》,专注于元数据登记注册系统的讨论。MDR可以看成是“术语服务”的一种特殊类型吧。该文将登载于SILF2008会议的论文集中。
仔细看了一下Diane的“骗骗他”,有这么几个感觉:
1.OCLC的术语服务已经干起来了;
2.术语服务就目前的种类和所要满足的需求来说相当复杂(例如要支持多种KOS,按照多种编码形式发布,支持多种协议调用,等等),所实现的功能却相对很“浅”(可能是我的无知和误解);
3.术语服务需要分门别类(目前也有一些分类);
4.术语服务需要标准化,当然,可能先应该将需求标准化;
5.就目前情况看,术语服务能够带来的好处远远不能弥补其所花费的代价(当然,图书馆员的自我满足除外);主要原因是:其目前所能提供服务都是只被小圈子需要的小众服务;
6.综合2、3、4、5,如果局限于“学术资源服务”,术语服务可能还能生存发展,但是如要大众化和“2.0化”,术语服务还需要进一步简化、草根化。
下图为Diane的PPT中解释OCLC术语服务架构的一个图示。
Popularity: 74% [?]
Tags: NKOS, OCLC, 元数据, 数图技术, 术语服务, 语义技术Related posts
几篇NKOS中文文献
书骨精把偶的个人计划都登出来了,压力很大很惊慌,而且不要版面费,心中很是不安,想到北京请他吃饭,可最近一直没有机会,就先做点功课吧,见了面兴许能捎带个小礼,不管人家看不看得上,礼轻情意重嘛。
知识组织是近年国内业界的热门话题,比较核心的,查NKOS,发现CNKI中论文并不多,下面一些仔细看了下,应该代表了国内目前的水平(如有重大遗漏,欢迎狗尾续貂,呵呵):
- 王茜,陶兰,王弼佐.语义Web中基于SKOS的知识组织模型《计算机工程与设计》2007.3.1441-1443
- 王一丁,王军.网络知识组织系统标识语言:SKOS《大学图书馆学报》2007.4.30-35
- 曾蕾.网络环境下的知识组织系统–编者的话《现代图书情报技术》2004.1.2-3
- 秦健.实践中的主题词表及其应用专辑:都柏林元数据年会论文选登(编者语)《现代图书情报技术》2006.1.1-2
- 牟冬梅,毕强.语义Web技术对知识组织理论和时间的影响研究《图书情报工作》2006.6.6-10,33
- 刘春艳,曹锦丹,李佳军.语义Web环境下知识组织体系SKOS应用研究《图书情报工作》2006.6.23-27
- 刘春艳,陈淑萍,伍玉成.基于SKOS的叙词表到本体的转换研究《现代图书情报技术》2007.5.32-35
- 邹瑾,张燕飞.主题标引的知识组织模型应用研究《图书馆理论与实践》2006.1.50-53
很多名家,让俺学了不少东西。其中曾蕾和秦健两位老师的文章是两期专辑的引言,点评高屋建瓴,也有参考价值。这些研究的重要贡献和价值就不多说了,大家可以自己看,以下对NKOS国内的研究,从总体上谈点不解渴的地方:
- 大都解其然不解其所以然。当然专业论文不是专著,不能把来龙去脉娓娓道来,然而仅仅介绍国外的进展和现状肯定是不够的,多问几个为什么,这些文章就捉襟见肘了;
- 大都(第一篇除外)不能跳出图情学的框框,而先验地认为以前的美味必然也是今天的佳肴,没想到时过境迁,过去的老屋子能够继续使用,可能是因为泥木砖瓦已经完全为钢筋水泥所取代。专业重构可以看成一种re-engineering,其重要原则之一,是推倒重来,然后再看有没有什么遗产能用,而不是先将就过去的东西新瓶装旧酒,炒炒冷饭;
- 虽然也有一些涉及案例,谈到怎样用的问题,但是难免琐碎,试验性,限于学术研究范围,看不到系统的、方法论层面的进展;
- 对技术性的进展眉毛胡子一把抓,不辨主次,难分轻重,使得一些研究在逻辑上的说服力不够。
国内近年KOS研究的成就是巨大滴,进步是显著滴。上面的评论总体上是以偏概全,主观上十分谬误,客观上造成不良影响,用心十分险恶,本人在此提前道歉。任何留言批判都是对偶的帮助,在此鞠躬,谨表谢意。
Popularity: 59% [?]
Tags: NKOS, SKOS, 知识组织