<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>数图研究笔记 &#187; FRSAR</title>
	<atom:link href="http://www.kevenlw.name/archives/tag/frsar/feed" rel="self" type="application/rss+xml" />
	<link>http://www.kevenlw.name</link>
	<description>When you have a hammer, everything looks like a nail.</description>
	<lastBuildDate>Mon, 11 Jul 2011 13:25:12 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=</generator>
		<item>
		<title>Bringing Authority Control to the Web</title>
		<link>http://www.kevenlw.name/archives/659</link>
		<comments>http://www.kevenlw.name/archives/659#comments</comments>
		<pubDate>Sun, 19 Oct 2008 06:29:08 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[语义技术]]></category>
		<category><![CDATA[authority control]]></category>
		<category><![CDATA[FRBR]]></category>
		<category><![CDATA[FRSAR]]></category>
		<category><![CDATA[规范控制]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=659</guid>
		<description><![CDATA[My colleague, Miss Zhang Chunjing, will give a presentation at SILF2008, which is going to be held on the following Tuesday. The presentation is based on a co-authored paper titled &#8220;the Authority Control for the Web Resources&#8221; by me and herself. To help her prepare the English lecture, I would like to make some of [...]]]></description>
			<content:encoded><![CDATA[<p>My colleague, Miss Zhang Chunjing, will give a presentation at <a href="http://www.libnet.sh.cn/silf2008">SILF2008</a>, which is going to be held on the following Tuesday. The presentation is based on a co-authored paper titled &#8220;the Authority Control for the Web Resources&#8221; by me and herself. To help her prepare the English lecture, I would like to make some of the arguments in the paper more clear with the following background thoughts in English.</p>
<p>In the vision of Semantic Web by Tim Burners-Lee and with the maturing of semantic technology, it gives us an opportunity to spread out the concept of bibliographic control into the Web at the Internet scale. Each piece of information with a URI on the Web can be treated as a &#8220;document&#8221; (resource), so some of them can be authority controlled by means of an experienced and proved way from Library and Information Science,  to bring some kind of authority semantics to the Web, and implement the trusted Web idea to some extent.</p>
<p>Control is a way to go Trust. We can never fully &#8220;bibliographically&#8221; control of everything on the Web (like DC metadata guys&#8217; wish in the early years of the Web). What we can do is try to implement a little bit &#8220;authority&#8221; by means of transplant our traditional authority control approaches into the Web. Although we believe &#8220;a little control will go a long way.&#8221;</p>
<p>Here are the definitions for Bibliographic Control and Authority Control which we followed in our paper:</p>
<p style="padding-left: 30px;"><a href="http://lu.com/odlis/odlis_b.cfm">Bibliographic Control</a> (BC): a broad term encompassing all the activities involved in creating, organizing, managing, and maintaining the file of bibliographic records representing the items held in a library or archival collection, or the sources listed in an index or database, to facilitate access to the information contained in them.</p>
<p style="padding-left: 30px;"><a href="http://en.wikipedia.org/wiki/Authority_control ">Authority Control</a> (AC): refer to the practice of creating and maintaining headings for bibliographic material in a catalog. It fulfills two important functions. First, it enables catalogers to disambiguate items with similar or identical headings. Second, authority control is used by catalogers to collocate materials that logically belong together (ie. with the help of uniform titles). Theoretically, any piece of information is amenable to authority control, but catalogers typically focus on authors and titles. Subject headings fulfill a function similar to authority records, although they are usually considered separately.</p>
<p>Dr. Gorman had a good discussion on the relationship between BC and AC <a id="ht9t" title="here" href="http://www.sba.unifi.it/ac/relazioni/gorman_eng.pdf" target="_blank">here</a>. Search Engine like Google can be thought as a kind of BC on the Internet. But it has no means of AC.</p>
<p>The ongoing research for the Future Bibliographic Control set a basis and starting point to the Web Authority Control. It contains several aspects as follows:</p>
<ul>
<li>FRBR: Provides a framework and model for the AC.</li>
<li>FRAD: Defines the functional requirement for authority data incl. uniform heading of works and agents, but not including KOS, events, and <big><span style="font-family: Trebuchet MS; font-size: x-small;">temporal/spacial name</span></big>.</li>
<li>FRSAR: Mainly contains KOS.</li>
</ul>
<p style="text-align: right;">
]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/659/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>网络资源如何规范控制</title>
		<link>http://www.kevenlw.name/archives/585</link>
		<comments>http://www.kevenlw.name/archives/585#comments</comments>
		<pubDate>Sat, 05 Jul 2008 16:29:24 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[FRBR]]></category>
		<category><![CDATA[FRSAR]]></category>
		<category><![CDATA[网络资源]]></category>
		<category><![CDATA[规范控制]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=585</guid>
		<description><![CDATA[计算机技术和互联网的发展使规范控制的环境、对象和需求均发生了巨大的变化。统一标目让位于数字资源唯一标识的管理；汇集、区分和引导等三类功能需求扩展为识别(Identify)、查找(Find)、选择(Select)、关联(Relate)四个方面的功能需求；规范控制工作也主要变成了资源对象属性关系语义的揭示；检索点的控制失去了原来的意义，变成了系统内部不同属性词、属性值的自动参照 和转换。规范不规范，从专业人员主导，变成了由用户主导；静态的“权威性”资源标注，变成了动态的“可信度”关系计算。 当然这些变化将会是慢慢发生的。好在规范控制不像传统的MARC一样，想扔都扔不掉，毕竟传统的规范控制在实践上远不如理论上做得那么完美，从FRBR开始的一系列研究可以使我们从一个新的高度设立一个新的起点。 FRBR为网络资源的规范控制提供了一个合理的框架模型，其中所涉及的三类实体：知识/艺术创造（包含作品、表达、表现和单件四种状态）、责任者（团体、个人）和主题（概念、对象、事件和地点）提供了规范控制的具体内容。第一、二类实体属于名称规范的范畴（题名规范和责任者规范），第三类实体包含了主题和名称（例如地名和事件名）两个方面的规范。在理论上这一框架首次把“文献”之外的实体：人、机构、程序（遗憾的是FRNAR小组后来将这个明确排除在外了，后面两个是否还包括在内，语焉不详）、地点、事件，也当作“资源”而纳入规范控制的范畴。 网络世界是一个由无数协议和规范构成的人造世界，规范控制是附加于网络世界的另一项人为的需求，是帮助用户判断网络资源内容可信度的一种方法。与传统资源所不同的，网络资源的可信度绝非黑白二值，而取决于信源、信宿和信道三方面的多种因素，并且具有主观性和动态性。一组信息对于某一用户的某项查询来说，其可信度应该是呈正态分布的。信息架构师的责任就是提供一定客观的算法，来实时实地地度量这种相对的可信度。 建立网络资源的规范控制需要建立两类设施：1、规范数据仓储；2、规范控制管理系统。后者是实现前者功能的必要保证，解决网络资源规范控制的实现机制问题。在开放异构的Web环境下网络资源的规范控制不可能是集中的、排他的，同一种类型的规范控制可以有多个模式，由规范控制平台提供的机制来实现一定的互操作。传统的规范数据可能会提供必要的“原始规范数据仓储”，但大量的规范数据需要“草根智慧”（collective intelligence），而不再是仅仅依靠图书馆员。 FRAD报告涉及的，以及FRSAR工作组试图做的，(主要)是名称规范和主题规范。而网络资源可以进行规范的内容还要多得多，例如各类“微内容”格式规范（包括事件、地理信息、化学分子式、基因序列等等）、各类标准应用程序接口（作为一种agent)规范、本体规范（也就是规范的领域模型，包括术语规范、关系规范和编码格式等）。 因此，网络世界的规范控制大有可为。 (本文为新近完成的论文《试论网络资源的规范控制》中的主要观点，若需引用，希望注明出处：刘炜,张春景. 试论网络资源的规范控制.现代图书情报技术,2008.12.27-31）。]]></description>
			<content:encoded><![CDATA[<p>计算机技术和互联网的发展使规范控制的环境、对象和需求均发生了巨大的变化。统一标目让位于数字资源唯一标识的管理；汇集、区分和引导等三类功能需求扩展为识别(Identify)、查找(Find)、选择(Select)、关联(Relate)四个方面的功能需求；规范控制工作也主要变成了资源对象属性关系语义的揭示；检索点的控制失去了原来的意义，变成了系统内部不同属性词、属性值的自动参照 和转换。规范不规范，从专业人员主导，变成了由用户主导；静态的“权威性”资源标注，变成了动态的“可信度”关系计算。</p>
<p>当然这些变化将会是慢慢发生的。好在规范控制不像传统的MARC一样，想扔都扔不掉，毕竟传统的规范控制在实践上远不如理论上做得那么完美，从FRBR开始的一系列研究可以使我们从一个新的高度设立一个新的起点。</p>
<p>FRBR为网络资源的规范控制提供了一个合理的框架模型，其中所涉及的三类实体：知识/艺术创造（包含作品、表达、表现和单件四种状态）、责任者（团体、个人）和主题（概念、对象、事件和地点）提供了规范控制的具体内容。第一、二类实体属于名称规范的范畴（题名规范和责任者规范），第三类实体包含了主题和名称（例如地名和事件名）两个方面的规范。在理论上这一框架首次把“文献”之外的实体：人、机构、程序（遗憾的是FRNAR小组后来将这个明确排除在外了，后面两个是否还包括在内，语焉不详）、地点、事件，也当作“资源”而纳入规范控制的范畴。</p>
<p>网络世界是一个由无数协议和规范构成的人造世界，规范控制是附加于网络世界的另一项人为的需求，是帮助用户判断网络资源内容可信度的一种方法。与传统资源所不同的，网络资源的可信度绝非黑白二值，而取决于信源、信宿和信道三方面的多种因素，并且具有主观性和动态性。一组信息对于某一用户的某项查询来说，其可信度应该是呈正态分布的。信息架构师的责任就是提供一定客观的算法，来实时实地地度量这种相对的可信度。</p>
<p>建立网络资源的规范控制需要建立两类设施：1、规范数据仓储；2、规范控制管理系统。后者是实现前者功能的必要保证，解决网络资源规范控制的实现机制问题。在开放异构的Web环境下网络资源的规范控制不可能是集中的、排他的，同一种类型的规范控制可以有多个模式，由规范控制平台提供的机制来实现一定的互操作。传统的规范数据可能会提供必要的“原始规范数据仓储”，但大量的规范数据需要“草根智慧”（collective intelligence），而不再是仅仅依靠图书馆员。</p>
<p>FRAD报告涉及的，以及FRSAR工作组试图做的，(主要)是名称规范和主题规范。而网络资源可以进行规范的内容还要多得多，例如各类“微内容”格式规范（包括事件、地理信息、化学分子式、基因序列等等）、各类标准应用程序接口（作为一种agent)规范、本体规范（也就是规范的领域模型，包括术语规范、关系规范和编码格式等）。</p>
<p>因此，网络世界的规范控制大有可为。</p>
<p>(本文为新近完成的论文《<a href="http://www.kevenlw.name/downloads/uploads/papers/2008/authoritycontrol4web.doc"><span style="font-size: 10.5pt; font-family: 宋体;">试论网络资源的规范控制</span></a>》中的主要观点，若需引用，希望注明出处：<strong><span style="color: #000080;">刘炜,张春景. 试论网络资源的规范控制.现代图书情报技术,2008.12.27-31</span></strong>）。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/585/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>关于FRSAR的问题</title>
		<link>http://www.kevenlw.name/archives/534</link>
		<comments>http://www.kevenlw.name/archives/534#comments</comments>
		<pubDate>Wed, 12 Mar 2008 17:48:10 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[语义技术]]></category>
		<category><![CDATA[FRBR]]></category>
		<category><![CDATA[FRSAR]]></category>
		<category><![CDATA[KOS]]></category>
		<category><![CDATA[曾蕾]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/index.php/archives/534</guid>
		<description><![CDATA[看了一晚上FRSAR，结合曾蕾老师的proposal，总结了如下问题： 1、作为描述任何信息资源“主题”属性的抽象模型和应用框架，感到FRSAR似乎没有必要受FRBR的局限，完全能够、也有必要独立存在。FRBR模型本身具有很多模糊性（如下所述的work的定义等），不利于计算机处理和应用，而对于“主题”属性的规范控制，是语义Web的一个极其重要的应用需求，目前还没有很好的解决方案（至少传统的、通过第三方标注而建立的可信任信息，仍旧是实现trusted web的一个方法）。 2、作为“主题”的承载对象的“作品(work)”如何界定？因为作品不仅仅是文学作品，如果所描述的主题只是关于作品的一个局部，如何描述？也就是说在work-thema-nomen的结构中（首先需要说明的是：窃以为这个模型的认识论意义非常重大，但是为了“机读”，还需要更加明确一些），thema可以有parts，work可不可以？局部的work还是不是work？描述局部work的thema能不能代表这个work的thema？（即thema与work的对应关系，不能搞得很复杂，所以就需要对work进行明确界定。） 3、thema有parts的意义何在？是不是因为thema有许多下位的parts，具有thema的work自然就继承了这些parts的thema?在实践中这里面又有一大堆问题需要研究和解决。不如先简化这个问题，留待以后解决。本来一个work可以有很多主题，各个主题并不排斥，可以并存。 4、thema除了可以有parts之外，还可以有type，目前的困境是，能否穷尽type？是否有必要穷尽type，制定严格的规范，必须在这些type中选择？目前的concept, object, event, place再加一个time，是不是就是thema的所有type？如果有从其它角度的分类，是否允许？类型是不是可以开放式的、可扩展的？ 5、我对于这个模型的理解：nomen似乎作为thema的形式表现而存在，所有的规范控制都可以归结为对于nomen的规范控制（通过对nomen的规范而达到对thema的规范），work、thema以及nomen这三类“实体”内部的关系和相互关系，都通过nomen的关系来反映。这就是说，规范词表就是nomen的词表（由此nomen词表的规范体系和功能实现又是一大堆问题需要研究了）。 6、根据figure4，由于第一、第二组实体都可以作为work的主题，nomen是不是也可以是第一、二组实体的表现形式呢？于是规范了 nomen就规范了一切。nomen就包括书目数据的规范记录、人名/机构名规范档以及主题词表/分类法等所有的规范控制体系(KOS)。 7、进一步的问题：如何以上述模型描述、并实现规范控制的功能需求？如何编码、形式化、机器可处理？ 参考： 编目精灵：FRBR家族未来的第三个成员&#8211;FRSAR 书蠹精：FRBR中文翻译版正式发布]]></description>
			<content:encoded><![CDATA[<p>看了一晚上<a href="http://www.ifla.org/VII/s29/wgfrsar.htm">FRSAR</a>，结合<a href="http://www.ebsi.umontreal.ca/isko2008/documents/abstracts/zeng.pdf">曾蕾老师的proposal</a>，总结了如下问题：</p>
<p>1、作为描述任何信息资源“主题”属性的抽象模型和应用框架，感到FRSAR似乎没有必要受<a href="http://www.ifla.org/VII/s13/frbr/index.htm">FRBR</a>的局限，完全能够、也有必要独立存在。FRBR模型本身具有很多模糊性（如下所述的work的定义等），不利于计算机处理和应用，而对于“主题”属性的规范控制，是语义Web的一个极其重要的应用需求，目前还没有很好的解决方案（至少传统的、通过第三方标注而建立的可信任信息，仍旧是实现trusted web的一个方法）。</p>
<p>2、作为“主题”的承载对象的“作品(work)”如何界定？因为作品不仅仅是文学作品，如果所描述的主题只是关于作品的一个局部，如何描述？也就是说在work-thema-nomen的结构中（首先需要说明的是：窃以为这个模型的认识论意义非常重大，但是为了“机读”，还需要更加明确一些），thema可以有parts，work可不可以？局部的work还是不是work？描述局部work的thema能不能代表这个work的thema？（即thema与work的对应关系，不能搞得很复杂，所以就需要对work进行明确界定。）</p>
<p>3、thema有parts的意义何在？是不是因为thema有许多下位的parts，具有thema的work自然就继承了这些parts的thema?在实践中这里面又有一大堆问题需要研究和解决。不如先简化这个问题，留待以后解决。本来一个work可以有很多主题，各个主题并不排斥，可以并存。</p>
<p>4、thema除了可以有parts之外，还可以有type，目前的困境是，能否穷尽type？是否有必要穷尽type，制定严格的规范，必须在这些type中选择？目前的concept, object, event, place再加一个time，是不是就是thema的所有type？如果有从其它角度的分类，是否允许？类型是不是可以开放式的、可扩展的？</p>
<p>5、我对于这个模型的理解：nomen似乎作为thema的形式表现而存在，所有的规范控制都可以归结为对于nomen的规范控制（通过对nomen的规范而达到对thema的规范），work、thema以及nomen这三类“实体”内部的关系和相互关系，都通过nomen的关系来反映。这就是说，规范词表就是nomen的词表（由此nomen词表的规范体系和功能实现又是一大堆问题需要研究了）。</p>
<p>6、根据figure4，由于第一、第二组实体都可以作为work的主题，nomen是不是也可以是第一、二组实体的表现形式呢？于是规范了 nomen就规范了一切。nomen就包括书目数据的规范记录、人名/机构名规范档以及主题词表/分类法等所有的规范控制体系(KOS)。</p>
<p>7、进一步的问题：如何以上述模型描述、并实现规范控制的功能需求？如何编码、形式化、机器可处理？</p>
<p>参考：</p>
<p>编目精灵：<a href="http://catwizard.bokee.com/3613278.html">FRBR家族未来的第三个成员&#8211;FRSAR</a></p>
<p>书蠹精：<a href="http://blog.sina.com.cn/s/blog_495d626401008ruz.html" id="articleTitle">FRBR中文翻译版正式发布</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/534/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

