<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>数图研究笔记 &#187; 元数据抽象模型</title>
	<atom:link href="http://www.kevenlw.name/archives/tag/%e5%85%83%e6%95%b0%e6%8d%ae%e6%8a%bd%e8%b1%a1%e6%a8%a1%e5%9e%8b/feed" rel="self" type="application/rss+xml" />
	<link>http://www.kevenlw.name</link>
	<description>When you have a hammer, everything looks like a nail.</description>
	<lastBuildDate>Mon, 11 Jul 2011 13:25:12 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=</generator>
		<item>
		<title>Web时代的“元数据方法”(四)</title>
		<link>http://www.kevenlw.name/archives/669</link>
		<comments>http://www.kevenlw.name/archives/669#comments</comments>
		<pubDate>Tue, 04 Nov 2008 16:00:25 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[语义技术]]></category>
		<category><![CDATA[DCAM]]></category>
		<category><![CDATA[元数据抽象模型]]></category>
		<category><![CDATA[元数据描述]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=669</guid>
		<description><![CDATA[Web上的所有东西，可以看成文本（或数据流），也可以看成是一个个独立的的“资源（resource)”，或者看成这两者的混合（本来就是）。 标 识符是“资源”是否具有独立性的基础，是核心，决定了“资源”的归属、身份、获得途径，等等。标识符体系包括了解析体系。在这个体系里，国家不分大小，一 律平等。国家 内部可以有不同的制度，无论多复杂，都可以交给ORE来负责（听说最近牛排正在研究这个，赞一个！）。目前的技术架构，URI已成主宰，各类Handle 方式基 本上以URI为依托，虽说无奈，倒也无伤大雅，好在DOI等Handle系统也是独立的，离了URI，只要有另外的体系能够取代URI，也能存活。记得 DC的创始人Stu Weibel曾有一阵专门研究取代URI的体系，现在也不知下文了。这些理论问题就不多言了。 因此，有没有URI 是“是不是资源”的 充分必要条件。 至此我们接受了这样一种世界观：网络上的东西，除了有URI的“资源”，就是没有URI的文本字串（literal或string），无 它。（在此我们不讨论“网络上的资源是现实中事物的指代”这样一个哲学跨越，以及由此带来的认识论问题。） 任何一个描述，都要明确，描述的对象是什么。无论是什么，都应该是一个网络存在，都有URI。（此乃描述的“资源模型”） 任何一个描述，都要明确，描述的是什么。即如果描述颜色，就说“颜色”或“color”，描述作者，就说“作者”、“创建者”或“creator”&#8230; 你立刻会发现，这里面有着“属性词”（也称为“术语”term，其实就是元数据元素metadata elements）统一的问题。这其实就是元数据标准规范所要做的：规范属性词。 所有的属性都有URI，因此也都是资源，于是都应该有管理主体对其“负责“ 。 由此可知，是不是DC元素（属性词）其实并不重要，只要大家都和谐相处。和谐相处的前提是，遵不遵从这个“资源模型”，因为不遵从这个模型，就有可能不遵从属性词与资源对象的对应关系，或者资源对象在网络上没有“户口”(URI)，整个描述体系就会乱套。而遵从这样的体系，将来国家语委的工作就比较好了，同理，很多领域知识也可以管理起自己的”领域概念“，不方便的话托管给图书馆来管也可以。目前”维基百科“已经在做此类事情了。将来所有的概念都有名有姓，有“监管”了。换句话说，网络上的每一句话每一个词都有出处，就有意思了。当然，这并不妨碍你发明自己的火星语，只是发明的火星语也需要有众多的URI管理起来）。（这就是“描述集模型”） 任何一个描述，其属性取值可以是互联网上的任何东西，自然就包括有URI的资源和没有URI的文本字串。是“资源”当然也可以像上述属性词一样进行规 范，包括取值体系规范（例如年代的表示规范）和值域规范（从值的列表中选取，例如国家列表、各类复分表，以及大量的KOS词表等）。当然，文本字串是最常见的“值”。（这里涉及 “词表模型”） 上述三个成份，构成描述的基本单元：一个RDF表达，也叫陈述（statement）。 一条资源描述可以由多个陈述（statement)组成，即多个属性和属性值对描述一个URI所标识的资源； 多条相关的资源描述构成一个描述集（Description Set）。 可以看到，一个陈述可以是资源和资源之间关系的表达式（通过也是资源的属性词表达主体资源和客体资源的关系），每一个作为资源的成份又都可以被其它陈述所描述，具有这种关联关系的描述通常组合成描述集，构成“元数据记录”。Web其实就是各种资源纠结在一起的网状结构，Web这时就从众多服务器构成的网络而转变为无数“资源”连接在一起的网状结构（意义非凡啊！）。联结的末梢常常就是那些字串——字串是无法被描述的，其语义需 要人来解读。 (updated:)与传统的资源描述模型最大的不同，在于明确强调了以下两点： 描述的原子性。即每一个陈述必须是由“资源-属性-值(可以是另一个资源)”构成。例如作者是图书的属性，而作者单位是作者的属性，这两者应该用两个RDF语句来陈述。 描述的专指性。即属性一定是所描述资源的属性，而不是其任何相关资源的属性。如“作者单位”的属性不能用来描述“图书”资源。 上面所说的，就是DCAM: DC抽象模型的大概。 推荐阅读：宋文等“CDOI规范及其在国家图书馆的应用”《现代图书情报技术》2008.10.1-5，虽然好像国图还没有用，但是这个方案不错。]]></description>
			<content:encoded><![CDATA[<p>Web上的所有东西，可以看成文本（或数据流），也可以看成是一个个独立的的“资源（resource)”，或者看成这两者的混合（本来就是）。</p>
<p>标 识符是“资源”是否具有独立性的基础，是核心，决定了“资源”的归属、身份、获得途径，等等。标识符体系包括了解析体系。在这个体系里，国家不分大小，一 律平等。国家 内部可以有不同的制度，无论多复杂，都可以交给ORE来负责（听说最近牛排正在研究这个，赞一个！）。目前的技术架构，URI已成主宰，各类Handle 方式基 本上以URI为依托，虽说无奈，倒也无伤大雅，好在DOI等Handle系统也是独立的，离了URI，只要有另外的体系能够取代URI，也能存活。记得 DC的创始人Stu Weibel曾有一阵专门研究取代URI的体系，现在也不知下文了。这些理论问题就不多言了。</p>
<p>因此，有没有URI 是“是不是资源”的 充分必要条件。</p>
<p>至此我们接受了这样一种世界观：网络上的东西，除了有URI的“资源”，就是没有URI的文本字串（literal或string），无 它。（在此我们不讨论“网络上的资源是现实中事物的指代”这样一个哲学跨越，以及由此带来的认识论问题。）</p>
<ul>
<li>任何一个描述，都要明确，描述的对象是什么。无论是什么，都应该是一个网络存在，都有URI。（此乃描述的“<strong>资源模型</strong>”）</li>
<li>任何一个描述，都要明确，描述的是什么。即如果描述颜色，就说“颜色”或“color”，描述作者，就说“作者”、“创建者”或“creator”&#8230;</li>
</ul>
<div style="margin-left: 40px;">你立刻会发现，这里面有着“属性词”（也称为“术语”term，其实就是元数据元素metadata elements）统一的问题。这其实就是元数据标准规范所要做的：规范属性词。</div>
<div style="margin-left: 40px;">所有的属性都有URI，因此也都是资源，于是都应该有管理主体对其“负责“ 。</div>
<div style="margin-left: 40px;">由此可知，是不是DC元素（属性词）其实并不重要，只要大家都和谐相处。和谐相处的前提是，遵不遵从这个“资源模型”，因为不遵从这个模型，就有可能不遵从属性词与资源对象的对应关系，或者资源对象在网络上没有“户口”(URI)，整个描述体系就会乱套。而遵从这样的体系，将来国家语委的工作就比较好了，同理，很多领域知识也可以管理起自己的”领域概念“，不方便的话托管给图书馆来管也可以。目前”维基百科“已经在做此类事情了。将来所有的概念都有名有姓，有“监管”了。换句话说，网络上的每一句话每一个词都有出处，就有意思了。当然，这并不妨碍你发明自己的火星语，只是发明的火星语也需要有众多的URI管理起来）。（这就是“<strong>描述集模型</strong>”）</div>
<ul>
<li>任何一个描述，其属性取值可以是互联网上的任何东西，自然就包括有URI的资源和没有URI的文本字串。是“资源”当然也可以像上述属性词一样进行规 范，包括取值体系规范（例如年代的表示规范）和值域规范（从值的列表中选取，例如国家列表、各类复分表，以及大量的KOS词表等）。当然，文本字串是最常见的“值”。（这里涉及 “<strong>词表模型</strong>”）</li>
</ul>
<p>上述三个成份，构成描述的基本单元：一个RDF表达，也叫陈述（statement）。</p>
<ul>
<li> 一条资源描述可以由多个陈述（statement)组成，即多个属性和属性值对描述一个URI所标识的资源；</li>
<li> 多条相关的资源描述构成一个描述集（Description Set）。</li>
</ul>
<p>可以看到，一个陈述可以是资源和资源之间关系的表达式（通过也是资源的属性词表达主体资源和客体资源的关系），每一个作为资源的成份又都可以被其它陈述所描述，具有这种关联关系的描述通常组合成描述集，构成“元数据记录”。Web其实就是各种资源纠结在一起的网状结构，Web这时就从众多服务器构成的网络而转变为无数“资源”连接在一起的网状结构（意义非凡啊！）。联结的末梢常常就是那些字串——字串是无法被描述的，其语义需 要人来解读。</p>
<p>(updated:)与传统的资源描述模型最大的不同，在于明确强调了以下两点：</p>
<ul>
<li>描述的原子性。即每一个陈述必须是由“资源-属性-值(可以是另一个资源)”构成。例如作者是图书的属性，而作者单位是作者的属性，这两者应该用两个RDF语句来陈述。</li>
<li>描述的专指性。即属性一定是所描述资源的属性，而不是其任何相关资源的属性。如“作者单位”的属性不能用来描述“图书”资源。</li>
</ul>
<p>上面所说的，就是DCAM: DC抽象模型的大概。</p>
<p>推荐阅读：宋文等“CDOI规范及其在国家图书馆的应用”《现代图书情报技术》2008.10.1-5，虽然好像国图还没有用，但是这个方案不错。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/669/feed</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>演讲：元数据抽象模型与新加坡框架</title>
		<link>http://www.kevenlw.name/archives/496</link>
		<comments>http://www.kevenlw.name/archives/496#comments</comments>
		<pubDate>Sat, 24 Nov 2007 16:07:10 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[元数据]]></category>
		<category><![CDATA[数字图书馆]]></category>
		<category><![CDATA[DCAM]]></category>
		<category><![CDATA[DCAP]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[元数据应用纲要]]></category>
		<category><![CDATA[元数据抽象模型]]></category>

		<guid isPermaLink="false">http://www.dlresearch.cn/keven/index.php/archives/496</guid>
		<description><![CDATA[讲这个主题，因为感到有必要，似乎大家都知道，但是理解各不相同。 没有自己的东西，纯粹介绍。也不一定正确，仅供参考。 说明Update：可能slideshare在某些网络以及用某些浏览器无法访问（感谢远洋老师等提供信息），在这里提供ppt下载。 &#124; View &#124; Upload your own]]></description>
			<content:encoded><![CDATA[<p>讲这个主题，因为感到有必要，似乎大家都知道，但是理解各不相同。</p>
<p>没有自己的东西，纯粹介绍。也不一定正确，仅供参考。</p>
<p><em><strong>说明Update</strong></em>：可能slideshare在某些网络以及用某些浏览器无法访问（感谢远洋老师等提供信息），在<a href="http://www.dlresearch.cn/download/lw/metadata4shenzhen.ppt">这里</a>提供ppt下载。</p>
<p style="width: 425px; text-align: left" id="__ss_178765"><object style="margin: 0px" height="355" width="425"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=metadata4shenzhen-final-1196001080572538-2"></param><param name="allowFullScreen" value="true"></param><param name="allowScriptAccess" value="always"></param><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=metadata4shenzhen-final-1196001080572538-2" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" height="355" width="425"></embed></object></p>
<p style="font-size: 11px; font-family: tahoma,arial; height: 26px; padding-top: 2px"><a href="http://www.slideshare.net/?src=embed"><img src="http://static.slideshare.net/swf/logo_embd.png" style="border: 0px none ; margin-bottom: -5px" alt="SlideShare" /></a> | <a href="http://www.slideshare.net/keven/metadata4shenzhen-final" title="View '元数据抽象模型与新加坡框架(更新)' on SlideShare">View</a> | <a href="http://www.slideshare.net/upload">Upload your own</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/496/feed</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
	</channel>
</rss>

