<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>数图研究笔记</title>
	<atom:link href="http://www.kevenlw.name/feed" rel="self" type="application/rss+xml" />
	<link>http://www.kevenlw.name</link>
	<description>When you have a hammer, everything looks like a nail.</description>
	<lastBuildDate>Sat, 06 Mar 2010 15:52:17 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Jesse Thomas关于互联网的统计数据</title>
		<link>http://www.kevenlw.name/archives/2154?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2154#comments</comments>
		<pubDate>Sat, 06 Mar 2010 15:26:06 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[读网]]></category>
		<category><![CDATA[Jesse Thomas]]></category>
		<category><![CDATA[互联网]]></category>
		<category><![CDATA[数据]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2154</guid>
		<description><![CDATA[

上面视频原作参见http://vimeo.com/9641036（需翻墙，是故转存土豆）。以下翻译文字来自 http://www.20ju.com/content/V139945.htm

互联网用户数量：17.3亿（欧洲4.18亿；非洲6700万；大洋洲约2100万；南美洲1.79亿；北美洲2.5亿；亚洲7.3亿）
2009年总计发出的电子邮件数量：90兆封（平均每天2470亿封——但其中2000亿封是垃圾邮件，垃圾邮件的比例是81%）
全球Email用户：14亿
全球网站数量：2.34亿个
全球博客数量：1.26亿个
社交网站的女性用户数量比男性用户数量高84%
twitter每天产生2730条推（估计现在又高了）
艾什顿·库彻在推特上有425万个追随者（Ashton Kutcher，当时是twitter上追随人数最多的用户，现在不知道还是不是？）
非死不可的月PV是2600亿次（每分钟600万次，或每年37.4兆次）
MySpace的月PV是240亿次；twitter是44亿次；Linkedln是19亿次。
非死不可有30000台服务器（还在增长）
非死不可用户：3.5亿
每月有25亿张图片上传到非死不可（一年300亿张）
每月有40亿张图片上传到Flickr
Youtube每天播放视频10亿次（美国用户每个月浏览Youtube视频的次数是122亿次，浏览Hulu

	Tags: Jesse Thomas, 互联网, 数据, 读网

	Related posts
	
	本博账单 (4)
	WorldCat有多少图书记录 (2)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2154"><!-- &nbsp; --></abbr>
<p><object width="420" height="363"><param name="movie" value="http://www.tudou.com/v/uW1vyI2T_8s"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><param name="wmode" value="opaque"></param><embed src="http://www.tudou.com/v/uW1vyI2T_8s" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" wmode="opaque" width="420" height="363"></embed></object></p>
<p>上面视频原作参见<a href="http://vimeo.com/9641036" target="_blank">http://vimeo.com/9641036</a>（需翻墙，是故转存土豆）。以下翻译文字来自 <a href="http://www.20ju.com/content/V139945.htm" target="_blank">http://www.20ju.com/content/V139945.htm</a></p>
<ul>
<li>互联网用户数量：17.3亿（欧洲4.18亿；非洲6700万；大洋洲约2100万；南美洲1.79亿；北美洲2.5亿；亚洲7.3亿）</li>
<li>2009年总计发出的电子邮件数量：90兆封（平均每天2470亿封——但其中2000亿封是垃圾邮件，垃圾邮件的比例是81%）</li>
<li>全球Email用户：14亿</li>
<li>全球网站数量：2.34亿个</li>
<li>全球博客数量：1.26亿个</li>
<li>社交网站的女性用户数量比男性用户数量高84%</li>
<li>twitter每天产生2730条推（估计现在又高了）</li>
<li>艾什顿·库彻在推特上有425万个追随者（Ashton Kutcher，当时是twitter上追随人数最多的用户，现在不知道还是不是？）</li>
<li>非死不可的月PV是2600亿次（每分钟600万次，或每年37.4兆次）</li>
<li>MySpace的月PV是240亿次；twitter是44亿次；Linkedln是19亿次。</li>
<li>非死不可有30000台服务器（还在增长）</li>
<li>非死不可用户：3.5亿</li>
<li>每月有25亿张图片上传到非死不可（一年300亿张）</li>
<li>每月有40亿张图片上传到Flickr</li>
<li>Youtube每天播放视频10亿次（美国用户每个月浏览Youtube视频的次数是122亿次，浏览Hulu<br />

	Tags: <a href="http://www.kevenlw.name/archives/tag/jesse-thomas" title="Jesse Thomas" rel="tag nofollow">Jesse Thomas</a>, <a href="http://www.kevenlw.name/archives/tag/%e4%ba%92%e8%81%94%e7%bd%91" title="互联网" rel="tag nofollow">互联网</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%95%b0%e6%8d%ae" title="数据" rel="tag nofollow">数据</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%bb%e7%bd%91" title="读网" rel="tag nofollow">读网</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1282" title="本博账单 (六月 4, 2009)">本博账单</a> (4)</li>
	<li><a href="http://www.kevenlw.name/archives/1652" title="WorldCat有多少图书记录 (八月 2, 2009)">WorldCat有多少图书记录</a> (2)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2154/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>TED上有图书馆啦！</title>
		<link>http://www.kevenlw.name/archives/2150?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2150#comments</comments>
		<pubDate>Mon, 22 Feb 2010 05:25:24 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[读网]]></category>
		<category><![CDATA[TED]]></category>
		<category><![CDATA[未来图书馆]]></category>
		<category><![CDATA[林宏泰]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2150</guid>
		<description><![CDATA[
以下内容转自台湾林宏泰先生的博客——Library Views，原视频在Youtube上，经过我的审查，并无黄色暴力，转载到土豆上，以飨国内同行。
&#60;林先生博文&#62;
“相信很多人都看過 TED 的影片，這裡的TED指的是Technology、Entertainment、Design，不過現在TED的眾多演講範疇實已超出這三個領域了。美國 有一些圖書館員準備效法，成立一個名為 TEDx Librarians 的網站，講白了就是圖書館員版的TED:
TEDx is a program of local, self-organized events that  bring people together to share a TED-like  experience.
查看了一下 TEDx  Librarian 網站，目前一切都在草創時期，還沒有什麼內容可言，不過還是令人期待。在網站上有分享一個 TED 的影片，內容是 Jay Walker 的演說，可以看看。本站曾介紹過他那令人驚艷的個人圖書館(link)， 想必有不同於常人的一些想法。”
&#60;/林先生博文&#62;



	Tags: TED, 未来图书馆, 林宏泰, 读网

	Related posts
	
	无相关日志.
	

]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2150"><!-- &nbsp; --></abbr>
<p>以下内容转自台湾林宏泰先生的博客——<a href="http://libraryviews.blogsome.com">Library Views</a>，原视频在Youtube上，经过我的审查，并无黄色暴力，转载到土豆上，以飨国内同行。</p>
<p style="padding-left: 30px;">&lt;<a href="http://libraryviews.blogsome.com/2010/02/21/923/">林先生博文</a>&gt;</p>
<p style="padding-left: 30px;">“相信很多人都看過 <a href="http://www.ted.com/" target="_blank"><span>TED</span></a> 的影片，這裡的TED指的是Technology、Entertainment、Design，不過現在TED的眾多演講範疇實已超出這三個領域了。美國 有一些圖書館員準備效法，成立一個名為 TEDx Librarians 的網站，講白了就是圖書館員版的TED:</p>
<p style="padding-left: 30px;">TEDx is a program of local, self-organized events that  bring people together to share a <span>TED</span>-like  experience.</p>
<p style="padding-left: 30px;">查看了一下 <a href="http://www.tedxlibrarians.com/" target="_blank">TEDx  Librarian</a> 網站，目前一切都在草創時期，還沒有什麼內容可言，不過還是令人期待。在網站上有分享一個 <span>TED </span>的影片，內容是 Jay Walker 的演說，可以看看。本站曾介紹過他那令人驚艷的個人圖書館(<a href="http://libraryviews.blogsome.com/2008/10/04/755/" target="_blank">link</a>)， 想必有不同於常人的一些想法。”</p>
<p style="padding-left: 30px;">&lt;/林先生博文&gt;</p>
<p style="padding-left: 30px;">
<p><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="420" height="363" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="wmode" value="opaque" /><param name="src" value="http://www.tudou.com/v/_lcwbDZELpc" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="420" height="363" src="http://www.tudou.com/v/_lcwbDZELpc" wmode="opaque" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>

	Tags: <a href="http://www.kevenlw.name/archives/tag/ted" title="TED" rel="tag nofollow">TED</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%9c%aa%e6%9d%a5%e5%9b%be%e4%b9%a6%e9%a6%86" title="未来图书馆" rel="tag nofollow">未来图书馆</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%9e%97%e5%ae%8f%e6%b3%b0" title="林宏泰" rel="tag nofollow">林宏泰</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%bb%e7%bd%91" title="读网" rel="tag nofollow">读网</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li>无相关日志.</li>
	</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2150/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>沿着张琪玉先生开创的道路奋勇前进</title>
		<link>http://www.kevenlw.name/archives/2138?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2138#comments</comments>
		<pubDate>Sun, 21 Feb 2010 08:28:32 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[元数据]]></category>
		<category><![CDATA[张琪玉]]></category>
		<category><![CDATA[本体]]></category>
		<category><![CDATA[祝希龄]]></category>
		<category><![CDATA[自然语言处理]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2138</guid>
		<description><![CDATA[
记得当年祝希龄老师给我们上情报检索语言课，用的当然是张琪玉先生的教材。这门课给我印象最深的是：情报检索语言是一种规范的人工语言，应该与自然语言区别开来。这种思想方法在近年来元数据和本体的学习中，一直让我受益匪浅。
最近在看一些本体的东西，想借鉴一下自然语言处理领域长期以来的研究成果，看着看着发现他们走不下去的一个重要原因是忽略了自然语言与人工语言的区别（他们并不是不懂，但却一定要将两者调和，或者说从自然语言中发现可以被形式化的东西），数字图书馆领域一直在搞的本体和元数据，一直想突破基于字词匹配的全文检索而达成基于概念（知识）的检索，一直在开发适用于网络和机器处理的人工语言规则，这条道路我认为是充满希望的康庄大道。
自然语言处理（NLP）的水很深，发展了很多年，规则繁复，成果众多，还跟人工智能有不小的瓜葛，特别是汉语的自然语言处理，其典型应用是机 器翻译。前一阵还跟一位网上偶遇的朋友聊起汉外自动翻译，我认为如果不局限于领域应用，普适的翻译机是开发不出来的。但是据我知道我们有不少科研机构从七 十年代开始就钻牛角尖，浪费了无数科研经费，还在做“无畏”的努力。而领域应用，实际上已经不是单纯的自然语言处理范畴了，例如我们目前积极推进的本体 （包括KOS）、元数据的应用，其目的就在于避开自然语言的弱点，而发明、构建一套人工语言和规则，达成机器对于语义的理解。在这个机器世界里，是不存在 语种差别的，任何语言都被机器理解为符号。这个目标能不能完全实现，能不能建立一套完全形式化的机器语言规则，很好地适用于某些领域，现在还不好说，可能 还有赖于我们当前的努力。
汉语的问题，曾经让汉外翻译系统的研发结结实实地摔跟头的，主要有以下一些（汉语分词问题由于引入了语境、采用穷 尽方法等，目前已经解决得相当不错，就不说了）：
1． 汉语同一词类担任多种语法成分且无形态变化；
2．  汉语句子的构造原则与短语的构造原则基本一致；
3．   汉语中的虚词；
4． 汉语的语序；
5． 汉语的书写习惯。
自然语言的机器处理有一个基本假设可能有问 题，这个假设即“语言表达的客观性假设”，即认为语言之所以能够达成交流的目的，是因为关于语言的表达 （包括语义、语法和结构）是客观的，对于客观性的认识能够使我们采用有限的形式 语法组合规则和统计规律，来“变换”、“重构”语言的表达，因此计算机也就能够“理解”“客观的”语言。然而迄今为止的研究似乎证明，语言的客观性是无法 被彻底揭示的。或者我们只能说语言有一定的客观性，但是本质上还是主观的。其客观性表现为人与人之间达成的理解“协议”，这种协议是可以随时变化的。
近 年来由于网络的发展带来语言现象的巨大变化，各种新的“火星语”“符号语”等网络语言层出不穷，老夫子们斥责这些表达不符合汉语习惯，需要规范，但毕竟 语言是活的东西，能够进行交流沟通，就一定会影响目前的语言规范。因此自然语言处理原有的套路（通过穷尽有限的规则来达到机器可处理）越来越不合时宜，应 该从哲学方法论的角度进行大规模的梳理和反省。当然，目前计算机的能力越来越强大，结合网络的发展而形成的巨大的云计算能力，可以支持越来越复杂的穷尽算 法、规则和统计规律，汉语输入法和搜索引擎的发展似乎也印证了这一点，因此如果应用得法，在一段时间内采用传统方法应该也是能够取得一定进展的，但是这种 方法应该看不到最终的解决自然语言机读化问题的希望。
前述5个问题在规范的情报检索系统（IR，或者说数字图书馆系统，或者说应用了本体和元数据 的系统）的开发中只有第一点略有相关，其余都可以绕过。因为概念体系（本体）的架构依赖于自然语言的，基本上只到单词（概念）一级（就是说概念来自于单 词，是对自然语言的规范产生的，是人为指定的概念符号），这一级（字词处理，包括分词和词性标注等）从理论到实践已基本成熟，到更宏观的句法（语法和结构）一级IR基本上与NLP开始分道扬镳了，都是采用“人工”的机器语言（RDF/XML）了，这是自然语言处理与情报检索系统两 个领域在研究对象方面最大的不同。正因为此，在领域应用方面就能够按照比较严格的规范体系来做（至于如何做又是一个大课题，如自顶向下一般是对于新建系统 可行，自底向上进行标注则不可能完全采用人工来做，就需要进行自然语言理解、模式识别或者原有结构的转换映射等方法）。其缺点可能是不够“自然”，即如果 让人直接进行阅读，人性化程度还是要差一点（就如同编程语言由机器语言向高级语言进化，但高级语言也主 要是给机器用的，如果在进行RDF/XML编码转换时能够尽可能应采用软件工具来实现，人性化程度可以高一些）。
上面一大通罗嗦，其实是想说：本体、元数据规则等，其实是（可以看成）一套人工语言规则系统，我们现在应该学习张琪玉先生当初的做法，为网络信息资源的描述和检索，提供一套形式化或半形式化的人工（规范）语言系统（概念体系）和规则，用以规范网络信息资源的管理，建立一套新的知识组织理论（和方法论）体系。或可叫做“元数据方法”或“本体方法”。目前计算语言学研究，就是要从自然语言中发现可被形式化的规则（可以理解为这部分内容只是语言现象的一部分，不可能找到所有的规则，否则就不是“自然”语言了），并对这部分 内容进行“机读化”。从这个角度思考，人工语言应该比对于传统的纯自然语言的形式化处理更为简单，从机器翻译等领域对于语言形式化的研究成果中应该可以找 到大量丰富的养料。
例如以下“计算机语言处理模式”的抽象思考就很有启发：
1、 处理对象（输入）为有限种符号的有限长序列。其中包括如何编码、如何形式化的一整套规则。
2、处理方式（运算）为有限的程序变换。早期采用 简单模式匹配法，后来（至今）采用基于规则的处理方法，近年来流行基于语料库的统计方法。
3、处理结果（输出）为符合新规则的表达 式。
计算语言学研究对象有点像现在的网络世界，在其中寻找规律，或者规范表达（通过语法、 惯用法等），有点像营造一个语义网，只不过网络世界使得人们有了一个工具进行规范（因为有一个前提是：必须机读），而自然语言因为无法规范，才具有无限的 创造力和想象力。上帝的归上帝，凯撒的归凯撒，整个世界才能和谐有序，语言问题的处理才能找到终极方案。
———————————无聊的分 隔符：搞研究是最无聊的——————————
附：以前收集的一个有关机器翻译困境的帖子：
发信人:  chris (亦云), 信区: LanguageLogic
标  题: 机器翻译难在哪里
发信站: BBS 曙光站 (Thu  Apr  8 14:08:34 1999)
机器翻译难在哪里
做这么多年的机器翻译，感到最大的意外是翻译竟然要调用如 此之深之广之
多层次的知识，而且各个层次的知识彼此如此强烈相关，剪不断，理还乱。
首先，翻译需要彻底的源自然 语言理解以及纯熟的目标自然语言运用，决
不是很多人以为的有一本英汉词典，记住所有英语词法句法规则就可以的。
而深层的自然语言理解则不 [...]]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2138"><!-- &nbsp; --></abbr>
<p>记得当年祝希龄老师给我们上情报检索语言课，用的当然是张琪玉先生的教材。这门课给我印象最深的是：情报检索语言是一种规范的人工语言，应该与自然语言区别开来。这种思想方法在近年来元数据和本体的学习中，一直让我受益匪浅。</p>
<p>最近在看一些本体的东西，想借鉴一下自然语言处理领域长期以来的研究成果，看着看着发现他们走不下去的一个重要原因是忽略了自然语言与人工语言的区别（他们并不是不懂，但却一定要将两者调和，或者说从自然语言中发现可以被形式化的东西），数字图书馆领域一直在搞的本体和元数据，一直想突破基于字词匹配的全文检索而达成基于概念（知识）的检索，一直在开发适用于网络和机器处理的人工语言规则，这条道路我认为是充满希望的康庄大道。</p>
<p>自然语言处理（NLP）的水很深，发展了很多年，规则繁复，成果众多，还跟人工智能有不小的瓜葛，特别是汉语的自然语言处理，其典型应用是机 器翻译。前一阵还跟一位网上偶遇的朋友聊起汉外自动翻译，我认为如果不局限于领域应用，普适的翻译机是开发不出来的。但是据我知道我们有不少科研机构从七 十年代开始就钻牛角尖，浪费了无数科研经费，还在做“无畏”的努力。而领域应用，实际上已经不是单纯的自然语言处理范畴了，例如我们目前积极推进的本体 （包括KOS）、元数据的应用，其目的就在于避开自然语言的弱点，而发明、构建一套人工语言和规则，达成机器对于语义的理解。在这个机器世界里，是不存在 语种差别的，任何语言都被机器理解为符号。这个目标能不能完全实现，能不能建立一套完全形式化的机器语言规则，很好地适用于某些领域，现在还不好说，可能 还有赖于我们当前的努力。</p>
<p>汉语的问题，曾经让汉外翻译系统的研发结结实实地摔跟头的，主要有以下一些（汉语分词问题由于引入了语境、采用穷 尽方法等，目前已经解决得相当不错，就不说了）：</p>
<blockquote><p>1． 汉语同一词类担任多种语法成分且无形态变化；<br />
2．  汉语句子的构造原则与短语的构造原则基本一致；<br />
3．   汉语中的虚词；<br />
4． 汉语的语序；<br />
5． 汉语的书写习惯。</p></blockquote>
<p>自然语言的机器处理有一个基本假设可能有问 题，这个假设即“语言表达的客观性假设”，即认为语言之所以能够达成交流的目的，是因为关于语言的表达 （包括语义、语法和结构）是客观的，对于客观性的认识能够使我们采用有限的形式 语法组合规则和统计规律，来“变换”、“重构”语言的表达，因此计算机也就能够“理解”“客观的”语言。然而迄今为止的研究似乎证明，语言的客观性是无法 被彻底揭示的。或者我们只能说语言有一定的客观性，但是本质上还是主观的。其客观性表现为人与人之间达成的理解“协议”，这种协议是可以随时变化的。</p>
<p>近 年来由于网络的发展带来语言现象的巨大变化，各种新的“火星语”“符号语”等网络语言层出不穷，老夫子们斥责这些表达不符合汉语习惯，需要规范，但毕竟 语言是活的东西，能够进行交流沟通，就一定会影响目前的语言规范。因此自然语言处理原有的套路（通过穷尽有限的规则来达到机器可处理）越来越不合时宜，应 该从哲学方法论的角度进行大规模的梳理和反省。当然，目前计算机的能力越来越强大，结合网络的发展而形成的巨大的云计算能力，可以支持越来越复杂的穷尽算 法、规则和统计规律，汉语输入法和搜索引擎的发展似乎也印证了这一点，因此如果应用得法，在一段时间内采用传统方法应该也是能够取得一定进展的，但是这种 方法应该看不到最终的解决自然语言机读化问题的希望。</p>
<p>前述5个问题在规范的情报检索系统（IR，或者说数字图书馆系统，或者说应用了本体和元数据 的系统）的开发中只有第一点略有相关，其余都可以绕过。因为概念体系（本体）的架构依赖于自然语言的，基本上只到单词（概念）一级（就是说概念来自于单 词，是对自然语言的规范产生的，是人为指定的概念符号），这一级（字词处理，包括分词和词性标注等）从理论到实践已基本成熟，到更宏观的句法（语法和结构）一级IR基本上与NLP开始分道扬镳了，都是采用“人工”的机器语言（RDF/XML）了，这是自然语言处理与情报检索系统两 个领域在研究对象方面最大的不同。正因为此，在领域应用方面就能够按照比较严格的规范体系来做（至于如何做又是一个大课题，如自顶向下一般是对于新建系统 可行，自底向上进行标注则不可能完全采用人工来做，就需要进行自然语言理解、模式识别或者原有结构的转换映射等方法）。其缺点可能是不够“自然”，即如果 让人直接进行阅读，人性化程度还是要差一点（就如同编程语言由机器语言向高级语言进化，但高级语言也主 要是给机器用的，如果在进行RDF/XML编码转换时能够尽可能应采用软件工具来实现，人性化程度可以高一些）。</p>
<p>上面一大通罗嗦，其实是想说：本体、元数据规则等，其实是（可以看成）一套人工语言规则系统，我们现在应该学习张琪玉先生当初的做法，为网络信息资源的描述和检索，提供一套形式化或半形式化的人工（规范）语言系统（概念体系）和规则，用以规范网络信息资源的管理，建立一套新的知识组织理论（和方法论）体系。或可叫做“元数据方法”或“本体方法”。目前计算语言学研究，就是要从自然语言中发现可被形式化的规则（可以理解为这部分内容只是语言现象的一部分，不可能找到所有的规则，否则就不是“自然”语言了），并对这部分 内容进行“机读化”。从这个角度思考，人工语言应该比对于传统的纯自然语言的形式化处理更为简单，从机器翻译等领域对于语言形式化的研究成果中应该可以找 到大量丰富的养料。</p>
<p>例如以下“计算机语言处理模式”的抽象思考就很有启发：</p>
<blockquote><p>1、 处理对象（输入）为有限种符号的有限长序列。其中包括如何编码、如何形式化的一整套规则。</p>
<p>2、处理方式（运算）为有限的程序变换。早期采用 简单模式匹配法，后来（至今）采用基于规则的处理方法，近年来流行基于语料库的统计方法。</p>
<p>3、处理结果（输出）为符合新规则的表达 式。</p></blockquote>
<p>计算语言学研究对象有点像现在的网络世界，在其中寻找规律，或者规范表达（通过语法、 惯用法等），有点像营造一个语义网，只不过网络世界使得人们有了一个工具进行规范（因为有一个前提是：必须机读），而自然语言因为无法规范，才具有无限的 创造力和想象力。上帝的归上帝，凯撒的归凯撒，整个世界才能和谐有序，语言问题的处理才能找到终极方案。</p>
<p>———————————无聊的分 隔符：搞研究是最无聊的——————————</p>
<p><strong>附：以前收集的一个有关机器翻译困境的帖子：</strong></p>
<p>发信人:  chris (亦云), 信区: LanguageLogic<br />
标  题: 机器翻译难在哪里<br />
发信站: BBS 曙光站 (Thu  Apr  8 14:08:34 1999)</p>
<p>机器翻译难在哪里</p>
<p>做这么多年的机器翻译，感到最大的意外是翻译竟然要调用如 此之深之广之<br />
多层次的知识，而且各个层次的知识彼此如此强烈相关，剪不断，理还乱。</p>
<p>首先，翻译需要彻底的源自然 语言理解以及纯熟的目标自然语言运用，决<br />
不是很多人以为的有一本英汉词典，记住所有英语词法句法规则就可以的。<br />
而深层的自然语言理解则不 得不触及到人类生活的各个层面各个角落，而<br />
且需要浩瀚的背景知识（国外已经有人在谈论语言是知识的海洋）。有的<br />
知识和语种有关，如汉语世 界谈及黄色新闻则会想到“色情”，英语世界<br />
则认为黄色新闻是“那种危言耸听，追求轰动效应的新闻”；有的知识和<br />
语种无关，如：孔子是中国 春秋战国时代的思想家、教育家；乔丹是芝加<br />
哥公牛队的篮球球星；克林顿和莱温斯基有某种关系；邓小平已经去世……</p>
<p>翻 译界常常讨论翻译人员不仅要熟习两种语言，而且要熟知两种文化的差异。<br />
但对计算机来讲，还有大量对人来说不讲自明的知识，如“苹果不能吃人，<br />
只 有人可以吃苹果”；“冬天比夏天冷”；“擀面杖和做饺子有关”这样的<br />
知识。其中绝大部分知识都不是老师教的或书本上讲的，而是我们从小长到<br />
大 所见所闻所感所悟，从具体的到抽象的，从星星点点的到连成体系的。我<br />
们在翻译时不知不觉（偷偷摸摸）调用了这些知识，计算机当然自叹弗如。<br />
请 看：</p>
<p>A. 1979年以前，中国大部分老百姓还没有解决温饱问题。<br />
B. 2500年以前，中国出了一个教育家孔子。<br />
为什 么前者理解为“公元1979年以前”，而后者是“距今2500年以前的那一年”？<br />
常识告诉我们孔老二早已作古。</p>
<p>I can  see Peking University tower on the mountain.<br />
为什么翻译成“我在山上能看见北京大学的水塔”而不 是“我能看见山上的<br />
北大水塔”？<br />
去过北大未名湖区的人都知道水塔并不在山上。</p>
<p>妻子晚餐还做了两个丈夫喜欢吃的菜。<br />
为 什么不能理解为“两个丈夫”而是“两个菜”？<br />
在我们这个一夫一妻制的国家里一个妻子不可能有两个丈夫。</p>
<p>演员谢幕时，不要坐着不鼓 掌。<br />
为什么“不要坐着不鼓掌”的主体是观众，不是演员？而“演员谢幕时，不要<br />
站着不鞠躬。”主体是演员？常识告知。</p>
<p>政府 发给她一次性生活补贴。<br />
为什么是“一次性  生活补贴”而不是“一次  性生活  补贴”？常识嘛！性<br />
生活怎么会发给补贴？<br />
等 等，等等。</p>
<p>于是我们也就理解了为什么计算机不能向人那样翻译，它根本不是人类社会生活<br />
的一员嘛！</p>
<p>语音上也能提示 一些消解歧义的信息。当一个老人说“孙子每天教我一点计算机。”<br />
我们知道他不是指战国时代的军事家孙子。因为他读为&#8221;sun1  zi4&#8243;,而不是&#8221;sun1<br />
zi3&#8243;。 “1979年以前”读成“一九七九年以前”则很可能是公元1979年；若读<br />
成“一千九百七十九 年以前”则疑为“1979 years ago&#8221;。</p>
<p>语言生活在语境里，正如人生活在社会里一样。即使是孤立的一句话，人也是要<br />
给 它造语境，使它有生命。“他今天没有喝酒。”言外之意，他一定经常喝酒。<br />
“在学校一定要听老师的话。”一定是爸爸妈妈送小孩上学时叮嘱的话。英语 也<br />
是一样，“Mr. Smith was a great man.&#8221; 言外之意，要么史密斯先生已经去世，<br />
要么他曾经是个伟人，但现在 不是了。</p>
<p>众所周知的信息，我们就不必说了；许多默认的你知我知的知识（公共知识）也不<br />
用显性地字面上表达出来，只有那些新的，不 那么明显的信息，才需要使用语言澄<br />
清。当代世界，语言是用来交流信息的。人们讲究的是语言的时效性，而不是<br />
规范性。在公共汽车里，我们拿 着钱递给售票员说“三个天安门”（&#8221;Three tickets<br />
for Tiananmen&#8221; rather &#8220;Three  Tiananmens&#8221;）。告诉售票员两个新的信息，(1)<br />
买三张票，（2）目的地是天安门。机器翻译必须把隐性（unsaid）的信息，提升<br />
到 字面上说出来。</p>
<p>因此，我认为，之所以机器翻译如此之难，是因为它涉及到诸多层次知识的调用。<br />
语言是一个多层次交织的系统，这些层 次包括：语法，语义，语境，语音，常识，<br />
专业知识，以及场景和文化背景知识……如果说靠乔姆斯基式的句法知识能够解<br />
决（汉语）40%（这 个数是瞎写的）问题；概念性的知识能够再解决到60%的问题；<br />
剩下的就都是语用知识。因此，机器翻译无法突破, say,  60%，而突破不了60%的<br />
机器翻译是没有什么实用价值的。</p>
<p>出路何在？或许我们应该把大百科全书都输入到计算机里？或许知识的获 取要靠<br />
机器和人，机器和机器，机器和环境相互交流来获得？或许计算机的世界和人类<br />
的世界根本就是两个世界，别指望机器能理解人类社会?</p>

	Tags: <a href="http://www.kevenlw.name/archives/category/%e7%9f%a5%e8%af%86%e7%bb%84%e7%bb%87/%e5%85%83%e6%95%b0%e6%8d%ae" title="元数据" rel="tag nofollow">元数据</a>, <a href="http://www.kevenlw.name/archives/tag/%e5%bc%a0%e7%90%aa%e7%8e%89" title="张琪玉" rel="tag nofollow">张琪玉</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%9c%ac%e4%bd%93" title="本体" rel="tag nofollow">本体</a>, <a href="http://www.kevenlw.name/archives/tag/%e7%a5%9d%e5%b8%8c%e9%be%84" title="祝希龄" rel="tag nofollow">祝希龄</a>, <a href="http://www.kevenlw.name/archives/tag/%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86" title="自然语言处理" rel="tag nofollow">自然语言处理</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1243" title="本体究竟应用得如何？ (六月 1, 2009)">本体究竟应用得如何？</a> (3)</li>
	<li><a href="http://www.kevenlw.name/archives/511" title="图书推介 (十二月 30, 2007)">图书推介</a> (5)</li>
	<li><a href="http://www.kevenlw.name/archives/78" title="叙词与本体，及其在Elsevier的应用 (三月 6, 2005)">叙词与本体，及其在Elsevier的应用</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1113" title="关于本体和云计算 (四月 23, 2009)">关于本体和云计算</a> (4)</li>
	<li><a href="http://www.kevenlw.name/archives/2122" title="关于中国历史朝代本体的rdf描述 (一月 27, 2010)">关于中国历史朝代本体的rdf描述</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1203" title="一个可资借鉴的本体应用项目：STERNA (五月 29, 2009)">一个可资借鉴的本体应用项目：STERNA</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2138/feed</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>数字原住民对数字图书馆的殷切希望</title>
		<link>http://www.kevenlw.name/archives/2134?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2134#comments</comments>
		<pubDate>Fri, 19 Feb 2010 10:01:45 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[数字图书馆]]></category>
		<category><![CDATA[vala2010]]></category>
		<category><![CDATA[视频]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2134</guid>
		<description><![CDATA[
FaceBook上分享的一段Youtube视频，是澳洲同行的一个会议广告，很有宣传效果，由于众所周知的原因，被长城保护起来的同胞们看不到，特此转发。


	Tags: vala2010, 数字图书馆, 视频

	Related posts
	
	讲座视频：如何发布关联数据 (0)
	SemTech2009回顾(视频) (1)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2134"><!-- &nbsp; --></abbr>
<p>FaceBook上分享的一段Youtube视频，是澳洲同行的一个<a href="http://www.vala.org.au/conf2010.htm">会议</a>广告，很有宣传效果，由于众所周知的原因，被长城保护起来的同胞们看不到，特此转发。</p>
<p><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="420" height="363" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="wmode" value="opaque" /><param name="src" value="http://www.tudou.com/v/5pcBhoNYJ9c" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="420" height="363" src="http://www.tudou.com/v/5pcBhoNYJ9c" wmode="opaque" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>

	Tags: <a href="http://www.kevenlw.name/archives/tag/vala2010" title="vala2010" rel="tag nofollow">vala2010</a>, <a href="http://www.kevenlw.name/archives/category/%e6%95%b0%e5%ad%97%e5%9b%be%e4%b9%a6%e9%a6%86" title="数字图书馆" rel="tag nofollow">数字图书馆</a>, <a href="http://www.kevenlw.name/archives/tag/%e8%a7%86%e9%a2%91" title="视频" rel="tag nofollow">视频</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1199" title="讲座视频：如何发布关联数据 (五月 28, 2009)">讲座视频：如何发布关联数据</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1425" title="SemTech2009回顾(视频) (七月 16, 2009)">SemTech2009回顾(视频)</a> (1)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2134/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>精彩视频：关于语义搜索</title>
		<link>http://www.kevenlw.name/archives/2131?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2131#comments</comments>
		<pubDate>Mon, 01 Feb 2010 03:27:43 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[语义技术]]></category>
		<category><![CDATA[RDFa]]></category>
		<category><![CDATA[search monkey]]></category>
		<category><![CDATA[语义搜索]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2131</guid>
		<description><![CDATA[
什么是语义搜索？这段很久以前（08年）的视频可以告诉你。


	Tags: RDFa, search monkey, 语义技术, 语义搜索

	Related posts
	
	语义技术不是什么 (1)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2131"><!-- &nbsp; --></abbr>
<p>什么是语义搜索？这段很久以前（08年）的视频可以告诉你。<br />
<object id="yfop" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="320" height="270" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="flashvars" value="id=8243625&amp;shareEnable=1" /><param name="src" value="http://d.yimg.com/m/up/fop/embedflv/swf/fop.swf" /><param name="name" value="yfop" /><embed id="yfop" type="application/x-shockwave-flash" width="320" height="270" src="http://d.yimg.com/m/up/fop/embedflv/swf/fop.swf" name="yfop" flashvars="id=8243625&amp;shareEnable=1"></embed></object></p>

	Tags: <a href="http://www.kevenlw.name/archives/tag/rdfa" title="RDFa" rel="tag nofollow">RDFa</a>, <a href="http://www.kevenlw.name/archives/tag/search-monkey" title="search monkey" rel="tag nofollow">search monkey</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%ad%e4%b9%89%e6%8a%80%e6%9c%af" title="语义技术" rel="tag nofollow">语义技术</a>, <a href="http://www.kevenlw.name/archives/tag/%e8%af%ad%e4%b9%89%e6%90%9c%e7%b4%a2" title="语义搜索" rel="tag nofollow">语义搜索</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1560" title="语义技术不是什么 (七月 26, 2009)">语义技术不是什么</a> (1)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2131/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>关于中国历史朝代本体的rdf描述</title>
		<link>http://www.kevenlw.name/archives/2122?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2122#comments</comments>
		<pubDate>Wed, 27 Jan 2010 01:34:26 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[语义技术]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[朝代]]></category>
		<category><![CDATA[本体]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2122</guid>
		<description><![CDATA[
书社会的Caveman在做一项很实用的研究，问了一个很好的问题（一般而言，回答不上来的问题都是好问题）。我在这里做一些讨论，希望抛砖引玉，批评指正。
在这里把问题归纳为：如何用RDF（及其家族）描述中国朝代的公元纪年。他的朝代与公元纪年对照表在这里：http://tinyurl.com/timeReignChinese。
直感转换方法有很多种，可以用RDF，也可以用SKOS和OWL，甚至其它，包括直接用XML自定义也可以。
编码原则应该是：能复用就复用，看看前人的成果。
而如何编码，哪种方式合用，关键还要看需求。
网络上已经有一些供人使用的转换工具了，但如果要通用性，应该基于RDF进行编码，并开发一个工具，甚至变成语义网络的一种服务，就能够直接为机器理解、获取和使用，能够被其它应用任意调用，就能体现语义技术最大的优越性了。
想到目前国内有些分类法主题词表分别都有了网络版，但那是给人看的，无法通过服务器直接获取术语和术语关系，进行匹配和关系运算，这实际上发挥不了多大的作用。只有用RDF（SKOS或OWL）编码之后，提供一定的语义Web服务（例如用关联数据方式发布），才能真正发挥词表的作用。
这里的核心需求可以整理为：
1、某个朝代有哪些年号，这些年号的起讫日期（即这个对照表：http://tinyurl.com/timeReignChinese）。
2、某个公元年号落在哪个朝代的哪个年号。
3、模糊年号（如不同朝代相同年号）和模糊日期（如起讫年精确到年还是月还是日）的处理。
4a、是否需要提供网络服务接口，实现双向转换；
4b、还是提供代码，嵌入任何应用；
4c、还是仅仅用RDF来描述这个对照表。
5、进一步的，不同朝代的国家情况（地理疆域、并行的国号等）。
就这个对照表的转换而言，可以认为只需满足1、2和4c即可。
简单的解决方案可以这样：
定义朝代（dynasty）类和年号（reign）子类，都属于event类，复用event本体（http://motools.sourceforge.net/event/event.html）和timeline本体（http://motools.sourceforge.net/timeline/timeline.html）中的元素，建立“朝代－年号”和“年号－公元纪年（date interval类型）”的rdf描述即可。
将来可以扩展（复用）event的其它属性，例如皇帝，都城，等等。

	Tags: RDF, 朝代, 本体, 知识组织, 语义技术

	Related posts
	
	语义表达是不是一定要用RDF？ (10)
	沿着张琪玉先生开创的道路奋勇前进 (11)
	本体究竟应用得如何？ (3)
	图书推介 (5)
	叙词与本体，及其在Elsevier的应用 (0)
	关于本体和云计算 (4)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2122"><!-- &nbsp; --></abbr>
<p><a href="http://sns.libspace.org">书社会</a>的Caveman在做一项很实用的研究，问了一个很好的问题（一般而言，回答不上来的问题都是好问题）。我在这里做一些讨论，希望抛砖引玉，批评指正。<br />
在这里把问题归纳为：如何用RDF（及其家族）描述中国朝代的公元纪年。他的朝代与公元纪年对照表在这里：<span><a href="http://sns.libspace.org/link.php?url=http://tinyurl.com%2FtimeReignChinese" target="_blank">http://tinyurl.com/timeReignChinese</a>。</span><br />
直感转换方法有很多种，可以用RDF，也可以用SKOS和OWL，甚至其它，包括直接用XML自定义也可以。<br />
编码原则应该是：能复用就复用，看看前人的成果。<br />
而如何编码，哪种方式合用，关键还要看需求。<br />
网络上已经有一些供人使用的转换工具了，但如果要通用性，应该基于RDF进行编码，并开发一个工具，甚至变成语义网络的一种服务，就能够直接为机器理解、获取和使用，能够被其它应用任意调用，就能体现语义技术最大的优越性了。</p>
<p>想到目前国内有些分类法主题词表分别都有了网络版，但那是给人看的，无法通过服务器直接获取术语和术语关系，进行匹配和关系运算，这实际上发挥不了多大的作用。只有用RDF（SKOS或OWL）编码之后，提供一定的语义Web服务（例如用关联数据方式发布），才能真正发挥词表的作用。<br />
这里的核心需求可以整理为：<br />
1、某个朝代有哪些年号，这些年号的起讫日期（即这个对照表：<span><a href="http://sns.libspace.org/link.php?url=http://tinyurl.com%2FtimeReignChinese" target="_blank">http://tinyurl.com/timeReignChinese</a>）</span>。<br />
2、某个公元年号落在哪个朝代的哪个年号。<br />
3、模糊年号（如不同朝代相同年号）和模糊日期（如起讫年精确到年还是月还是日）的处理。<br />
4a、是否需要提供网络服务接口，实现双向转换；<br />
4b、还是提供代码，嵌入任何应用；<br />
4c、还是仅仅用RDF来描述这个对照表。<br />
5、进一步的，不同朝代的国家情况（地理疆域、并行的国号等）。<br />
就这个对照表的转换而言，可以认为只需满足1、2和4c即可。</p>
<p><strong>简单的解决方案可以这样：</strong><br />
定义朝代（dynasty）类和年号（reign）子类，都属于event类，复用<a href="http://sns.libspace.org/link.php?url=http://motools.sourceforge.net%2Fevent%2Fevent.html" target="_blank">event本体</a>（http://motools.sourceforge.net/event/event.html）和<a href="http://sns.libspace.org/link.php?url=http://motools.sourceforge.net%2Ftimeline%2Ftimeline.html" target="_blank">timeline本体</a>（http://motools.sourceforge.net/timeline/timeline.html）中的元素，建立“朝代－年号”和“年号－公元纪年（date interval类型）”的rdf描述即可。<br />
将来可以扩展（复用）event的其它属性，例如皇帝，都城，等等。</p>

	Tags: <a href="http://www.kevenlw.name/archives/tag/rdf" title="RDF" rel="tag nofollow">RDF</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%9c%9d%e4%bb%a3" title="朝代" rel="tag nofollow">朝代</a>, <a href="http://www.kevenlw.name/archives/tag/%e6%9c%ac%e4%bd%93" title="本体" rel="tag nofollow">本体</a>, <a href="http://www.kevenlw.name/archives/category/%e7%9f%a5%e8%af%86%e7%bb%84%e7%bb%87" title="知识组织" rel="tag nofollow">知识组织</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%ad%e4%b9%89%e6%8a%80%e6%9c%af" title="语义技术" rel="tag nofollow">语义技术</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/2109" title="语义表达是不是一定要用RDF？ (一月 12, 2010)">语义表达是不是一定要用RDF？</a> (10)</li>
	<li><a href="http://www.kevenlw.name/archives/2138" title="沿着张琪玉先生开创的道路奋勇前进 (二月 21, 2010)">沿着张琪玉先生开创的道路奋勇前进</a> (11)</li>
	<li><a href="http://www.kevenlw.name/archives/1243" title="本体究竟应用得如何？ (六月 1, 2009)">本体究竟应用得如何？</a> (3)</li>
	<li><a href="http://www.kevenlw.name/archives/511" title="图书推介 (十二月 30, 2007)">图书推介</a> (5)</li>
	<li><a href="http://www.kevenlw.name/archives/78" title="叙词与本体，及其在Elsevier的应用 (三月 6, 2005)">叙词与本体，及其在Elsevier的应用</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1113" title="关于本体和云计算 (四月 23, 2009)">关于本体和云计算</a> (4)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2122/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>DC-2010征文通知</title>
		<link>http://www.kevenlw.name/archives/2119?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2119#comments</comments>
		<pubDate>Wed, 27 Jan 2010 01:10:20 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[元数据]]></category>
		<category><![CDATA[DC]]></category>
		<category><![CDATA[DC2010]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2119</guid>
		<description><![CDATA[
DC-2010征文通知
“庆祝都柏林核心元数据诞生15周年：让元数据工作得更努力些吧！”
2010 都柏林核心元数据应用国际会议（2010年10月20日-22日）暨ASIS&#38;T年会（10月24日-27日）
美国 宾夕法尼亚州 匹兹堡
重要日期：

论文、报告或挂图（Poster）提交：2010年4月2日
录用通知：2010年5月14日
定稿提交：2010年6月11日

2010年是都柏林核心元数据提出的第15个年头，DC-2010大会将联袂召开第十届ASIS&#38;T年会。为了更好地总结DC元数据的过去，并展望未来，届时将与往年一样，探讨元数据应用于资源发现的理论和实践问题，并交流新的进展，交换“让元数据工作得更努力”的心得。不仅如此，会议还将回顾近年来元数据领域的最新成果：以“DCMI抽象模型”、已趋完善的“应用纲要”概念和初步成型的“描述集纲要”规 范这三者为代表，标志了元数据对于满足人类信息需求的作用正走向一个转折点。但是现实是不完美的，我们还需要从别人的经验中更多地分享和学习。DC- 2010将总结现状，并着眼未来，进一步拓宽研究和应用的领域，使元数据能够更努力地为满足人类的信息需求而自动地工作。
除了大会的主题外，我们还欢迎就以下元数据专题进行投稿（包括论文，报告和挂图）：

 元数据制定原则，指南和最佳实践
 元数据质量、规范化、改进和映射
 概念模型和框架（例如RDF、DCAM、OAIS）
 元数据应用纲要
 跨领域、语言、时间、结构、规模之间的元数据互操作
 跨领域元数据的应用（例如记录留存、永久保存、保管(curation)、机构库、出版）
 领域元数据（例如企业、文化记忆机构、教育、政府及科研领域等）
 作为语义万维网词汇的书目标准（例如RDA、FRBR、主题词表）
 可获得性元数据
 科学数据、e-Science和网格应用方面的元数据
 社会化标注和元数据构建中的用户参与
 知识组织系统例（如本体、分类法、规范档、大众分类法、叙词表）和SKOS（简单知识组织体系）
 本体的设计和开发
 元数据和本体的整合
 元数据生成（方法、工具和实践）
 搜索引擎和元数据
 语义万维网元数据及应用
 词汇表注册及注册服务

提交：
论文，报告或者挂图的投稿可通过DCMI同行评议系统提交，网址为：http://dcpapers.dublincore.org/index.php/pubs/。网页设有会议注册及论文提交流程指南（可点击“Information for Authors”链接），以及论文、项目报告或挂图/演示的作者指南。DC-2010的所有投稿都将由大会的国际学术委员会进行专家评审。所有稿件都必须 用英文撰写。被录用的稿件将正式发表于电子版的会议录。若无特殊安排，被录用的论文、项目报告和挂图应该至少由其中一位作者在匹兹堡会议上宣读。
为了稿件能够顺利接收与出版，所有的投稿者需提供自己的基本资料，包括目前的专业职务和联系方式等。
论文（8-10页）
论文既可以详细描述创新性的工作，也可以对前述的一些领域性重要进展或者最佳实践进行介绍评议。论文评判标准如下：

 实现方法的创新性
 所做贡献的质量
 呈现结果的重要性
 表达的明确性

项目报告（4-5页）

项目报告应该简明扼要地介绍一个特定的模型、应用或者活动。项目报告的评判标准如下：

 技术描述的精确性和完整性
 对其他潜在用户技术指导的可用性
 表达的明确性

挂图及演示（1-2页）

挂图是关于正在进行中的项目或课题研究的展示，或者已完成项目、课题研究的最新结果的展示。挂图建议应当包括一个长为一到两页的摘要。挂图的评判标准如下：

 精确陈述研究项目的目标和里程碑事件
 研究课题或者项目的重要性
 陈述主要的难点和进一步的研究
 陈述结果和取得的主要成果
 表达的明确性

被录用的挂图将会发表在会议论文集并在会议现场展示。除非另有安排，录用的挂图必须至少由一位作者在匹兹堡会议上宣读，并收录到论文集中，并可以进行4-10分钟的视频展示（上传至YouTube中）。会议将会为参会者和作者之间的沟通提供便利。
大会筹备委员会主席：

Stuart A. Sutton，美国华盛顿大学信息学院，sasutton@uw.edu

学术委员会共同主席：

Diane I. Hillmann，美国雪城大学信息学院，metadata.maven@gmail.com
Michael Lauruhn，美国Taxonomy Strategies公司，mlauruhn@taxonomystrategies.com

工作小组委员会主席：

Liddy Nevile，澳大利亚拉筹伯大学，liddy@sunriseresearch.org

培训委员会主席：

Marcia Zeng，美国肯特州立大学，mzeng@kent.edu


	Tags: DC, DC2010, 元数据

	Related posts
	
	“新加坡框架(Singapore Framework)” (1)
	Stu点评张晓星主任的Keynote (2)
	DC元素的中文翻译 (7)
	DCMI向实体化发展 [...]]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2119"><!-- &nbsp; --></abbr>
<h1 style="text-align: center;">DC-2010征文通知</h1>
<p style="text-align: center;">“<strong>庆祝都柏林核心元数据诞生15周年：让元数据工作得更努力些吧！</strong>”</p>
<p style="text-align: center;">2010 都柏林核心元数据应用国际会议（2010年10月20日-22日）暨ASIS&amp;T年会（10月24日-27日）<br />
美国 宾夕法尼亚州 匹兹堡</p>
<h3><strong>重要日期：</strong></h3>
<ul>
<li>论文、报告或挂图（Poster）提交：2010年4月2日</li>
<li>录用通知：2010年5月14日</li>
<li>定稿提交：2010年6月11日</li>
</ul>
<p>2010年是都柏林核心元数据提出的第15个年头，DC-2010大会将联袂召开第十届ASIS&amp;T年会。为了更好地总结DC元数据的过去，并展望未来，届时将与往年一样，探讨元数据应用于资源发现的理论和实践问题，并交流新的进展，交换“让元数据工作得更努力”的心得。不仅如此，会议还将回顾近年来元数据领域的最新成果：以“DCMI抽象模型”、已趋完善的“应用纲要”概念和初步成型的“描述集纲要”规 范这三者为代表，标志了元数据对于满足人类信息需求的作用正走向一个转折点。但是现实是不完美的，我们还需要从别人的经验中更多地分享和学习。DC- 2010将总结现状，并着眼未来，进一步拓宽研究和应用的领域，使元数据能够更努力地为满足人类的信息需求而自动地工作。</p>
<p>除了大会的主题外，我们还欢迎就以下元数据专题进行投稿（包括论文，报告和挂图）：</p>
<ul>
<li> 元数据制定原则，指南和最佳实践</li>
<li> 元数据质量、规范化、改进和映射</li>
<li> 概念模型和框架（例如RDF、DCAM、OAIS）</li>
<li> 元数据应用纲要</li>
<li> 跨领域、语言、时间、结构、规模之间的元数据互操作</li>
<li> 跨领域元数据的应用（例如记录留存、永久保存、保管(curation)、机构库、出版）</li>
<li> 领域元数据（例如企业、文化记忆机构、教育、政府及科研领域等）</li>
<li> 作为语义万维网词汇的书目标准（例如RDA、FRBR、主题词表）</li>
<li> 可获得性元数据</li>
<li> 科学数据、e-Science和网格应用方面的元数据</li>
<li> 社会化标注和元数据构建中的用户参与</li>
<li> 知识组织系统例（如本体、分类法、规范档、大众分类法、叙词表）和SKOS（简单知识组织体系）</li>
<li> 本体的设计和开发</li>
<li> 元数据和本体的整合</li>
<li> 元数据生成（方法、工具和实践）</li>
<li> 搜索引擎和元数据</li>
<li> 语义万维网元数据及应用</li>
<li> 词汇表注册及注册服务</li>
</ul>
<h3><strong>提交：</strong></h3>
<p>论文，报告或者挂图的投稿可通过DCMI同行评议系统提交，网址为：<a title="http://dcpapers.dublincore.org/index.php/pubs/。网页设有会议注册及论文提交流程指南（可点击“Information" rel="nofollow" href="http://dcpapers.dublincore.org/index.php/pubs/%E3%80%82%E7%BD%91%E9%A1%B5%E8%AE%BE%E6%9C%89%E4%BC%9A%E8%AE%AE%E6%B3%A8%E5%86%8C%E5%8F%8A%E8%AE%BA%E6%96%87%E6%8F%90%E4%BA%A4%E6%B5%81%E7%A8%8B%E6%8C%87%E5%8D%97%EF%BC%88%E5%8F%AF%E7%82%B9%E5%87%BB%E2%80%9CInformation">http://dcpapers.dublincore.org/index.php/pubs/。网页设有会议注册及论文提交流程指南（可点击“Information</a> for Authors”链接），以及论文、项目报告或挂图/演示的作者指南。DC-2010的所有投稿都将由大会的国际学术委员会进行专家评审。所有稿件都必须 用英文撰写。被录用的稿件将正式发表于电子版的会议录。若无特殊安排，被录用的论文、项目报告和挂图应该至少由其中一位作者在匹兹堡会议上宣读。</p>
<p>为了稿件能够顺利接收与出版，所有的投稿者需提供自己的基本资料，包括目前的专业职务和联系方式等。</p>
<h4><strong>论文</strong>（8-10页）</h4>
<p>论文既可以详细描述创新性的工作，也可以对前述的一些领域性重要进展或者最佳实践进行介绍评议。论文评判标准如下：</p>
<ul>
<li> 实现方法的创新性</li>
<li> 所做贡献的质量</li>
<li> 呈现结果的重要性</li>
<li> 表达的明确性</li>
</ul>
<h4>项目报告<strong>（4-5页）<br />
</strong></h4>
<p>项目报告应该简明扼要地介绍一个特定的模型、应用或者活动。项目报告的评判标准如下：</p>
<ul>
<li> 技术描述的精确性和完整性</li>
<li> 对其他潜在用户技术指导的可用性</li>
<li> 表达的明确性</li>
</ul>
<h4>挂图及演示<strong>（1-2页）<br />
</strong></h4>
<p>挂图是关于正在进行中的项目或课题研究的展示，或者已完成项目、课题研究的最新结果的展示。挂图建议应当包括一个长为一到两页的摘要。挂图的评判标准如下：</p>
<ul>
<li> 精确陈述研究项目的目标和里程碑事件</li>
<li> 研究课题或者项目的重要性</li>
<li> 陈述主要的难点和进一步的研究</li>
<li> 陈述结果和取得的主要成果</li>
<li> 表达的明确性</li>
</ul>
<p>被录用的挂图将会发表在会议论文集并在会议现场展示。除非另有安排，录用的挂图必须至少由一位作者在匹兹堡会议上宣读，并收录到论文集中，并可以进行4-10分钟的视频展示（上传至YouTube中）。会议将会为参会者和作者之间的沟通提供便利。</p>
<h4><strong>大会筹备委员会主席：</strong></h4>
<ul>
<li>Stuart A. Sutton，美国华盛顿大学信息学院，sasutton@uw.edu</li>
</ul>
<h4>学术委员会共同主席：</h4>
<ul>
<li>Diane I. Hillmann，美国雪城大学信息学院，metadata.maven@gmail.com</li>
<li>Michael Lauruhn，美国Taxonomy Strategies公司，mlauruhn@taxonomystrategies.com</li>
</ul>
<h4>工作小组委员会主席：</h4>
<ul>
<li>Liddy Nevile，澳大利亚拉筹伯大学，liddy@sunriseresearch.org</li>
</ul>
<p><strong>培训委员会主席：</strong></p>
<ul>
<li>Marcia Zeng，美国肯特州立大学，mzeng@kent.edu</li>
</ul>

	Tags: <a href="http://www.kevenlw.name/archives/tag/dc" title="DC" rel="tag nofollow">DC</a>, <a href="http://www.kevenlw.name/archives/tag/dc2010" title="DC2010" rel="tag nofollow">DC2010</a>, <a href="http://www.kevenlw.name/archives/category/%e7%9f%a5%e8%af%86%e7%bb%84%e7%bb%87/%e5%85%83%e6%95%b0%e6%8d%ae" title="元数据" rel="tag nofollow">元数据</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/472" title="“新加坡框架(Singapore Framework)” (九月 2, 2007)">“新加坡框架(Singapore Framework)”</a> (1)</li>
	<li><a href="http://www.kevenlw.name/archives/470" title="Stu点评张晓星主任的Keynote (八月 30, 2007)">Stu点评张晓星主任的Keynote</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/493" title="DC元素的中文翻译 (十一月 11, 2007)">DC元素的中文翻译</a> (7)</li>
	<li><a href="http://www.kevenlw.name/archives/469" title="DCMI向实体化发展 (八月 29, 2007)">DCMI向实体化发展</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/471" title="DC2007总结 (九月 2, 2007)">DC2007总结</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/60" title="DC2005&#21644;ECDL2005- - (二月 21, 2005)">DC2005&#21644;ECDL2005- -</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2119/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SKOS不是KOS，Linked Data不是Data</title>
		<link>http://www.kevenlw.name/archives/2124?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2124#comments</comments>
		<pubDate>Mon, 25 Jan 2010 23:37:12 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[知识组织]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[SKOS]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2124</guid>
		<description><![CDATA[
有些缩略语不能只看其表面用词，还需了解具体内容。有两个手边的例子：

SKOS（Simple Knowledge Organization System）与NKOS（Networked Knowledge Organization System）长得很像，但他们全然不是一个东西。前者是用以编码KOS的一套基于RDF的扩展模式（RDF Schema），似乎称之为Simple Knowledge Organization Schema更确切些。而后者是指各类知识组织体系（分类法、叙词表等）在网络上的形态，可以用SKOS来编码NKOS。因此SKOS实际上不是知识组织 体系，只是一种编码方式而已。
关联数据Linked Data是发布RDF数据的一种简捷开放高效的方法（机制），是语义Web的一种实现，可以看成是Web上发布数据的一种标准的API（对于HTTP进行进一步的规定和扩展），而不是一种特殊的数据。


	Tags: linked data, SKOS, 知识组织

	Related posts
	
	讲座视频：如何发布关联数据 (0)
	百思买开始发布关联数据 (0)
	李爵士介绍Web3.0 (2)
	数据的万维网（The Web of Data） (2)
	就建立“主题描述模型”与雨师的对话 (2)
	几篇NKOS中文文献 (0)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2124"><!-- &nbsp; --></abbr>
<p>有些缩略语不能只看其表面用词，还需了解具体内容。有两个手边的例子：</p>
<ol>
<li>SKOS（Simple Knowledge Organization System）与NKOS（Networked Knowledge Organization System）长得很像，但他们全然不是一个东西。前者是用以编码KOS的一套基于RDF的扩展模式（RDF Schema），似乎称之为Simple Knowledge Organization Schema更确切些。而后者是指各类知识组织体系（分类法、叙词表等）在网络上的形态，可以用SKOS来编码NKOS。因此SKOS实际上不是知识组织 体系，只是一种编码方式而已。</li>
<li>关联数据Linked Data是发布RDF数据的一种简捷开放高效的方法（机制），是语义Web的一种实现，可以看成是Web上发布数据的一种标准的API（对于HTTP进行进一步的规定和扩展），而不是一种特殊的数据。</li>
</ol>

	Tags: <a href="http://www.kevenlw.name/archives/tag/linked-data" title="linked data" rel="tag nofollow">linked data</a>, <a href="http://www.kevenlw.name/archives/tag/skos" title="SKOS" rel="tag nofollow">SKOS</a>, <a href="http://www.kevenlw.name/archives/category/%e7%9f%a5%e8%af%86%e7%bb%84%e7%bb%87" title="知识组织" rel="tag nofollow">知识组织</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1199" title="讲座视频：如何发布关联数据 (五月 28, 2009)">讲座视频：如何发布关联数据</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1866" title="百思买开始发布关联数据 (九月 1, 2009)">百思买开始发布关联数据</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1070" title="李爵士介绍Web3.0 (三月 22, 2009)">李爵士介绍Web3.0</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/1185" title="数据的万维网（The Web of Data） (五月 28, 2009)">数据的万维网（The Web of Data）</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/557" title="就建立“主题描述模型”与雨师的对话 (四月 9, 2008)">就建立“主题描述模型”与雨师的对话</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/571" title="几篇NKOS中文文献 (四月 29, 2008)">几篇NKOS中文文献</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2124/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>互操作层次</title>
		<link>http://www.kevenlw.name/archives/2127?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2127#comments</comments>
		<pubDate>Mon, 25 Jan 2010 01:41:10 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[语义技术]]></category>
		<category><![CDATA[互操作]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2127</guid>
		<description><![CDATA[

图片来自http://en.wikipedia.org/wiki/Levels_of_conceptual_interoperability
简单说明：

第0层：没有（不考虑）互操作性（封闭如C/S系统）
第1层：技术互操作，可利用至少一种协议，能够在一个平台上使其它系统获得比特或字节信息。
第2层：语法互操作，支持进行一定格式的数据交换。
第3层：语义互操作，在数据交换的基础上，依靠共有互通的解释机制，达到语义的交换和共享（互操作）。语义Web就提供了一套协议机制，支持整个Web范围内的语义交换与共享。
第4层：程序互操作，支持协同语境。在语义理解的基础上，共同实现一定的功能。
第5层：动态互操作，系统的变化和迁移被记录和控制，变化不影响数据的交换和功能的实现。
第6层：概念互操作，具有一定智能的系统，不同系统间的互操作能够自动地实现。


	Tags: 互操作, 语义技术

	Related posts
	
	OCLC的元数据映射Web服务 (1)
	&#20803;&#25968;&#25454;&#26144;&#23556;&#65306;&#23454;&#29992;&#30340;&#26435;&#23452;&#20043;&#35745; (0)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2127"><!-- &nbsp; --></abbr>
<p><img class="alignnone" title="互操作层次" src="http://pic.yupoo.com/keven/383488bc5877/g189ynvq.jpg" alt="" width="680" height="510" /></p>
<p>图片来自<a href="http://en.wikipedia.org/wiki/Levels_of_conceptual_interoperability">http://en.wikipedia.org/wiki/Levels_of_conceptual_interoperability</a></p>
<p><strong>简单说明：</strong></p>
<ul>
<li>第0层：没有（不考虑）互操作性（封闭如C/S系统）</li>
<li>第1层：技术互操作，可利用至少一种协议，能够在一个平台上使其它系统获得比特或字节信息。</li>
<li>第2层：语法互操作，支持进行一定格式的数据交换。</li>
<li>第3层：语义互操作，在数据交换的基础上，依靠共有互通的解释机制，达到语义的交换和共享（互操作）。语义Web就提供了一套协议机制，支持整个Web范围内的语义交换与共享。</li>
<li>第4层：程序互操作，支持协同语境。在语义理解的基础上，共同实现一定的功能。</li>
<li>第5层：动态互操作，系统的变化和迁移被记录和控制，变化不影响数据的交换和功能的实现。</li>
<li>第6层：概念互操作，具有一定智能的系统，不同系统间的互操作能够自动地实现。</li>
</ul>

	Tags: <a href="http://www.kevenlw.name/archives/tag/%e4%ba%92%e6%93%8d%e4%bd%9c" title="互操作" rel="tag nofollow">互操作</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%ad%e4%b9%89%e6%8a%80%e6%9c%af" title="语义技术" rel="tag nofollow">语义技术</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/632" title="OCLC的元数据映射Web服务 (八月 25, 2008)">OCLC的元数据映射Web服务</a> (1)</li>
	<li><a href="http://www.kevenlw.name/archives/88" title="&#20803;&#25968;&#25454;&#26144;&#23556;&#65306;&#23454;&#29992;&#30340;&#26435;&#23452;&#20043;&#35745; (九月 16, 2005)">&#20803;&#25968;&#25454;&#26144;&#23556;&#65306;&#23454;&#29992;&#30340;&#26435;&#23452;&#20043;&#35745;</a> (0)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2127/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>几个概念：开放数据，关联数据，语义Web和Web3.0</title>
		<link>http://www.kevenlw.name/archives/2114?utm_source=subscriber&amp;utm_medium=rss&amp;utm_campaign=rss</link>
		<comments>http://www.kevenlw.name/archives/2114#comments</comments>
		<pubDate>Wed, 20 Jan 2010 10:35:59 +0000</pubDate>
		<dc:creator>keven</dc:creator>
				<category><![CDATA[语义技术]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[Open Data]]></category>
		<category><![CDATA[Web3.0]]></category>
		<category><![CDATA[关联数据]]></category>
		<category><![CDATA[语义Web]]></category>

		<guid isPermaLink="false">http://www.kevenlw.name/?p=2114</guid>
		<description><![CDATA[
针对童鞋们经常提问，以及本人根据网络资源和自己的理解整理如下：
开放数据（Open Data）：
在网络上可以公开得到的数据，没有任何控制访问的措施（无需登录，否则只能是免费数据或其它名称）。
为了促进开放数据应用，模仿“创作共用”协议，好事者也提出了“开放数据共用协议”。
开放元数据是其中的一类。
项目举例：

data.gov（美国）
Open Data Network（德国）
making public data public（英国）

关联数据（Linked Data）：
一种数据访问（整合）技术，基本上都是以RDF方式表达，对于Http协议进行少量扩展（规定）而成。低成本，高可用性，整合简单。
开放链接数据（Linked Open Data）是关联数据的一项运动。

美国纽约时报项目，目前已经上载了5000个人物的主题表目，可以按照cc by协议开放使用。
Linked Data Research Center
GoodRelations：关于产品、价格和企业数据的规范词表
oeGOV：应用于政府信息管理的本体词表

Web3.0：
Web2.0的热衷者或者搅局者提出的一个概念，作为下一代Web的一种趋势探讨，有人说就是语义Web，有人在语义Web基础上添加了P2P、各类无线应用甚至云计算等内容。
语义Web：
现有Web之上的、以数据资源为基本组成单位的Web，这些资源（数据）都标注有元数据描述，从而能够进行语义查询，以及数据整合，提供了互联网上实现语义互操作的技术平台。关联数据可以理解为语义Web的一种实现。
Web of Data是其另一别称。

	Tags: linked data, Open Data, Web3.0, 关联数据, 语义Web, 语义技术

	Related posts
	
	讲座视频：如何发布关联数据 (0)
	百思买开始发布关联数据 (0)
	数据的万维网（The Web of Data） (2)
	关联数据：意义及其实现 (3)
	关联数据浏览器 (2)
	关联数据四原则 (4)


]]></description>
			<content:encoded><![CDATA[<abbr class="unapi-id" title="http://www.kevenlw.name/?p=2114"><!-- &nbsp; --></abbr>
<p>针对童鞋们经常提问，以及本人根据网络资源和自己的理解整理如下：</p>
<p>开放数据（Open Data）：<br />
在网络上可以公开得到的数据，没有任何控制访问的措施（无需登录，否则只能是免费数据或其它名称）。<br />
为了促进开放数据应用，模仿“创作共用”协议，好事者也提出了“<a href="http://www.opendatacommons.org/">开放数据共用协议</a>”。<br />
开放元数据是其中的一类。<br />
项目举例：</p>
<ul>
<li><a href="http://www.data.gov/">data.gov</a>（美国）</li>
<li><a href="http://opendata-network.org/">Open Data Network</a>（德国）</li>
<li><a href="http://www.fco.gov.uk/en/about-us/publications-and-documents/publications1/public-data/">making public data public</a>（英国）</li>
</ul>
<p>关联数据（Linked Data）：<br />
一种数据访问（整合）技术，基本上都是以RDF方式表达，对于Http协议进行少量扩展（规定）而成。低成本，高可用性，整合简单。<br />
开放链接数据（Linked Open Data）是关联数据的一项运动。</p>
<ul>
<li><a href="http://data.nytimes.com/">美国纽约时报项目</a>，目前已经上载了5000个人物的主题表目，可以按照cc by协议开放使用。</li>
<li><a href="http://linkeddata.deri.ie/ ">Linked Data Research Center</a></li>
<li><a href="http://purl.org/goodrelations/">GoodRelations</a>：关于产品、价格和企业数据的规范词表</li>
<li><a href="http://www.oegov.org/">oeGOV</a>：应用于政府信息管理的本体词表</li>
</ul>
<p>Web3.0：<br />
Web2.0的热衷者或者搅局者提出的一个概念，作为下一代Web的一种趋势探讨，有人说就是语义Web，有人在语义Web基础上添加了P2P、各类无线应用甚至云计算等内容。</p>
<p>语义Web：<br />
现有Web之上的、以数据资源为基本组成单位的Web，这些资源（数据）都标注有元数据描述，从而能够进行语义查询，以及数据整合，提供了互联网上实现语义互操作的技术平台。关联数据可以理解为语义Web的一种实现。<br />
Web of Data是其另一别称。</p>

	Tags: <a href="http://www.kevenlw.name/archives/tag/linked-data" title="linked data" rel="tag nofollow">linked data</a>, <a href="http://www.kevenlw.name/archives/tag/open-data" title="Open Data" rel="tag nofollow">Open Data</a>, <a href="http://www.kevenlw.name/archives/tag/web30" title="Web3.0" rel="tag nofollow">Web3.0</a>, <a href="http://www.kevenlw.name/archives/tag/%e5%85%b3%e8%81%94%e6%95%b0%e6%8d%ae" title="关联数据" rel="tag nofollow">关联数据</a>, <a href="http://www.kevenlw.name/archives/tag/%e8%af%ad%e4%b9%89web" title="语义Web" rel="tag nofollow">语义Web</a>, <a href="http://www.kevenlw.name/archives/category/%e8%af%ad%e4%b9%89%e6%8a%80%e6%9c%af" title="语义技术" rel="tag nofollow">语义技术</a><br />

	<h4>Related posts</h4>
	<ul class='st-related-posts'>
	<li><a href="http://www.kevenlw.name/archives/1199" title="讲座视频：如何发布关联数据 (五月 28, 2009)">讲座视频：如何发布关联数据</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1866" title="百思买开始发布关联数据 (九月 1, 2009)">百思买开始发布关联数据</a> (0)</li>
	<li><a href="http://www.kevenlw.name/archives/1185" title="数据的万维网（The Web of Data） (五月 28, 2009)">数据的万维网（The Web of Data）</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/1435" title="关联数据：意义及其实现 (七月 17, 2009)">关联数据：意义及其实现</a> (3)</li>
	<li><a href="http://www.kevenlw.name/archives/1844" title="关联数据浏览器 (八月 25, 2009)">关联数据浏览器</a> (2)</li>
	<li><a href="http://www.kevenlw.name/archives/1190" title="关联数据四原则 (五月 28, 2009)">关联数据四原则</a> (4)</li>
</ul>

]]></content:encoded>
			<wfw:commentRss>http://www.kevenlw.name/archives/2114/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
