关于DC的一些动向和讨论

关于DC的一些动向和讨论

Filed under: Correspondence (同行交流)


1、DCMI Type术语定义的格式变化。定义的书写更加规范,一些举例或说明性文字放到了Comment项目中。参见: http://dublincore.org/usage/public-comment/2005/12/type-vocabulary-changes/ 。目前科技部标准规范项目这两天也在进行格式修改和最终定稿,我们在格式上和版本上的混乱除了形式上的问题之外,在指导思想上的不明确和”多目的”性,使得修改工作只能勉力为之,很难达成一个各方满意的最终定稿。当然这么一个大项目的确不好管理,项目运行的本身就是一个很好的交流和普及的过程。

2、确立了采用美国国会图书馆维护的MARC责任方式(又称为关系词RelatorTerms,目前竟然有190个!这可以看作MARC社区对于元数据界的一大贡献,我相信绝大多数元数据应用纲要中凡是涉及责任方式/角色描述的,应该都够用了。)作为合法的DC元数据应用纲要用词,并规定了被修饰词(主要是三个”agent”元素:Creator、Contributor、Publisher)和命名域(这一点非常重要,实际开发中如果以XML/RDF置标马上就可以采用了,只是有一些修饰词没有指定修饰的是哪一个元素,这样的话有可能这些词只能用在把Relator作为一个Encoding Scheme的情况下了,或者自己规定被修饰词,这往往是不太规范的)。详见: http://lcweb2.loc.gov/cocoon/loc.terms/relators/dc-relators.html

3、DC 2005的培训材料(tutorial)已经上网,参见:
Tutorial 1: Basic Syntax English Andy Powell

Tutorial 2: Basic Semantics English Diane I. Hillmann

Tutorial 3: Vocabularies English Ron Daniel

Tutorial 4: SKOS-Core English Alistair Miles

Tutorial 5: Metadata Application Profiles English (Part I) English (Part II) Rachel Heery and Robina Clayphan

与去年DC年会的培训相比(往年的培训材料见http://dublincore.org/resources/training/),今年的内容似乎更加”专业”一些,上来就是Andy介绍DC语法,抽象模型作为目前DC应用的基础居然占据了近一半的时间(30分钟),相当于介绍XHTML、XML的置标时间的总和(各15分钟),而RDF置标只安排了5分钟,还有20分钟介绍了OAI收割和RSS中DC元数据应用的语法问题。Diane的DC基础语义基本上还是去年Introduction toDC的内容,部分内容与Andy有些重复。第三个培训我打不开,估计是介绍元素语义和用法的,RonDaniel也是个新人。下一个报告:Alistair Miles讲SKOSCore,这是个好东西,虽然应用还不算广泛,夸张点说,图书馆用于知识组织的所有成就,能不能应用于网络时代,就看这个SKOS了。最近有幸接待了中信所的一批老师,听说中信所有打算(并已经申请立项!)将我们的汉语主题词表作一番改造,应该大可借鉴这个东东,千万不要再从手工角度出发,一开始就应该考虑计算机如何用、系统如何实现,等等。最后一个部分时介绍AP(应用纲要),用了两个时段、分别有两位DC的顶级专家介绍,可见这个东东的重要。Rachel去年因为身体不好没有来DC2004,但是Andy专门为她要了一套资料,尤其是DC年会的T-shirt是这些DC粉丝的收藏品(2003年西雅图因为经费拮据居然没有T恤,让许多人耿耿于怀)。

另外得到消息,说DCMI正在筹备一个工作组为各个国家依据DCMI的标准制定国家标准提供指南。联想到我们目前的注册登记系统和命名域规定的问题,应该可以询问一下DCMI有些什么想法。因为本人没有参与有关这个问题的讨论,在这里发表一些意见也不知合不合适,好在也是对事不对人。简单地说本人是不赞成为中国的”基本元数据标准”中复用的术语采用我们自己的命名域的,我们自己的命名域可以用来管理我们扩展的术语(扩展的元素、修饰词及编码体系)。我的一个基本理由是网上的资源都是全球一体的,同样语义的元素(现在的政策就是复用)如果采用不同命名域,其含义就是不同的,这样做dc.title前面的dc标签如果指向我们自己的命名域,实际上是没有意义的(可以看成是一个笑话),还会带来进一步的互操作性问题。这是一个常识,纯技术问题,与国家自主自尊没有关系,因此我估计我的担心是多余的。




7 Comments »

1、MARC责任方式应视为相关元素的语义限定词。
2、很反感该做不做,不做瞎做的现状–当我想用中图法(CLC)、汉语主题词(CT)限定subject时,我反而找不到一个标准的命名域,只得自己声明–相关机构为什么不及时注册登记这个最该确立的命名域呢?虽然可以事后批转换方式解决,但这与采用DC元素语义一样的元素,但声明不一样的命名域的行为一样,纯属脱了裤子打屁–多此一举。
3、下周我们准备和卜书庆老师谈谈中国分类主题词表的网络版一事。不知您所说中信所对汉语主题词表的改造打算具体是什么?如果中信所词表改造项目主线条与我们一致,不知能否由您牵个线,大家合作来完成–希望别重复建设和投资。

Comment by 平台江 – December 10, 2005 @ 2:01 pm

国内对于NKOS(DC2005会上叫做SKOS: Simple Knowledge OrganizationSystems,看来大家都想搞得越简单越好,包括分类法和各种词表方法)正在开始重视,北京应该有一些机构在搞,而且许多老师都意识到必须开放地来搞,像由张晓林主任牵头的科技部的标准规范项目就是一个很好的开放合作例子,我们从中也得益良多,否则偏于一隅的我们不可能参与国家的这种大项目。
中信所的项目我也不知道具体内容,估计中信所的王惠临老师应该参与或者牵头,他是这方面的专家,或者也可以问问中信所的张翼燕博士,他们新成立一个数字图书馆研究所。我在这个行业里虽然浸淫多年,然而一直两耳不闻窗外事,不善言谈交际,很难胜任牵线搭桥的事情,十分抱歉了。

Comment by keven – December 10, 2005 @ 4:02 pm

其实,象词表系统的开发,是付出的多,回报的少;行业指导意义和社会效应大,商业效应小。由商业公司来开发,实在是不太合算。只是担忧拿着国家的钱的开发,路子走错了,最后钱花了,对业界的贡献却没多少。所以总有蠢蠢欲动的冲动,反省自己:自以为是,自作多情,嗬嗬。

Comment by 平台江 – December 10, 2005 @ 8:19 pm

遭Keven点名,一直潜水,来说两句。汉语主题词表我们也只是参与者,决策性的事情无法做主。要是依着我,索性要名声不要利润–修改后公开化,就像人民日报的数据库一样,虽说也有商业行为,但基本是”一元钱”的买卖,图什么?图的是为这个业界做点应做的贡献!

如果这样,岂不是双赢?呵呵,岂不是都满意了吗?

Comment by robin – December 14, 2005 @ 8:53 am

欢迎robin老师的到来。希望这种基础性的事情能有国家项目资助,开放社会(包括企业)使用,这是功德无量的事情。当多数专家能够达成一致理解的时候,应该也能影响决策层,何况很多专家本身就是领导,很多领导也是专家。国家做标准规范推广应用的事情,企业做具体工具和应用开发的事情,让企业主导开发标准规范(当然参与还是应该鼓励的),如果没有一种机制,不是我不相信江先生,恐怕是缺乏公信力的,而做一些开放使用的工具软件也的确是件吃力不讨好的事情。除非像IBM/微软/Google之类公司,能够开发个”事实”规范或协议让大家不用都不行(实际上这些大公司在这方面也不敢轻举妄动,也在合纵连横)。

Comment by keven – December 14, 2005 @ 9:44 am

对,我们一直觉得人微言轻,所以希望相关机构能动作起来,扯虎皮作大旗,才能推动业界的应用。很简单,为了在我系统中声明中图法分类号或汉语主题词,我不得不自定义一个命名空间–虽然在系统内部可以不用,但为了所谓的开放性和显得地道些,照猫画虎呗–但这个自定义的命名空间,可能会让很多专家不置可否:你有啥资格哟。
前两天在作汉语著者号码取号系统时,为了让它更完美,体现出《通用汉语著者号码表》处理多音节的规则:”著者名称中不同章节的多音字(姓氏除外),统一依照常用读音取号,即按《汉字属性字典》中所列的第一个读音取号”,我们想从国图相关部门索取这个属性字典的数据,直接转换参考。如果自己按印刷本属性字典键入内容,一是时间浪费,二也担心数据出错,但这类看起来合理的要求,可能会因很多人为的障碍不能顺利满足。每当这种时候,总会让人感到悲哀–技术没问题、投入也没问题,非不能也,乃不为也。
占着茅厕不拉屎,憋死人不偿命。
–又在Keven先生的雅居中说出不雅之语,见谅见谅。

Comment by 平台江 – December 14, 2005 @ 1:37 pm

不知robin老师高姓大名。既然是Keven先生”点名”的,想来对分类主题词表一定深有造诣。我在以下链接中放入了最近设计的XML格式的分类主题对照词条,请robin老师访问并指点。
http://www.dp2003.com/dp2bbs/article.aspx?board=%e6%95%b0%e5%ad%97%e5%9b%be%e4%b9%a6%e9%a6%86&id=15

Comment by 平台江 – December 17, 2005 @ 6:48 pm



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=668389




    Technorati :

Leave a Reply




*