DC资源集合描述元数据应用纲要(DC CD AP)进展
Pete Johnston 对于 DC-2005 的总结给我们带来了DC CD AP工作组的最新信息,这些情况都反映在 Pete的ppt报告 中了:
DC CD AP过往一年最显著的进展可能要算是DC CD AP草案的推出,在DC-2005应用委员会的全体会议上”非正式”地讨论了这个草案,除了形式上的修改建议之外,对于存在的几个问题中的一个比较大的问题提出了指导性意见。这个问题是:
在资源集合描述时,如果需要同时用到元素及其元素修饰词,例如dc:relation/dcterms:isReferencedBy;dc:description/dcterms:abstract(dc:rights也会碰到),这两类term修饰的内容会发生矛盾。例如一个资源集合的dc:relation的值是另一个资源集合,而这个资源集合isReferencedBy另一本书;dc:description的值是这个资源集合的一般性描述而dcterms:abstract是其某个单元的摘要。应用委员会建议在这种情况下不能够复用dc:relation或dc:description(或dc:rights)而必须专门为资源集合描述寻找新的元素。
另一些正在讨论、尚未定论的问题(虽然在草案中已经有推荐的规定)是:
1、属性值作为字串还是作为引用(use a (value) URI or a (value) string)?编码体系syntaxencoding scheme/富结构rich representation如何用?相关描述(relateddescriptions)应该允许,但是DC CD AP应该保持术语无关。
2、 资源集合媒体类型(格式)的描述。功能需求提出必须能够描述资源集合中是否有提问所需的媒体格式,于是问题就变得很复杂。
3、 开放的时间段。对于资源集合来说,其内容的时间跨度常常是不可确定的。W3CDTF不支持时间范围的表述,ISO8601支持时间范围,但是不支持一头开放的时间范围,例如1949-?。这个问题需要DC Date WG工作组解决。
4、 资源集合的位置location和服务services分离是否有必要?如何分离?是否isLocatedAt/ isAccessedVia两个修饰词都需要?
DC定义的相关概念如下:
• Collection
- An aggregation of one or more items
• Location
- Aplace where a collection is held (Michael Heaney, Analytical Model)
• Service
-Asystem that provides one or more functions of value to the end-user.Examplesinclude: a photocopying service, a banking service, anauthentication service,interlibrary loans, a Z39.50 or Web server (DCMIType Vocabulary)
- Provided physically or digitally
- User may be human, organisation orsoftware application.
• (DCCD AP) Service
- A system that provides access to theItems within the Collection
来年的工作计划就围绕这些问题进行讨论、提出解决方案,并修订DC CD AP。
序号
工作内容
开始日期
结束日期
1
Revise in light of Usage Board review
2005-09
2005-11
2
Resolve item media-type issue
2005-09
2005-11
3
Finalise isLocatedIn/isAccessedVia properties
2005-11
2006-02
4
Work with DC Date WG on date range format
2005-09
2006-03?
5
Update DCAP
2006-01
2006-04
6
Syntax (based on work by DC Arch WG)
2006-05?
2006-09
7
Crosswalks
2006-05
2006-09
8
Usage Guidelines
2006-05
2006-09
9
Usage Board Review
2006-10
2006-10
DC-2005上资源集合工作组还交流了三篇报告:
来自University of Illinois at Urbana-Champaign的Sarah Shreeves 和Muriel Foulonneau通过网络视频会议形式报告了他们在 几个项目中使用资源集合描述 的情况。
英国博物馆、图书馆、档案馆联合委员会的Kate Fernie介绍了他们承担的 文化遗产资源集合项目 的情况。
大英图书馆的Bill Oldroyd简短地介绍了TEL (The European Library:欧洲图书馆)项目中采用资源集合描述的情况。
DC CD AP草案精简版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-ap-summary/2005-08-25/
草案完整版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623606
Popularity: 45% [?]
Tags: DC, 元数据, 应用纲要, 资源集合, 资源集合元数据, 进展Related posts
近期讨论(2004年11月23日)
1、 如何理解资源集合的登记系统问题?
2、资源集合的内涵是什么?
发件人: zy
发送时间: 2004年11月24日 17:32
各位老师好,最近大家都在以Email方式交流课题问题,这样很好。在此我也想问大家两个问题:
(1)如何理解资源集合的登记系统问题,资源集合的登记我认为有两种理解:
a.资源集合元数据规范(包括元素)登记
b.资源集合及其服务登记
如果理解为资源集合元数据规范的登记,我个人认为与基本组和专门组的元数据规范登记应该没有太大的区别吧?如果是这样,为什么资源集合组需要专门来做登记系统的需求分析,而这一层面的需求分析是否会和登记组的工作重复?
如果理解为资源集合及其服务的登记,则表明所谓的登记系统就是一个资源和服务的联合目录?不知道我的理解是否正确?如果是这样,是否主要依照DC2004年会论文集中Ann的那篇文章的思路来写就可以了呢。
(2)资源集合服务的内涵是什么?
资源集合服务的内涵可以理解为通过资源集合获取资源对象的一种服务形式,也即资源集合本身提供的一种服务形式。例如数据库,作为资源集合,提供了检索手段,可以让用户查找到资源对象。
资源集合服务是否还指可以通过其他服务方式获取到资源集合,例如通过信息门户,可以获取到某一个数据库的URL地址。
上述两个问题是基本的概念问题,和我们的课题密切相关,希望能得到大家的反馈意见。
我个人认为仅仅依靠文献做研究不太可取,虽然也看了一些文献,但是有些疑问久久得不到解决,希望能在此讨论,谢谢大家。
lsh:
Sent: Wednesday, November 24, 2004 5:56 PM
元数据登记系统是元数据应用的一个重要环节。通过登记系统的注册机制,各种元数据从而建立和保证相关元数据标准的普及、反馈和修订机制,并能实现元数据标准的推广和普及。
我有2点理解要补充:
1。资源集合所提供的服务,除了检索资源对象以外,还有很重要的一种服务是”聚类”的服务,也就是”集合”这个词本身所包含的意义,就是把具有相同特性的一堆对象聚集在一起,以满足特定的需要。资源集合应该是个动态的概念,每个集合都是根据一定的主题或目的由一个或多个对象组成的。
这里,组成集合的这个”主题”或”目的”很关键,同一个资源对象可以因为某个主题属于这个资源集合,也可以由于另一个主题属于另一个资源集合。资源集合描述元数据所起的作用就是在资源对象描述元数据的基础上,在更高的层次,更有针对性地描述一堆因为某种共同特性而聚集在一起的资源对象,以起到分类和导航的作用。
2。关于服务注册的问题。这个问题可以交给web services,因为web services本身就有服务注册的机制。我们的元数据登记系统只管到刘老师所列的那些东西就行了,没有必要管理服务。但我们还是要提出资源集合元数据服务注册的需求,因为资源集合元数据要能够支持web services,肯定要满足一定的要求,如要遵循一定的置标规范和接口规范。这些要求具体有哪些,是什么,我们也应该考虑到的。
K老师最后一段讲的是Metasearch技术。Metasearch中很重要的一项是Resource Metadata,又包括两种类型:Description metadata和Technical metadata。我觉得目前我们的资源集合元数据还只是Description metadata的层面。因此,未来我们课题的可能应用或许会是:使用者利用这些信息,来决定在做某个特定的检索时,是否需要选择这个数据库。
如果每个数据库厂商都能建立对其资源的最准确的描述,那是最好不过的。如果不是,这项工作需要每个图书馆自行处理?就会面临很多的问题。
我们的工作如果能够邀请到数据库厂商参加,是最好不过的。不过就目前的发展现状来说并不乐观。Z39.50 Explain 功能就是建立在这个假设的基础之上。但实际上,到2000年,Z39.50 server中作了这项工作的还不到1%;而且即使是实现了,所用的格式还五花八门。
未来的Semantic web或许可以使得这一想法走得更远,但目前还看不到什么出路。
> k的分析很准确的。每个资源集合其实可以看成数据提供者DP,而要发现这些DP并
> 去使用它就要借助一个中间人,就是注册中心,这好像是一种普遍的做法,
> 在OAI的应用中,这种原型已经出现,Identify命令返回的信息基本可以认为是一种资
> 源集合描述,而且在此框架内大家都已经遵循OAI-PMH协议了,所以从技术上实现
> 自动化的数据通讯问题已经解决,但是要得到DP的baseURL还是要从其他地方获得,所
> 以OAI组织建立了一个DP的Registry,需要从DP获取数据的SP必须先从DP Registry那找
> 到某个
> DP的baseURL。更进一步的做法是DP Registry事先对每个DP发一个Identify命令获得DP
> 的描述信息,然后供SP们检索发现和选择。
>
> 所以要实现更广泛的资源集合的自动化的metasearch,除了描述性元数据以外,还需要
> 技术性的元数据,比如遵循的标准、协议、查询语法等等。这些都要由某个注册机构来
> 提供。
> 这一点同意zyy的看法。
Popularity: 30% [?]
Tags: 元数据, 元数据, 数字图书馆, 知识组织, 课题讨论, 资源集合元数据