DC资源集合描述元数据应用纲要(DC CD AP)进展
Pete Johnston 对于 DC-2005 的总结给我们带来了DC CD AP工作组的最新信息,这些情况都反映在 Pete的ppt报告 中了:
DC CD AP过往一年最显著的进展可能要算是DC CD AP草案的推出,在DC-2005应用委员会的全体会议上”非正式”地讨论了这个草案,除了形式上的修改建议之外,对于存在的几个问题中的一个比较大的问题提出了指导性意见。这个问题是:
在资源集合描述时,如果需要同时用到元素及其元素修饰词,例如dc:relation/dcterms:isReferencedBy;dc:description/dcterms:abstract(dc:rights也会碰到),这两类term修饰的内容会发生矛盾。例如一个资源集合的dc:relation的值是另一个资源集合,而这个资源集合isReferencedBy另一本书;dc:description的值是这个资源集合的一般性描述而dcterms:abstract是其某个单元的摘要。应用委员会建议在这种情况下不能够复用dc:relation或dc:description(或dc:rights)而必须专门为资源集合描述寻找新的元素。
另一些正在讨论、尚未定论的问题(虽然在草案中已经有推荐的规定)是:
1、属性值作为字串还是作为引用(use a (value) URI or a (value) string)?编码体系syntaxencoding scheme/富结构rich representation如何用?相关描述(relateddescriptions)应该允许,但是DC CD AP应该保持术语无关。
2、 资源集合媒体类型(格式)的描述。功能需求提出必须能够描述资源集合中是否有提问所需的媒体格式,于是问题就变得很复杂。
3、 开放的时间段。对于资源集合来说,其内容的时间跨度常常是不可确定的。W3CDTF不支持时间范围的表述,ISO8601支持时间范围,但是不支持一头开放的时间范围,例如1949-?。这个问题需要DC Date WG工作组解决。
4、 资源集合的位置location和服务services分离是否有必要?如何分离?是否isLocatedAt/ isAccessedVia两个修饰词都需要?
DC定义的相关概念如下:
• Collection
- An aggregation of one or more items
• Location
- Aplace where a collection is held (Michael Heaney, Analytical Model)
• Service
-Asystem that provides one or more functions of value to the end-user.Examplesinclude: a photocopying service, a banking service, anauthentication service,interlibrary loans, a Z39.50 or Web server (DCMIType Vocabulary)
- Provided physically or digitally
- User may be human, organisation orsoftware application.
• (DCCD AP) Service
- A system that provides access to theItems within the Collection
来年的工作计划就围绕这些问题进行讨论、提出解决方案,并修订DC CD AP。
序号
工作内容
开始日期
结束日期
1
Revise in light of Usage Board review
2005-09
2005-11
2
Resolve item media-type issue
2005-09
2005-11
3
Finalise isLocatedIn/isAccessedVia properties
2005-11
2006-02
4
Work with DC Date WG on date range format
2005-09
2006-03?
5
Update DCAP
2006-01
2006-04
6
Syntax (based on work by DC Arch WG)
2006-05?
2006-09
7
Crosswalks
2006-05
2006-09
8
Usage Guidelines
2006-05
2006-09
9
Usage Board Review
2006-10
2006-10
DC-2005上资源集合工作组还交流了三篇报告:
来自University of Illinois at Urbana-Champaign的Sarah Shreeves 和Muriel Foulonneau通过网络视频会议形式报告了他们在 几个项目中使用资源集合描述 的情况。
英国博物馆、图书馆、档案馆联合委员会的Kate Fernie介绍了他们承担的 文化遗产资源集合项目 的情况。
大英图书馆的Bill Oldroyd简短地介绍了TEL (The European Library:欧洲图书馆)项目中采用资源集合描述的情况。
DC CD AP草案精简版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-ap-summary/2005-08-25/
草案完整版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623606
Popularity: 45% [?]
Tags: DC, 元数据, 应用纲要, 资源集合, 资源集合元数据, 进展Related posts
关于METS用于资源集合的两个问题
METS网站上找了半天,还没有找到答案,先把问题记在这里:
- METS作为元数据方案的Wrapper,如何进行不同元数据方案的互操作(映射或者中介)?这个功能可能放在extension schema中的,或者通过Establish registry of METS repositories来实现?
- METS对于数字资源集合元数据的编码是否有用(通过它的structural map)?
元数据项目在编码方案方面应该参考METS:
METS Profile:
METS profiles allow digital libraries to specify constraints that they place on METS for ingest, storage/processing or dissemination, including:
- dictating use of particular extension schema, rules of description, and controlled vocabularies
- specifying arrangement and use of METS elements and attributes for particular classes of documents
- specifying the technical characteristics of data files within a METS object
- identifying tools for creating/processing METS documents compliant with a particular profile
Popularity: 30% [?]
Tags: METS, 元数据, 元数据, 资源集合Related posts
资源集合元数据登记系统
资源集合元数据主要是提供机器与机器之间的理解机制,解决分布环境信息资源集合的封装、提问分发等实用的元数据形式。目前一个比较成熟的做法是利用资源集合的注册系统,作为分布信息环境中的中介,进行资源集合的揭示、管理。其中主要要解决以下问题:
-
注册系统的协同、标准化问题。
-
“服务”的描述。
-
资源集合的描述来自开放标准,(是否依旧可以以应用纲要形式?管理元数据等如何办?)
-
注册系统的基本功能:XML Repository, Meta-registry, several interface including server to server (SOAP/Z39.50/OAI等);
资源集合注册体系的功能:
- 注册系统实际上是提供了机器利用的portal。
- 对于普通用户来说,提供了单一入口、整合的导航工具,把相关的资源集合集中在一起,提供可选的获取信息的方案(最方便?最便宜?最符合自己需要?)。
- 提供到资源集合的指向(导航);
- 提供多集合的统一/联邦查询
资源集合注册系统包含的内容:
- 资源集合的相关信息
- 服务信息(eg. OpenURL etc.)
- 技术信息
- 权限信息
- 资源集合各类责任实体信息
资源集合描述的要求:
- 不仅给人使用,更重要的是M2M或S2S。因而需要大量的标准,符合众多的协议。例如在Web Service架构下;
- Query的分发;
- 本体的支持
资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:
要求(方法):
- 定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
- 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
- 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
- 可以规定元素的编码规则;
- 可以规定元素的值的约束;
- 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
- 如果需要增加”新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
- 编码规则(制定置标方案)(机读);
- 编写有关应用文档(人读)
过程:
- 根据资源类型和系统开发需要,定义元数据及数据元素需求
- 选择现有的最合适的元数据标准规范(元数据元素集)
- 复用标准的元素,根据目标系统的需要赋予特定的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表
- 扩展元素/限定并进行定义,赋予本地的命名域进行管理
资源集合描述元数据基于:
- Research Support Libraries Programme name (RSLP) Collection Description schema (RSLPCD) ( RSLP Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/)
- DC CD AP
资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:
[1] 元数据应用纲要参见CEN CWA14855
资源集合描述的对象:
- a collection; (may have many services that provide access but it must have at least one service registered in registry.)
- a service, either informational (i.e. providing access to a collection), or transactional;
- and an agent that is the owner of a collection or an administrator of a service. (An agent may be an owner or an administrator, or both, of many collections or services.)
资源集合的类型
DCMI提案(2003年10月)
扩展:
资源集合描述
增加的元素如searchable元素,表示内容是否可以检索。还有一些纯粹是informational型的。
对于控制词表也做出一定的规定,例如增加usesControlledVocabulary元素。
hasService元素用来描述资源集合所能提供的服务,比DCMI的isAvailableAt 和RSLPCD 的‘locator’元素都要清晰。后两者可同时应用于传统资源和电子资源,而hasService更直接地指用于电子资源。
the coverage, geographic, temporal and educational of the collection, containing or associated collections, and related publications.
权利类:‘dc:rights’,
‘dc:rights’ records any copyright statement about the collection. ‘iesr:useRights’ contains a statement about allowed usage of data from the collection, such as terms and conditions. ‘dcterms:accessRights’ holds information about any licence requirements to access the collection.
服务描述
locator采用:Z39.50或SOAP作为locator的属性值,但是一些服务还需要进一步信息,例如合法用户登陆信息等。
Title
Description
Locator (服务的一个入口,例如一个url或端口)
dc: type包括:Z39.50, Web Services SOAP, SRW (Search – Retrieve – Web) [14], and OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), webpage, webcgi
iesr:interface
iesr:supportsStandard.
注册系统的管理:
每一个注册实体都需要给定一个标识符POI(PURL-based Object Identifier)
编码举例:
<dcmitype:Collection>
<dc:title>zetoc</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056366559-25788
</dc:identifier>
<dcterms:abstract>The zetoc database, the British Library’s ETOC, contains…
</dcterms:abstract>
<dc:type xsi:type=”dcterms:DCMIType”>
Collection</dc:type>
<dc:type xsi:type=”rslpcd:CLDT”>
Catalogue.Library.Text</dc:type>
<dc:rights>Copyright (c) British Library 1993-2004</dc:rights>
<iesr:useRights>All Rights Reserved. http://zetoc.mimas.ac.uk/terms.html
</iesr:useRights>
<dcterms:accessRights>
Available conditionally free to UK FE and HE. Available by subscription to…
</dcterms:accessRights>
<iesr:hasService xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</iesr:hasService>
<dc:subject xsi:type=”dcterms:DDC”>
050</dc:subject>
<dc:subject xsi:type=”dcterms:LCSH”>
Medicine</dc:subject>
<rslpcd:contentsDateRange
xsi:type=”dcterms:W3CDTF”>
1993/</rslpcd:contentsDateRange>
<iesr:usesControlledList
xsi:type=”iesr:CtrldVocabsList”>
DDC</iesr:usesControlledList>
<rslpcd:owner xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381752-28099
</rslpcd:owner>
<rslpcd:hasPublication>
http://zetoc.mimas.ac.uk</rslpcd:hasPublication>
</dcmitype:Collection>
<dcmitype:Service>
<dc:title>zetoc Z39.50 search</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</dc:identifier>
<rslpcd:locator xsi:type=”dcterms:URI”>
z3950s://zetoc.mimas.ac.uk:2121/zetoc
</rslpcd:locator>
<iesr:interface xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk/iesr/metadata/examples/interfaces/svc-1056380019-18263-z.xml
</iesr:interface>
<dc:type xsi:type=”iesr:AccMthdList”>
z3950</dc:type>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
ip</dcterms:accessRights>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
athens</dcterms:accessRights>
<iesr:supportsStandard xsi:type=”iesr:StdsList”>
bath-1-c</iesr:supportsStandard>
<rslpcd:seeAlso xsi:type=”dcterms:URI”>
http://zetoc.mimas.ac.uk/z3950.html
</rslpcd:seeAlso>
<rslpcd:administrator xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</rslpcd:administrator>
</dcmitype:Service>
<iesr:Agent>
<dc:title>MIMAS</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</dc:identifier>
<dc:relation xsi:type=”dcterms:URI”>
mailto:info@mimas.ac.uk</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
tel:00441612756109</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk</dc:relation>
</iesr:Agent>
本文主要参考Ann Apps DC-2004的投稿文章
Popularity: 28% [?]
Tags: 元数据, 元数据, 登记系统, 资源集合