资源集合元数据登记系统

资源集合元数据登记系统

资源集合元数据主要是提供机器与机器之间的理解机制,解决分布环境信息资源集合的封装、提问分发等实用的元数据形式。目前一个比较成熟的做法是利用资源集合的注册系统,作为分布信息环境中的中介,进行资源集合的揭示、管理。其中主要要解决以下问题:

  • 注册系统的协同、标准化问题。

  • “服务”的描述。

  • 资源集合的描述来自开放标准,(是否依旧可以以应用纲要形式?管理元数据等如何办?)

  • 注册系统的基本功能:XML Repository, Meta-registry, several interface including server to server (SOAP/Z39.50/OAI)

资源集合注册体系的功能:

  • 注册系统实际上是提供了机器利用的portal
  • 对于普通用户来说,提供了单一入口、整合的导航工具,把相关的资源集合集中在一起,提供可选的获取信息的方案(最方便?最便宜?最符合自己需要?)。
  • 提供到资源集合的指向(导航);
  • 提供多集合的统一/联邦查询

资源集合注册系统包含的内容:

  • 资源集合的相关信息
  • 服务信息(eg. OpenURL etc.
  • 技术信息
  • 权限信息
  • 资源集合各类责任实体信息

资源集合描述的要求:

  • 不仅给人使用,更重要的是M2MS2S。因而需要大量的标准,符合众多的协议。例如在Web Service架构下;
  • Query的分发;
  • 本体的支持

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:

要求(方法):

  • 定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
  • 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
  • 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
    • 可以规定元素的编码规则;
    • 可以规定元素的值的约束;
    • 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
  • 如果需要增加”新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
  • 编码规则(制定置标方案)(机读);
  • 编写有关应用文档(人读)

过程:

  • 根据资源类型和系统开发需要,定义元数据及数据元素需求
  • 选择现有的最合适的元数据标准规范(元数据元素集)
  • 复用标准的元素,根据目标系统的需要赋予特定的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表
  • 扩展元素/限定并进行定义,赋予本地的命名域进行管理

资源集合描述元数据基于:

  1. Research Support Libraries Programme name (RSLP) Collection Description schema (RSLPCD) ( RSLP Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/)
  2. DC CD AP

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:



[1] 元数据应用纲要参见CEN CWA14855

资源集合描述的对象:

  • a collection; (may have many services that provide access but it must have at least one service registered in registry.)
  • a service, either informational (i.e. providing access to a collection), or transactional;
  • and an agent that is the owner of a collection or an administrator of a service. (An agent may be an owner or an administrator, or both, of many collections or services.)

资源集合的类型

DCMI提案(2003年10月)

扩展:

资源集合描述

增加的元素如searchable元素,表示内容是否可以检索。还有一些纯粹是informational型的。

对于控制词表也做出一定的规定,例如增加usesControlledVocabulary元素。

hasService元素用来描述资源集合所能提供的服务,比DCMI的isAvailableAt 和RSLPCD 的‘locator’元素都要清晰。后两者可同时应用于传统资源和电子资源,而hasService更直接地指用于电子资源。
the coverage, geographic, temporal and educational of the collection, containing or associated collections, and related publications.
权利类:‘dc:rights’,
‘dc:rights’ records any copyright statement about the collection. ‘iesr:useRights’ contains a statement about allowed usage of data from the collection, such as terms and conditions. ‘dcterms:accessRights’ holds information about any licence requirements to access the collection.

服务描述

locator采用:Z39.50或SOAP作为locator的属性值,但是一些服务还需要进一步信息,例如合法用户登陆信息等。
Title
Description
Locator (服务的一个入口,例如一个url或端口)
dc: type包括:Z39.50, Web Services SOAP, SRW (Search – Retrieve – Web) [14], and OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), webpage, webcgi
iesr:interface
iesr:supportsStandard.
注册系统的管理:

每一个注册实体都需要给定一个标识符POI(PURL-based Object Identifier)

编码举例:

<dcmitype:Collection>
<dc:title>zetoc</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056366559-25788
</dc:identifier>
<dcterms:abstract>The zetoc database, the British Library’s ETOC, contains…
</dcterms:abstract>
<dc:type xsi:type=”dcterms:DCMIType”>
Collection</dc:type>
<dc:type xsi:type=”rslpcd:CLDT”>
Catalogue.Library.Text</dc:type>
<dc:rights>Copyright (c) British Library 1993-2004</dc:rights>
<iesr:useRights>All Rights Reserved. http://zetoc.mimas.ac.uk/terms.html
</iesr:useRights>
<dcterms:accessRights>
Available conditionally free to UK FE and HE. Available by subscription to…
</dcterms:accessRights>
<iesr:hasService xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</iesr:hasService>
<dc:subject xsi:type=”dcterms:DDC”>
050</dc:subject>
<dc:subject xsi:type=”dcterms:LCSH”>
Medicine</dc:subject>
<rslpcd:contentsDateRange
xsi:type=”dcterms:W3CDTF”>
1993/</rslpcd:contentsDateRange>
<iesr:usesControlledList
xsi:type=”iesr:CtrldVocabsList”>
DDC</iesr:usesControlledList>
<rslpcd:owner xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381752-28099
</rslpcd:owner>
<rslpcd:hasPublication>
http://zetoc.mimas.ac.uk</rslpcd:hasPublication>
</dcmitype:Collection>

<dcmitype:Service>
<dc:title>zetoc Z39.50 search</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</dc:identifier>
<rslpcd:locator xsi:type=”dcterms:URI”>
z3950s://zetoc.mimas.ac.uk:2121/zetoc
</rslpcd:locator>
<iesr:interface xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk/iesr/metadata/examples/interfaces/svc-1056380019-18263-z.xml
</iesr:interface>
<dc:type xsi:type=”iesr:AccMthdList”>
z3950</dc:type>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
ip</dcterms:accessRights>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
athens</dcterms:accessRights>
<iesr:supportsStandard xsi:type=”iesr:StdsList”>
bath-1-c</iesr:supportsStandard>
<rslpcd:seeAlso xsi:type=”dcterms:URI”>
http://zetoc.mimas.ac.uk/z3950.html
</rslpcd:seeAlso>
<rslpcd:administrator xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</rslpcd:administrator>
</dcmitype:Service>
<iesr:Agent>
<dc:title>MIMAS</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</dc:identifier>
<dc:relation xsi:type=”dcterms:URI”>
mailto:info@mimas.ac.uk</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
tel:00441612756109</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk</dc:relation>
</iesr:Agent>
本文主要参考Ann Apps DC-2004的投稿文章


Technorati : , ,

发表评论

*

code