存档2005年2月24日

关于METS用于资源集合的两个问题

METS网站上找了半天,还没有找到答案,先把问题记在这里:

  1. METS作为元数据方案的Wrapper,如何进行不同元数据方案的互操作(映射或者中介)?这个功能可能放在extension schema中的,或者通过Establish registry of METS repositories来实现?
  2. METS对于数字资源集合元数据的编码是否有用(通过它的structural map)?

元数据项目在编码方案方面应该参考METS

METS Profile:

METS profiles allow digital libraries to specify constraints that they place on METS for ingest, storage/processing or dissemination, including:

  • dictating use of particular extension schema, rules of description, and controlled vocabularies
  • specifying arrangement and use of METS elements and attributes for particular classes of documents
  • specifying the technical characteristics of data files within a METS object
  • identifying tools for creating/processing METS documents compliant with a particular profile

资源集合元数据登记系统

资源集合元数据主要是提供机器与机器之间的理解机制,解决分布环境信息资源集合的封装、提问分发等实用的元数据形式。目前一个比较成熟的做法是利用资源集合的注册系统,作为分布信息环境中的中介,进行资源集合的揭示、管理。其中主要要解决以下问题:

  • 注册系统的协同、标准化问题。

  • “服务”的描述。

  • 资源集合的描述来自开放标准,(是否依旧可以以应用纲要形式?管理元数据等如何办?)

  • 注册系统的基本功能:XML Repository, Meta-registry, several interface including server to server (SOAP/Z39.50/OAI)

资源集合注册体系的功能:

  • 注册系统实际上是提供了机器利用的portal
  • 对于普通用户来说,提供了单一入口、整合的导航工具,把相关的资源集合集中在一起,提供可选的获取信息的方案(最方便?最便宜?最符合自己需要?)。
  • 提供到资源集合的指向(导航);
  • 提供多集合的统一/联邦查询

资源集合注册系统包含的内容:

  • 资源集合的相关信息
  • 服务信息(eg. OpenURL etc.
  • 技术信息
  • 权限信息
  • 资源集合各类责任实体信息

资源集合描述的要求:

  • 不仅给人使用,更重要的是M2MS2S。因而需要大量的标准,符合众多的协议。例如在Web Service架构下;
  • Query的分发;
  • 本体的支持

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:

要求(方法):

  • 定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
  • 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
  • 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
    • 可以规定元素的编码规则;
    • 可以规定元素的值的约束;
    • 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
  • 如果需要增加”新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
  • 编码规则(制定置标方案)(机读);
  • 编写有关应用文档(人读)

过程:

  • 根据资源类型和系统开发需要,定义元数据及数据元素需求
  • 选择现有的最合适的元数据标准规范(元数据元素集)
  • 复用标准的元素,根据目标系统的需要赋予特定的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表
  • 扩展元素/限定并进行定义,赋予本地的命名域进行管理

资源集合描述元数据基于:

  1. Research Support Libraries Programme name (RSLP) Collection Description schema (RSLPCD) ( RSLP Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/)
  2. DC CD AP

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:



[1] 元数据应用纲要参见CEN CWA14855

资源集合描述的对象:

  • a collection; (may have many services that provide access but it must have at least one service registered in registry.)
  • a service, either informational (i.e. providing access to a collection), or transactional;
  • and an agent that is the owner of a collection or an administrator of a service. (An agent may be an owner or an administrator, or both, of many collections or services.)

资源集合的类型

DCMI提案(2003年10月)

扩展:

资源集合描述

增加的元素如searchable元素,表示内容是否可以检索。还有一些纯粹是informational型的。

对于控制词表也做出一定的规定,例如增加usesControlledVocabulary元素。

hasService元素用来描述资源集合所能提供的服务,比DCMI的isAvailableAt 和RSLPCD 的‘locator’元素都要清晰。后两者可同时应用于传统资源和电子资源,而hasService更直接地指用于电子资源。
the coverage, geographic, temporal and educational of the collection, containing or associated collections, and related publications.
权利类:‘dc:rights’,
‘dc:rights’ records any copyright statement about the collection. ‘iesr:useRights’ contains a statement about allowed usage of data from the collection, such as terms and conditions. ‘dcterms:accessRights’ holds information about any licence requirements to access the collection.

服务描述

locator采用:Z39.50或SOAP作为locator的属性值,但是一些服务还需要进一步信息,例如合法用户登陆信息等。
Title
Description
Locator (服务的一个入口,例如一个url或端口)
dc: type包括:Z39.50, Web Services SOAP, SRW (Search – Retrieve – Web) [14], and OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), webpage, webcgi
iesr:interface
iesr:supportsStandard.
注册系统的管理:

每一个注册实体都需要给定一个标识符POI(PURL-based Object Identifier)

编码举例:

<dcmitype:Collection>
<dc:title>zetoc</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056366559-25788
</dc:identifier>
<dcterms:abstract>The zetoc database, the British Library’s ETOC, contains…
</dcterms:abstract>
<dc:type xsi:type=”dcterms:DCMIType”>
Collection</dc:type>
<dc:type xsi:type=”rslpcd:CLDT”>
Catalogue.Library.Text</dc:type>
<dc:rights>Copyright (c) British Library 1993-2004</dc:rights>
<iesr:useRights>All Rights Reserved. http://zetoc.mimas.ac.uk/terms.html
</iesr:useRights>
<dcterms:accessRights>
Available conditionally free to UK FE and HE. Available by subscription to…
</dcterms:accessRights>
<iesr:hasService xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</iesr:hasService>
<dc:subject xsi:type=”dcterms:DDC”>
050</dc:subject>
<dc:subject xsi:type=”dcterms:LCSH”>
Medicine</dc:subject>
<rslpcd:contentsDateRange
xsi:type=”dcterms:W3CDTF”>
1993/</rslpcd:contentsDateRange>
<iesr:usesControlledList
xsi:type=”iesr:CtrldVocabsList”>
DDC</iesr:usesControlledList>
<rslpcd:owner xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381752-28099
</rslpcd:owner>
<rslpcd:hasPublication>
http://zetoc.mimas.ac.uk</rslpcd:hasPublication>
</dcmitype:Collection>

<dcmitype:Service>
<dc:title>zetoc Z39.50 search</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</dc:identifier>
<rslpcd:locator xsi:type=”dcterms:URI”>
z3950s://zetoc.mimas.ac.uk:2121/zetoc
</rslpcd:locator>
<iesr:interface xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk/iesr/metadata/examples/interfaces/svc-1056380019-18263-z.xml
</iesr:interface>
<dc:type xsi:type=”iesr:AccMthdList”>
z3950</dc:type>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
ip</dcterms:accessRights>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
athens</dcterms:accessRights>
<iesr:supportsStandard xsi:type=”iesr:StdsList”>
bath-1-c</iesr:supportsStandard>
<rslpcd:seeAlso xsi:type=”dcterms:URI”>
http://zetoc.mimas.ac.uk/z3950.html
</rslpcd:seeAlso>
<rslpcd:administrator xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</rslpcd:administrator>
</dcmitype:Service>
<iesr:Agent>
<dc:title>MIMAS</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</dc:identifier>
<dc:relation xsi:type=”dcterms:URI”>
mailto:info@mimas.ac.uk</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
tel:00441612756109</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk</dc:relation>
</iesr:Agent>
本文主要参考Ann Apps DC-2004的投稿文章


Technorati : , ,

"语义万维网服务(SWSI)"- –

“语义万维网服务” Semantic Web Services Initiative (SWSI) 的目标是使目前的万维网技术结合相关的最新进展,得以发挥其最大潜能。

语义万维网技术

万维网协会主席 Tim Berners-Lee 认为万维网的未来是”语义万维网”–万维网向机读信息和自动服务的延伸而远远超出目前的能力。在数据、程序、网页以及其他万维网资源之上的语义呈现,将使万维网成为基于知识的万维网,使目前的服务提升到一个新的水平。通过”理解”万维网上的内容,达到更精确的过滤、分类以及检索信息资源,自动服务将在更大的范围上帮助人类实现目标。这个过程将最终实现极端丰富的知识系统以及在此基础上的特别的推理服务。这些服务将有助于我们日常生活的方方面面,像今天人们对于电力一样普遍而不可或缺。

目前的万维网只是信息的堆积而不提供信息的处理,也就是说并没有把计算机当作一种计算设备。最近围绕 UDDI, WSDL, 和 SOAP 等发展起来的新技术正在把 Web 变成一种新的水平层次上的服务。应用软件课题通过万维网而获得和执行,这个技术叫做 Web 服务。 Web 服务通过提供一种程序自动交流、发现服务的机制,从而可以大大提高万维网体系结构的潜能。因而得到众多软件开发公司的关注。 Web 服务使电脑设备连接在一起,以一种新的方式使用因特网交换和联合数据。 Web 服务技术的关键在于使用松散耦合的”随时”组合可重用软件组件的方式提供服务。这从技术和业务两方面都产生深远的影响。

Semantic Web Service 似乎又多了一个兄弟: Semantic Web enabled Web Services ,欧洲 IST 的一个项目。

相关的项目、组织或网站:

http://swws.semanticweb.org/

http://swsi.semanticweb.org/

Software can be delivered and paid for as fluid streams of services as opposed to packaged products. It is possible to achieve automatic, ad hoc interoperability between systems to accomplish organizational tasks. Examples include business application, such as automated procurement and supply chain management, but also non-commercial applications as well as military applications. Web services can be completely decentralized and distributed over the Internet and accessed by a wide variety of communications devices. Organizations can be released from the burden of complex, slow and expensive software integration and focus instead on the value of their offerings and mission critical tasks. The dynamic enterprise and dynamic value chains would become achievable and may be even mandatory for competitive advantage.


Technorati : , ,

元数据注册系统的作用

一套元数据规范可以看成是一套规范词表,可以认为具有权威控制的功能,并构成一个独特应用领域的本体。利用数据库提供词汇的组织、管理功能,以 RDF 编码,提供友好的界面供人工查询,提供 application program interfaces ( API )供机器使用。同时可用于非 DCMI 词的注册、管理。

  • 通过元数据元素的重用支持语义互操作;
  • 通过元数据XML Schema的重用支持编码的一致性;
  • 通过元数据应用规则和著录规则的重用而获得模型的一致性;
  • 提供制定元数据方案的方法论和工具(编辑加工修改查询及形式化工具);
  • 提供Semantic Web Serviceautomatic access API
  • 提供各语种的翻译对照

关于CALIS- –

CALIS二期是我国最有希望的数字图书馆系统之一,可与一争的只有CAS图书馆,而后者还不具有前者广大读者群和分布式资源管理的特点。

以前学习过CALIS二期的计划,也给馆长们汇报过一次,有关资料整理存档如下。

CADLIS 十五建设的总目标:在完善九五期间 CALIS 建设成果的基础上,到 2005 年底,初步建成具有国际先进水平的、开放式的中国高等教育数字图书馆。

对此数字图书馆的描述:以系统化、数字化的学术信息资源为基础,以先进的数字图书馆技术为手段,以 CERNET 为依托,为高等院校教学、科研和重点学科建设提供高效率、全方位的文献信息保障与服务,成为经济和社会发展的重要基础设施。

十五期间的建设内容:

5 大环境系统中的三大:

1、文献服务环境

联合目录数据库、学位论文库、特色数据库、以及馆际互借系统等成果以及各类数字资源,通过对各种形态数字资源和各种资源服务方式进行多种方式的整合和自动化协同工作,建立分布式的、开放的综合文献服务环境。该环境已资助的方式向不同类型的读者提供多层次、个性化的文献检索与获取服务等。

相关子项目:

2、参考咨询环境

通过建立以共享知识库和学习中心为支撑的全国咨询台、本地咨询台等良机分布式服务体系,构建面向中国高等教育的分布式联合虚拟参考咨询环境。该环境以本地咨询台为主体,全国咨询台为支撑,实现 24/7 合作咨询服务模式,针对高校读者在使用数字图书馆中所发生的问题,咨询官员能够予以及时解答,不受时间、地点的限制。

相关子项目:分布式联合虚拟参考咨询系统(上海交大)

3、教学辅助环境

以教学参考信息和教学电子参考书为基础,构筑面向我国高等教育的教学参考辅助环境。不经提供教学参考信息和教学参考书的电子文献等一般性服务,而且集成文献服务环境和参考咨询环境的部分功能,构建面向实际教学的 E-reserve (教学参考)环境,成为现代教学的重要辅助环节。

相关子项目:高校教学参考信息管理与服务系统

4、科研辅助环境

基于网络手段和数字文献服务,构建网上学术交流和科研服务平台。结合科研特点,充分挖掘和利用 CALIS 和各个高校馆拥有的丰富数字文献资源。建立网上学术文献发布体系,实现学术成果的及时发表( E-print ),为各个学科之间科研活动的交流与合作、跨地域的协作科研提供虚拟场所,促进高校内各学科领域之间以及高校外学术界之间进一步的资源共享与协作。

相关子项目:科研服务系统

5、专业培训环境

采用远程教育和多媒体手段,建立高校图书馆专业人员的培训服务平台。采用全国中心和地区中心两级培训服务模式,开展网上培训,组织网上考试认证。使更多的图书馆专业人员能够获得及时有效的专业技术培训,使其掌握数字图书馆是第新的服务手段和服务方式。

相关子项目:分布式联合虚拟参考咨询系统

通过各类标准规范和统一接口与架构下互相联系,可分可合。

5+1 数字服务平台: + 服务支撑平台


Technorati :

情报检索与知识组织(2月25日修订)- –

对于知识的认识(包括”知识组织”)在古代应该属于哲学领域,如果沾得上边,后来的图书馆学可以算是一门。图书馆学通过管理知识载体来反映知识结构,并促进知识的有效传播和利用。其中的核心内容”分类编目”堪当此任。

纸、泥板、羊皮、竹、石以及电光磁等媒介是知识的有形载体,书籍、报刊、杂志、图片、动画等是知识的媒体类型,图书馆、博物馆、大学等社会组织可算是知识的交流机构,也是知识运动国政中不可缺少的一种形式。研究知识,这些方面都值得研究。

二战以后诞生的情报学(或也可称为信息学)专注于知识的内容–信息,而把知识的躯壳留给了图书馆学。信息论走的更远,认为信息是”不确定性的减少”或”负熵”。从这一点说信息学和情报学可以分道扬镳了。二战以后的 情报学受到计算机科学发展的影响,但还是基本上从人的角度去研究情报的规律,无法对只能机械操纵符号的计算机提出任何”智能”一点的要求。人为了充分利用计算机的高速运算、大容量存储能力,以及准确性,发明了一整套情报检索技术。

从穿孔卡片开始,人类最早的计算机奴隶就叫做情报检索。一直到后来的字词索引、匹配、倒排档等等。

计算机就象是上帝给人类的一个魅力无穷的玩具,真的让人能够像上帝一样思考了(不知上帝是否会继续发笑?还是发怒?),人类依靠它,在几十年的时间里除了破解了数据的奥秘(关系型数据库技术),拓展了应用的疆域(Internet和Web技术),甚至创造了人类更加富足的信息化社会。这也再次证明了知识的力量。

目前计算机具有的能力与我们人类的需求之间的鸿沟越来越弥合。然而我们还是不得不为人机之间沟通制定一些原则和模式,这样机器才能更好地模仿人的程序处理信息和知识。元数据和知识本体都是这类工具。

我们现在研究知识组织,已经无法不受到计算机科学已有成果的影响。图书馆情报学知识域中有关信息组织(情报检索)的”话语体系”、”领域本体”必须与计算机科学相关的概念体系进行融合,才能发展。所以我们不得不用计算机科学中在知识组织方面的研究进展取代我们传统的情报检索课程内容。这两个领域的发展速度不是一个数量级的,图书馆学的知识组织能够提供计算机科学许多人文滋养,但是如果不承认计算机科学的主体地位,图书馆学的那点经验学识将会荡然无存。计算机科学的发展有如一辆无可回头的蒸汽机车,在历史的进程中摧枯拉朽、一往无前。

近期大量阅读我图书馆学的情报检索、信息组织教材和计算机科学中的知识库研究成果。

首先对张琪玉、侯汉清编的这本《情报检索语言实用教程》非常感兴趣。一本刚出炉的教材,而且是国内该领域的领衔人物的新作,老树开新花,而且书名冠以”实用”,又是武大出的,让人立刻有探个究竟的愿望。

翻开前言,原来是武大出版社委托编写的,让人感到武大对于传统的图书馆学分支学科已经后继无人了。否则恐怕不会委托早已与武大没有瓜葛的两位老人编写。

前言中还说,本书的编写目的是”减少情报语言学领域诸课程之间的重复,精简讲授内容,突出实用性”,看来传统图书馆学科面临的冲击确实不小。

重复课程大概是指”情报语言学基础””图书分类学””主题法导论”之类的课程,与我目前要给北大研究生班上的”信息组织”主题的课程应该有些类似。

减少了不常用的情报检索语言类型和语种、发展历史的讲授。

内容主要包括:

总的看来,体系结构还是比较严谨和全面的。(这本书值得购买收藏)

情报检索语言及情报语言学的基本问题

作者避开情报、信息、文献的概念争论,把这三者的检索和检索系统作为同一概念。也算是一大实用的认识吧。

对于文献的概念,作者没有使用国标中”记录有知识的一切载体”,而解释为:”文献是存储和传递知识、信息的主要载体,所以,利用文献成为获取知识、信息的主要途径。”逃避概念几乎有点过于随意了(捣浆糊)。

对于”情报检索”概念的解释也是非常”图书馆学”化的:”其广义是指通过建立情报检索系统来解决文献查找问题(也就是知识和信息的查找问题)的整个实践,其侠义仅指根据某种需要从情报检索系统中查找出相关文献线索(也称文献检索)或文献中相关内容(也称事实检索、数据检索或全文检索)的操作过程”。可见其感念定义中的同义反复和不严密的地方何其多。并且从计算机界的角度看这些”同类”概念有不少不必要的人为定义和偏差在其中。广义和狭义,到底如何理解?

从作者的角度而言,数字图书馆可以看成是一个情报检索系统,因为是有序的,可以通过多种途径检索的,检索结果也是经过排序输出的,用户能够满足信息需求的。

关于情报检索语言的定义也是本书中非常核心的概念。情报检索语言是根据情报检索的需要而创制的人工语言,专门用于各种手工的和计算机化的情报检索系统,表达文献主题概念和检索课题概念。他作为提供文献内容检索途径的情报检索系统的一个构成因素,在其中起到语言保障的作用。情报检索语言分为分类检索语言、主题检索语言和代码检索语言三大语系。情报检索语言的实质是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统。

作者的一个经典的理论是:情报检索与情报存储是相反过程

情报存储过程:文献的情报内容 – 经过主题分析确立主题概念 – 经过利用情报检索语言的标引过程输入到情报检索系统中。而情报检索过程是一个相反的过程,检索者的情报需要经过主题分析,得出一系列的主题概念,经过情报检索语言的标引之后,通过检索系统进行检索,最后输出检索结果。

情报检索语言的特点:

情报检索语言的基本功能:

术语与情报检索语言是应用于被应用的关系。

概念的概念:概念是事物本质属性的概括。概念的内涵是指它所指事物的本质属性的综合,即概念的含义。概念的外延是它所指的一切事物,即概念的适用范围。

概念之间的关系:

相容关系(概念的外延至少有一部分相重合)

同一关系、属种关系、交叉关系、整体与部分关系、全面与某一方面关系、外延不相排斥的并列关系。

不相容关系:

并列关系(同位关系):同一个上位概念之下的几个下位概念之间的关系;

矛盾关系:并列关系的特殊形式,外延总合等于其上位概念全部外延的两个并列概念之间的关系。如金属材料与非金属材料;

对立关系:外延总合小于其上位概念全部外延的两个并列而且相互对立的概念之间的关系。例如导电体和绝缘体;其上位概念除了这两者之外,还有半导体。

概念的划分与概括(分类)指对概念的内涵而言,内涵的扩大或缩小。

概念的分析与综合(组配)指对概念的外延而言,外延的融合或分化。


Technorati :

ADL:一个古老但可资参考的例子- –

加州大学圣巴巴拉分校牵头的” Alexandria Digital Library “项目从 DLI1 就开始作,目前应该说已经基本完全结束。其中涉及到数字图书馆体系结构、分布式资源组织管理、资源集合元数据应用等都是我比较关心的,只有一项:地理信息的规范控制和管理却不是我的重点。

亚历山大数字图书馆项目在 1999 年就提出了资源集合描述元数据的各项功能,现在实际上还是沿着这条道路继续标准化,然而进展看起来并不是很大。 ADL 当初的陈述如下(见 1999 年的一篇文章: http://www.alexandria.ucsb.edu/%7Egjanee/archive/1999/jasis-paper.pdf Linda Hill etc. Collection Metadata Solutions for Digital Library Applications ):

The Alexandria Digital Library (ADL) Project has designed and implemented collection metadata for several purposes: in XML form, the collection metadata “registers” the collection with the user interface client; in HTML form, it is used for user documentation; eventually, it will be used to describe the collection to network search agents; and it is used for internal collection management, including mapping the object metadata attributes to the common search parameters of the system.

现在看起来 ADL 中的资源集合元数据有许多”不规范”的地方:即为了实现功能而”任意”添加的属性。由于其应用平台为 C/S 结构,编码虽然是 XML 格式,但是 Vocabulary 是自定义的。数字对象的描述是封装于 Bucket 中,规定了 Bucketde 的类型和结构,以及一个 Core Bucket 。

一些想法:

康奈尔、加大圣塔巴巴拉、斯坦福三个高校的 DLI2 项目与我的论文有关。涉及的主要内容有:

鳕鱼岬会议(2月25日修订)- –

会议名称: Wave of the Future: NSF Post Digital Library Future Workshop ,简称 鳕鱼岬 会议

会议性质:NSF主办,邀请参加

主题: “Ubiquitous Knowledge Environments: The Cyberinfrastructure Information Ether”

地点: Wequassett Inn, Cape Cod, Chatham, Massachusetts

报告标题: Knowledge Lost in Information

参加人员:数字图书馆的父母们

网址: http://www.sis.pitt.edu/~dlwkshop/

美国现在热衷于 Cyberinfrastructure 的研究和建设,每年要投入 1 billion 经费,这是NII/DL的一个后续研究领域,去年3月在日本筑波开 DLKC04 会议时认识的米歇根大学的 Daniel E Atkins 教授是其中的重要人物 [1]

匹兹堡大学信息科学学院的一帮教授似乎对 Atkins 提出的构建 Cyberinfrastructure 的报告非常有心得,在 2003 年 5 月决定美国数字图书馆研发未来方向的鳕鱼角会议上提交了一份报告: Ubiquitous Knowledge Environments: The Cyberinfrastructure Information Ether ,一举为这次会议定下了基调。会议网站也寄放在匹兹堡大学的域名之下。

这份主旨报告,以及这次 鳕鱼岬 会议本身,似乎很清楚地表明,数字图书馆的研究重点已经转为 Ubiquitous Knowledge Environment ( UKE :无所不在的知识环境),或者说数字图书馆将为 UKE 所取代,或者说数字图书馆将以 UKE 的形式而存在。而 UKE 的存在目的是什么?大会的副标题说的很清楚:( to provide ) Cyberinfrastructure Information Ether (提供赛百基础结构的信息大气)。

查国内对于 Daniel Atkins 的 Cyberinfrastructure 报告是否有报道。查到 http://www.sunway.cn/swnews/html/2/2004-02-25/20040225100106.html 有一段:

阅读” 鳕鱼岬 “会议上专家提交的报告,一些感悟:

Carl Lagoze 认为:

NSF 倡导的数字图书馆研发开始于”前” Web 时代,因而造成了数字图书馆研究与 Web 为基础的研究有些各走各的道,并造成数字图书馆研究成果的一定的落后和不合时宜。然而具有讽刺意味的是,目前如日中天的宠儿,也是 Web 世界近来最重要的进展– Google ,最早却是来自于 DLI1 支持的一个项目; DL 研发促进了 Web 核心技术 (Java 、 XML 、 RDF 等 ) 的进展,然而这些技术没有任何一个源自 DLI 项目。

陈钦智说:

经过十余年的研发,例如 DLI1 、 DLI2 、 IDLP 等的系列项目的研发,我们取得了丰硕的成果,包括元数据和 OAI 方面的进展、全文本和机遇图像、视频的检索技术的进展等,这些项目带来了全球数字图书馆的研究开发热潮。数字图书馆的研究顺理成章地引申出 Cyber-infrastructure 的研究领域,后者广泛地包容了数字环境下人、数据、信息、工具、设施设备等复杂的联系,以及信息系统在其中的功能实现,这个领域逐渐取代了数字图书馆的研究地位。 (NSF 每年拟投入 10 亿美元进行研究 ) 。数字图书馆的研究过多地注重技术研发,虽然 DLI2 注意了这一点,然而也还是基于技术创新的。而 Cyber-infrastructure 更注重功能和实践。

数字图书馆研发的任务依旧是:

数字图书馆的研发没有带来大规模的应用,主要原因还是许多研发还是基于 R&D ,而没有将这些技术很好地整合起来。数字图书馆大踏步地进步依赖于对其相关技术、内容和用户的整合(见图示):

待续……


Technorati :