分类目录数字图书馆

数字人文系统有没有“需求”?

问:基于自己对现有文献的了解,我有一个基本印象:数字人文的相关研究似乎更侧重在“技术”这件事本身,似乎学者们将研究的重心更多的放在如何去更好的用技术去成就事情。包括您昨天的课,很大程度上也在强调基础设施、平台、资源以及数字人文行为;但是是不是跳过了一个东西,那就是需求呢?所以我的问题是:(1)图书馆在建设关于数字人文相关平台的时候,是如何去权衡这个需求的?是根据人文学者的需求吗?还是图书馆觉得应该有这样一个平台?(2)图书馆建成这个平台后,人文学者的利用率高吗?是人文学者利用的更多,还是普通用户?最后用于人文的学术研究更多还是普及知识的作用更多呢?(3)昨天您也提到了,也是我想问的,图书馆如何去吸引和鼓励人文学者和其他用户使用相关基础设施的?

答:感谢来函提问,非常好的问题,就这个问题我的思考如下,仅供参考。

1.需求分析法是构建一个系统或平台所必须步骤,但却不是做一件创新的事情所必须步骤。科学研究和艺术创作最早完全是因为人类的好奇心使然,是一种娱人娱己,说句直白的话,人文基本上是人吃饱了饭没事干才想到的事情,所以并非所有的事情都由需求来驱动和引导的,那样就非常功利了,与动物就没啥两样了。
2.很多时候需求是创造和引导出来的。英国人喝茶完全是中国和印度带过去的,没有手机的时候怎么知道手机能不能卖掉?
3.图书馆建设数字人文平台时其实一开始是模拟人文学者传统的研究方式,比如检索、比较、统计,等等,用技术能够更快更精确更大范围地检索,就像电子书是对纸本书的模拟一样,一开始总是模仿,然后再有突破。你能够帮到他,那就是满足了他的需求,即便不是所有人都会用,但总有一批先行者,带动研究范式但转变。
4.在开发系统但时候必须要有需求分析的过程,系统设计的依据是需求设计,否则就无法开发出良好的系统。我们数字人文系统平台的研发通常有三类人参与:领域专家、图书馆员和软件开发人员,其中图书馆员往往充当需求设计者,他们把学者的研究行为转化为程序员能够看懂的说明书。
5.人文学者是不是利用率高,首先需要明确的是,未来的人文学者一定是基于数据进行研究的,当所有的素材都是原生数字资源的时候,他们别无选择。至于这个平台是不是图书馆来提供,这其实是不重要的,因为总要有人来做这个事情,目前因为图书馆有大量的人文内容是稀缺资源,是研究者不可或缺的。

爱迪生从来不是根据需求进行发明创造的,乔布斯也不会迎合需求而让自己的产品设计有所妥协,如果说有需求,他们自己就是需求者。一切开发源自需求是一个伪问题,尤其不能让这个问题禁锢思维和束缚手脚。系统好不好是可以迭代开发的,不好了可以推倒重来。

数字图书馆的前世今生

数字图书馆前世今生

 

 

数字图书馆是上世纪90年代初作为与“信息高速公路”配套的基础设施而提出的概念。基于“有路必有车”的认识,美国分别于1992年和1994年分两期投入上亿美元设立“数字图书馆先导计划(Digital Library Initiative)”,孵化了一大批项目,如谷歌搜索引擎算法、谷歌数字图书计划、都柏林核心元数据、互联网档案项目和美国公共数字图书馆(DPLA)等等,都直接源自于其项目成果,或有着千丝万缕的因果联系。

我国的数字图书馆建设起始于1996年,一个标志性事件是国家图书馆联合上海等六家公共图书馆共同发起了“中国国家试验型数字图书馆”项目,第二年该项目得到了国家计委的正式批准,成为国家级信息基础设施建设项目。该项目的研发带动了我国一大批相关标准规范的确立,澄清了许多关键性概念,促进了学界和业界对一个新兴领域的关注,也促使整个图书馆行业迈出向数字图书馆转型、建设“复合型图书馆”的第一步。

二十多年来信息技术飞速发展,经历了从传统互联网、Web2.0到移动互联网的三代变迁,目前正进入以物联网、云计算、大数据与人工智能为特征的智慧互联时代,人们早年寄希望于数字图书馆技术来解决海量、异构、非结构化、多媒体信息的管理、组织、传播和利用问题,随着大数据技术的进步早已不成问题,而数字图书馆本身也从一个以技术研发为特征的应用领域,发展为以数字知识的保存、提供、交流和服务为特征的数字文化设施。伴随着上游知识产业生态的剧烈变化,以及下游读者用户信息需求和行为方式的巨大变化,作为一种知识中介的图书馆也应需而变,呈现出三个发展趋势:

1、从数字化到数据化

早期的数字图书馆项目主要是利用扫描技术将传统的纸本资源数字化,通过对资源内容和其他特征进行描述,建立关系型数据库提供检索,这种数字图书馆相当于传统“物理”图书馆的翻版。随着全文搜索和OCR技术的进步,越来越多的扫描图像可以经过文本化处理而提供全文检索,加上目前越来越多的原生数字内容和多媒体资源的引入,目前的数字图书馆呈现出非常纷繁复杂和丰富多彩的形态。

如果不能解决基于知识的服务问题,就谈不上是好的数字图书馆。当前的数据技术特别是关联数据等语义技术已经提供了初步的解决方案,能够使数字图书馆的基本结构单元,从图像、文本、多媒体文件等机器无法理解的内容,转变为人、地、时、事、物等“数据”信息,即“数据化”,让计算机的管理对象突破文献的限制,而直接管理内容语义,从而使数字图书馆成为真实世界和领域知识的映射。这类基于数据的数字图书馆正在成为数据驱动型科学研究的基础设施,在数字人文、e-Science 以及数字出版等领域发挥着越来越重要的作用。

2、从标准化到个性化

图书馆行业的标准化肇始于上世纪六十年代 MARC 书目数据记录格式,这可能是唯一沿用至今的磁带记录格式,几乎所有图书馆都基于这一格式设计业务流程和服务模式,尽管各类 MARC 略有不同,但没有哪一个行业像图书馆这样重视并应用最前沿的技术标准。

然而越早采用信息技术也就意味着今天包袱越重。标准化是工业时代的理念,它能够带来合作和效率,但信息时代强调的是差异化带来的个性化体验。当前不同类型图书馆由于用户对象的不同和资源类型的不同而呈现完全不同的发展方向,老的业务规范已不再能涵盖所有图书馆,新扩展的子系统完全无法覆盖所有类型的图书馆,标准化已不再可能,新的差异化的业务模式正在建立,图书馆与图书馆将呈现越来越不相同的形态和模式。

目前看来,公共图书馆将继续承担起文化保存、信息交流和普遍均等无差别知识服务的职能,开展阅读普及、消除信息鸿沟、提供信息素养培育是其不可推卸的责任;高校图书馆则必须顺应数据驱动型科研和教学的转变,承担起科研数据生命周期完整过程的管理和提供,同时提供各类共享空间服务;研究型图书馆则完全依靠学科馆员和数据馆员,转型为提供智慧型数据服务为主的无纸图书馆和虚拟图书馆。

整个知识产业上下游融合的趋势日渐明显,内容产业大洗牌,互联网公司全面介入知识生产流通在所难免。在这个新的产业生态中,图书馆由于拥有大量的读者,以熟悉读者的需求、掌握用户行为大数据作为利基,介入开放存取运动,甚至参与学术出版也不是没有可能。

3、从信息化到智慧化

智慧型社会是未来社会的重要特征,也是当前各行各业激烈角逐的主要战场。得益于过去数十年来全社会对于信息化的巨大投入,产生的海量数据为目前人工智能的进步提供了丰富的食粮。图书馆从来是与数据打交道的,从服务的内容和对象来看,图书馆的服务也应该精准化和智能化,智慧图书馆也无疑是数字图书馆的发展方向。

图书馆行业很早就提出智慧图书馆的概念,目前也是数字图书馆研究的一个热点。就采用的技术来看,如下表所示,智慧图书馆的发展可以分为四个阶段,第一代智慧图书馆只是采用了无线射频(RFID)技术的无人图书馆,其实并无任何人工智能的采用。第二代是当前研发的重点,通过采用多种传感器实现各类数据的采集,从而能够提供基于位置的精准服务(或称为SoLoMo,即社会化的基于位置的移动服务)。目前的各类机器学习技术已经为第三代智慧图书馆提供了可能,将对于信息内容的加工处理和提供服务两方面全面实现智慧化。第四代“超智慧”有赖于超级人工智能的突破和应用,目前还是科学幻想,但引起的讨论颇能给人启发。

表:四种智慧图书馆

类型

说明

特征

举例

伪智慧

通过应用RFID等智能标签技术,感知与反馈结合,一定的行为引发一定的结果,“好像”有了一定的智慧。已经实现。

单向度(仅感知图书等实体)、单循环

无人图书馆

智慧图书馆

弱智慧

各类传感器(如iBeacon、WIFI、人脸识别)应用模型和算法综合应用,可进行推送等个性化服务,实现了按程序设计好的“智慧”。正在实现。

多条件,复杂,类似于专家系统,双向,预先设定

小i参考咨询机器人

SoLoMo

强智慧

人工智能和机器学习的普遍应用,动态实时地应对复杂情况,无须预先设定,智能响应。有可能实现。

交互性、随机性;

智能化、人性化

*第三代图书馆*

超智慧

图书馆能够像人一样思考,具有人类知识的总和,总能在你需要的时间和地点,提供需要的知识服务。

应用强人工智能,图书馆工作的许多岗位被机器取代

化于无形,无所不在,随处服务

综上所述,数字图书馆概念由于受到技术进步的强烈影响,一直在发展变化,然而万变不离其宗的是人们赋予它的永恒职能,即保存文化、开展教育、传递信息和终身学习。即便到了数字时代,变化的只有方式和手段,图书馆永远都是天堂一般的模样。

 

近期图书馆技术趋势

  1. 移动化:关注并尽可能提供移动服务
  2. 电子书借阅:尽早开展数字阅读,并统一服务政策,数字资源服务纳入绩效考核
  3. 数字馆藏建设:地方或特色数字资源建设
  4. 统一的资源发现:取代OPAC,把电子书及其它数字内容纳入到馆藏揭示体系中
  5. 逐步放弃传统的集成管理系统:采用基于云服务的管理系统
  6. 追身服务:学科馆员,随时随地
  7. 作为空间的图书馆:讲座会议展览沙龙培训diy创客创新活动空间
  8. 图书馆建筑布局:再一次藏用分离的趋势
又要讲趋势了。总结了上述八项,欢迎板砖。

在Springer电子书与图书馆馆藏发展论坛上的致辞

在Springer电子书与图书馆馆藏发展论坛上的致辞
20130418
众所周知,现代图书发端于1450年前后的德国。数百年来,它带来了知识的平民化,推动了人类记忆的存续,点燃了文艺复兴的火种,促进了科技的创新和两次工业革命,奠定了现代社会形态的基础,使科技能不断站在巨人肩膀上发展,使人类社会以一种不断迭代方式积累知识、创造财富。今天,我们越来越多的人相信,这种传统的、以纸张作为介质的图书正在走向它生命的终点,图书所负载的灵魂正在以数字化虚无缥缈的形式无所不在,而当你需要时候能够瞬间出现在你的眼前。
我们很高兴地看到,同样来自德国的Springer出版公司在全球顶尖的科技出版领域引领着这场变革。凭借其1842年创立的近两百年基业,以先知般的睿智和超越同侪的勇气,于上世纪末率先涉足网络出版,这其实是一场自我革命。可喜的是迄今已取得非常好的效果,在这场颠覆性的变革中继续稳坐钓鱼台。
现代图书馆是现代出版的受益者,同时也是整个出版生态中不可或缺的一环,肩负着为人找书、为书找人的永恒的职责。面对数字化变革的浪潮,图书馆行业虽能先知先觉、上下求索,为继续履行其天堂般的职责而奔走呼号,但却碍于其公益性质,势单力薄、步履艰难。在图书馆最需要与上游行业协力共进的时候,有很多出版社却设定了违背图书馆职业理念的所谓新模式,他们忘了,图书馆和出版社,既是利益分享、风险共担的伙伴,更是患难与共、唇齿相依的兄弟。
Spinger在这方面树立了一贯的楷模,它在获取商业利益、实现自身企业价值的同时,既帮助图书馆实现各项职能,又充分尊重图书馆倡导知识自由、信息无障碍以及人类知识的永久保存理念。它的电子书支持购买模式而不是只能租用,允许馆际互借,无复本限制,甚至无DRM,还提供完整的MARC记录供图书馆进行数据整合,它让图书馆真正感到得道多助、德者不孤。
今天Springer在这里发布又一款数字图书新产品,再一次把历史的厚重带到这浅阅读和碎片化阅读时代。我们怀着满腔的热情和极大的期待,祝愿Springer取得圆满成功!

数字图书馆先导研究计划第二期(1999~ 2002)

1998 年春,在首期 先导研究计划面临结束 之时,经过认真的总结和调研,美国政府打算从各个层面加深拓宽研究领域,于是发布了先导研究计划第二期 招标书 。

首先,主办机构从首期的三个赞助,增加到七个,增加的四个机构是美国国会图书馆 (LC, Library of Congress) 、美国国立医学图书馆( NLM , National Library of Medicine )、美国人文学科基金会( NEH , National Endowment for the Humanities )和美国联邦调查局( FBI , Federal Bureau of Investigation ),可见增加了图书馆的比重应用成分。其次,项目的持续时间和经费增加了。 DLI2 计划持续 5 年,五年中上述 6 个单位计划提供 4000 到 5000 万美元。第三,为了资助更多的项目,资助方法与第一期有所不同。到 99 年 9 月为止就有 30 个项目入围,目前(至 2000 年 10 月)已经有 36 个项目获得资助。这些项目分为两类:单独的研究项目和多学科综合项目,单独项目资助一到三年,资助上限为 20 万美元,大项目资助一到五年,资助上限为 120 万美元。第四,研究目标有所侧重,重点提出三个中心:以人为中心、以系统为中心、以技术为中心,具体研究目标是:

l 为数字图书馆界定适当的发展领域,有选择性的开展研究和实验活动;

l 使数字化资源的扩充、管理、存取更加迅速、便利,增加利用信息的深度;

l 创造新方法、新机会,使数字图书馆更好地为不同教育水平的、现有的和潜在的用户群服务;

l 推动从社会学和经济学角度对人与数字图书馆交互作用的研究。

第五,极大地扩展了数字图书馆应用领域,首期项目以研究为主,所牵头的六个高校都具有极强的计算机技术背景,而这一期涉及到许多专业领域。当然图书馆和情报方面还嫌太少,虽然有一些项目针对情报检索问题(如加州伯克力大学项目),但总的比例太小。可喜的是确有一些图书情报专家领衔进行一些项目的开发工作。第六,该期计划加强了项目管理,同时也注意促进项目间的交流和成果的转化与推广。该计划重新建立了一个网页,将所有项目分为资助项目( 36 个)、大学教育项目( 8 个,专为提供大学教育用的学科资源库建设)、国际合作项目(与英国、德国和欧盟合作的一个项目)、特别项目( 14 个)及专题研讨会等 5 个栏目,包含了最新会议及项目进展的介绍,所有阶段性研究报告都可以找到,还有大量的新闻、事件、论文、报告、相关项目和相关信息的链接。

图表参见 Edward A. Fox “Digital Libraries Initiative (DLI) Projects (1994-1999)” Bulletin of the American Society for Information Science October/November 1999 。由于涉及到三十多个具体项目,在此无法一一介绍,请参阅 DLI2 网页: http://www.dli2.nsf.gov 。


Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552982

本人收集的数字图书馆定义汇总(2000年以前)

数字图书馆定义

定 义

北图的定义

数字图书馆是没有时空限制的、便于使用的、超大规模的知识中心

国际通行的定义

数字图书馆为国家信息基础设施提供关键性信息管理技术,同时提供其主要的信息库和资源库。换句话说,数字图书馆是国家信息基础设施的核心

其它定义

数字化图书馆就是图书馆在线服务系统;

数字图书馆就是以数字形式存贮和处理信息的图书馆;

数字图书馆是指图书馆所有的工作流程都基于计算机,而且馆藏资源都实现数字化;

所谓 ” 数字图书馆 ” 就是图书馆馆藏实现数字化管理,并上网服务,供读者随时随地查阅;

数字图书馆是指通过多种技术将各种文献数字化,并将其组织起来在网上提供信息服务的信息中心或数据库;

数字化图书馆实际就是人们所说的电子图书馆、虚拟图书馆、无墙图书馆,不同的称谓只是人们从不同的角度描述数字化图书馆的特征;

其它定义

数字式图书馆为国家信息基础设施提供关键性的信息管理技术,同时提供主要的信息源和资源库。换言之,数字式图书馆是国家信息基础设施的核心;

数字图书馆一般而言是指利用当今先进的数字化技术,通过诸如 Internet 国际互联网等计算机网络,使人数众多且又处在不同地理位置的用户能够方便地利用 … ;

数字图书馆是一个数字化系统。它将分散于不同载体,不同地理位置的信息资源以数字化的形式贮存,以网络化的方式互相连接,提供及时利用,实现资源共享,其核心是数字化和网络化;其实质则是形成有序的信息空间;

数字图书馆是一个大系统,它具有分布的、大规模的和有组织数据库和知识库,用户或用户团体可对系统内的数据库和知识库进行一致性的访问,获得自己所需的最终情报;

1. http://www.ifla.org/documents/libraries/net/arl-dlib.txt

[ Berkeley Digital LibrarySunSITE]

Definition and Purposes of a Digital Library

Association of Research Libraries

October 23, 1995

Definition

There are many definitions of a “digital library.” Terms such as

“electronic library” and “virtual library” are often used synonymously. The

elements that have been identified as common to these definitions[1] are:

* The digital library is not a single entity;

* The digital library requires technology to link the resources of many

* The linkages between the many digital libraries and information

services are transparent to the end users;

* Universal access to digital libraries and information services is a

goal;

* Digital library collections are not limited to document surrogates:

they extend to digital artifacts that cannot be represented or

distributed in printed formats.

Purposes

The purposes of a North American digital library system[2] are:

* to expedite the systematic development of: the means to collect,

store, and organize information and knowledge in digital form; and of

digital library collections in North America ;

* to promote the economical and efficient delivery of information to all

sectors of North American society;

* to encourage co-operative efforts which leverage the considerable

investment in North American research resources, computing and

communications network;

* to strengthen communication and collaboration between and among the

research, business, government, and educational communities;

* to take an international leadership role in the generation and

dissemination of knowledge in areas of strategic importance to North

America ;

* to contribute to the lifelong learning opportunities of all North

Americans.

[1] See: Drabenstott, Karen M. Analytical review of the library of the

future, Washington , DC : Council Library Resources, 1994.

[2] Adapted from The CAN-LINKED Initiative, a proposal for the co-ordinated

development of a distributed national digital library system in Canada ,

prepared by a group of academic and research libraries. February, 1995.

——————-

Association of Research Libraries

October 23, 1995

Copyright ?Association of Research Libraries 1995. All rights reserved.

Document maintained at http://sunsite.berkeley.edu/ARL/definition.html by

the SunSITE Manager.

Last update 1/10/96 . SunSITE Manager: manager@sunsite.berkeley.edu

2. UCLA-NSF Workshop on Social Aspects of Digital Libraries, Final report, November, 1996 http://www-lis.gseis.ucla.edu/DL/UCLA_DL_Report.html#introduction

The core premise of the workshop was that digital libraries represent a set of significant social problems that require human and technological resources to solve. Workshop participants were charged with appraising the scope of social aspects of digital libraries, assessing what is known about these problems, and identifying the research and development issues that need to be addressed to solve them. Our first task was to define “digital libraries.” We determined that digital libraries encompass two complementary ideas:

  • Digital libraries are a set of electronic resources and associated technical capabilities for creating, searching, and using information. In this sense they are an extension and enhancement of information storage and retrieval systems that manipulate digital data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks. The content of digital libraries includes data, metadata that describe various aspects of the data (e.g., representation, creator, owner, reproduction rights), and metadata that consist of links or relationships to other data or metadata, whether internal or external to the digital library.
  • Digital libraries are constructed — collected and organized — by a community of users, and their functional capabilities support the information needs and uses of that community. They are a component of communities in which individuals and groups interact with each other, using data, information, and knowledge resources and systems. In this sense they are an extension, enhancement, and integration of a variety of information institutions as physical places where resources are selected, collected, organized, preserved, and accessed in support of a user community. These information institutions include, among others, libraries, museums, archives, and schools, but digital libraries also extend and serve other community settings, including classrooms, offices, laboratories, homes, and public spaces.

The first idea emphasizes the fact that digital libraries are computer-based systems constructed for people to use and that they are extensions of information storage and retrieval systems. The second emphasizes the belief that digital libraries should be constructed in a way that accommodates the actual tasks and activities that people engage in when they create, seek, and use information resources; in this sense they are an extension of physical environments. Both assert that digital libraries are sets of information resources collected and organized on behalf of a community.

Embedded in this definition are complex concepts with meanings that vary by context and by field of study. The terms ìinformation,î ìcommunity,î and ìlibraryî are the most problematic. Definitions of ìinformationî abound: signal processing; sensory perception; data generated by individuals and groups; objects that can be managed in retrieval systems; intellectual commodities that can be exchanged in the marketplace; etc. ìCommunityî implies a group of people with something in common, but those common features may be permanent or temporary, static or dynamic, innate or selected; biological or cultural, etc. — and any one individual can be a member of many communities at once. A ìlibraryî is often narrowly defined in technical contexts as a database application, while in other contexts a ìlibraryî is a social institution that selects, collects, organizes, preserves, conserves, and provides access to information on behalf of a community. Even the term ìdigitalî is problematic, for it reflects both ìdigital objectsî — those created in digital form, and “digitized objects” — those that are representations (e.g., scanned images, keyed text) of objects in other forms.

3. ( ref. To 2 ) http://www-lis.gseis.ucla.edu/DL/dl_handout.html

As a National Challenge Project under the NII/IITA, Digital Libraries represent a set of significant societal problems that require human and technological resources to solve.

Digital libraries represent two complementary ideas:

  • Digital libraries are a set of resources and associated technical capabilities for creating, searching, and utilizing information. In this sense they are an extension of information storage and retrieval systems that manipulate digitized data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks.
  • Digital libraries are virtual communities in which individuals and groups interact with data, information, and knowledge resources and systems. In this sense they are an extension, enhancement and integration of a variety of information institutions as physical places where resources are selected, collected, organized, preserved, and accessed in support of a user community. These information institutions include, among others:
  • Libraries
  • Museums
  • Archives
  • Schools
  • Laboratories

4. Gladney, Henry M. et. al. Digital Library: Gross Structure and Requirements (Report from a Workshop.) IBM Research Report RJ 9840, May 1994. http://www.ifla.org/documents/libraries/net/rj9840.pdf

A digital library is a machine readable representation of materials which might

be found in a university library together with organizing information intended

to help users find specific information. A digital library service is an assemblage

of digital computing, storage, and communications machinery together with the

software needed to reproduce, emulate, and extend the services provided by

conventional libraries based on paper and other material means of collecting,

storing, cataloging, finding, and disseminating informatio n. A full service digital

library must accomplish all essential services of traditional libraries and also

exploit digital storage, searching, and communication.

Public, private, professional, school, commercial, and other kinds of library

emphasize different services, different kinds of information, and different service

styles. While any digital library instance may thus offer only partial services, the

technology suite from which library instances are assembled must permit

assembly of a full service library. In addition, this suite must shield the user

who wishes to draw on multiple libraries from inter-library differences which are

irrelevant to him.

What distinguishes a conventional library from a heap of things to read is

organization provided by someone other than the authors of the collected

materials. For a small, private collection this could be shelf organization; for a

large collection it is typically a descriptive catalog 2 which is distinct from the

collection, with at least one catalog record associated with each item held.

Not every database is a library, but every library is a database 3 . What distin-guishes

a library from an arbitrary database are certain data integrity and

security rules that constitute an implicit contract between custodians and users.

5. The NSF/ARPA/NASA Digital Library Initiative, FY 1994 Na93 states:

“Information sources accessed via the Internet are ingredients of a digital library. Today, the

network connects some information sources that are a mixture of publicly available (with

or without charge) information and private information shared by collaborators. They

include reference volumes, books, journals, newspapers, national phone directories, sound

and voice recordings, images, video clips, scientific data (raw data streams from instruments

and processed information), and private information services such as stock market reports

and private newsletters. These information sources, when connected electronically through

a network, represent important components of an emerging, universally accessible, digital

library.”

Digital Library Initiative, FY 1994, A joint initiative of the National Science Foundation, the Advanced Research Projects Agency, and the National Aeronautics and Space Administration, U.S. Government document NSF 93-141, (1993).

6. In a prior DL workshop report Fo93,p.65 , we find:

“A digital library is a distributed technology environment which dramatically reduces barriers

to the creation, dissemination, manipulation, storage, integration, and reuse of information

by individuals and groups.”

http://ei.cs.vt.edu/~dlib/def.htm E.A. Fox (ed.), Source Book on Digital Libraries, TR93-35, Dept. of Computer Science , Virginia Tech, (1993);

“Digital libraries are complex data/information/knowlege (hereafter information) systems that

help: satisfy the information needs of users (societies), provide information services (scenarios),

organize information in usable ways (structures), manage the location of information (spaces), and

communicate information with users and their agents (streams).”

(Edward A. Fox, July 1999, according to 5S Framework)

l

“Digital library work occurs in the context of a complex design space shaped by four dimensions:

community, technology, services and content”

(Gary Marchionini and Edward A. Fox, “Progress toward digital libraries: augmentation through

integration”, pp. 219-225, guest editors' introduction to “Progress Toward Digital Libraries”, eds.

Gary Marchionini and Edward A. Fox, Special Issue, Information Processing & Management,

35(3), May 1999.)

l

“The field of digital libraries deals with augmenting human civilization through the application of

digital technology to the information problems addressed by institutions such as libraries, archives,

museums, schools, publishers and other information agencies. Work on digital libraries focuses on

integrating services and better serving human needs, through holistic treatment irrespective of

interface, location, time, language and system. Although substantial collections may be created

solely for the use of individuals, we consider sharable resources one of the defining characteristics

of libraries. Libraries connect people and information; digital libraries amplify and augment these

connections.”

(Gary Marchionini and Edward A. Fox, “Progress toward digital libraries: augmentation through

integration”, Information Processing & Management, 35(3):219-225, May 1999.)

l

For a thoughtful discussion of definitions, approaches, and community perspectives on “digital

libraries” see “What are digital libraries? Competing visions” by Christine L. Borgman, pp.

227-244, in “Progress Toward Digital Libraries”, eds. Gary Marchionini and Edward A. Fox,

Special Issue, Information Processing & Management, 35(3), May 1999.

l

“The generic name for federated structures that provide humans both intellectual and physical

access to the huge and growing worldwide networks of information encoded in multimedia digital

formats.”

(The University of Michigan Digital Library: This Is Not Your Father's Library, Birmingham ,

1994)

l

“Systems providing a community of users with coherent access to a large, organized repository of

information and knowledge.”

(Lynch, 1995)

l

“Digital libraries are a set of electronic resources and associated technical capabilities for creating,

searching, and using information. In this sense they are an extension and enhancement of

information storage and retrieval systems that manipulate digital data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks. The content of digital libraries includes data, metadata that describe various aspects of the data (e.g., representation, creator, owner, reproduction rights), and metadata that consist of links or relationships to other data or metadata, whether internal or external to the digital library.

(UCLA-NSF Social Aspects of Digital Libraries Workshop)

Digital libraries are constructed — collected and organized — by a community of users, and their

functional capabilities support the information needs and uses of that community. They are a

component of communities in which individuals and groups interact with each other, using data,

information, and knowledge resources and systems.In this sense they are an extension,

enhancement, and integration of a variety of information institutions as physical places where

resources are selected, collected, organized, preserved, and accessed in support of a user

community. These information institutions include, among others, libraries, museums, archives,

and schools, but digital libraries also extend and serve other community settings, including

classrooms, offices, laboratories, homes, and public spaces.” (UCLA-NSF Social Aspects of

Digital Libraries Workshop)

l

“systems providing a community of users with coherent access to a large, organized repository of

information and knowledge. This organization of information is characterized by the absence of

prior detailed knowledge of the uses of the information. The ability of the user to access,

reorganize, and utilize this repository is enriched by the capabilities of digital technology”

(adapted from Interoperability, Scaling, and the Digital Libraries Research Agenda)

l

“Digital library is a concept that has different meanings in different communities. To the

engineering and computer science community, digital library is a metaphor for the new kinds of

distributed data base services that manage unstructured multimedia data. To the political and

business communities, the term represents a new marketplace for the world's information resources

and services. To futurist communities, digital libraries represent the manifestation of Wells' World

Brain. The perspective taken here is rooted in an information science tradition.”

(Research and Development in Digital Libraries by Gary Marchionini)

l

“A digital library is a distributed technology environment which dramatically reduces barriers to

the creation, dissemination, manipulation, storage, integration, and reuse of information by

individuals and groups.”

(Edward A. Fox, editor, Source Book on Digital Libraries, pg. 65)

l

“A digital library is a machine readable representation of materials which might be found in a

university library together with organizing information intended to help users find specific

information. A digital library service is an assemblage of digital computing, storage, and

communicate machinery together with the software needed to reprise, emulate, and extend the

services provided by conventional libraries based on paper and other material means of collecting,

storing, cataloging, finding, and disseminating information.”

(Edward A. Fox, editor, Source Book on Digital Libraries, pg. 65)

l

“an organized data base of digital information objects in varying formats maintained to provide

unmediated ease of access to a user community, with these further characteristics:

– an overall access tool (e.g. a catalog) provides search and retrieval capability over the entire data

base;

– organized technical procedures exist through which the library management adds objects to the

data base and removes them according to a coherent and accessible collections policy.”

(Peter Graham, Rutgers University Libraries)

l

“A library that has been extended and enhanced by the application of digital technology. Important

aspects of the digital library that may be extended and enhanced include :

– Collections of the library

– Organization and management of the collections

– Access of the library items and the processing

of the information contained in the items

– Communication of information about the items “

(Smith, 1995)

7. http://www.nlc-bnc.ca/pubs/nl-news/1998/feb98e/3002-06e.htm

“The literature on digital libraries contains numerous, often dissimilar, definitions of 慸 igital library'. These definitions range from the digital library as a computer data repository or a collection of digital objects, to much broader definitions that consider the digital library to be an extension of the traditional library: that is, a library that carries out the traditional library functions of collection, preservation and access provision, while integrating, to an increasing degree, digital media and remotely accessible digital library services. For librarians, this last definition is most realistic….Digital libraries are libraries , with the same purposes, functions and goals as traditional libraries.” 1

加拿大国家图书馆的数字图书馆理解

8. http://www.dl.ulis.ac.jp/ISDL97/proceedings/collier.html Towards a general theory of the Digital Library

9. http://scholar.lib.vt.edu/staff/accessibility/bobby-report-042099/7b.html Digital Library Definition for DLI2

10. Griffin , Stephen M. (Program Manager of the Digital Libraries Initiative, NSF) interview: “Taking the Initiative for Digital Libraries, ” The Electronic Library, vol. 16, no. 1, Feb. 1998: 24-27.

…digital libraries provide for collection development, organisation, access, annotation and preservation, and deal both with information in digital form as well as digital management of information residing on physical media. My definition places additional emphasis on the need to consider users and usage as part of any analytical framework used to study digital libraries.

<p style=”MARGIN: 0cm 0cm 0pt 21pt; TEXT-INDENT: -21pt; tab-stops: list 21.0pt; mso-list: l3 level1 lfo1″ class=”MsoNo

数字图书馆的概念成型期(1994~1999)

虽然本人认同较为宽泛的定义,但我们仍然需要清晰地了解数字图书馆概念的产生和演变的历史,我们应该知道别人所谈论的”数字图书馆”是什么概念,与我们是否有什么不同,这样我们在交流时才可能更好地沟通和彼此理解。

站在今天的角度,可以认为过去的二十多年一直在为数字图书馆的突现进行技术积累,清除技术障碍。直至 90 年代早期,一系列的技术进步彻底破除了建立数字图书馆所面临的最后障碍。虽然技术永远是不充分的,但经济廉价的设备和急剧成长的网络规模最终产生了量变到质变的飞跃:数字图书馆最终成为一个明确的研究开发领域,而获得大量的研究经费,得到高度重视。

1993 年 11 月至 1994 年 2 月间,美国连续有四次与”数字图书馆”有关的专题会议召开 [1] ,”数字图书馆”这一名词已经不是计算机界或图书馆界的专业术语,而成了许多专业会议的口头语。”数字图书馆”这一名词被广泛使用用,此时人们对于规范数字图书馆这一概念内涵提出了强烈要求。这一概念最早来自于人们对于计算机信息处理能力的憧憬,来自于技术所提供的可能性,也来自于构建国家信息基础设施的要求。从文献上看,自 1993 年至 1998 年,美国进行过数次大规模的研讨,包括后面将提到的美国信息基础结构技术与应用工作组 IITA( 全称 U.S. Government&apos;s Information Infrastructure Technology and Applications) 的专题研讨,虽然并没有形成完全统一的认识,但无疑对统一认识、交流成果起到了非常积极的作用。

首当其冲的依然是具有美国政府背景的研究机构及非赢利性公司等。 1986 年成立的美国”国家先导研究公司”( Corperation of National Research Initiative ,简称 CNRI )是一个非赢利性研究机构,其总裁兼首席执行长( CEO )曾经是美国国防部高级研究计划署信息处理部主任、 Internet 前身 ARPANET 的主要设计者、被《今日美国》称作因特网之父的罗伯特 · 卡恩( Robert E. Kahn ,见照片)。 CNRI 公司主要从美国政府获得经费,承担许多国家信息基础设施建设所必须的基础性研究,可以说是设计美国国家信息高速公路的主要机构,后来负责维护大多数因特网协议、标准及草案等等。”数字图书馆的基础结构”是卡恩 1995 年发表的数字图书馆奠基之作 [2] ,从某种意义上说卡恩也是数字图书馆之父。

该报告确立的数字图书馆基础结构获得了随后大多数研究计划的一致支持,被称为 Kahn-Wilensky 结构(下文简称 k-w 结构),曾有 William Arms 等写过为数不多的几篇论文对这个主题进行进一步深化和讨论 [3][4] ,但基本都沿用了该报告提出的基本概念和体系结构。本书将在第 章中较为详细地介绍这一体系结构。该报告提出的数字图书馆是一个在广域网中面向对象的分布式的数字资源组织体系。提出这些想法能够从本质上改进目前因特网在资源组织上的与生俱来的弱点。该报告提出一整套新的概念体系,例如”数字对象” (digital objects) 、”调度系统” (handle system) 、”元数据与键元数据”、”统一资源命名域 (URN:Universal Resources Namespace) 及其认证”、”资源库访问协议” (repository access protocol) 等,影响了以后的所有数字图书馆技术研发项目,包括美国数字图书馆先导研究计划( DLI1 )中的许多项目、美国国会图书馆的国家数字图书馆计划以及各大公司对于数字图书馆的理解。可能由于该报告提出的设想过于”基础”,实际上是对整个因特网结构的优化,在因特网的应用如日中天之时,不可能得到普遍推广,到目前为止我们还只能看到一些试验性应用开发项目。

该公司并不满足于提出一些基本概念和基础结构,而是与美国政府资助的许多数字图书馆项目密切合作,不断推出一些试验原型系统或”测试平台” (Testbed) ,并利用其下属著名的”数字图书馆杂志”( http://www.dlib.org )发表成果,展开交流讨论。

《数字图书馆杂志》创刊于 1995 年 7 月,全称是 d-lib magazine: a magazine of the digital library forum ,至今已发表了大量的高水平的数字图书馆研究论文,成为名副其实的论坛。该杂志很好地利用了电子出版的所有优势,同时借鉴了传统期刊的特点(例如准时、定期出版,对过刊的完整保留等),不仅是学术研究工具,同时其本身也成为数字图书馆许多新观念新理念的实践者。这是一本数字图书馆领域名副其实的核心期刊,具有难以替代的地位,并且做到了”免费”与”高质量”这一对矛盾的和谐统一。

1994~1995 年间美国关于数字图书馆方面的研讨会( workshop )不断,美国政府感到有必要统一大家对这个问题的看法,于是美国信息基础结构技术与应用工作组( U.S. Government&apos;s Information Infrastructure Technology and Applications :简称 IITA )组织了一次声势浩大的专题研究,试图弄清楚数字图书馆的研究范围、内容和应采取的步骤。 IITA 是美国航空航天局 NASA 设立的一项”高性能计算与通信计划( High Performance Computing and Communications Program ,简称 HPCC )”中的一个项目组 ,是美国国家信息基础结构 NII 的最高技术委员会。 会议邀请了多达 60 位数字图书馆及相关领域的活跃分子,向他们询问了三个基本问题:

a. 什么是数字图书馆?它与一般的信息库或因特网有什么区别?将会有多少数字图书馆?它们相互之间的关系怎样?用户看到的数字图书馆是怎样的?

b. 数字图书馆需要怎样的基础结构?由哪些要素组成?与 NII 所需的更宽泛的基础结构有何不同?基础结构与标准的关系如何?谁会使用这些基础结构?这些基础结构怎样处理与知识产权管理有关的出版商关心的问题?

c. 怎样评价数字图书馆?如何知道三四年后现在的研究项目成功地为用户开发了有效的数字图书馆服务?

为了使会议避免无休止的争论、更好地达成一致看法,会议还根据专家的不同背景分了五个小组,它们是:出版界、商业、图书馆界、因特网领域和多媒体领域,分别进行讨论和总结 [5] 。会议就数字图书馆研究急需解决的问题达成了初步一致的意见,并基本确认了 k-w 结构作为数字图书馆基础结构所确立的基本框架。结论分为 5 个方面:互操作性、数字对象及对象库的描述、收藏的管理与组织、用户界面与人机交互以及经济、社会和法律问题,为以后的研究工作确立了框架,理清了思路,划定了边界,对以后美国国内数字图书馆的研究发展产生了巨大的影响。

[1] 1994 年 IBM Research Report RJ 9840, May 1994.Submitted to IEEE Computer Society Press, Proc. Workshop on On-line Access to Digital Libraries ,见本书网页: http://www.libnet.sh.cn/introdl/ 。

[2] Robert Kahn and Robert Wilensky, “A Framework for Distributed Digital Object Services”, May 1995. (http://WWW.CNRI.Reston.VA.US/home/cstr/arch/k-w.html)

[3] William Y. Arms “Key Concepts in the Architecture of the Digital Library” D-Lib Magazine, July 1995

[4] William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

[5] 见 IITA 有关资料。

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552968

数字图书馆初创期(1993年以前)

Vannevar Bush 在大脑中发明的信息机” Memex ” [1] 一直被当作数字图书馆的概念起源, 1945 年的计算机甚至连存储设备都没有, Bush 设想的 Memex 系统以缩微作为信息的存储体,计算机负责信息索引和查询,实际上是一个计算机辅助检索系统。这个想法在 50 年代至 60 年代就被马萨诸塞技术学院实现了,该学院的 Intrex 项目将一个收藏两万篇科学文献的缩微库与一个计算机目录检索系统相连,实现了自动检索。

第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到 20 世纪 60 年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统( Ohio Bar Automated Research System ,是后来著名的 LEXIS 系统的前身)能够提供法律状态的联机检索,空军建立的法律信息电子系统( LITE )索引了当时美国所有的法律法规和司法解释,提供检索服务。 70 年代 IBM 基于文本存储与检索技术开发了 STAIRS 系统,安装在许多大型机中,提供当时许多图书馆用于流通管理等。虽然当时面临一系列的技术障碍,例如昂贵的计算机、居高不下的存储成本、简陋的用户界面以及网络的缺乏,仍然产生了上述可圈可点的应用,当然图书馆界最值得一提的事件是美国国会图书馆成功开发了 MARC 格式,这是一种机读目录格式。美国图书馆联机中心( OCLC )多年来利用 MARC 为全球的图书馆进行服务,节省了可观的费用。

同时早期产生了一些信息服务,如联合编目、法律信息系统和美国国家医学图书馆的 Medline 联机数据库系统等,当时采用的是主机 – 终端模式,少量的信息装载在一台大型计算机上,用户坐在专门的终端前,通过一种低速的通信联接(例如电话线或专用网络)与中央计算机交换信息。这些系统要求用户训练有素,以便通过简陋的字符型人机界面,自动搜索,获取本地无法得到的信息。这种模式一直沿用到八十年代中期,这时大型国际联机检索系统,例如 DIALOG 、 ORBIT 、 STN 等已获得普遍应用,通过它们, Medline 、化学文摘( CA )、科学文摘( INSPEC )、美国政府研究报告( NTIS )、世界专利文摘( WPI )等非常重要的科学数据库得到广泛传播,虽然通信费用昂贵,仍然成为各国有一定规模的图书馆和信息机构所必备的信息源。

真正形成数字图书馆概念核心的技术应用发生在 80 年代中期,随着计算机信息存储成本的大幅下跌和信息处理能力的提高,特别是个人电脑的普及, 1985 年产生了 CD-ROM 这种电子出版的主要载体,接着多媒体出现,一时间联机( Online )和光盘成了两种互相竞争的技术,万维网的出现和迅速普及打断了这种争论,多媒体数字信息,而不仅仅是二次文献或事实型数据库全面通过网络提供成为可能,半个世纪的数字图书馆的畅想从云端落到了地面。

在这里我们把万维网出现之前的一些通过网络提供服务的全文信息系统看作是早期数字图书馆应用,它们中有许多延续至今,且已经改头换面,但仍然是数字图书馆的先驱,它们为数字图书馆概念框架的形成做出了许多贡献,参与这些系统设计和开发的许多专家都成了后来数字图书馆领域的活跃分子。这些项目有卡内基 • 梅隆大学的 Mercury 计划、康奈尔大学的 CORE 计划、 Elsevier Science Publishing 的 Tulip 计划、以及著名的美国国会图书馆”美国记忆”计划等等。

美国弗吉尼亚技术大学的 Edward A. Fox 在《 Digital Library Source Book 》中详细介绍了”数字图书馆”在美国产生和兴起初期的情况,介绍了当时召开的一些著名的研讨会,阐述了美国政府基于战略上的考虑,积极促进其研究部门,如美国科学基金会等,在催生数字图书馆中所起的重要作用。


[1] 见 http://www.theatlantic.com/unbound/flashbacks/computer/bushf.htm

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552949