数字图书馆的概念成型期(1994~1999)

虽然本人认同较为宽泛的定义,但我们仍然需要清晰地了解数字图书馆概念的产生和演变的历史,我们应该知道别人所谈论的”数字图书馆”是什么概念,与我们是否有什么不同,这样我们在交流时才可能更好地沟通和彼此理解。

站在今天的角度,可以认为过去的二十多年一直在为数字图书馆的突现进行技术积累,清除技术障碍。直至 90 年代早期,一系列的技术进步彻底破除了建立数字图书馆所面临的最后障碍。虽然技术永远是不充分的,但经济廉价的设备和急剧成长的网络规模最终产生了量变到质变的飞跃:数字图书馆最终成为一个明确的研究开发领域,而获得大量的研究经费,得到高度重视。

1993 年 11 月至 1994 年 2 月间,美国连续有四次与”数字图书馆”有关的专题会议召开 [1] ,”数字图书馆”这一名词已经不是计算机界或图书馆界的专业术语,而成了许多专业会议的口头语。”数字图书馆”这一名词被广泛使用用,此时人们对于规范数字图书馆这一概念内涵提出了强烈要求。这一概念最早来自于人们对于计算机信息处理能力的憧憬,来自于技术所提供的可能性,也来自于构建国家信息基础设施的要求。从文献上看,自 1993 年至 1998 年,美国进行过数次大规模的研讨,包括后面将提到的美国信息基础结构技术与应用工作组 IITA( 全称 U.S. Government's Information Infrastructure Technology and Applications) 的专题研讨,虽然并没有形成完全统一的认识,但无疑对统一认识、交流成果起到了非常积极的作用。

首当其冲的依然是具有美国政府背景的研究机构及非赢利性公司等。 1986 年成立的美国”国家先导研究公司”( Corperation of National Research Initiative ,简称 CNRI )是一个非赢利性研究机构,其总裁兼首席执行长( CEO )曾经是美国国防部高级研究计划署信息处理部主任、 Internet 前身 ARPANET 的主要设计者、被《今日美国》称作因特网之父的罗伯特 · 卡恩( Robert E. Kahn ,见照片)。 CNRI 公司主要从美国政府获得经费,承担许多国家信息基础设施建设所必须的基础性研究,可以说是设计美国国家信息高速公路的主要机构,后来负责维护大多数因特网协议、标准及草案等等。”数字图书馆的基础结构”是卡恩 1995 年发表的数字图书馆奠基之作 [2] ,从某种意义上说卡恩也是数字图书馆之父。

该报告确立的数字图书馆基础结构获得了随后大多数研究计划的一致支持,被称为 Kahn-Wilensky 结构(下文简称 k-w 结构),曾有 William Arms 等写过为数不多的几篇论文对这个主题进行进一步深化和讨论 [3][4] ,但基本都沿用了该报告提出的基本概念和体系结构。本书将在第 章中较为详细地介绍这一体系结构。该报告提出的数字图书馆是一个在广域网中面向对象的分布式的数字资源组织体系。提出这些想法能够从本质上改进目前因特网在资源组织上的与生俱来的弱点。该报告提出一整套新的概念体系,例如”数字对象” (digital objects) 、”调度系统” (handle system) 、”元数据与键元数据”、”统一资源命名域 (URN:Universal Resources Namespace) 及其认证”、”资源库访问协议” (repository access protocol) 等,影响了以后的所有数字图书馆技术研发项目,包括美国数字图书馆先导研究计划( DLI1 )中的许多项目、美国国会图书馆的国家数字图书馆计划以及各大公司对于数字图书馆的理解。可能由于该报告提出的设想过于”基础”,实际上是对整个因特网结构的优化,在因特网的应用如日中天之时,不可能得到普遍推广,到目前为止我们还只能看到一些试验性应用开发项目。

该公司并不满足于提出一些基本概念和基础结构,而是与美国政府资助的许多数字图书馆项目密切合作,不断推出一些试验原型系统或”测试平台” (Testbed) ,并利用其下属著名的”数字图书馆杂志”( http://www.dlib.org )发表成果,展开交流讨论。

《数字图书馆杂志》创刊于 1995 年 7 月,全称是 d-lib magazine: a magazine of the digital library forum ,至今已发表了大量的高水平的数字图书馆研究论文,成为名副其实的论坛。该杂志很好地利用了电子出版的所有优势,同时借鉴了传统期刊的特点(例如准时、定期出版,对过刊的完整保留等),不仅是学术研究工具,同时其本身也成为数字图书馆许多新观念新理念的实践者。这是一本数字图书馆领域名副其实的核心期刊,具有难以替代的地位,并且做到了”免费”与”高质量”这一对矛盾的和谐统一。

1994~1995 年间美国关于数字图书馆方面的研讨会( workshop )不断,美国政府感到有必要统一大家对这个问题的看法,于是美国信息基础结构技术与应用工作组( U.S. Government's Information Infrastructure Technology and Applications :简称 IITA )组织了一次声势浩大的专题研究,试图弄清楚数字图书馆的研究范围、内容和应采取的步骤。 IITA 是美国航空航天局 NASA 设立的一项”高性能计算与通信计划( High Performance Computing and Communications Program ,简称 HPCC )”中的一个项目组 ,是美国国家信息基础结构 NII 的最高技术委员会。 会议邀请了多达 60 位数字图书馆及相关领域的活跃分子,向他们询问了三个基本问题:

a. 什么是数字图书馆?它与一般的信息库或因特网有什么区别?将会有多少数字图书馆?它们相互之间的关系怎样?用户看到的数字图书馆是怎样的?

b. 数字图书馆需要怎样的基础结构?由哪些要素组成?与 NII 所需的更宽泛的基础结构有何不同?基础结构与标准的关系如何?谁会使用这些基础结构?这些基础结构怎样处理与知识产权管理有关的出版商关心的问题?

c. 怎样评价数字图书馆?如何知道三四年后现在的研究项目成功地为用户开发了有效的数字图书馆服务?

为了使会议避免无休止的争论、更好地达成一致看法,会议还根据专家的不同背景分了五个小组,它们是:出版界、商业、图书馆界、因特网领域和多媒体领域,分别进行讨论和总结 [5] 。会议就数字图书馆研究急需解决的问题达成了初步一致的意见,并基本确认了 k-w 结构作为数字图书馆基础结构所确立的基本框架。结论分为 5 个方面:互操作性、数字对象及对象库的描述、收藏的管理与组织、用户界面与人机交互以及经济、社会和法律问题,为以后的研究工作确立了框架,理清了思路,划定了边界,对以后美国国内数字图书馆的研究发展产生了巨大的影响。

[1] 1994 年 IBM Research Report RJ 9840, May 1994.Submitted to IEEE Computer Society Press, Proc. Workshop on On-line Access to Digital Libraries ,见本书网页: http://www.libnet.sh.cn/introdl/ 。

[2] Robert Kahn and Robert Wilensky, “A Framework for Distributed Digital Object Services”, May 1995. (http://WWW.CNRI.Reston.VA.US/home/cstr/arch/k-w.html)

[3] William Y. Arms “Key Concepts in the Architecture of the Digital Library” D-Lib Magazine, July 1995

[4] William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

[5] 见 IITA 有关资料。

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552968

数字图书馆初创期(1993年以前)

Vannevar Bush 在大脑中发明的信息机” Memex ” [1] 一直被当作数字图书馆的概念起源, 1945 年的计算机甚至连存储设备都没有, Bush 设想的 Memex 系统以缩微作为信息的存储体,计算机负责信息索引和查询,实际上是一个计算机辅助检索系统。这个想法在 50 年代至 60 年代就被马萨诸塞技术学院实现了,该学院的 Intrex 项目将一个收藏两万篇科学文献的缩微库与一个计算机目录检索系统相连,实现了自动检索。

第一次真正应用计算机存储和处理图书馆信息的尝试可追溯到 20 世纪 60 年代末,首先是从建立法律和科学文献的全文索引开始的,美国俄亥俄法律自动研究系统( Ohio Bar Automated Research System ,是后来著名的 LEXIS 系统的前身)能够提供法律状态的联机检索,空军建立的法律信息电子系统( LITE )索引了当时美国所有的法律法规和司法解释,提供检索服务。 70 年代 IBM 基于文本存储与检索技术开发了 STAIRS 系统,安装在许多大型机中,提供当时许多图书馆用于流通管理等。虽然当时面临一系列的技术障碍,例如昂贵的计算机、居高不下的存储成本、简陋的用户界面以及网络的缺乏,仍然产生了上述可圈可点的应用,当然图书馆界最值得一提的事件是美国国会图书馆成功开发了 MARC 格式,这是一种机读目录格式。美国图书馆联机中心( OCLC )多年来利用 MARC 为全球的图书馆进行服务,节省了可观的费用。

同时早期产生了一些信息服务,如联合编目、法律信息系统和美国国家医学图书馆的 Medline 联机数据库系统等,当时采用的是主机 – 终端模式,少量的信息装载在一台大型计算机上,用户坐在专门的终端前,通过一种低速的通信联接(例如电话线或专用网络)与中央计算机交换信息。这些系统要求用户训练有素,以便通过简陋的字符型人机界面,自动搜索,获取本地无法得到的信息。这种模式一直沿用到八十年代中期,这时大型国际联机检索系统,例如 DIALOG 、 ORBIT 、 STN 等已获得普遍应用,通过它们, Medline 、化学文摘( CA )、科学文摘( INSPEC )、美国政府研究报告( NTIS )、世界专利文摘( WPI )等非常重要的科学数据库得到广泛传播,虽然通信费用昂贵,仍然成为各国有一定规模的图书馆和信息机构所必备的信息源。

真正形成数字图书馆概念核心的技术应用发生在 80 年代中期,随着计算机信息存储成本的大幅下跌和信息处理能力的提高,特别是个人电脑的普及, 1985 年产生了 CD-ROM 这种电子出版的主要载体,接着多媒体出现,一时间联机( Online )和光盘成了两种互相竞争的技术,万维网的出现和迅速普及打断了这种争论,多媒体数字信息,而不仅仅是二次文献或事实型数据库全面通过网络提供成为可能,半个世纪的数字图书馆的畅想从云端落到了地面。

在这里我们把万维网出现之前的一些通过网络提供服务的全文信息系统看作是早期数字图书馆应用,它们中有许多延续至今,且已经改头换面,但仍然是数字图书馆的先驱,它们为数字图书馆概念框架的形成做出了许多贡献,参与这些系统设计和开发的许多专家都成了后来数字图书馆领域的活跃分子。这些项目有卡内基 • 梅隆大学的 Mercury 计划、康奈尔大学的 CORE 计划、 Elsevier Science Publishing 的 Tulip 计划、以及著名的美国国会图书馆”美国记忆”计划等等。

美国弗吉尼亚技术大学的 Edward A. Fox 在《 Digital Library Source Book 》中详细介绍了”数字图书馆”在美国产生和兴起初期的情况,介绍了当时召开的一些著名的研讨会,阐述了美国政府基于战略上的考虑,积极促进其研究部门,如美国科学基金会等,在催生数字图书馆中所起的重要作用。


[1] 见 http://www.theatlantic.com/unbound/flashbacks/computer/bushf.htm

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552949