分类目录数字图书馆

阅读的未来

能不能告诉我,你最近一次去图书馆是在什么时候?

中学?大学?某次路过?

没关系,不用为没去过图书馆而感到内疚,你可能根本就找不到它。目前在中国每 47 万个人才有一个公共图书馆。如果你碰巧还有一张「读者证」的话,那么真的要恭喜你了,你属于「百里挑一」:每 130 个人当中才有一个。

全民阅读调查统计显示,我国每个识字公民年购书经费约在 30-40 元,除去教科书教辅书,其中真正购买「图书」的花费不足 10 元;被调查者自述年阅读图书一般在 4-5 本。从图书馆方面来统计,全国公共图书馆人均年购书经费 0.5 元;全国 2762 个县级以上公共图书馆收藏了 4.8 亿册图书,人均 0.39 册;服务了总人口的 0.8%,即 1062 万持卡读者;年借阅图书 2.03 亿册次(2005 年),平均每个读者每年看书 19.11 本。

而美国,每三个公民就有两个是图书馆的持卡读者,平均每人每年去图书馆7次(年接待人数 22 亿),图书流通率相当于美国人口的近五倍(14 亿册件)。在英国,每一万人就有一所图书馆。

这些数字说明,我国远远算不上一个图书馆大国或者读书大国,但图书馆的读者却都是读书狂人。公共图书馆成了极少一部分自己买不起书,却酷爱读书的公民的乐园,它用了极少的社会投入,获得了极大的社会效益。

与此同时,我们所处的时代又是一个信息泛滥的时代,人们每天一睁眼,就被「信息污染」包围,始终处于「被阅读」、「被轰炸」的状态。书店里坐卧横斜人满为患,地铁里嘻哈一族捧着 PSP、手机看小说,「起点中文网」的崛起标志着网络阅读财源滚滚,出版界为 Kindle、电纸书而疯狂,手机报正在兴起,3G 厂商也已推出多媒体阅读概念……,未被「娱乐至死」的电视媒体所终结的印刷王朝,几乎已经无法在数码网络时代继续苟延残喘。

这一切说明人们并非不喜欢阅读,社会也并非不需要阅读,而是阅读正在转型,阅读也需要重新定义。

在这个过程中,传统的图书馆正在 OUT。

数字图书馆正在兴起。

数字图书馆:不再有「书」的图书馆

前国家领导人李岚清在 1998 年 10 月 2 日视察国家图书馆时指出:「数字图书馆是图书馆的未来」。这当然不是他本人的研究成果,而是自上世纪九十年代开始,随着美国国家科学基金会(NSF)、国防部高级研究署(DARPA)和美国航空航天局(NASA)巨额资助数字图书馆研发之后,国内连续数年不断学习、消化、试验、讨论,形成的一定程度上的共识。

然而,对于什么是数字图书馆,可以说至今还没有给出能够得到大家公认的定义,或许我们只能让「数字图书馆」的未来发展自己来定义。

什么不是数字图书馆,倒是得到了一定程度的公认,这种公认与人们的常识有一定距离:通常认为的「数字图书馆」,一般是指印刷的图书经过扫描数字化、变成「电子书」之后,在网上提供在线阅览或下载服务的网站。这恰恰不是「数字图书馆」的主流,至少不是数字图书馆的理想形式,最多只是一种形式而已。电脑科学家甚至认为「数字图书馆」与现在的图书馆没有多少关系,它只是因特网上海量信息的一种结构化存在形式。

不过目前这种「山寨」数字图书馆概念充斥了主流媒体,从而在人们的大脑中形成了认知惯性。这应该都是「图书」这个名称惹的祸。2006 年美国 OCLC 的调查表明,社会大众对于「图书馆」的认知,是与「图书」这种形式紧紧捆绑的,这种捆绑有利有弊,「利」在于赋予了图书馆一种实在、永恒的特性,一想到图书馆,总是巍峨的大厦,无尽的书架和人类所有的知识;「弊」也显而易见,随着传统「图书」的消亡,图书馆也将无可避免地走入历史。数字时代,一切皆有可能。

其实图书馆只是通过「图书」,最终与「知识」达成捆绑。「图书」(包括期刊、报纸等传统纸媒读物)这种载体形态及其所造成的阅读习惯是印刷时代的产物,知识一旦数字化之后,内容与载体就彻底分离,编码与形式得以彼此独立,任何内容、任何媒体,还原为电脑可处理的 0 和 1,一下子就「人人平等」。对于图书馆来说,只是知识的载体形态发生了变化,知识的内容并无发生改变,图书馆收藏、保存、传播知识的职能并未发生变化。

因此,从上世纪九十年代以来,图书馆开始收藏光盘,后来是越来越多的文摘索引数据库和全文数据库,数字媒体在图书馆的采购比例越来越高。目前,国内外一些研究型图书馆采购数字资源的比重最高可达订购经费的 80%。由于检索、传递和使用的方便性,数字资源的利用率更是远远超过传统资源。

资源的数字化对图书馆的业务流程和服务方式造成了重大影响,对图书馆员的素质要求和工作内容也产生了巨大变化。一个直接的影响就是,图书馆员必须自己首先具有相当的电脑技能,克服「信息鸿沟」,才能帮助读者,提供必需的服务。目前我们正处于由传统图书馆向数字图书馆过渡的时期,「复合型图书馆」就是为在这个特定时期、传统资源与数字资源混合的业务和管理模式提出的一个新的概念。

「图书」等传统载体形态,随着出版行业的彻底的「数字化」,成为数字化信息内容的一种输出形式。因为将来的绝大多数信息都是「Born Digital」的,先有数字形式,再有物质形态,而不是相反的先有传统出版,再进行数字化。而且由于传统图书的材料消耗和工艺流程所造成的高额成本(相对于数字拷贝而言),「印刷」将成为一种「贵族」消费。现在的图书必然是将来的「古籍」和艺术品,按需打印的图书也会进入奢侈品的行列。

数字图书馆就像一台大熔炉,所有的数字信息都可以在其中煅烧、冶炼,然后水银泻地一般,通过覆盖世界各个角落的互联网传播开去。大众阅读将彻底碎片化、多媒体化、动态化,任何手持设备都能够显示内容,电脑可以在任何时间、地点、瞬间将任何内容,在全球范围内,以任何载体、形态、格式和体验传输给任何需要它的「读者」。

这就是未来的数字图书馆。

数字图书馆:时势造英雄

与「图书」捆绑的图书馆最终将会为图书陪葬,与「知识」捆绑的图书馆,才能独立于知识形态和载体的变化,不论信息技术风云变幻,继续实践图书馆「收集保存、有序组织、知识交流、休闲娱乐」的社会职能。图书馆的社会职能可能会随着社会分工变化和替代行业的出现而发生重点的转移,但是无论如何,作为一种保障民众获取知识与信息的公平权利、消除知识鸿沟和信息鸿沟的公益性社会机构,无论是实体的还是虚拟的,纸张的还是数字的,其职能是永恒的。

如果我们把「无纸社会」作为传统媒体向数字媒体过渡的一种象征的话,真正的「无纸社会」只是一个无限逼近的目标。历史上媒体的变迁很少有直接替代的情况发生,更多的是由于功能被新的媒体所替代而造成使用方式和习惯的迁移,老的媒体通常能发掘出新的用途,或者以前的次要功能发展成主要功能。

美国伊利诺伊州大学厄本那—香槟分校的兰开斯特教授分别在 1978 年和 1982 年写过两本关于未来图书馆和图书馆员的书,预言无纸化社会将在上世纪末到来。1999 年他老人家对他的预言进行了反省,提醒人们技术的发展会带来对人的忽视。其实技术的发展总有个过程,电脑科学和网络技术一直在向更加人性化的方向发展,可视化、虚拟现实、穿戴电脑等都是近年来最前沿的技术,上世纪七十年代兴起的人工智能研究虽然是失败了,但记载了科学家的努力,Web2.0、语义万维网更是技术以人为本的证明。技术到底还是为人服务的。人的贪婪总是会对技术提出越来越高的要求,归咎于技术,只能是人的无能和无知,也是把技术异化了的表征。有人根据兰老的反省仿佛见证了兰老的愚蠢,认为他的预言的破产就是信息技术的破产,并举例说「无纸社会」实际上用纸更多了。

真是这样吗?预言家们只不过性急了一点,无纸社会尚未到来,但纸张作为一种印刷媒介和信息载体,已经不再具有主流媒体和知识传播的作用,不再具有大众媒体的地位,而逐渐退出历史舞台;取而代之的,数字媒体、网络传播将成为主导方式。

印刷取代手抄,报纸取代公文,电视取代广播,电话取代电报,电邮取代信件……历史上这样的故事发生过多次,但是当前的数字化浪潮恐怕只有印刷术能够相比。我们正在经历一场由信息技术革命带来的人类社会的整体变革。能源、生物、材料和信息四大决定人类未来的发动机中,到目前为止,还只有信息革命率先取得了突破。

目前全球的网民已超过 16 亿,我国约占五分之一,更有手机上网用户1.55 亿。这个媒体迁移过程,随着我们一两代人的更替,可以自然完成。现在的网络一代,眼不离屏幕,手不离键盘,一天可以泡网十几个小时,出门也不忘带着上网手机。网络就是他们的江湖。对他们而言,任何东西,只要网上没有,就不存在。书本基本上是个负担:书包是每天的负担,买书有金钱的负担,读书更是扼杀青春的负担。偶尔街头买一张小报,或时尚杂志,一般是为了心理需要,或者可以当个坐垫。

如果我们把人类历史的坐标尺度放大,自上世纪下半叶开始的信息技术革命已经是快如闪电了。我们生活在一个一切都按照指数级发展的时代,现代人一年中所获得的信息量,是 19 世纪一个英国普通人一生所获信息量的总和,而目前每年新增的信息量,又是过去 5000 年人类信息的总和。历史上还没有哪次新技术革命,能够给人的生活,在一个人有限的一生中带来如此剧烈的变化。

工业文明的印刷技术带来了图书馆的第一次复兴,数字时代必将带来下一次复兴。人类探索世界、追求理性的天性赋予图书馆以基本精神,这些精神随着知识的丰富和理性的进化而不断发展,即存在于图书馆收藏和整理的知识中,也浓缩和积淀于图书馆的精神和理念中,归纳起来,图书馆的基本精神就是知识自由的精神,图书馆的服务理念就是平等无差别和免费服务。现代图书馆的贫民化和开放运动、美国钢铁大王卡内基对公共图书馆的塑造、当前学术领域的开放存取运动等等,这些东西不会随着技术的进步、服务手段的提高以及图书馆形态的变化而变化的。这些理念和精神是永恒的。

这就是现在图书馆行业面临的信息环境,也是数字图书馆应运而生的土壤。图书馆的理念、价值和运作模式独立于它的形态和内容,就像印度图书馆学家阮冈那赞所说的,图书馆是一个不断发展的有机体。其最大特点就是适应性,在任何环境下,都能够调整自己,复制自己,发展自己。

数字图书馆:存取人类所有知识

1849 年,英国考古学家莱尔德发掘了迄今确知的最早的图书馆——亚述巴尼拔图书馆,发掘出近三万块泥版文书。这座公元前六世纪的图书馆却不是最有名的,只是由于泥版文书的特殊性,使其免于战火,保存至今。而大大有名的,只限于文献记载的、比它晚 400 年的古埃及亚历山大图书馆,却成了一个永恒的传奇。

以羊皮书和纸莎卷为主要收藏的亚历山大图书馆命多劫难,两次毁于战火,以至于其宏富的收藏和辉煌的历史只能散见于文献,据说其最多时收藏有 50 万卷各类手稿,是由数百位「誊写员」(当时的图书馆员)日夜不停地抄写得来的。最使这座图书馆文明的是它的收藏理念:穷尽人类的所有知识。

从这一点来讲,谷歌就是现代的亚历山大图书馆。谷歌昭告天下的使命是:「整合全球范围的信息,使人人皆可访问并从中受益」(To organize the world’s information and make it universally accessible and useful),这与 2001 年 2 月美国信息技术咨询委员会(PITAC)向布什总统提出的报告《数字图书馆:实现对人类知识的普遍访问》(Digital Libraries: Universal Access to Human Knowledge)如出一辙,甚至可以认为,谷歌就是在干未来图书馆的活。

谷歌与图书馆和出版商合作的谷歌 图书搜索计划目前已提供 700 万种数字化图书的在线服务,很快会达到 1000 万种。这批图书最早来源于五家图书馆:密西根、斯坦福、哈佛、牛津 Bodleian 四个大学图书馆和纽约公共图书馆,仅这五家图书馆的藏书就高达 1500 万种。谷歌打算投资两亿美元,在 2014 年前完成这个数字化项目,据估计最后可能远远不止。据说人类目前保存的图书总数一共也就一亿种左右,对于谷歌来说,把它们全部储存起来似乎不是什么遥不可及的事情。

随着 2008 年 10 月谷歌就其扫描的绝版书与美国出版商协会和美国作家协会达成赔偿 1.25 亿美元的和解协议,谷歌几乎就是拿到了合法的扫描人类所有图书的执照。即便该和解协议覆盖范围极其有限,这个模式也为将来处理同类纠纷提供了参考。当然没有多少人能够出得起谷歌开出的价码。谷歌建立了一个无比巨大的图书分销零售平台,凭借其所向披靡的搜索引擎和其它技术优势,将内容重新标注、索引、组合,并扩展到期刊、报告、会议录等传统学术出版产业中,甚至可以进一步与新闻、多媒体行业进行整合,而在整个内容产业中攻城略地,依靠其平台和商务模式,左右整个内容产业链。

现在谷歌的战略布局虽然初现端倪,已经很难有实质性抵抗了。由Internet  Archive、微软、雅虎等组成的开放内容联盟曾经也想在这个领域分一杯羹,但在扫描了 75 万册图书之后,微软还是放弃了该计划。当初微软的决策似乎是出于与谷歌竞争的冲动,与 Internet Archive 的合作也使其变成纯粹烧钱商务模式。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模上和技术上不能跟谷歌图书搜索计划相比,只能算是实验性或示范性项目。

当然一家通吃的局面是很难出现的,亚马逊公司凭借其 Kindle 阅读器一鸣惊人,通过终端的标准化,打通整个产业链,打造出一个电子书零售市场,其商务模式有模仿苹果公司 iTunes / iPod 之嫌,但依然取得了巨大的成功。该领域还有索尼等公司加入战团,实力不可小觑。

与「数字内容」的生产、组织、发布、服务相关的公司还有一类,就是像「盛大文学网」这种原生数字内容平台公司,他们与传统出版行业的竞争看起来是最激烈的,互相渗透,抢夺地盘,但是这个战场最多只是局域性的,而且其商务模式目光短浅,很难打造起真正的行业平台。真正具有战略意义的,能够左右整个数字内容产业的应该是谷歌、亚马逊这类野心和实力并举、掌握了各类数字内容分销平台和渠道的公司。

图书馆在这场大战中尽可以采取坐山观虎斗的策略,谁赢谁输都没有坏处,行业整合了、科技进步了,图书馆可以更好地实现其固有的职能。要知道任何企业都是有其生命周期的,据说目前存世的最长寿的企业,是传了 40 代,已有 1400 多年历史的日本大阪寺庙建筑企业金刚组,西方最古老的企业为法国葡萄酒世家 Château de Goulaine,已超过千岁了。然而正如前文所述,图书馆至少已有 2600 多年的历史,再强大的企业,存续再久的企业,也无法跟一项公益性的事业相比,尽管可能干了与图书馆相同的工作。

图书馆作为知识中介的功能,可能会被商业化的服务逐步取代,然而图书馆作为保障知识自由和平等获取的机构,其真正覆盖的应该是无法获得商业化服务的人群,任何时代都有这样的人群,以逐利为目的的企业总有服务的盲区。另外,图书馆尚有「保存、组织、交流、娱乐」四大职能,是任何私有企业无法完全覆盖的。

数字图书馆的前景风光无限。

未来的图书馆:随需而变,无所不在

图书馆事业的不可取代性,并不是图书馆可以不思进取的理由。行业的兴衰成败,背后可能的原因比企业的开停并转要复杂很多,但并不是没有前车之鉴。图书馆不管有多少职能,只要不能继续吸引读者,它的前景就堪忧。因此图书馆面临的挑战还是十分巨大的。

建设数字图书馆并非不要场地,不要空间。自古以来,图书馆都是人们交际聚会的场所,近年来更有「城市的起居室」、「市民的书房」等称谓。数字图书馆只是指它的资源是数字化的,设施是围绕数字化资源所配备的,从功能上说,它依旧是城市或社区的信息中心。

图书馆发展「信息共享空间」和「学习共享空间」,甚至「Idea Shop」,正在成为公共图书馆和高校图书馆的潮流。你如果去一个社区图书馆,可能看不到成排的书架、报栏,倒是有不少沙发、茶几,以及零星的电脑和散落各处。这种「共享空间」的理念就是,综合图书馆的各种资源、设施和能力,以人为本,向读者提供所有可能的服务。每一个「共享空间」可能都是个性化的,就像每一所星巴克的布局都不一样,但他们提供的服务和体验是一样的。

将来你可能会见到环境优雅,音乐幽幽,提供咖啡茶点,可以免费上网的社区图书馆;或者接受专题资料预约,提供投影等会议设施,到处都能无线上网的图书馆阅览室供您在需要的时段使用;如果需要专业的参考馆员陪伴协助,也可以预约。

当前制约图书馆提供数字资源服务的还有一个重要障碍,就是版权。传统图书馆提供纸本图书、期刊和其它馆藏资源的借阅、复印,有行业规范(例如每次复印不超过一本书的三分之一之类),属于「合理使用」范围。但数字资源由于拷贝和传播的便利性,一下子就无法「合理使用」了,许多限制不能充分发挥数字资源的优势,使得许多公共图书馆在数字资源的服务和提供方面十分被动,利用率很低。

图书馆的存在本来就是对于版权制度的一种调节和弥补,是平等获取知识的一种保障。从经济价值上来考量,目前图书馆购买力大约能够占到全部出版市场的 5% 左右,虽然不是举足轻重,也能算相当可观。本来这一部分投入就是应用于没有能力购买出版品的广大「长尾」读者,他们是出版市场的无效用户,这些没有市场价值的用户的阅读需求由图书馆这种制度设计来满足,公共资金(或捐助资金)购买的资源或服务实际上对于出版市场来说是额外的收入。数字出版其实也是如此,当然长尾用户的需求不一定通过图书馆来满足,但是图书馆肯定是一个拾遗补缺的、不可替代的渠道。对于如果数字资源不能通过公共图书馆进行提供,其就会丧失保障信息获取自由的职能,走向「博物馆化」就是个时间问题了。对于研究型图书馆和大学图书馆来说,一般对于开放存取具有本能的冲动,因为本身其所属机构就是学术出版的最大生产者,自己生产的知识,再通过商人的渠道,附加很多利润,再卖给自己,本身的商务模式就有许多荒谬之处,这些机构的联合所形成的购买力也是一个谈判筹码。相信进过不屑的努力,图书馆在数字资源的合理使用方面能够探索一些新的模式。

大学图书馆和研究型图书馆在向数字图书馆的过渡方面更有积极性,欧美国家已经认识到图书馆在数字时代亦然是教育和科研的基础设施,因此花巨资研究数字仓储、数字资源的保存、组织和利用问题。数字图书馆通常有两张面孔,除了现实中的古典庄重巍峨的大厦之外,通常在虚拟世界里也具有「课件中心」、「数据中心」、「学术信息中心」及「交流中心」等职能。无纸图书馆(E-Only)将在这两类图书馆中率先实现。不仅如此,这类数字图书馆将利用各种技术,将资源入口和服务「嵌入」到用户(通常是教授、研究人员和学生)的信息环境中(例如做成桌面工具、浏览器插件、工具条等),从而更加虚拟化而真正「无所不在」。

十年内可以弯折的电子纸应该能够得到商用,电子墨水技术在灰度级别和色彩深度方面已经能够超出普通人的需求,翻转速度能够应用于基本的视频播放。「电子书包」(即存储有所有教科书和教辅书的可写电脑)的普及可能会更快一些,电子书会也像 MP3 一样大行其道,这些载体在感官舒适度方面甚至会超过目前的普通纸张。所有这些变化将给新闻和出版行业全盘数字化提供巨大的市场动力,人们获取新闻和学习知识的习惯也会发生重大变化。

图书馆作为一种实体空间的作用和作为一种虚拟知识传播机构的功能将会彻底分开,实体机构的图书馆依旧作为公民知识生活的中心,而虚拟的知识传播通过各类渠道和设备(例如利用无所不在的「云计算」环境)而变得「泛在」,图书馆通过网络提供大量的信息服务,但是你可能丝毫都感觉不到它的存在。

由于数字化造成的媒体融合,许多大型的图书馆或图书馆联盟同时会扮演出版商和资源服务商的角色,向产业上下游同时挺进,特别是那些有独特资源或者能够提供深度信息咨询服务的图书馆(如议会图书馆和研究型图书馆等),一方面成为知识的出版者和发布者,另一方面依靠新型电子报纸、电子书或手持设备,提供更为专指的内容分发业务,因而也可能兼具一定的媒体角色,但是这类图书馆可能为数很少。

图书馆行业现在正处于历史上独一无二的阶段,原先的产业链已经松动、断裂,新的链条尚未建立、成型。图书馆在社会中所承担的职能虽然没有本质的变化,但角色已经发生了重大变化,图书馆不再仅仅是伫立于街角等待别人上门的一栋大楼或者几个房间,而是人们电脑桌面的一个图标,手机上的几个应用,Kindle 上的一个帐号,等等。图书馆的服务流程与人们的学习生活密切相关,同时图书馆事业作为一个整体,依旧支撑着人类所有的知识记忆。

英国哲学家波普尔曾经做过一个著名的「思想实验」:如果地球遭到毁灭,我们可以依靠图书馆中保存的人类记忆,花费一两代人的时间,重建整个人类的文明。而如果图书馆也遭到毁灭了,人类将重新进入一个漫长的文明重建时期。我由此推理,由于数字图书馆的存在,我们重建人类文明的时间将大大缩短,甚至就像恢复备份一样容易。

(本文写于2010年初,Apple4.us约稿,目前该网站已不可考)

数字人文系统有没有“需求”?

问:基于自己对现有文献的了解,我有一个基本印象:数字人文的相关研究似乎更侧重在“技术”这件事本身,似乎学者们将研究的重心更多的放在如何去更好的用技术去成就事情。包括您昨天的课,很大程度上也在强调基础设施、平台、资源以及数字人文行为;但是是不是跳过了一个东西,那就是需求呢?所以我的问题是:(1)图书馆在建设关于数字人文相关平台的时候,是如何去权衡这个需求的?是根据人文学者的需求吗?还是图书馆觉得应该有这样一个平台?(2)图书馆建成这个平台后,人文学者的利用率高吗?是人文学者利用的更多,还是普通用户?最后用于人文的学术研究更多还是普及知识的作用更多呢?(3)昨天您也提到了,也是我想问的,图书馆如何去吸引和鼓励人文学者和其他用户使用相关基础设施的?

答:感谢来函提问,非常好的问题,就这个问题我的思考如下,仅供参考。

1.需求分析法是构建一个系统或平台所必须步骤,但却不是做一件创新的事情所必须步骤。科学研究和艺术创作最早完全是因为人类的好奇心使然,是一种娱人娱己,说句直白的话,人文基本上是人吃饱了饭没事干才想到的事情,所以并非所有的事情都由需求来驱动和引导的,那样就非常功利了,与动物就没啥两样了。
2.很多时候需求是创造和引导出来的。英国人喝茶完全是中国和印度带过去的,没有手机的时候怎么知道手机能不能卖掉?
3.图书馆建设数字人文平台时其实一开始是模拟人文学者传统的研究方式,比如检索、比较、统计,等等,用技术能够更快更精确更大范围地检索,就像电子书是对纸本书的模拟一样,一开始总是模仿,然后再有突破。你能够帮到他,那就是满足了他的需求,即便不是所有人都会用,但总有一批先行者,带动研究范式但转变。
4.在开发系统但时候必须要有需求分析的过程,系统设计的依据是需求设计,否则就无法开发出良好的系统。我们数字人文系统平台的研发通常有三类人参与:领域专家、图书馆员和软件开发人员,其中图书馆员往往充当需求设计者,他们把学者的研究行为转化为程序员能够看懂的说明书。
5.人文学者是不是利用率高,首先需要明确的是,未来的人文学者一定是基于数据进行研究的,当所有的素材都是原生数字资源的时候,他们别无选择。至于这个平台是不是图书馆来提供,这其实是不重要的,因为总要有人来做这个事情,目前因为图书馆有大量的人文内容是稀缺资源,是研究者不可或缺的。

爱迪生从来不是根据需求进行发明创造的,乔布斯也不会迎合需求而让自己的产品设计有所妥协,如果说有需求,他们自己就是需求者。一切开发源自需求是一个伪问题,尤其不能让这个问题禁锢思维和束缚手脚。系统好不好是可以迭代开发的,不好了可以推倒重来。

数字图书馆的前世今生

数字图书馆前世今生

 

 

数字图书馆是上世纪90年代初作为与“信息高速公路”配套的基础设施而提出的概念。基于“有路必有车”的认识,美国分别于1992年和1994年分两期投入上亿美元设立“数字图书馆先导计划(Digital Library Initiative)”,孵化了一大批项目,如谷歌搜索引擎算法、谷歌数字图书计划、都柏林核心元数据、互联网档案项目和美国公共数字图书馆(DPLA)等等,都直接源自于其项目成果,或有着千丝万缕的因果联系。

我国的数字图书馆建设起始于1996年,一个标志性事件是国家图书馆联合上海等六家公共图书馆共同发起了“中国国家试验型数字图书馆”项目,第二年该项目得到了国家计委的正式批准,成为国家级信息基础设施建设项目。该项目的研发带动了我国一大批相关标准规范的确立,澄清了许多关键性概念,促进了学界和业界对一个新兴领域的关注,也促使整个图书馆行业迈出向数字图书馆转型、建设“复合型图书馆”的第一步。

二十多年来信息技术飞速发展,经历了从传统互联网、Web2.0到移动互联网的三代变迁,目前正进入以物联网、云计算、大数据与人工智能为特征的智慧互联时代,人们早年寄希望于数字图书馆技术来解决海量、异构、非结构化、多媒体信息的管理、组织、传播和利用问题,随着大数据技术的进步早已不成问题,而数字图书馆本身也从一个以技术研发为特征的应用领域,发展为以数字知识的保存、提供、交流和服务为特征的数字文化设施。伴随着上游知识产业生态的剧烈变化,以及下游读者用户信息需求和行为方式的巨大变化,作为一种知识中介的图书馆也应需而变,呈现出三个发展趋势:

1、从数字化到数据化

早期的数字图书馆项目主要是利用扫描技术将传统的纸本资源数字化,通过对资源内容和其他特征进行描述,建立关系型数据库提供检索,这种数字图书馆相当于传统“物理”图书馆的翻版。随着全文搜索和OCR技术的进步,越来越多的扫描图像可以经过文本化处理而提供全文检索,加上目前越来越多的原生数字内容和多媒体资源的引入,目前的数字图书馆呈现出非常纷繁复杂和丰富多彩的形态。

如果不能解决基于知识的服务问题,就谈不上是好的数字图书馆。当前的数据技术特别是关联数据等语义技术已经提供了初步的解决方案,能够使数字图书馆的基本结构单元,从图像、文本、多媒体文件等机器无法理解的内容,转变为人、地、时、事、物等“数据”信息,即“数据化”,让计算机的管理对象突破文献的限制,而直接管理内容语义,从而使数字图书馆成为真实世界和领域知识的映射。这类基于数据的数字图书馆正在成为数据驱动型科学研究的基础设施,在数字人文、e-Science 以及数字出版等领域发挥着越来越重要的作用。

2、从标准化到个性化

图书馆行业的标准化肇始于上世纪六十年代 MARC 书目数据记录格式,这可能是唯一沿用至今的磁带记录格式,几乎所有图书馆都基于这一格式设计业务流程和服务模式,尽管各类 MARC 略有不同,但没有哪一个行业像图书馆这样重视并应用最前沿的技术标准。

然而越早采用信息技术也就意味着今天包袱越重。标准化是工业时代的理念,它能够带来合作和效率,但信息时代强调的是差异化带来的个性化体验。当前不同类型图书馆由于用户对象的不同和资源类型的不同而呈现完全不同的发展方向,老的业务规范已不再能涵盖所有图书馆,新扩展的子系统完全无法覆盖所有类型的图书馆,标准化已不再可能,新的差异化的业务模式正在建立,图书馆与图书馆将呈现越来越不相同的形态和模式。

目前看来,公共图书馆将继续承担起文化保存、信息交流和普遍均等无差别知识服务的职能,开展阅读普及、消除信息鸿沟、提供信息素养培育是其不可推卸的责任;高校图书馆则必须顺应数据驱动型科研和教学的转变,承担起科研数据生命周期完整过程的管理和提供,同时提供各类共享空间服务;研究型图书馆则完全依靠学科馆员和数据馆员,转型为提供智慧型数据服务为主的无纸图书馆和虚拟图书馆。

整个知识产业上下游融合的趋势日渐明显,内容产业大洗牌,互联网公司全面介入知识生产流通在所难免。在这个新的产业生态中,图书馆由于拥有大量的读者,以熟悉读者的需求、掌握用户行为大数据作为利基,介入开放存取运动,甚至参与学术出版也不是没有可能。

3、从信息化到智慧化

智慧型社会是未来社会的重要特征,也是当前各行各业激烈角逐的主要战场。得益于过去数十年来全社会对于信息化的巨大投入,产生的海量数据为目前人工智能的进步提供了丰富的食粮。图书馆从来是与数据打交道的,从服务的内容和对象来看,图书馆的服务也应该精准化和智能化,智慧图书馆也无疑是数字图书馆的发展方向。

图书馆行业很早就提出智慧图书馆的概念,目前也是数字图书馆研究的一个热点。就采用的技术来看,如下表所示,智慧图书馆的发展可以分为四个阶段,第一代智慧图书馆只是采用了无线射频(RFID)技术的无人图书馆,其实并无任何人工智能的采用。第二代是当前研发的重点,通过采用多种传感器实现各类数据的采集,从而能够提供基于位置的精准服务(或称为SoLoMo,即社会化的基于位置的移动服务)。目前的各类机器学习技术已经为第三代智慧图书馆提供了可能,将对于信息内容的加工处理和提供服务两方面全面实现智慧化。第四代“超智慧”有赖于超级人工智能的突破和应用,目前还是科学幻想,但引起的讨论颇能给人启发。

表:四种智慧图书馆

类型

说明

特征

举例

伪智慧

通过应用RFID等智能标签技术,感知与反馈结合,一定的行为引发一定的结果,“好像”有了一定的智慧。已经实现。

单向度(仅感知图书等实体)、单循环

无人图书馆

智慧图书馆

弱智慧

各类传感器(如iBeacon、WIFI、人脸识别)应用模型和算法综合应用,可进行推送等个性化服务,实现了按程序设计好的“智慧”。正在实现。

多条件,复杂,类似于专家系统,双向,预先设定

小i参考咨询机器人

SoLoMo

强智慧

人工智能和机器学习的普遍应用,动态实时地应对复杂情况,无须预先设定,智能响应。有可能实现。

交互性、随机性;

智能化、人性化

*第三代图书馆*

超智慧

图书馆能够像人一样思考,具有人类知识的总和,总能在你需要的时间和地点,提供需要的知识服务。

应用强人工智能,图书馆工作的许多岗位被机器取代

化于无形,无所不在,随处服务

综上所述,数字图书馆概念由于受到技术进步的强烈影响,一直在发展变化,然而万变不离其宗的是人们赋予它的永恒职能,即保存文化、开展教育、传递信息和终身学习。即便到了数字时代,变化的只有方式和手段,图书馆永远都是天堂一般的模样。

 

近期图书馆技术趋势

  1. 移动化:关注并尽可能提供移动服务
  2. 电子书借阅:尽早开展数字阅读,并统一服务政策,数字资源服务纳入绩效考核
  3. 数字馆藏建设:地方或特色数字资源建设
  4. 统一的资源发现:取代OPAC,把电子书及其它数字内容纳入到馆藏揭示体系中
  5. 逐步放弃传统的集成管理系统:采用基于云服务的管理系统
  6. 追身服务:学科馆员,随时随地
  7. 作为空间的图书馆:讲座会议展览沙龙培训diy创客创新活动空间
  8. 图书馆建筑布局:再一次藏用分离的趋势
又要讲趋势了。总结了上述八项,欢迎板砖。

在Springer电子书与图书馆馆藏发展论坛上的致辞

在Springer电子书与图书馆馆藏发展论坛上的致辞
20130418
众所周知,现代图书发端于1450年前后的德国。数百年来,它带来了知识的平民化,推动了人类记忆的存续,点燃了文艺复兴的火种,促进了科技的创新和两次工业革命,奠定了现代社会形态的基础,使科技能不断站在巨人肩膀上发展,使人类社会以一种不断迭代方式积累知识、创造财富。今天,我们越来越多的人相信,这种传统的、以纸张作为介质的图书正在走向它生命的终点,图书所负载的灵魂正在以数字化虚无缥缈的形式无所不在,而当你需要时候能够瞬间出现在你的眼前。
我们很高兴地看到,同样来自德国的Springer出版公司在全球顶尖的科技出版领域引领着这场变革。凭借其1842年创立的近两百年基业,以先知般的睿智和超越同侪的勇气,于上世纪末率先涉足网络出版,这其实是一场自我革命。可喜的是迄今已取得非常好的效果,在这场颠覆性的变革中继续稳坐钓鱼台。
现代图书馆是现代出版的受益者,同时也是整个出版生态中不可或缺的一环,肩负着为人找书、为书找人的永恒的职责。面对数字化变革的浪潮,图书馆行业虽能先知先觉、上下求索,为继续履行其天堂般的职责而奔走呼号,但却碍于其公益性质,势单力薄、步履艰难。在图书馆最需要与上游行业协力共进的时候,有很多出版社却设定了违背图书馆职业理念的所谓新模式,他们忘了,图书馆和出版社,既是利益分享、风险共担的伙伴,更是患难与共、唇齿相依的兄弟。
Spinger在这方面树立了一贯的楷模,它在获取商业利益、实现自身企业价值的同时,既帮助图书馆实现各项职能,又充分尊重图书馆倡导知识自由、信息无障碍以及人类知识的永久保存理念。它的电子书支持购买模式而不是只能租用,允许馆际互借,无复本限制,甚至无DRM,还提供完整的MARC记录供图书馆进行数据整合,它让图书馆真正感到得道多助、德者不孤。
今天Springer在这里发布又一款数字图书新产品,再一次把历史的厚重带到这浅阅读和碎片化阅读时代。我们怀着满腔的热情和极大的期待,祝愿Springer取得圆满成功!

数字图书馆先导研究计划第二期(1999~ 2002)

1998 年春,在首期 先导研究计划面临结束 之时,经过认真的总结和调研,美国政府打算从各个层面加深拓宽研究领域,于是发布了先导研究计划第二期 招标书 。

首先,主办机构从首期的三个赞助,增加到七个,增加的四个机构是美国国会图书馆 (LC, Library of Congress) 、美国国立医学图书馆( NLM , National Library of Medicine )、美国人文学科基金会( NEH , National Endowment for the Humanities )和美国联邦调查局( FBI , Federal Bureau of Investigation ),可见增加了图书馆的比重应用成分。其次,项目的持续时间和经费增加了。 DLI2 计划持续 5 年,五年中上述 6 个单位计划提供 4000 到 5000 万美元。第三,为了资助更多的项目,资助方法与第一期有所不同。到 99 年 9 月为止就有 30 个项目入围,目前(至 2000 年 10 月)已经有 36 个项目获得资助。这些项目分为两类:单独的研究项目和多学科综合项目,单独项目资助一到三年,资助上限为 20 万美元,大项目资助一到五年,资助上限为 120 万美元。第四,研究目标有所侧重,重点提出三个中心:以人为中心、以系统为中心、以技术为中心,具体研究目标是:

l 为数字图书馆界定适当的发展领域,有选择性的开展研究和实验活动;

l 使数字化资源的扩充、管理、存取更加迅速、便利,增加利用信息的深度;

l 创造新方法、新机会,使数字图书馆更好地为不同教育水平的、现有的和潜在的用户群服务;

l 推动从社会学和经济学角度对人与数字图书馆交互作用的研究。

第五,极大地扩展了数字图书馆应用领域,首期项目以研究为主,所牵头的六个高校都具有极强的计算机技术背景,而这一期涉及到许多专业领域。当然图书馆和情报方面还嫌太少,虽然有一些项目针对情报检索问题(如加州伯克力大学项目),但总的比例太小。可喜的是确有一些图书情报专家领衔进行一些项目的开发工作。第六,该期计划加强了项目管理,同时也注意促进项目间的交流和成果的转化与推广。该计划重新建立了一个网页,将所有项目分为资助项目( 36 个)、大学教育项目( 8 个,专为提供大学教育用的学科资源库建设)、国际合作项目(与英国、德国和欧盟合作的一个项目)、特别项目( 14 个)及专题研讨会等 5 个栏目,包含了最新会议及项目进展的介绍,所有阶段性研究报告都可以找到,还有大量的新闻、事件、论文、报告、相关项目和相关信息的链接。

图表参见 Edward A. Fox “Digital Libraries Initiative (DLI) Projects (1994-1999)” Bulletin of the American Society for Information Science October/November 1999 。由于涉及到三十多个具体项目,在此无法一一介绍,请参阅 DLI2 网页: http://www.dli2.nsf.gov 。


Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552982

本人收集的数字图书馆定义汇总(2000年以前)

数字图书馆定义

定 义

北图的定义

数字图书馆是没有时空限制的、便于使用的、超大规模的知识中心

国际通行的定义

数字图书馆为国家信息基础设施提供关键性信息管理技术,同时提供其主要的信息库和资源库。换句话说,数字图书馆是国家信息基础设施的核心

其它定义

数字化图书馆就是图书馆在线服务系统;

数字图书馆就是以数字形式存贮和处理信息的图书馆;

数字图书馆是指图书馆所有的工作流程都基于计算机,而且馆藏资源都实现数字化;

所谓 ” 数字图书馆 ” 就是图书馆馆藏实现数字化管理,并上网服务,供读者随时随地查阅;

数字图书馆是指通过多种技术将各种文献数字化,并将其组织起来在网上提供信息服务的信息中心或数据库;

数字化图书馆实际就是人们所说的电子图书馆、虚拟图书馆、无墙图书馆,不同的称谓只是人们从不同的角度描述数字化图书馆的特征;

其它定义

数字式图书馆为国家信息基础设施提供关键性的信息管理技术,同时提供主要的信息源和资源库。换言之,数字式图书馆是国家信息基础设施的核心;

数字图书馆一般而言是指利用当今先进的数字化技术,通过诸如 Internet 国际互联网等计算机网络,使人数众多且又处在不同地理位置的用户能够方便地利用 … ;

数字图书馆是一个数字化系统。它将分散于不同载体,不同地理位置的信息资源以数字化的形式贮存,以网络化的方式互相连接,提供及时利用,实现资源共享,其核心是数字化和网络化;其实质则是形成有序的信息空间;

数字图书馆是一个大系统,它具有分布的、大规模的和有组织数据库和知识库,用户或用户团体可对系统内的数据库和知识库进行一致性的访问,获得自己所需的最终情报;

1. http://www.ifla.org/documents/libraries/net/arl-dlib.txt

[ Berkeley Digital LibrarySunSITE]

Definition and Purposes of a Digital Library

Association of Research Libraries

October 23, 1995

Definition

There are many definitions of a “digital library.” Terms such as

“electronic library” and “virtual library” are often used synonymously. The

elements that have been identified as common to these definitions[1] are:

* The digital library is not a single entity;

* The digital library requires technology to link the resources of many

* The linkages between the many digital libraries and information

services are transparent to the end users;

* Universal access to digital libraries and information services is a

goal;

* Digital library collections are not limited to document surrogates:

they extend to digital artifacts that cannot be represented or

distributed in printed formats.

Purposes

The purposes of a North American digital library system[2] are:

* to expedite the systematic development of: the means to collect,

store, and organize information and knowledge in digital form; and of

digital library collections in North America ;

* to promote the economical and efficient delivery of information to all

sectors of North American society;

* to encourage co-operative efforts which leverage the considerable

investment in North American research resources, computing and

communications network;

* to strengthen communication and collaboration between and among the

research, business, government, and educational communities;

* to take an international leadership role in the generation and

dissemination of knowledge in areas of strategic importance to North

America ;

* to contribute to the lifelong learning opportunities of all North

Americans.

[1] See: Drabenstott, Karen M. Analytical review of the library of the

future, Washington , DC : Council Library Resources, 1994.

[2] Adapted from The CAN-LINKED Initiative, a proposal for the co-ordinated

development of a distributed national digital library system in Canada ,

prepared by a group of academic and research libraries. February, 1995.

——————-

Association of Research Libraries

October 23, 1995

Copyright ?Association of Research Libraries 1995. All rights reserved.

Document maintained at http://sunsite.berkeley.edu/ARL/definition.html by

the SunSITE Manager.

Last update 1/10/96 . SunSITE Manager: manager@sunsite.berkeley.edu

2. UCLA-NSF Workshop on Social Aspects of Digital Libraries, Final report, November, 1996 http://www-lis.gseis.ucla.edu/DL/UCLA_DL_Report.html#introduction

The core premise of the workshop was that digital libraries represent a set of significant social problems that require human and technological resources to solve. Workshop participants were charged with appraising the scope of social aspects of digital libraries, assessing what is known about these problems, and identifying the research and development issues that need to be addressed to solve them. Our first task was to define “digital libraries.” We determined that digital libraries encompass two complementary ideas:

  • Digital libraries are a set of electronic resources and associated technical capabilities for creating, searching, and using information. In this sense they are an extension and enhancement of information storage and retrieval systems that manipulate digital data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks. The content of digital libraries includes data, metadata that describe various aspects of the data (e.g., representation, creator, owner, reproduction rights), and metadata that consist of links or relationships to other data or metadata, whether internal or external to the digital library.
  • Digital libraries are constructed — collected and organized — by a community of users, and their functional capabilities support the information needs and uses of that community. They are a component of communities in which individuals and groups interact with each other, using data, information, and knowledge resources and systems. In this sense they are an extension, enhancement, and integration of a variety of information institutions as physical places where resources are selected, collected, organized, preserved, and accessed in support of a user community. These information institutions include, among others, libraries, museums, archives, and schools, but digital libraries also extend and serve other community settings, including classrooms, offices, laboratories, homes, and public spaces.

The first idea emphasizes the fact that digital libraries are computer-based systems constructed for people to use and that they are extensions of information storage and retrieval systems. The second emphasizes the belief that digital libraries should be constructed in a way that accommodates the actual tasks and activities that people engage in when they create, seek, and use information resources; in this sense they are an extension of physical environments. Both assert that digital libraries are sets of information resources collected and organized on behalf of a community.

Embedded in this definition are complex concepts with meanings that vary by context and by field of study. The terms ìinformation,î ìcommunity,î and ìlibraryî are the most problematic. Definitions of ìinformationî abound: signal processing; sensory perception; data generated by individuals and groups; objects that can be managed in retrieval systems; intellectual commodities that can be exchanged in the marketplace; etc. ìCommunityî implies a group of people with something in common, but those common features may be permanent or temporary, static or dynamic, innate or selected; biological or cultural, etc. — and any one individual can be a member of many communities at once. A ìlibraryî is often narrowly defined in technical contexts as a database application, while in other contexts a ìlibraryî is a social institution that selects, collects, organizes, preserves, conserves, and provides access to information on behalf of a community. Even the term ìdigitalî is problematic, for it reflects both ìdigital objectsî — those created in digital form, and “digitized objects” — those that are representations (e.g., scanned images, keyed text) of objects in other forms.

3. ( ref. To 2 ) http://www-lis.gseis.ucla.edu/DL/dl_handout.html

As a National Challenge Project under the NII/IITA, Digital Libraries represent a set of significant societal problems that require human and technological resources to solve.

Digital libraries represent two complementary ideas:

  • Digital libraries are a set of resources and associated technical capabilities for creating, searching, and utilizing information. In this sense they are an extension of information storage and retrieval systems that manipulate digitized data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks.
  • Digital libraries are virtual communities in which individuals and groups interact with data, information, and knowledge resources and systems. In this sense they are an extension, enhancement and integration of a variety of information institutions as physical places where resources are selected, collected, organized, preserved, and accessed in support of a user community. These information institutions include, among others:
  • Libraries
  • Museums
  • Archives
  • Schools
  • Laboratories

4. Gladney, Henry M. et. al. Digital Library: Gross Structure and Requirements (Report from a Workshop.) IBM Research Report RJ 9840, May 1994. http://www.ifla.org/documents/libraries/net/rj9840.pdf

A digital library is a machine readable representation of materials which might

be found in a university library together with organizing information intended

to help users find specific information. A digital library service is an assemblage

of digital computing, storage, and communications machinery together with the

software needed to reproduce, emulate, and extend the services provided by

conventional libraries based on paper and other material means of collecting,

storing, cataloging, finding, and disseminating informatio n. A full service digital

library must accomplish all essential services of traditional libraries and also

exploit digital storage, searching, and communication.

Public, private, professional, school, commercial, and other kinds of library

emphasize different services, different kinds of information, and different service

styles. While any digital library instance may thus offer only partial services, the

technology suite from which library instances are assembled must permit

assembly of a full service library. In addition, this suite must shield the user

who wishes to draw on multiple libraries from inter-library differences which are

irrelevant to him.

What distinguishes a conventional library from a heap of things to read is

organization provided by someone other than the authors of the collected

materials. For a small, private collection this could be shelf organization; for a

large collection it is typically a descriptive catalog 2 which is distinct from the

collection, with at least one catalog record associated with each item held.

Not every database is a library, but every library is a database 3 . What distin-guishes

a library from an arbitrary database are certain data integrity and

security rules that constitute an implicit contract between custodians and users.

5. The NSF/ARPA/NASA Digital Library Initiative, FY 1994 Na93 states:

“Information sources accessed via the Internet are ingredients of a digital library. Today, the

network connects some information sources that are a mixture of publicly available (with

or without charge) information and private information shared by collaborators. They

include reference volumes, books, journals, newspapers, national phone directories, sound

and voice recordings, images, video clips, scientific data (raw data streams from instruments

and processed information), and private information services such as stock market reports

and private newsletters. These information sources, when connected electronically through

a network, represent important components of an emerging, universally accessible, digital

library.”

Digital Library Initiative, FY 1994, A joint initiative of the National Science Foundation, the Advanced Research Projects Agency, and the National Aeronautics and Space Administration, U.S. Government document NSF 93-141, (1993).

6. In a prior DL workshop report Fo93,p.65 , we find:

“A digital library is a distributed technology environment which dramatically reduces barriers

to the creation, dissemination, manipulation, storage, integration, and reuse of information

by individuals and groups.”

http://ei.cs.vt.edu/~dlib/def.htm E.A. Fox (ed.), Source Book on Digital Libraries, TR93-35, Dept. of Computer Science , Virginia Tech, (1993);

“Digital libraries are complex data/information/knowlege (hereafter information) systems that

help: satisfy the information needs of users (societies), provide information services (scenarios),

organize information in usable ways (structures), manage the location of information (spaces), and

communicate information with users and their agents (streams).”

(Edward A. Fox, July 1999, according to 5S Framework)

l

“Digital library work occurs in the context of a complex design space shaped by four dimensions:

community, technology, services and content”

(Gary Marchionini and Edward A. Fox, “Progress toward digital libraries: augmentation through

integration”, pp. 219-225, guest editors' introduction to “Progress Toward Digital Libraries”, eds.

Gary Marchionini and Edward A. Fox, Special Issue, Information Processing & Management,

35(3), May 1999.)

l

“The field of digital libraries deals with augmenting human civilization through the application of

digital technology to the information problems addressed by institutions such as libraries, archives,

museums, schools, publishers and other information agencies. Work on digital libraries focuses on

integrating services and better serving human needs, through holistic treatment irrespective of

interface, location, time, language and system. Although substantial collections may be created

solely for the use of individuals, we consider sharable resources one of the defining characteristics

of libraries. Libraries connect people and information; digital libraries amplify and augment these

connections.”

(Gary Marchionini and Edward A. Fox, “Progress toward digital libraries: augmentation through

integration”, Information Processing & Management, 35(3):219-225, May 1999.)

l

For a thoughtful discussion of definitions, approaches, and community perspectives on “digital

libraries” see “What are digital libraries? Competing visions” by Christine L. Borgman, pp.

227-244, in “Progress Toward Digital Libraries”, eds. Gary Marchionini and Edward A. Fox,

Special Issue, Information Processing & Management, 35(3), May 1999.

l

“The generic name for federated structures that provide humans both intellectual and physical

access to the huge and growing worldwide networks of information encoded in multimedia digital

formats.”

(The University of Michigan Digital Library: This Is Not Your Father's Library, Birmingham ,

1994)

l

“Systems providing a community of users with coherent access to a large, organized repository of

information and knowledge.”

(Lynch, 1995)

l

“Digital libraries are a set of electronic resources and associated technical capabilities for creating,

searching, and using information. In this sense they are an extension and enhancement of

information storage and retrieval systems that manipulate digital data in any medium (text, images, sounds; static or dynamic images) and exist in distributed networks. The content of digital libraries includes data, metadata that describe various aspects of the data (e.g., representation, creator, owner, reproduction rights), and metadata that consist of links or relationships to other data or metadata, whether internal or external to the digital library.

(UCLA-NSF Social Aspects of Digital Libraries Workshop)

Digital libraries are constructed — collected and organized — by a community of users, and their

functional capabilities support the information needs and uses of that community. They are a

component of communities in which individuals and groups interact with each other, using data,

information, and knowledge resources and systems.In this sense they are an extension,

enhancement, and integration of a variety of information institutions as physical places where

resources are selected, collected, organized, preserved, and accessed in support of a user

community. These information institutions include, among others, libraries, museums, archives,

and schools, but digital libraries also extend and serve other community settings, including

classrooms, offices, laboratories, homes, and public spaces.” (UCLA-NSF Social Aspects of

Digital Libraries Workshop)

l

“systems providing a community of users with coherent access to a large, organized repository of

information and knowledge. This organization of information is characterized by the absence of

prior detailed knowledge of the uses of the information. The ability of the user to access,

reorganize, and utilize this repository is enriched by the capabilities of digital technology”

(adapted from Interoperability, Scaling, and the Digital Libraries Research Agenda)

l

“Digital library is a concept that has different meanings in different communities. To the

engineering and computer science community, digital library is a metaphor for the new kinds of

distributed data base services that manage unstructured multimedia data. To the political and

business communities, the term represents a new marketplace for the world's information resources

and services. To futurist communities, digital libraries represent the manifestation of Wells' World

Brain. The perspective taken here is rooted in an information science tradition.”

(Research and Development in Digital Libraries by Gary Marchionini)

l

“A digital library is a distributed technology environment which dramatically reduces barriers to

the creation, dissemination, manipulation, storage, integration, and reuse of information by

individuals and groups.”

(Edward A. Fox, editor, Source Book on Digital Libraries, pg. 65)

l

“A digital library is a machine readable representation of materials which might be found in a

university library together with organizing information intended to help users find specific

information. A digital library service is an assemblage of digital computing, storage, and

communicate machinery together with the software needed to reprise, emulate, and extend the

services provided by conventional libraries based on paper and other material means of collecting,

storing, cataloging, finding, and disseminating information.”

(Edward A. Fox, editor, Source Book on Digital Libraries, pg. 65)

l

“an organized data base of digital information objects in varying formats maintained to provide

unmediated ease of access to a user community, with these further characteristics:

– an overall access tool (e.g. a catalog) provides search and retrieval capability over the entire data

base;

– organized technical procedures exist through which the library management adds objects to the

data base and removes them according to a coherent and accessible collections policy.”

(Peter Graham, Rutgers University Libraries)

l

“A library that has been extended and enhanced by the application of digital technology. Important

aspects of the digital library that may be extended and enhanced include :

– Collections of the library

– Organization and management of the collections

– Access of the library items and the processing

of the information contained in the items

– Communication of information about the items “

(Smith, 1995)

7. http://www.nlc-bnc.ca/pubs/nl-news/1998/feb98e/3002-06e.htm

“The literature on digital libraries contains numerous, often dissimilar, definitions of 慸 igital library'. These definitions range from the digital library as a computer data repository or a collection of digital objects, to much broader definitions that consider the digital library to be an extension of the traditional library: that is, a library that carries out the traditional library functions of collection, preservation and access provision, while integrating, to an increasing degree, digital media and remotely accessible digital library services. For librarians, this last definition is most realistic….Digital libraries are libraries , with the same purposes, functions and goals as traditional libraries.” 1

加拿大国家图书馆的数字图书馆理解

8. http://www.dl.ulis.ac.jp/ISDL97/proceedings/collier.html Towards a general theory of the Digital Library

9. http://scholar.lib.vt.edu/staff/accessibility/bobby-report-042099/7b.html Digital Library Definition for DLI2

10. Griffin , Stephen M. (Program Manager of the Digital Libraries Initiative, NSF) interview: “Taking the Initiative for Digital Libraries, ” The Electronic Library, vol. 16, no. 1, Feb. 1998: 24-27.

…digital libraries provide for collection development, organisation, access, annotation and preservation, and deal both with information in digital form as well as digital management of information residing on physical media. My definition places additional emphasis on the need to consider users and usage as part of any analytical framework used to study digital libraries.

<p style=”MARGIN: 0cm 0cm 0pt 21pt; TEXT-INDENT: -21pt; tab-stops: list 21.0pt; mso-list: l3 level1 lfo1″ class=”MsoNo

数字图书馆的概念成型期(1994~1999)

虽然本人认同较为宽泛的定义,但我们仍然需要清晰地了解数字图书馆概念的产生和演变的历史,我们应该知道别人所谈论的”数字图书馆”是什么概念,与我们是否有什么不同,这样我们在交流时才可能更好地沟通和彼此理解。

站在今天的角度,可以认为过去的二十多年一直在为数字图书馆的突现进行技术积累,清除技术障碍。直至 90 年代早期,一系列的技术进步彻底破除了建立数字图书馆所面临的最后障碍。虽然技术永远是不充分的,但经济廉价的设备和急剧成长的网络规模最终产生了量变到质变的飞跃:数字图书馆最终成为一个明确的研究开发领域,而获得大量的研究经费,得到高度重视。

1993 年 11 月至 1994 年 2 月间,美国连续有四次与”数字图书馆”有关的专题会议召开 [1] ,”数字图书馆”这一名词已经不是计算机界或图书馆界的专业术语,而成了许多专业会议的口头语。”数字图书馆”这一名词被广泛使用用,此时人们对于规范数字图书馆这一概念内涵提出了强烈要求。这一概念最早来自于人们对于计算机信息处理能力的憧憬,来自于技术所提供的可能性,也来自于构建国家信息基础设施的要求。从文献上看,自 1993 年至 1998 年,美国进行过数次大规模的研讨,包括后面将提到的美国信息基础结构技术与应用工作组 IITA( 全称 U.S. Government&apos;s Information Infrastructure Technology and Applications) 的专题研讨,虽然并没有形成完全统一的认识,但无疑对统一认识、交流成果起到了非常积极的作用。

首当其冲的依然是具有美国政府背景的研究机构及非赢利性公司等。 1986 年成立的美国”国家先导研究公司”( Corperation of National Research Initiative ,简称 CNRI )是一个非赢利性研究机构,其总裁兼首席执行长( CEO )曾经是美国国防部高级研究计划署信息处理部主任、 Internet 前身 ARPANET 的主要设计者、被《今日美国》称作因特网之父的罗伯特 · 卡恩( Robert E. Kahn ,见照片)。 CNRI 公司主要从美国政府获得经费,承担许多国家信息基础设施建设所必须的基础性研究,可以说是设计美国国家信息高速公路的主要机构,后来负责维护大多数因特网协议、标准及草案等等。”数字图书馆的基础结构”是卡恩 1995 年发表的数字图书馆奠基之作 [2] ,从某种意义上说卡恩也是数字图书馆之父。

该报告确立的数字图书馆基础结构获得了随后大多数研究计划的一致支持,被称为 Kahn-Wilensky 结构(下文简称 k-w 结构),曾有 William Arms 等写过为数不多的几篇论文对这个主题进行进一步深化和讨论 [3][4] ,但基本都沿用了该报告提出的基本概念和体系结构。本书将在第 章中较为详细地介绍这一体系结构。该报告提出的数字图书馆是一个在广域网中面向对象的分布式的数字资源组织体系。提出这些想法能够从本质上改进目前因特网在资源组织上的与生俱来的弱点。该报告提出一整套新的概念体系,例如”数字对象” (digital objects) 、”调度系统” (handle system) 、”元数据与键元数据”、”统一资源命名域 (URN:Universal Resources Namespace) 及其认证”、”资源库访问协议” (repository access protocol) 等,影响了以后的所有数字图书馆技术研发项目,包括美国数字图书馆先导研究计划( DLI1 )中的许多项目、美国国会图书馆的国家数字图书馆计划以及各大公司对于数字图书馆的理解。可能由于该报告提出的设想过于”基础”,实际上是对整个因特网结构的优化,在因特网的应用如日中天之时,不可能得到普遍推广,到目前为止我们还只能看到一些试验性应用开发项目。

该公司并不满足于提出一些基本概念和基础结构,而是与美国政府资助的许多数字图书馆项目密切合作,不断推出一些试验原型系统或”测试平台” (Testbed) ,并利用其下属著名的”数字图书馆杂志”( http://www.dlib.org )发表成果,展开交流讨论。

《数字图书馆杂志》创刊于 1995 年 7 月,全称是 d-lib magazine: a magazine of the digital library forum ,至今已发表了大量的高水平的数字图书馆研究论文,成为名副其实的论坛。该杂志很好地利用了电子出版的所有优势,同时借鉴了传统期刊的特点(例如准时、定期出版,对过刊的完整保留等),不仅是学术研究工具,同时其本身也成为数字图书馆许多新观念新理念的实践者。这是一本数字图书馆领域名副其实的核心期刊,具有难以替代的地位,并且做到了”免费”与”高质量”这一对矛盾的和谐统一。

1994~1995 年间美国关于数字图书馆方面的研讨会( workshop )不断,美国政府感到有必要统一大家对这个问题的看法,于是美国信息基础结构技术与应用工作组( U.S. Government&apos;s Information Infrastructure Technology and Applications :简称 IITA )组织了一次声势浩大的专题研究,试图弄清楚数字图书馆的研究范围、内容和应采取的步骤。 IITA 是美国航空航天局 NASA 设立的一项”高性能计算与通信计划( High Performance Computing and Communications Program ,简称 HPCC )”中的一个项目组 ,是美国国家信息基础结构 NII 的最高技术委员会。 会议邀请了多达 60 位数字图书馆及相关领域的活跃分子,向他们询问了三个基本问题:

a. 什么是数字图书馆?它与一般的信息库或因特网有什么区别?将会有多少数字图书馆?它们相互之间的关系怎样?用户看到的数字图书馆是怎样的?

b. 数字图书馆需要怎样的基础结构?由哪些要素组成?与 NII 所需的更宽泛的基础结构有何不同?基础结构与标准的关系如何?谁会使用这些基础结构?这些基础结构怎样处理与知识产权管理有关的出版商关心的问题?

c. 怎样评价数字图书馆?如何知道三四年后现在的研究项目成功地为用户开发了有效的数字图书馆服务?

为了使会议避免无休止的争论、更好地达成一致看法,会议还根据专家的不同背景分了五个小组,它们是:出版界、商业、图书馆界、因特网领域和多媒体领域,分别进行讨论和总结 [5] 。会议就数字图书馆研究急需解决的问题达成了初步一致的意见,并基本确认了 k-w 结构作为数字图书馆基础结构所确立的基本框架。结论分为 5 个方面:互操作性、数字对象及对象库的描述、收藏的管理与组织、用户界面与人机交互以及经济、社会和法律问题,为以后的研究工作确立了框架,理清了思路,划定了边界,对以后美国国内数字图书馆的研究发展产生了巨大的影响。

[1] 1994 年 IBM Research Report RJ 9840, May 1994.Submitted to IEEE Computer Society Press, Proc. Workshop on On-line Access to Digital Libraries ,见本书网页: http://www.libnet.sh.cn/introdl/ 。

[2] Robert Kahn and Robert Wilensky, “A Framework for Distributed Digital Object Services”, May 1995. (http://WWW.CNRI.Reston.VA.US/home/cstr/arch/k-w.html)

[3] William Y. Arms “Key Concepts in the Architecture of the Digital Library” D-Lib Magazine, July 1995

[4] William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

William Y. Arms, Christophe Blanchi, Edward A. Overly “An Architecture for Information in Digital Libraries” ( http://www.dlib.org/dlib/february97/cnri/02arms1.html )

[5] 见 IITA 有关资料。

[5] 见 IITA 有关资料。

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=552968