存档二月 2005

呼唤数字图书馆的“统一场”理论- –

数字图书馆需要整合。不是说某一个数字图书馆的资源,或者服务需要整合,而是数字图书馆的研究内容需要整合。

记得七、八年前我们刚接触数字图书馆的时候,被其”博大精深”,或者说”混乱无序”弄得非常沮丧。除了一些零散项目、计划的举例,不知道如何认识、怎样下手。好不容易提出了”三种数字图书馆”:即来自计算机界的研究开发、来自各类机构的服务体系建设和纯粹的数字化,又觉得分类很粗,缺乏逻辑,无法反映数字图书馆内在的体系结构和本质联系。

在美国虽数字图书馆的支持接近尾声之际,似乎到来了数字图书馆总结之时( NSF 的”后数字图书馆时代”的提法颇有些对数字图书馆进行”清算”的味道,见” 鳕鱼岬会议 “博客文章。在对 2002 年以来的数次数字图书馆”峰会”(指以回顾展望为主题的管理型的工作会议,如 NSF/DELOS 的一些会议。 99 年也曾召开过一些)进行认真学习之后,突然感到数字图书馆的”学科体系”似乎已然建立,从 Fox 等人的 5S 基础理论( Leon 说 Witten调侃其 为”五行学说”)以及 SFX 的发明人 Sompel 呼吁数字图书馆基础理论建立的必要性,一直到 NSDL 、 CDL 以及 LoC 实打实的建设,以及从技术角度 Digital Library 与 Semantic Web 的联姻,并共同迎接 Cyberinfrastructure 的挑战。数字图书馆的社会性、人文性、技术性正在融合,站得高一点,打破学科之间的固有樊篱,整个图景会变得越来越清晰。本人很想就数字图书馆建立”统一场理论”作一些研究。目前可资借鉴的报告就有如下数篇(名称凭记忆列出):

当然这项研究需要理论与实践的结合,需要不同”粒度”的研究,需要技术与人文的对话。尤其重要的,是需要一个崭新的视角、宽广的视野和突破传统的勇气。这些都不是靠个人的力量所能达到的,需要一个团队,一批人共同的努力。无奈的是国内这个圈子的人太少了。


Technorati :

Michael Gorman最近有点烦

本不想对 Michael Gorman 最近发表的观点 发表什么意见,实在没空写这个故事,而且那毕竟是美国人的事情。然而我的博客聚集器中众多的美国同行都有反应,甚至是强烈反应,他自己都意识到引起了”轩然大波”(big stir),甚至有人骂他白痴(idiot),要串联签名呼吁他下台。使我想到这可能是一个行业中一部分守旧人士的普遍问题,是我们这个学科的问题。 Gorman 作为一个国家的当选图书馆学会主席,一贯坚持图书馆的人文主义性质和信息技术的功能主义特点,然而这次好像在信息技术的功能主义道路上走得太远,对”先进生产力的代表” Google 以及 Blog 连讽刺带挖苦,几乎表现出”仇很”,以至于几乎使其晚节不保。不禁使我想到,我们是不是也有领导有这个问题?

可能国情不同,我们总是见到领导对技术敬畏有加,这应该与三个代表的教育有关,也与国情有关。近代中国的落后给我们几代人都烙下了深深印记,”师夷之长技以制夷”,领导总的素质还是不错的,即便没有很强的技术理解力,技术支持力还是有一些的,特别是现在越来越多的钱投入到了图书馆信息技术能力的提高方面,不管效率如何,以及是否好钢用在了刀口上。

然而还是有一些领导总是愚蠢地认为技术是可以用钱买到的,数字图书馆似乎只要投入,指日可待。姑且不论我们这个行业能够有多少资金投入,就算是不愁花钱,观念的落后,体制的束缚,管理的低效,也会把信息技术创造的优势消耗殆尽。 Gorman 蔑视 Blogger 们文笔粗糙,(就差说”没有文化”了),对 Google 充满疑虑和戒心,(仿佛兰开斯特为图书馆掘了坟墓, Google 又要上来推一把),但那毕竟是一个守旧的智者深思熟虑之后发表的观点,就怕我们很多 的Stakeholder 们连思考都懒得思考,或者根本就麻木不仁。我从感情上很赞同我们北京大学一个研究所最近的研究报告,说我们与美国的差距不是一点点,而是一百年!我们都知道这是在麻痹美帝国主义,然而实际上能够好多少呢?

这番议论没有任何价值,也算是完成今天写博客的任务吧。

Michael Gorman (1941– )

王美鸿 Mei-Hung Wang

E-mail: mhwang@cc.nctu.edu.tw

【摘 要】

  本文旨在介绍图书馆界编目的权威 Michael Gorman 。 文中,首先摘要简介他在图书馆事业生涯的英国书目局、美国伊利诺大学及美国加州大学三个时期的工作经历与论著。其后,综合他参与修订编目规则的经验、担任图书馆技术服务主管的经历及发表的丰富论著,发现 Michael Gorman 是一位务实的图书馆员、热忱的图书馆学的教育家、书目控制的权威及信息技术的机能主义者。

【 Abstract 】

This article introduces Mr. Michael Gorman, a well-known authority on library cataloging, an experienced editor in ISBD and AACR2, a leader in the technical services division and an enthusiastic educator in library science. As an authority on bibliographic control and a functionalist of information technology, Mr. Gorman has published numerous articles in many professional and scholarly journals.

关键词: Michael Gorman ;技术服务;编目;英美编目规则第二版

Keywords: Michael Gorman; Technical services; Cataloging; AACR2

壹、前言

  「在信息高速公路蓬勃发展下,传统的图书馆即将消失。」、「信息将以电子化的方式储存、传递 与呈现,未来的读者将使用虚拟的图书馆,因此不需再建立图书馆的馆舍了。 」、「全文检索将可取代图书馆编目的功能。」,诸如此类的说法,纷陈于市。于图书 馆界中,经常疾言厉色的反击上述的说法,并理直气壮的强调图书馆的历史传统与独特功能者,以 Michael Gorman 为最。 ( 注 1)( 注 2) 究竟是怎样的教育背景与专业经验,使他对于图书馆事业的未来发展仍旧信心十足呢﹖本文的主要目的,即是来介绍 Michael Gorman 。文中,首先介绍他在图书馆事业生涯的三个阶段,分别为:英国时期、美国伊利诺大学时期及美国加州大学时期的经历与论著。接着,综合他的论述与经验,汇整出他于当前图书馆事业的地位与贡献。文后,整理出他的著作目录及专业活动的年表,以为附录。

贰、生平

   Gorman 生于 1941 年,于 1964 年至 1966 年接受英国 Ealing School 的图书馆专业教育。他于图书馆事业的生涯,至目前为止可分为三个时期﹕第一为 1964 年至 1977 年的英国时期,主要致力于书目编目规则的编订工作﹔第二为 1977 年至 1988 年,在美国伊利诺大学时期,主要从事技术服务的行政业务﹔第三则是 1988 年迄今,于加州州立大学担任图书馆馆长。 ( 注 3) 此三时期主要的工作与论述,分别介绍于下﹕

一、英国时期 (1964-1977)

  英国时期的 Gorman ,接受了图书馆专业教育后,前后参与英国国家及国际性编目标准的制定研究。此阶段的经历与论著,分别为﹕

( 一 ) 经历

Gorman 于 1964 年进入英国的 Ealing 图书馆学校,接专业的训练。在修业期间,表现非常优异。 1965 年参加期中考试,获得全英国成绩最佳奖 (Cawthrone Prize) ﹔ 1966 年的毕业考试,其中,有两科获得最佳荣誉、两科得奖章。 Gorman 于图书馆学校毕业之后,在 1966 年至 1967 年间,参与西北技术学院图书馆学系与英国国家书目局的研究计划,从事研究助理的工作。由于此份工作,使他一生与书目控制领域,结下不解之缘。在工作一年后,他获得英国图书馆学会认可的助理图书馆员资格。接着, 1967 年至 1974 年间,他任职于英国国家书目局,前二年担任作者编目修订馆员,后三年担任编目组主任一职。 1972 年至 1974 年,他于大英图书馆规划处,担任书目顾问。在 1974 年夏,他到美国伊利诺大学香槟校区的图书馆学系,担任访问教授。于 1974 年至 1977 年,他担任了大英图书馆书目标准室主任。

在英国的这段期间, Gorman 积极参与国际性书目标准的制定,并担任重要的职位。他于 1969 年代表英国国家书目局,参加在哥本哈根举行的「国际编目专家会议」,与各国的专家代表一起探讨合作编目的可能性。随后,他即代表英国参与国际标准书目著录 (International Standard Bibliographic Description, ISBD) 的编订工作,并担任秘书长的职务。在此期间陆续完成单行本、连续性出版品、通则、非书数据及地图数据等版本的国际标准图书著录规则。 1974 年,他又参与英、美、加三国会议,讨论修订英美编目规则 (Anglo-American Cataloguing Rules, AACR) 事宜。随后, Gorman 与 Paul Winkler 被聘为编订 AACR 的编辑。 Gorman 原本就非常合适担任此任务,他长久以来在英国国家书目局从事编目标准的制定工作,再加上对 AACR 有深入的研究,又参与 ISBD 的编订。

( 二 ) 论著

于国家书目局任内,他先后完成三份研究报告。在 1968 年,曾研究 1967 年出版的英国版 AACR 里款目与标目的规则﹔在 1970 年,亦完成大英图书馆使用英美编目规则的研究报告﹔在 1971 年,编制国家书目局机读编目格式的工作手册。

他于此阶段发表的期刊论文有﹕ AACR 之评论、编撰修订 AACR2 之说明、修订 ISBD 之说明、回溯建档之步骤及编目馆员的态度等五方面,分别介绍如下﹕

1 、 AACR 之评论

Gorman 早期对于 AACR 的研究成果,除由英国图书馆学会出版之外 ( 注 4) ,同时也发表于由英国图书馆学会出版的期刊 ( 注 5) 。在此研究报告中, Gorman 首先回顾编目规则的发展﹔其次介绍 Antonio Panizzi, Charles A. Cutter 及 Seymour Lubetzky 等编目先驱者的论点﹔接着,他比照当时的编目理论及他个人的经验,评析 AACR 的著者、基本原则、人名、团体名称、政府机构、划一题名、副款目、叙述、特殊媒体及排列等项目。 Gorman 并不同意 AACR 中作者与团体作者的定义。 AACR 认为作者是一个人或团体,对该作品的制作上,于知识上或技术上有重要贡献者;但是, Gorman 认为出版技术日趋复杂,一作品经常靠许多人的贡献才能出版,因此此种作者的定义过于含糊﹔此外,与一出版品相关的团体,可能包含出版者 (published by) 、资助者 (sponsored by) 、呈献对象 (published for) , AACR 对于团体作者的定义过于简化,令人难以分辨。其它他也不同意 AACR 中对于作者的选取与表现的格式。虽然,在此研究报告中,他对 AACR 里主要作者的选定与团体作者的定义,有严苛的评述,但他也认为 AACR 的基本原则与结论中的观点,是正确且合于时宜的。整体而言, Gorman 肯定 AACR 的价值,认为它是图书馆史上的一个重要的里程碑。

2 、 AACR2 修订之说明

Gorman 在此阶段的后期,对 AACR 的研究,由评论转为建议,并直接参与修订编辑的工作。在此方面研究的具体论著,有﹕款目与标目及连续性出版品的编目规则两方面。 在承继着 Panizzi 与 Lubetzky 等人的努力之后, Gorman 认为修订 AACR 的主要目的,是来解决英语体系作者篇名目录中款目排列的问题。 AACR2 在款目的选择与标目形式方面,皆有所进展,尤其是使用团体为标目与采自然语法著录等,皆取得英美两国图书馆的共识。修订 AACR 的主要原则,除遵守 AACR 所采用的巴黎原则的精神外,另外也配合机器处理编目的发展与 ISBD 著录各类型数据的原则,来做修订。同时,他亦指出编目作业自动化后,编目的原则将有所改变,例如,主款目的重要性与选取对象均异于往昔,著者、题名和团体名称皆可以选为主款目。他相信在善用科技的发展及寻求国际的共识与合作下,图书编目将会有另一黄金的时代。 ( 注 6)

对连续性出版品的书目标准, Gorman 也曾撰文陈述他的观点。文 中,他首先指出连续性出版品的特性与连续性出版品的国际标准著录的内容。连续性出版品的编目,首要解决主款目的选择、排列顺序及刊名改变的问题。他对于连 续性出版品有其独特的见解。他认为连续性是一种状况 (condition) ,而非书目的状况 (bibliographic condition) ﹔也就是说,在叙述图书馆的数据,不论该数据是印刷、微片、或视听数据,均可将之分为完整或非完整的项目。非完整的项目即是指连续性 出版品;因此, AACR2 对连续性出版品的编目改为记述一期,即以第一期为基准,在附注项中,说明后来刊期中不同的资料。这样就可使各图书馆的数据一致,利于连续性出版品中信息的分享。 ( 注 7)

3 、修订 ISBD 之说明

ISBD 的初稿,于 1971 年完成,随后经过修改,于 1974 年发行第一标准版。同时 IFLA 也组成联合工作小组,致力于期刊著录标准化的工作,依据 ISBD(M)(Monography) 的结构,在 1974 年出版国际标准书目著录用连续性出版品 (ISBD(S)(Serials)) 的初稿,且于 1977 年完成第一标准版。 ( 注 8)

Gorman 在这一段期间内,参与各类 ISBD 的编订工作。他对从事的工作非常专注。在 1973 年, Gerald Swanson 于 Library Journal 撰文质疑美国国会图书馆采用 ISBD 的著录方式, Gorman 以 ISBD 工作小组秘书长的身分,立即响应说明 ISBD 的功能与国会图书馆应用国际性标准之适用性。 ( 注 9) 此 外,为说明 ISBD 的标点符号与规则,将会造成使用障碍的疑虑, Gorman 以实验方法进行一实证性的研究。此研究假设是,读者理解 ISBD 著录与非 ISBD 著录的书目,并没有显著的差异。实验的结果推翻其假设。经由四十多位大学生阅读不同著录方式及不同语言的目录卡片,结果发现 ISBD 的著录具有系 统化与一致性,的确有助于读者了解书目纪录。 ( 注 10)

依据多年来参与 ISBD 的订定, Gorman 于 1978 年撰文叙述 ISBD 的发展历程。他认为 ISBD 地位与功能的混淆,皆来自于其纠结的发展过程。 ISBD 既不是使用手册也不是编目规则,其主要的支助者 IFLA 更不愿称之为标准,但图书馆实务界却希望 ISBD 成为编目的规范。不过, Gorman 仍是肯定 ISBD 书目记述的项目、顺序及标点符号的标准清单等原则, AACR2 也将参照这些原则来做修订。 ( 注 11)

4 、回溯建档之步骤

Gorman 于 1976 年 夏,在伊利诺大学图书馆学系的讲习会中,依据他在大英图书馆的经验,发表专文讨论回溯建档的经济效益。回溯建档的目的,除了将源文件转为计算机文件外,最重 要的还是计算机化的系统可比人工系统提供更佳的服务。在规划回溯建档时,转文件的资料、书目的来源、书目内容的层次、书目数据的标准、输入的方式、质量控制及 人员的训练等,都须谨慎做全面性考虑。此文所提的皆是众所皆知的步骤,但是他一再的强调回溯建档不只是为回溯建档而建档。他认为在训练馆员做回溯建档工作 时,不仅要让馆员熟悉编辑、键盘、检查等技术性的技能,更须全面性的了解所使用的书目标准,以及所建立书目档案在整个自动化系统的功能;他甚至一再的强 调,回溯建档的最终目的,是提供读者更佳的服务。 ( 注 12)

5 、编目馆员的工作态度

1941 年 Andrew Osborn 曾发表” The Crisis in Cataloging “一文,引起当时图书馆界的热烈讨论。文中 Osborn 将编目馆员分为四种类别﹕遵守法规型、完美主义型、书目型及实用主义型。 Gorman 认为这样的分类已经过时,在 1975 年,他将编目馆员的类别加以修改,分为﹕颓废者 (the decadent) 、机械万能者 (the stern mechanic) 、虔信者 (the pious) 及机能主义者 (the functionalist) 。 所谓颓废者,是指编目馆员只重视目录的形式,而不关心目录的目的;只注意标点符号的位置,而不考虑目录的意义。他发现可能是图书馆学系编目课程的设计不 当,造成颓废者的增加。他认为当时最迫切的需求,不是训练更多的编目馆员,而是要让更多的馆员了解目录的内涵及目录在图书馆的重要性。所谓机械万能者,系 指认为机械可以解决所有的问题者。当时有些人以为复制的机器与计算机,可以解决目录制作的问题。 Gorman 则 认为要解决编目的问题,譬如计算机化后是否需要主款目的争议,不光是只使用计算机就可以解决,而是改变编目观念与修订编目规则,才是首要的工作。而所谓的虔信 者,系认为编目是一神圣的工作,任何人或机器都不能怀疑其业务;编目规则就如圣经一样,不可置疑。最后一类的编目员﹕机能主义者, Gorman 认为此种人才可以拯救图书馆目录的现况。机能主义者相信目录的功能,但不盲目的相信目录是全能且神圣不可侵犯﹔机能主义者将会善用现代化的机械,让目录发挥更大的功能,但不会将机械化视为唯一的目的。虽然, Cutter 在 1904 年说编目的黄金时代已过去了, Osborn 在 1941 年也指出编目的危机, Gorman 却非常的乐观,认为编目机械化、自动化后,另一编目的黄金时代将会来临。编目馆员是进步的障碍或是成功的关键,端视于编目馆员对于编目目的的了解与应用新科技的态度而定。 ( 注 13)

二、伊利诺大学时期 (1977-1988)

   Gorman 于 1977 年离开英国,应聘到美国伊利诺大学香槟校区图书馆,担任技术服务部的主任,并任教于图书馆学系。在此阶段,他关心的除书目标准的应用与发展外,更扩展至技术服务自动化、图书馆管理及图书馆教育等议题。以下藉由其经历与论著两方面,来介绍他此阶段的事迹。

   (一)、经历

1977 年至 1981 年间, Gorman 担任伊利诺大学图书馆技术服务部门的主任。该图书馆为顺应自动化的冲击,在 1981 年调整部门组织。他在 1981 年至 1988 年担任一般服务部门的主任,并在 1986 年至 1987 年间代理图书馆馆长。除担任图书馆行政工作外,他也于伊利诺大学的图书馆学系开授图书馆行政科目﹔在 1984 年及 1986 至 1988 年间,也曾至芝加哥大学图书馆学系任访问教授。由于他在分类编目领域的贡献, 1979 年 Gorman 荣获 Margaret Mann 奖。

(二)、论著

Gorman 在伊利诺大学时期的论著颇为丰富。 AACR2 的修订版于 1988 年出版。此阶段他在技术服务领域的工作与研究心得,则呈现于他主编的 Technical Services Today and Tomorrow 一书中。 ( 注 14) 此外,他亦活跃于美国的书馆专业组织,在 1983 年及 1988 年举行的第一、二届美国图书馆与信息科技学会 (The Library and Information Technology Association , LITA) 的研讨会,他负责主编会议论文集。 在期刊论文方面,他除为 American Libraries 撰写书目控制的专栏外,也在其它重要期刊上发表论著。

  他于这段期间探讨的主题,主要有﹕书目纪录标准与编目规则、连续性出版品管理、图书馆管理及图书馆教育等,兹分别介绍于下﹕

   1 、书目纪录标准与编目规则

由于他曾参与 ISBD 与 AACR2 的编订,因此他成为编目标准的阐释者。在 1978 年 AACR2 出版的同时,他特别撰文介绍 AACR2 的目的、结构及各部分的特色,是概要式了解 AACR2 必读的文章。 ( 注 15) 当时,有人认为书目自动化之后就不需有编目规则与标准时,他却认为新系统将会有新的规则。新的编目规则与标准,需要各方的合作,来全面考虑现有的 AACR2 、 MARC 、国会图书馆主题标引及排架规则等内容。他建议图书馆员不要花费太多的心思于小细节上﹔而是要有宽广的眼光,重新解释书目控制的目的与方法。 ( 注 16)

虽然,他编订了多种书目纪录的标准,但他并不墨守成规,他支持不同层次的著录方式。依据研究显示,五分之 四的目录使用者查询已知的项目,因此,对于公共图书馆或学校图书馆而言,第一层次的著录已足够。他强调其实用主义的论点 — 追求多数人的最大幸福,而不是 事事追求完美。 ( 注 17)

在 1989 年 Gorman 撰写专文回顾五十年来英美编目规则记述编目的发展。文中提及,团体作 者、划一人名标目、主款目及卡片目录,在以往有其正统的地位,由于出版形式、编目观念及目录形式的改变,其功能已异于往昔,而这些改变已呈现于 AACR2 中。以主款目的变化为例,他介绍了 Dewey 、 Cutter 等人对于主款目的定义与功能,即主款目是完整或主要的款目,通常为作者,其功能除利于分辨每一 书目单元外,也方便排片。但是利用计算机处理书目之后,展现、查询的方式呈多元化,主款目的选取与否,不再是那么重要。文后,他仍是秉持其实用主义的态度, 乐观的看待计算机化后编目规则的自然改变。 ( 注 18)

2 、连续性出版品管理

Gorman 在编订 ISBD 与 AACR2 时,连续性出版品的书目控制,有独到的看法。 1980 年起,他服务的伊利诺大学图书馆的组织架构重整,也致使他对连续性出版品的研究,扩展至期刊自动化管理及组织架构等议题,并陆续发表多篇相关的论文。他 认为连续性出版品的自动化,千万不可基于目前的直线式的记录方式,而是需要对单一的纪录,提供更多的联结。以往连续性出版品的目录,只提供有限的检索点, 因此检索的效果有限。因此,他建议在 MARC 的 700 段中,可加入与连续性出版品相关的作者、团体、变换的刊名及主题等项目以利检索,甚至可与其它数据库 相联结。他强调图书馆使用计算机,不是只将目前的工作自动化,而应该要重新考虑工作的流程,并尽量简化。他建议图书馆不要一味的顺应外界的变化,而是要主动 的做为改变的机制。 ( 注 19-23)

   3 、图书馆组织与管理

伊利诺大学图书馆于 1981 年起调整组织架构,将较具专业性的原始编目、学科书目及馆藏发展分散至各分馆处理,而将较不具专业性的一般业务与抄录编目集中处理﹔将图书馆分为一般服务处与公共服务处。一般服务处之下,设有采购、抄录编目、自动化纪录管理、流通、集中式参考服务 ( 包含有参考图书馆、询问台、档案图书馆 ) 、书库管理及装订等部门。在公共服务处之下,有 35 个以上的系所图书分馆与大学部图书馆,各分馆负责选择馆藏数据、参考服务、原始编目、书目指导及专题书目服务等业务。 Gorman 解 释此种组织架构的调整,乃是由于人力资源的经济效益、图书馆自动化及社会变迁所造成。组织重整的目的,不只是为读者提供更好的服务,同时也可提供馆员更好 的工作环境,提高其工作满意度。他本着其乐观的态度,鼓励馆员不需为自动化的冲击而感到沮丧,自动化将为馆员制造更美好的时光。 ( 注 24-26)

Gorman 掌管的一般服务处,也负责书库管理的业务。在这段期间内,他曾撰文陈述他 对于电动式密集书库的看法。由于读者有浏览书架的行为与及时取得书籍的需求,他认为密集书库比设远地的储存书库、制成微缩片、或全面电子化更具经济效益。 密集书库有书库维护、地板承重要求及不方便多人同时使用等缺点﹔但节省空间、节省经费、安全性高及方便读者使用等优点,已足以胜过缺点。 ( 注 27-28)

他对于技术服务的实际工作与研究心得,呈现于他主编的 Technical Services Today and Tomorrow 书中。 ( 注 29) 此书的内容包括采购、书目控制、书籍保存、自动化与技术服务及技术服务的行政管理。 Gorman 邀请他在伊利诺大学图书馆的同事参与撰写,他本人则负责写 序、跋及书目控制叙述编目的部分。在序言中,他首先界定了技术服务的范围,并且强调在自动化的图书馆中,技术服务将是所有图书馆活动的中枢。在书后的跋 中,他提醒技术服务部门的馆员,不宜妄自菲薄﹔技术服务的主要目的,是在有限的时间与经费之下,获取、组织、传递及流通知识与智能的载体。图书馆员不要惧 怕去学习新的技术,技术只是一种完成目的的工具,而图书馆与图书馆员的功能与存在的价值,是历久不衰的。

4 、图书馆教育

Gorman 同时担任图书馆的行政工作及图书馆学系的教职,他曾接受过英国图书馆专业训练,因此对于图书馆学的教育有其独特的见解。他认为技术服务方面的教育需要配合更多的&


Technorati :

知识的接生婆

苏格拉底曾说,他是他的听众的 知识的”接生婆 “。( Socrates said he was the midwife to his listeners, i.e., be made them reflect better concerning that which they already knew and become better conscious of it. If we only knew what we know, namely,k in the use of certain words and concepts that are so subtle in application, we would be astonished at the treasures contained in our knowledge. — Immanuel Kant “Vienna Logic” )知识远比用概念、词汇和句子表达出来的要丰富的多。知识的宝藏需要挖掘。做到这一点对计算机来说将有很长的路要走。

从某种程度上来说图书馆员、教师等作的工作也是”知识接生婆”的工作,他们启迪知识、传播文明、点燃独立人格,使更多的人有尊严地生活。这其中有许多内容是机器永远无法替代的。(当然这只是从职业角度上来说的, 自己是火种才能点燃别人 ,有多少教师、图书馆员有这种职业意识?像 Dead Poets Society里的Keating,或Mona Lisa Smile里的Katherine Watson )?

计算机科学对语言的研究

计算机科学对语言的研究(包括对自然语言和对人工语言)大致有三个路向:语法syntax语义semantics语用pragmatics, 语法研究语言的形态结构,语义研究语言与其所指代对象的联系,语用研究语言和其使用者之间的联系(从使用者角度、按使用者的需求对语料进行差异化)。计算 机没有智能,计算机智能都是假的,是人给它安装上去的(像是变魔术,有人创造,目的在骗人,当然达到了目的:娱乐、教育、传递信息等),所以计算机语言最 大的特点是形式化(Formalization,包含规范化Normalization的意思),计算机语言的形式化分为语法形式化和语义形式化两个方面,形式语义学研究语义形式化,包括操作语义学、指称语义学、公理语义学和代数语义学四种。具体可参考:

  • 陆汝钤,计算机语言的形式语义.北京:科学出版社,1992
  • 屈延文,形式语义学基础与形式说明.北京:科学出版社,1998
  • 周巢尘,形式语义学引论,长沙:湖南科学技术出版社,1985

另外上海师范大学物理信息学院陈仪香教授对此也有深入研究。以下对四种语义学的简介来即自陈教授”形式语义的论语理论研究进展”一文(见下列著作第二章:陆汝钤主编,《知识科学与计算科学》.北京:清华大学出版社,2003)

  1. 操作语义的基本思想是建立一个抽象机器以模拟程序在执行过程中如何进行数据处理。
  2. 指称语义的思想是使语言的每一成分对应于一个数学对象,该对象称为该语言成分的指称,程序看作输入域到输出域的映射,输入域和输出域统称为论域。因此论域与映射是指称语义的基本研究对象。
  3. 公理语义实在程序正确性验证的基础上发展起来的,它给出一种方法,使人们在给定的前提下,验证某种特性是否成立。
  4. 代数语义的基本思想是把描述语义的逻辑体系和满足这个逻辑系统的各种模型统一在一起,同时把模型的集合看成是以代数机构,研究这些模型之间的关系。

戴维民主编的《信息组织》一书(高等教育出版社.2004 面向21世纪课程教材)中认为语法、语义和语用信息的分法是按照信息组织的层次分,具体解释如下:
从认知的角度,可把信息分为语法信息、语义信息和语用信息。由于主体具有观察力,能够感知事物运动状态及其变化方式的外在形式,由此获得的信息称为语法 信息;由于主体具有理解力,能够领悟事物运动状态及其变化方式的逻辑含义,由此获得的信息称为语义信息;又由于主体具有明确的目的性,能够判断事物运动状 态及其变化方式的效用,由此获得的信息称为语用信息。
有一定道理,好像又不是很确切。不知道这种理解出自何处?语言学?哲学?认识论?

读Lorcan Dempsey等人的一篇报告

OCLC 的副总裁 Lorcan Dempsey 最近完成了一篇有关元数据应用新环境文章: Metadata switch: thinking about some metadata management and knowledge organization issues in the changing research and learning landscape ( Draft Version 见: http://www.oclc.org/research/ publications/archive/2004/dempsey-mslitaguide.pdf ),不少很好的观点。

学术研究活动的模式随着网络应用的纵深发展而不断变化,图书馆对于知识的整理和元数据的应用等也必须随着环境的变化而发展。文章第一部分重点论述了 OCLC 在著名报告《 environment scanning 环境扫描》中提出的观点:我们的学术环境正在发生根本性的变化( Changing Patterns of Research and Learning )。使我想起了图书馆学基础理论中著名的几个交流论(自米哈伊洛夫的交流论到宓浩黄纯元的社会知识交流论),传统的知识交流链在 20 世纪一直发生着改变,直至信息社会,成为一个有多个角色参与的,非常复杂的流程。 LD 附了一张图示:

Lorcan Dempsey 的报告的第一部分基本上就这个图进行分析说明,并由此推出对于图书馆的需求和挑战,诸如:

由此图书馆应该做到:

文章的第二部分” OCLC 相关研究”介绍了 OCLC 近年的一些研究课题、研究成果和想法。与第一部分 OCLC 的认识相呼应:

整个第二部分队上述功能进行了详细的解释,基本利用了英美正在进行的一些项目所提出的解决方案和正在做的工作。

LD 希望上述服务尽可能以 Web Services 形式实现。他举了一个很好的用 WS 技术实现人名规范控制的例子。可以做到松散耦合,即插即用。当然如何实现,可以有多种方法,在目前的技术环境下,各有优缺点。我们就考虑是否能采用纯粹的语义万维网的形式( FOAF 架构)来实现,应该从灵活性、可扩展性上具有无比的优势,但是对传统应用的结合程度就不好说了,非互联网应用(例如我们现在的编目)是否能够集成进去,另外安全性如何?并发控制如何?数据量大了之后的可用性等等都是问题。

OCLC 目前应该说代表了图书馆界参与了信息时代的许多变革,例如与 Google 的一些合作等,他近年的表现显示了它一贯的开放、平等的理念,当然图书馆界,特别是欧洲的图书馆对它的许多大动作,以及新的理念、计划、项目等还是抱有戒心的。然而相对于信息技术应用的迅猛发展,我感到 OCLC 也有些力不从心,我们广大的图书馆如果不支持它一把,很可能我们也就一同完蛋了。虽然 OCLC 是一个 Coporation (尽管 non profit ),毕竟代表了图书馆行业,希望我们能够在数字信息时代继续争有一席之地。


Technorati : ,

关于METS用于资源集合的两个问题

METS网站上找了半天,还没有找到答案,先把问题记在这里:

  1. METS作为元数据方案的Wrapper,如何进行不同元数据方案的互操作(映射或者中介)?这个功能可能放在extension schema中的,或者通过Establish registry of METS repositories来实现?
  2. METS对于数字资源集合元数据的编码是否有用(通过它的structural map)?

元数据项目在编码方案方面应该参考METS

METS Profile:

METS profiles allow digital libraries to specify constraints that they place on METS for ingest, storage/processing or dissemination, including:

  • dictating use of particular extension schema, rules of description, and controlled vocabularies
  • specifying arrangement and use of METS elements and attributes for particular classes of documents
  • specifying the technical characteristics of data files within a METS object
  • identifying tools for creating/processing METS documents compliant with a particular profile

资源集合元数据登记系统

资源集合元数据主要是提供机器与机器之间的理解机制,解决分布环境信息资源集合的封装、提问分发等实用的元数据形式。目前一个比较成熟的做法是利用资源集合的注册系统,作为分布信息环境中的中介,进行资源集合的揭示、管理。其中主要要解决以下问题:

  • 注册系统的协同、标准化问题。

  • “服务”的描述。

  • 资源集合的描述来自开放标准,(是否依旧可以以应用纲要形式?管理元数据等如何办?)

  • 注册系统的基本功能:XML Repository, Meta-registry, several interface including server to server (SOAP/Z39.50/OAI)

资源集合注册体系的功能:

  • 注册系统实际上是提供了机器利用的portal
  • 对于普通用户来说,提供了单一入口、整合的导航工具,把相关的资源集合集中在一起,提供可选的获取信息的方案(最方便?最便宜?最符合自己需要?)。
  • 提供到资源集合的指向(导航);
  • 提供多集合的统一/联邦查询

资源集合注册系统包含的内容:

  • 资源集合的相关信息
  • 服务信息(eg. OpenURL etc.
  • 技术信息
  • 权限信息
  • 资源集合各类责任实体信息

资源集合描述的要求:

  • 不仅给人使用,更重要的是M2MS2S。因而需要大量的标准,符合众多的协议。例如在Web Service架构下;
  • Query的分发;
  • 本体的支持

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:

要求(方法):

  • 定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
  • 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
  • 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
    • 可以规定元素的编码规则;
    • 可以规定元素的值的约束;
    • 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
  • 如果需要增加”新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
  • 编码规则(制定置标方案)(机读);
  • 编写有关应用文档(人读)

过程:

  • 根据资源类型和系统开发需要,定义元数据及数据元素需求
  • 选择现有的最合适的元数据标准规范(元数据元素集)
  • 复用标准的元素,根据目标系统的需要赋予特定的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表
  • 扩展元素/限定并进行定义,赋予本地的命名域进行管理

资源集合描述元数据基于:

  1. Research Support Libraries Programme name (RSLP) Collection Description schema (RSLPCD) ( RSLP Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/)
  2. DC CD AP

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:



[1] 元数据应用纲要参见CEN CWA14855

资源集合描述的对象:

  • a collection; (may have many services that provide access but it must have at least one service registered in registry.)
  • a service, either informational (i.e. providing access to a collection), or transactional;
  • and an agent that is the owner of a collection or an administrator of a service. (An agent may be an owner or an administrator, or both, of many collections or services.)

资源集合的类型

DCMI提案(2003年10月)

扩展:

资源集合描述

增加的元素如searchable元素,表示内容是否可以检索。还有一些纯粹是informational型的。

对于控制词表也做出一定的规定,例如增加usesControlledVocabulary元素。

hasService元素用来描述资源集合所能提供的服务,比DCMI的isAvailableAt 和RSLPCD 的‘locator’元素都要清晰。后两者可同时应用于传统资源和电子资源,而hasService更直接地指用于电子资源。
the coverage, geographic, temporal and educational of the collection, containing or associated collections, and related publications.
权利类:‘dc:rights’,
‘dc:rights’ records any copyright statement about the collection. ‘iesr:useRights’ contains a statement about allowed usage of data from the collection, such as terms and conditions. ‘dcterms:accessRights’ holds information about any licence requirements to access the collection.

服务描述

locator采用:Z39.50或SOAP作为locator的属性值,但是一些服务还需要进一步信息,例如合法用户登陆信息等。
Title
Description
Locator (服务的一个入口,例如一个url或端口)
dc: type包括:Z39.50, Web Services SOAP, SRW (Search – Retrieve – Web) [14], and OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), webpage, webcgi
iesr:interface
iesr:supportsStandard.
注册系统的管理:

每一个注册实体都需要给定一个标识符POI(PURL-based Object Identifier)

编码举例:

<dcmitype:Collection>
<dc:title>zetoc</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056366559-25788
</dc:identifier>
<dcterms:abstract>The zetoc database, the British Library’s ETOC, contains…
</dcterms:abstract>
<dc:type xsi:type=”dcterms:DCMIType”>
Collection</dc:type>
<dc:type xsi:type=”rslpcd:CLDT”>
Catalogue.Library.Text</dc:type>
<dc:rights>Copyright (c) British Library 1993-2004</dc:rights>
<iesr:useRights>All Rights Reserved. http://zetoc.mimas.ac.uk/terms.html
</iesr:useRights>
<dcterms:accessRights>
Available conditionally free to UK FE and HE. Available by subscription to…
</dcterms:accessRights>
<iesr:hasService xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</iesr:hasService>
<dc:subject xsi:type=”dcterms:DDC”>
050</dc:subject>
<dc:subject xsi:type=”dcterms:LCSH”>
Medicine</dc:subject>
<rslpcd:contentsDateRange
xsi:type=”dcterms:W3CDTF”>
1993/</rslpcd:contentsDateRange>
<iesr:usesControlledList
xsi:type=”iesr:CtrldVocabsList”>
DDC</iesr:usesControlledList>
<rslpcd:owner xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381752-28099
</rslpcd:owner>
<rslpcd:hasPublication>
http://zetoc.mimas.ac.uk</rslpcd:hasPublication>
</dcmitype:Collection>

<dcmitype:Service>
<dc:title>zetoc Z39.50 search</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</dc:identifier>
<rslpcd:locator xsi:type=”dcterms:URI”>
z3950s://zetoc.mimas.ac.uk:2121/zetoc
</rslpcd:locator>
<iesr:interface xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk/iesr/metadata/examples/interfaces/svc-1056380019-18263-z.xml
</iesr:interface>
<dc:type xsi:type=”iesr:AccMthdList”>
z3950</dc:type>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
ip</dcterms:accessRights>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
athens</dcterms:accessRights>
<iesr:supportsStandard xsi:type=”iesr:StdsList”>
bath-1-c</iesr:supportsStandard>
<rslpcd:seeAlso xsi:type=”dcterms:URI”>
http://zetoc.mimas.ac.uk/z3950.html
</rslpcd:seeAlso>
<rslpcd:administrator xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</rslpcd:administrator>
</dcmitype:Service>
<iesr:Agent>
<dc:title>MIMAS</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</dc:identifier>
<dc:relation xsi:type=”dcterms:URI”>
mailto:info@mimas.ac.uk</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
tel:00441612756109</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk</dc:relation>
</iesr:Agent>
本文主要参考Ann Apps DC-2004的投稿文章


Technorati : , ,

"语义万维网服务(SWSI)"- –

“语义万维网服务” Semantic Web Services Initiative (SWSI) 的目标是使目前的万维网技术结合相关的最新进展,得以发挥其最大潜能。

语义万维网技术

万维网协会主席 Tim Berners-Lee 认为万维网的未来是”语义万维网”–万维网向机读信息和自动服务的延伸而远远超出目前的能力。在数据、程序、网页以及其他万维网资源之上的语义呈现,将使万维网成为基于知识的万维网,使目前的服务提升到一个新的水平。通过”理解”万维网上的内容,达到更精确的过滤、分类以及检索信息资源,自动服务将在更大的范围上帮助人类实现目标。这个过程将最终实现极端丰富的知识系统以及在此基础上的特别的推理服务。这些服务将有助于我们日常生活的方方面面,像今天人们对于电力一样普遍而不可或缺。

目前的万维网只是信息的堆积而不提供信息的处理,也就是说并没有把计算机当作一种计算设备。最近围绕 UDDI, WSDL, 和 SOAP 等发展起来的新技术正在把 Web 变成一种新的水平层次上的服务。应用软件课题通过万维网而获得和执行,这个技术叫做 Web 服务。 Web 服务通过提供一种程序自动交流、发现服务的机制,从而可以大大提高万维网体系结构的潜能。因而得到众多软件开发公司的关注。 Web 服务使电脑设备连接在一起,以一种新的方式使用因特网交换和联合数据。 Web 服务技术的关键在于使用松散耦合的”随时”组合可重用软件组件的方式提供服务。这从技术和业务两方面都产生深远的影响。

Semantic Web Service 似乎又多了一个兄弟: Semantic Web enabled Web Services ,欧洲 IST 的一个项目。

相关的项目、组织或网站:

http://swws.semanticweb.org/

http://swsi.semanticweb.org/

Software can be delivered and paid for as fluid streams of services as opposed to packaged products. It is possible to achieve automatic, ad hoc interoperability between systems to accomplish organizational tasks. Examples include business application, such as automated procurement and supply chain management, but also non-commercial applications as well as military applications. Web services can be completely decentralized and distributed over the Internet and accessed by a wide variety of communications devices. Organizations can be released from the burden of complex, slow and expensive software integration and focus instead on the value of their offerings and mission critical tasks. The dynamic enterprise and dynamic value chains would become achievable and may be even mandatory for competitive advantage.


Technorati : , ,