规范控制向何处去

最近又把高红老师的《编目思想史》和富平等老师的《中文书目规范控制的理论和实践》拿出来学习,感到我们这个行业的确有很多好东西值得自夸,但是其中的许多思想要拿到数字网络世界去实施,将会面临巨大困难。这个“实施”工作应该说已经在吵吵嚷嚷中开始了,RDA至少可以看成一个很重要的努力吧,如果不算DC的话。

最大的困难在于,我们这个行业还没有多少人意识到这一点。(我也不想老拿生存危机来说事,只要大家都有饭吃,谁管这个饭碗叫什么?)可能个别专家学者也有先知先觉,但距离行业共识还很遥远。这是个异常艰巨的事情,只要我们无法调动体系和制度的资源力量去做,就几乎没有希望。好在西风可以东渐,那就等着吧。

数字图书馆、元数据、本体、知识组织系统、语义万维网、资源描述、语义互操作、资源整合、跨库检索、可信网络、维基百科、机器可理解、规范控制……所有这一切,都已经汇聚起来,构成了现代图书馆运行的技术环境。这些技术都是相通的,互相影响、渗透、融合,如果说传统的以纸张为基础的社会知识交流架构形成了传统的书目控制理论的话,目前正在重新架构一个与以往完全不同的社会知识组织与交流结构,需要一个全新的书目控制理论(如果还叫“书目”的话)。

就规范控制而言,规范是控制的基础,控制是为了组织、可信(不要跟我说“数字无序”等时髦话,那纯粹是作者吸引眼球的说法,在他那里,无序是另一种有序)。当然并非网上的所有信息都需要“控制”、都能够“控制”,但是一定有大量的信息需要控制(例如学术、科技信息),之所以不控制,就像传统的书目控制实践一样,非不为也,实不能也,受到资源、技术、成本等等方面的局限。网络资源规范控制的价值是不言而喻的。

控制需要规范,而规范必须基于新的环境。FRBR以及RDA的努力很艰苦,是因为它希望在兼容过去开创未来之间寻求一个平衡,这个平衡不经过争吵、挫折以及初步的实践是很难取得的。

面临新的环境我们尤其需要观念更新,包括对传统做法的反省和对新的技术的理解两个方面。

1、传统规范控制最大问题是“刚性”控制,追求一致,导致并没有对“规范性”下一个明确的定义,以至于不可衡量,不承认规范是有程度的,可以根据实际需求可以有所选择,从而在体系架构的设计时允许容错。在一个架构中什么都要控制,导致什么都控制不好。

2、规范控制有一个规模效应,不达到一定的使用规模可能无法体现出其好处。宽泛意义上说对于网络资源普遍使用元数据也是规范控制的一种形式,这方面的努力已经进行了十多年,直到最近Web2.0和3.0的发展才显示出其普遍的好处。

3、传统规范控制的很多规定在新的环境下显得莫名其妙,感觉制定或执行的人只知其然不知其所以然。这也是为什么我们总要从头开始,对“功能需求”进行重新审视的原因。一切从功能需求出发,才能够提供规范控制一个理论基础。当然,理论也是需要发展、修正的。

4、数字环境下有一个最重要的观念必须时刻牢记:所有被规范控制的对象必须是网上的一种独立的数字存在,即便是只有一个id的“虚拟存在”。网络世界可以是现实世界的一种映射,但是他们(元数据和资源)之间的关系必须明确定义,很多混淆都是从这里来的。例如书目控制究竟控制什么的问题,虽然没有必要严格统一,但对于具体的应用来说,必须首先明确。

Popularity: 62% [?]

Tags: FRBR, RDA, 专业评论, 书目控制, 图书馆2.0, 知识组织, 规范控制

Related posts

中国特色的规范控制问题

早上读闾丘,说在北大讲座跟学生的问答要打暗号,但是这种暗号居然并不影响交流,这实在是一种奇特的语言现象。

接着读南方周末吴澧的专栏文章”网络言论和四项基本原则“,更是发现这类语言问题似乎给我们情报检索数据挖掘带来了新的挑战,从技术角度我们如何解决这类问题呢?不知道曾蕾、秦健老师能不能给支支招。

这篇数百字的短文中,诸如”老邓“”某君“之类的明言暗指就不多说了,而”中央“成为”重阳“,”总理“成”宗理“,”邓小平“成”邓晓平“,比比皆是。联想到”吾讲斯美“、”图有其表“之类,将来”同义词环“越做越大,而且会带来新的歧义,这样的本体又该怎样做啊!

这应该是一种中国特色的网络资源规范控制问题吧?

Popularity: 32% [?]

Tags: 专业评论, 规范控制

Related posts

Bringing Authority Control to the Web

My colleague, Miss Zhang Chunjing, will give a presentation at SILF2008, which is going to be held on the following Tuesday. The presentation is based on a co-authored paper titled “the Authority Control for the Web Resources” by me and herself. To help her prepare the English lecture, I would like to make some of the arguments in the paper more clear with the following background thoughts in English.

In the vision of Semantic Web by Tim Burners-Lee and with the maturing of semantic technology, it gives us an opportunity to spread out the concept of bibliographic control into the Web at the Internet scale. Each piece of information with a URI on the Web can be treated as a “document” (resource), so some of them can be authority controlled by means of an experienced and proved way from Library and Information Science, to bring some kind of authority semantics to the Web, and implement the trusted Web idea to some extent.

Control is a way to go Trust. We can never fully “bibliographically” control of everything on the Web (like DC metadata guys’ wish in the early years of the Web). What we can do is try to implement a little bit “authority” by means of transplant our traditional authority control approaches into the Web. Although we believe “a little control will go a long way.”

Here are the definitions for Bibliographic Control and Authority Control which we followed in our paper:

Bibliographic Control (BC): a broad term encompassing all the activities involved in creating, organizing, managing, and maintaining the file of bibliographic records representing the items held in a library or archival collection, or the sources listed in an index or database, to facilitate access to the information contained in them.

Authority Control (AC): refer to the practice of creating and maintaining headings for bibliographic material in a catalog. It fulfills two important functions. First, it enables catalogers to disambiguate items with similar or identical headings. Second, authority control is used by catalogers to collocate materials that logically belong together (ie. with the help of uniform titles). Theoretically, any piece of information is amenable to authority control, but catalogers typically focus on authors and titles. Subject headings fulfill a function similar to authority records, although they are usually considered separately.

Dr. Gorman had a good discussion on the relationship between BC and AC here. Search Engine like Google can be thought as a kind of BC on the Internet. But it has no means of AC.

The ongoing research for the Future Bibliographic Control set a basis and starting point to the Web Authority Control. It contains several aspects as follows:

  • FRBR: Provides a framework and model for the AC.
  • FRAD: Defines the functional requirement for authority data incl. uniform heading of works and agents, but not including KOS, events, and temporal/spacial name.
  • FRSAR: Mainly contains KOS.

Popularity: 54% [?]

Tags: authority control, FRBR, FRSAR, 知识组织, 规范控制, 语义技术

Related posts

网络资源如何规范控制

计算机技术和互联网的发展使规范控制的环境、对象和需求均发生了巨大的变化。统一标目让位于数字资源唯一标识的管理;汇集、区分和引导等三类功能需求扩展为识别(Identify)、查找(Find)、选择(Select)、关联(Relate)四个方面的功能需求;规范控制工作也主要变成了资源对象属性关系语义的揭示;检索点的控制失去了原来的意义,变成了系统内部不同属性词、属性值的自动参照 和转换。规范不规范,从专业人员主导,变成了由用户主导;静态的“权威性”资源标注,变成了动态的“可信度”关系计算。

当然这些变化将会是慢慢发生的。好在规范控制不像传统的MARC一样,想扔都扔不掉,毕竟传统的规范控制在实践上远不如理论上做得那么完美,从FRBR开始的一系列研究可以使我们从一个新的高度设立一个新的起点。

FRBR为网络资源的规范控制提供了一个合理的框架模型,其中所涉及的三类实体:知识/艺术创造(包含作品、表达、表现和单件四种状态)、责任者(团体、个人)和主题(概念、对象、事件和地点)提供了规范控制的具体内容。第一、二类实体属于名称规范的范畴(题名规范和责任者规范),第三类实体包含了主题和名称(例如地名和事件名)两个方面的规范。在理论上这一框架首次把“文献”之外的实体:人、机构、程序(遗憾的是FRNAR小组后来将这个明确排除在外了,后面两个是否还包括在内,语焉不详)、地点、事件,也当作“资源”而纳入规范控制的范畴。

网络世界是一个由无数协议和规范构成的人造世界,规范控制是附加于网络世界的另一项人为的需求,是帮助用户判断网络资源内容可信度的一种方法。与传统资源所不同的,网络资源的可信度绝非黑白二值,而取决于信源、信宿和信道三方面的多种因素,并且具有主观性和动态性。一组信息对于某一用户的某项查询来说,其可信度应该是呈正态分布的。信息架构师的责任就是提供一定客观的算法,来实时实地地度量这种相对的可信度。

建立网络资源的规范控制需要建立两类设施:1、规范数据仓储;2、规范控制管理系统。后者是实现前者功能的必要保证,解决网络资源规范控制的实现机制问题。在开放异构的Web环境下网络资源的规范控制不可能是集中的、排他的,同一种类型的规范控制可以有多个模式,由规范控制平台提供的机制来实现一定的互操作。传统的规范数据可能会提供必要的“原始规范数据仓储”,但大量的规范数据需要“草根智慧”(collective intelligence),而不再是仅仅依靠图书馆员。

FRAD报告涉及的,以及FRSAR工作组试图做的,(主要)是名称规范和主题规范。而网络资源可以进行规范的内容还要多得多,例如各类“微内容”格式规范(包括事件、地理信息、化学分子式、基因序列等等)、各类标准应用程序接口(作为一种agent)规范、本体规范(也就是规范的领域模型,包括术语规范、关系规范和编码格式等)。

因此,网络世界的规范控制大有可为。

(本文为新近完成的论文《试论网络资源的规范控制》中的主要观点,若需引用,希望注明出处:刘炜,张春景. 试论网络资源的规范控制.现代图书情报技术,2008.12.27-31)。

Popularity: 58% [?]

Tags: FRBR, FRSAR, 知识组织, 网络资源, 规范控制

Related posts