分类目录知识组织

叙词与本体,及其在Elsevier的应用

在我看来,叙词表是一类特殊的本体–反映领域知识,具有本体的概念层级结构和用代属分参概念联系,但是没有公理、没有实例,或者说公理和实例不是内在的,体现在应用叙词表的系统中。
情报检索的规范控制近年来有明显的回归趋势,主要归功于语义万维网的提出和研究,语义万维网需要机器来操作语义,就必须首先进行规范控制,最好整个知识系统成为一个封闭世界,语义计算就能够”安全”地进行。当然这是不可能的。
我们大约从2001年开始对知识本体的作用进行研究,感到本体是一个非常重要的、代表未来应用方向的研究和开发领域,也是图书馆学能够贡献我们宝贵的专业知识、使我们这个学科”显性化”的领域,当然离开了我们也不是不能搞,可能创建的本体就不会那么中庸、平衡、人性化,甚至”不象”对普遍知识进行抽象的”学科本体”,而带有许多技术描述的、或十分随意的特征,像yahoo的分类体系一样让我们看不上眼,没有DC元数据那么让图书馆员似曾相似、赏心悦目。我们感到应该尽快像当年搞748工程(建立汉语主题词表)一样进行学科本体的创建和应用,但是好像至今仍没有什么启动项目。

知识本体的主要作用如下:

* 在人、机器(表现为软件代理)以及人与机器之间共享对于信息及结构的共同理解
* 实现一定程度的领域知识的重用
* 知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知
* 对于领域知识进行分析、明确,并使其形式化

对于数字图书馆应该能起到如下作用:

* 提供与描述型元数据有关语义描述的知识地图
* 提供资源库领域知识的规范描述
* 提供元数据映射方案,集成到数字图书馆体系中的元数据服务中,成为协议的一部分
* 提供智能代理与信息环境之间基于语义的理解机制
* 跨平台、跨系统之间的通信中介
* 分布环境下查询请求的语义理解

现 有的技术当中最接近本体的就是叙词表了。前些年基于自由词的全文检索势不可挡,而今面临信息超载,注意力稀缺,查到和查准成了非常困难的事情,人们对信息组 织和查询的要求更高了,不得不回过头来,重新审视传统情报检索领域的一些几乎被人遗忘的好的想法。而这些想法一经计算机专家之手,就被玩得完全不同了。
研 究叙词表与知识本体的文章已经有不少了,今天看了一篇Elsevier出版公司对于其众多数据库进行”技术改造”的想法,应用语义技术,涉及叙词表的改 造,虽然没有什么非常特出的地方,但因为是具体企业的应用,还是很有启发的。我国的很多计算机公司,包括软件公司,对新技术的研发投入和应用能力实在不敢 恭维。例如帮我们开发系统的公司,一边赚我们的钱,一边跟我们学,东西开发出来还不能让人满意,真让人愤愤啊!

elsevier 的语义系统应用;

传统上 Elsevier 采用属性字段检索和叙词表主要用于:

*标引文献Indexing (tagging) articles, books and other materials
*层次浏览Browsing thesaurus-indexed content
*扩检Expanding searches against specialized content
*   Overall, a net benefit, but not huge
*范围限定Limiting a search by category
*文件聚类Clustering documents by category
*   Better than limiting search up front…data-driven

然而 Elsevier 目前没有在检索中采用叙词表,据称是因为相对于现在流行的全文检索而言好处不明显(可能还极大地增加了系统的复杂性和维护成本)。

Elsevier 在语义主导 Web 的时候重新考虑采用叙词表,据称主要原因是:

*采用多种叙词表,能够对开放或者内部的数据库实现统一的字段检索,Integrated search of proprietary, public and/or local user content using multiple thesauri
*整合文本名称与化学结构Integrating chemical structure info with text documents
*整合各种模式的数据库Integrating databases with diverse schemas
*支持文本挖掘Supporting text mining
*扩展检索范围Other uses requested by our customers (e.g., extensibility for local content)
*改进叙词表的导航性能Improved thesaurus navigation
*改进查询命中结果Improved search results

叙词表的新用法:

建立基于 RDF 的中间本体用于不同叙词表之间进行映射;

支持多种关系描述 Support multiple relationships

支持用户自行扩展 Extensible by customers

改进性能和可扩展性

试验新的查询选项

在改进查准率的同时改进查全率

用于查询结果的可视化展示,优化用户交户界面

Elsevier 对于文本挖掘的看法:

  • 认识:文本挖掘已经成为信息过剩(overload)时代信息提供的一个必备工具;
  • 重视需求调查,不断开发新的应用;
  • 同时提供”实质性”的挖掘工具和”预备研究”(meta-research)工具;
  • 时间维上的发展趋势,作者/机构分布等等;
  • 以RDF形式作为存储事实的基本形式,提供事实抽取的数据基础。


Technorati : ,

关于元数据方案的问题- –

这是2002年的一个文档中的一些思考,现在有些问题已经有所解决,有些问题的提法已经不对了。贴在这里存档。有机会更新一下。

1、元数据方案分两层:站点级元数据与资源级元数据,名称是否合适?

2、 资源级元数据方案的是否一定要一种”核心”元数据方案(例如选择 DC),作为整个系统的”必须”的元数据元素方案,并规定一组核心元数据元素,哪些是必需的,哪些是可选的等等?或者认为各种元数据方案都是平等的,(缺省甚至可以没有元数据方案?)通过元数据服务器提供相应元数据的包装,以及映射、解析服务,由此揭示资源内容。

3、 元数据方案的功能需求?资源揭示 / 管理 / 保存?
集成数据的结构和语义信息,为实现一定的数据服务进行必要的数据规范和描述,同时实现一些功能性要求(管理、版本 etc.)

4、 对于特定用户查询,元数据方案在资源揭示时是怎样起作用的?
先是通过匹配用户查询针对那些领域(站点元数据),确定需要查询的索引服务器,寻找到合适的站点,发送请求(资源级元数据),然后返回请求,汇总,排序,显示给浏览着。

5、元数据服务器究竟能够实现什么功能?哪些功能是必要的?哪些是可选的?

6、站点级元数据与本体论的关系,如何实现以本体论组织站点?

7、 站点级元数据如何产生(注册)?站点级元数据的具体内容是什么?站点与站点之间的关系如何通过元数据来表现( ontology )?
站点级元数据需要说明站点的内容、能力、地址等信息。信息类别、素材种类、属性模型( CNMARC 或 Dublin Core)、查询能力、查询操作符等。
站点级元数据与资源级元数据是怎样的关系?怎样”收获 harvest “元数据?有必要收获吗?怎样情况下应该收获?怎样情况应该可以允许” on the fly ” ?

8、现有数字图书馆方案中的元数据方案分别是怎样的?

9、 元数据对于语义揭示的互操作是根本的,但是在结构方面的互操作也实在元数据方面不得不考虑的因素。因而描述规范(结构)也是元数据方案必须确定的内容之一。目前的元数据描述规范(表达: XML/RDF/HTML/RMDB/Warwick Framework )有哪些?能否尽量罗列完全 ?

10、元数据著录规则?元数据应用机制?元数据推广方案。

11、查询服务器:生成规范的查询提问式,提供查询路由服务

12、 资源级元数据是否在数字图书馆中分布式保存?互为镜像?抑或纯粹保存在资源站点本地?抑或采取目前 OAI 的方案:采取内容提供站点和服务提供站点分开的方式。

呼唤数字图书馆的“统一场”理论- –

数字图书馆需要整合。不是说某一个数字图书馆的资源,或者服务需要整合,而是数字图书馆的研究内容需要整合。

记得七、八年前我们刚接触数字图书馆的时候,被其”博大精深”,或者说”混乱无序”弄得非常沮丧。除了一些零散项目、计划的举例,不知道如何认识、怎样下手。好不容易提出了”三种数字图书馆”:即来自计算机界的研究开发、来自各类机构的服务体系建设和纯粹的数字化,又觉得分类很粗,缺乏逻辑,无法反映数字图书馆内在的体系结构和本质联系。

在美国虽数字图书馆的支持接近尾声之际,似乎到来了数字图书馆总结之时( NSF 的”后数字图书馆时代”的提法颇有些对数字图书馆进行”清算”的味道,见” 鳕鱼岬会议 “博客文章。在对 2002 年以来的数次数字图书馆”峰会”(指以回顾展望为主题的管理型的工作会议,如 NSF/DELOS 的一些会议。 99 年也曾召开过一些)进行认真学习之后,突然感到数字图书馆的”学科体系”似乎已然建立,从 Fox 等人的 5S 基础理论( Leon 说 Witten调侃其 为”五行学说”)以及 SFX 的发明人 Sompel 呼吁数字图书馆基础理论建立的必要性,一直到 NSDL 、 CDL 以及 LoC 实打实的建设,以及从技术角度 Digital Library 与 Semantic Web 的联姻,并共同迎接 Cyberinfrastructure 的挑战。数字图书馆的社会性、人文性、技术性正在融合,站得高一点,打破学科之间的固有樊篱,整个图景会变得越来越清晰。本人很想就数字图书馆建立”统一场理论”作一些研究。目前可资借鉴的报告就有如下数篇(名称凭记忆列出):

当然这项研究需要理论与实践的结合,需要不同”粒度”的研究,需要技术与人文的对话。尤其重要的,是需要一个崭新的视角、宽广的视野和突破传统的勇气。这些都不是靠个人的力量所能达到的,需要一个团队,一批人共同的努力。无奈的是国内这个圈子的人太少了。


Technorati :

关于METS用于资源集合的两个问题

METS网站上找了半天,还没有找到答案,先把问题记在这里:

  1. METS作为元数据方案的Wrapper,如何进行不同元数据方案的互操作(映射或者中介)?这个功能可能放在extension schema中的,或者通过Establish registry of METS repositories来实现?
  2. METS对于数字资源集合元数据的编码是否有用(通过它的structural map)?

元数据项目在编码方案方面应该参考METS

METS Profile:

METS profiles allow digital libraries to specify constraints that they place on METS for ingest, storage/processing or dissemination, including:

  • dictating use of particular extension schema, rules of description, and controlled vocabularies
  • specifying arrangement and use of METS elements and attributes for particular classes of documents
  • specifying the technical characteristics of data files within a METS object
  • identifying tools for creating/processing METS documents compliant with a particular profile

资源集合元数据登记系统

资源集合元数据主要是提供机器与机器之间的理解机制,解决分布环境信息资源集合的封装、提问分发等实用的元数据形式。目前一个比较成熟的做法是利用资源集合的注册系统,作为分布信息环境中的中介,进行资源集合的揭示、管理。其中主要要解决以下问题:

  • 注册系统的协同、标准化问题。

  • “服务”的描述。

  • 资源集合的描述来自开放标准,(是否依旧可以以应用纲要形式?管理元数据等如何办?)

  • 注册系统的基本功能:XML Repository, Meta-registry, several interface including server to server (SOAP/Z39.50/OAI)

资源集合注册体系的功能:

  • 注册系统实际上是提供了机器利用的portal
  • 对于普通用户来说,提供了单一入口、整合的导航工具,把相关的资源集合集中在一起,提供可选的获取信息的方案(最方便?最便宜?最符合自己需要?)。
  • 提供到资源集合的指向(导航);
  • 提供多集合的统一/联邦查询

资源集合注册系统包含的内容:

  • 资源集合的相关信息
  • 服务信息(eg. OpenURL etc.
  • 技术信息
  • 权限信息
  • 资源集合各类责任实体信息

资源集合描述的要求:

  • 不仅给人使用,更重要的是M2MS2S。因而需要大量的标准,符合众多的协议。例如在Web Service架构下;
  • Query的分发;
  • 本体的支持

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:

要求(方法):

  • 定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
  • 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
  • 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
    • 可以规定元素的编码规则;
    • 可以规定元素的值的约束;
    • 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
  • 如果需要增加”新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
  • 编码规则(制定置标方案)(机读);
  • 编写有关应用文档(人读)

过程:

  • 根据资源类型和系统开发需要,定义元数据及数据元素需求
  • 选择现有的最合适的元数据标准规范(元数据元素集)
  • 复用标准的元素,根据目标系统的需要赋予特定的语义(仅缩小语义,不扩大、改变),制订著录规则并考虑应用规范词表
  • 扩展元素/限定并进行定义,赋予本地的命名域进行管理

资源集合描述元数据基于:

  1. Research Support Libraries Programme name (RSLP) Collection Description schema (RSLPCD) ( RSLP Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/)
  2. DC CD AP

资源集合对象的描述方案也是”应用纲要”,符合应用纲要[1]的要求:



[1] 元数据应用纲要参见CEN CWA14855

资源集合描述的对象:

  • a collection; (may have many services that provide access but it must have at least one service registered in registry.)
  • a service, either informational (i.e. providing access to a collection), or transactional;
  • and an agent that is the owner of a collection or an administrator of a service. (An agent may be an owner or an administrator, or both, of many collections or services.)

资源集合的类型

DCMI提案(2003年10月)

扩展:

资源集合描述

增加的元素如searchable元素,表示内容是否可以检索。还有一些纯粹是informational型的。

对于控制词表也做出一定的规定,例如增加usesControlledVocabulary元素。

hasService元素用来描述资源集合所能提供的服务,比DCMI的isAvailableAt 和RSLPCD 的‘locator’元素都要清晰。后两者可同时应用于传统资源和电子资源,而hasService更直接地指用于电子资源。
the coverage, geographic, temporal and educational of the collection, containing or associated collections, and related publications.
权利类:‘dc:rights’,
‘dc:rights’ records any copyright statement about the collection. ‘iesr:useRights’ contains a statement about allowed usage of data from the collection, such as terms and conditions. ‘dcterms:accessRights’ holds information about any licence requirements to access the collection.

服务描述

locator采用:Z39.50或SOAP作为locator的属性值,但是一些服务还需要进一步信息,例如合法用户登陆信息等。
Title
Description
Locator (服务的一个入口,例如一个url或端口)
dc: type包括:Z39.50, Web Services SOAP, SRW (Search – Retrieve – Web) [14], and OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting), webpage, webcgi
iesr:interface
iesr:supportsStandard.
注册系统的管理:

每一个注册实体都需要给定一个标识符POI(PURL-based Object Identifier)

编码举例:

<dcmitype:Collection>
<dc:title>zetoc</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056366559-25788
</dc:identifier>
<dcterms:abstract>The zetoc database, the British Library’s ETOC, contains…
</dcterms:abstract>
<dc:type xsi:type=”dcterms:DCMIType”>
Collection</dc:type>
<dc:type xsi:type=”rslpcd:CLDT”>
Catalogue.Library.Text</dc:type>
<dc:rights>Copyright (c) British Library 1993-2004</dc:rights>
<iesr:useRights>All Rights Reserved. http://zetoc.mimas.ac.uk/terms.html
</iesr:useRights>
<dcterms:accessRights>
Available conditionally free to UK FE and HE. Available by subscription to…
</dcterms:accessRights>
<iesr:hasService xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</iesr:hasService>
<dc:subject xsi:type=”dcterms:DDC”>
050</dc:subject>
<dc:subject xsi:type=”dcterms:LCSH”>
Medicine</dc:subject>
<rslpcd:contentsDateRange
xsi:type=”dcterms:W3CDTF”>
1993/</rslpcd:contentsDateRange>
<iesr:usesControlledList
xsi:type=”iesr:CtrldVocabsList”>
DDC</iesr:usesControlledList>
<rslpcd:owner xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381752-28099
</rslpcd:owner>
<rslpcd:hasPublication>
http://zetoc.mimas.ac.uk</rslpcd:hasPublication>
</dcmitype:Collection>

<dcmitype:Service>
<dc:title>zetoc Z39.50 search</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056380019-18263
</dc:identifier>
<rslpcd:locator xsi:type=”dcterms:URI”>
z3950s://zetoc.mimas.ac.uk:2121/zetoc
</rslpcd:locator>
<iesr:interface xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk/iesr/metadata/examples/interfaces/svc-1056380019-18263-z.xml
</iesr:interface>
<dc:type xsi:type=”iesr:AccMthdList”>
z3950</dc:type>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
ip</dcterms:accessRights>
<dcterms:accessRights xsi:type=”iesr:AuthList”>
athens</dcterms:accessRights>
<iesr:supportsStandard xsi:type=”iesr:StdsList”>
bath-1-c</iesr:supportsStandard>
<rslpcd:seeAlso xsi:type=”dcterms:URI”>
http://zetoc.mimas.ac.uk/z3950.html
</rslpcd:seeAlso>
<rslpcd:administrator xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</rslpcd:administrator>
</dcmitype:Service>
<iesr:Agent>
<dc:title>MIMAS</dc:title>
<dc:identifier xsi:type=”dcterms:URI”>
http://purl.org/poi/iesr.ac.uk/1056381864-28646
</dc:identifier>
<dc:relation xsi:type=”dcterms:URI”>
mailto:info@mimas.ac.uk</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
tel:00441612756109</dc:relation>
<dc:relation xsi:type=”dcterms:URI”>
http://www.mimas.ac.uk</dc:relation>
</iesr:Agent>
本文主要参考Ann Apps DC-2004的投稿文章


Technorati : , ,

元数据注册系统的作用

一套元数据规范可以看成是一套规范词表,可以认为具有权威控制的功能,并构成一个独特应用领域的本体。利用数据库提供词汇的组织、管理功能,以 RDF 编码,提供友好的界面供人工查询,提供 application program interfaces ( API )供机器使用。同时可用于非 DCMI 词的注册、管理。

  • 通过元数据元素的重用支持语义互操作;
  • 通过元数据XML Schema的重用支持编码的一致性;
  • 通过元数据应用规则和著录规则的重用而获得模型的一致性;
  • 提供制定元数据方案的方法论和工具(编辑加工修改查询及形式化工具);
  • 提供Semantic Web Serviceautomatic access API
  • 提供各语种的翻译对照

情报检索与知识组织(2月25日修订)- –

对于知识的认识(包括”知识组织”)在古代应该属于哲学领域,如果沾得上边,后来的图书馆学可以算是一门。图书馆学通过管理知识载体来反映知识结构,并促进知识的有效传播和利用。其中的核心内容”分类编目”堪当此任。

纸、泥板、羊皮、竹、石以及电光磁等媒介是知识的有形载体,书籍、报刊、杂志、图片、动画等是知识的媒体类型,图书馆、博物馆、大学等社会组织可算是知识的交流机构,也是知识运动国政中不可缺少的一种形式。研究知识,这些方面都值得研究。

二战以后诞生的情报学(或也可称为信息学)专注于知识的内容–信息,而把知识的躯壳留给了图书馆学。信息论走的更远,认为信息是”不确定性的减少”或”负熵”。从这一点说信息学和情报学可以分道扬镳了。二战以后的 情报学受到计算机科学发展的影响,但还是基本上从人的角度去研究情报的规律,无法对只能机械操纵符号的计算机提出任何”智能”一点的要求。人为了充分利用计算机的高速运算、大容量存储能力,以及准确性,发明了一整套情报检索技术。

从穿孔卡片开始,人类最早的计算机奴隶就叫做情报检索。一直到后来的字词索引、匹配、倒排档等等。

计算机就象是上帝给人类的一个魅力无穷的玩具,真的让人能够像上帝一样思考了(不知上帝是否会继续发笑?还是发怒?),人类依靠它,在几十年的时间里除了破解了数据的奥秘(关系型数据库技术),拓展了应用的疆域(Internet和Web技术),甚至创造了人类更加富足的信息化社会。这也再次证明了知识的力量。

目前计算机具有的能力与我们人类的需求之间的鸿沟越来越弥合。然而我们还是不得不为人机之间沟通制定一些原则和模式,这样机器才能更好地模仿人的程序处理信息和知识。元数据和知识本体都是这类工具。

我们现在研究知识组织,已经无法不受到计算机科学已有成果的影响。图书馆情报学知识域中有关信息组织(情报检索)的”话语体系”、”领域本体”必须与计算机科学相关的概念体系进行融合,才能发展。所以我们不得不用计算机科学中在知识组织方面的研究进展取代我们传统的情报检索课程内容。这两个领域的发展速度不是一个数量级的,图书馆学的知识组织能够提供计算机科学许多人文滋养,但是如果不承认计算机科学的主体地位,图书馆学的那点经验学识将会荡然无存。计算机科学的发展有如一辆无可回头的蒸汽机车,在历史的进程中摧枯拉朽、一往无前。

近期大量阅读我图书馆学的情报检索、信息组织教材和计算机科学中的知识库研究成果。

首先对张琪玉、侯汉清编的这本《情报检索语言实用教程》非常感兴趣。一本刚出炉的教材,而且是国内该领域的领衔人物的新作,老树开新花,而且书名冠以”实用”,又是武大出的,让人立刻有探个究竟的愿望。

翻开前言,原来是武大出版社委托编写的,让人感到武大对于传统的图书馆学分支学科已经后继无人了。否则恐怕不会委托早已与武大没有瓜葛的两位老人编写。

前言中还说,本书的编写目的是”减少情报语言学领域诸课程之间的重复,精简讲授内容,突出实用性”,看来传统图书馆学科面临的冲击确实不小。

重复课程大概是指”情报语言学基础””图书分类学””主题法导论”之类的课程,与我目前要给北大研究生班上的”信息组织”主题的课程应该有些类似。

减少了不常用的情报检索语言类型和语种、发展历史的讲授。

内容主要包括:

总的看来,体系结构还是比较严谨和全面的。(这本书值得购买收藏)

情报检索语言及情报语言学的基本问题

作者避开情报、信息、文献的概念争论,把这三者的检索和检索系统作为同一概念。也算是一大实用的认识吧。

对于文献的概念,作者没有使用国标中”记录有知识的一切载体”,而解释为:”文献是存储和传递知识、信息的主要载体,所以,利用文献成为获取知识、信息的主要途径。”逃避概念几乎有点过于随意了(捣浆糊)。

对于”情报检索”概念的解释也是非常”图书馆学”化的:”其广义是指通过建立情报检索系统来解决文献查找问题(也就是知识和信息的查找问题)的整个实践,其侠义仅指根据某种需要从情报检索系统中查找出相关文献线索(也称文献检索)或文献中相关内容(也称事实检索、数据检索或全文检索)的操作过程”。可见其感念定义中的同义反复和不严密的地方何其多。并且从计算机界的角度看这些”同类”概念有不少不必要的人为定义和偏差在其中。广义和狭义,到底如何理解?

从作者的角度而言,数字图书馆可以看成是一个情报检索系统,因为是有序的,可以通过多种途径检索的,检索结果也是经过排序输出的,用户能够满足信息需求的。

关于情报检索语言的定义也是本书中非常核心的概念。情报检索语言是根据情报检索的需要而创制的人工语言,专门用于各种手工的和计算机化的情报检索系统,表达文献主题概念和检索课题概念。他作为提供文献内容检索途径的情报检索系统的一个构成因素,在其中起到语言保障的作用。情报检索语言分为分类检索语言、主题检索语言和代码检索语言三大语系。情报检索语言的实质是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统。

作者的一个经典的理论是:情报检索与情报存储是相反过程

情报存储过程:文献的情报内容 – 经过主题分析确立主题概念 – 经过利用情报检索语言的标引过程输入到情报检索系统中。而情报检索过程是一个相反的过程,检索者的情报需要经过主题分析,得出一系列的主题概念,经过情报检索语言的标引之后,通过检索系统进行检索,最后输出检索结果。

情报检索语言的特点:

情报检索语言的基本功能:

术语与情报检索语言是应用于被应用的关系。

概念的概念:概念是事物本质属性的概括。概念的内涵是指它所指事物的本质属性的综合,即概念的含义。概念的外延是它所指的一切事物,即概念的适用范围。

概念之间的关系:

相容关系(概念的外延至少有一部分相重合)

同一关系、属种关系、交叉关系、整体与部分关系、全面与某一方面关系、外延不相排斥的并列关系。

不相容关系:

并列关系(同位关系):同一个上位概念之下的几个下位概念之间的关系;

矛盾关系:并列关系的特殊形式,外延总合等于其上位概念全部外延的两个并列概念之间的关系。如金属材料与非金属材料;

对立关系:外延总合小于其上位概念全部外延的两个并列而且相互对立的概念之间的关系。例如导电体和绝缘体;其上位概念除了这两者之外,还有半导体。

概念的划分与概括(分类)指对概念的内涵而言,内涵的扩大或缩小。

概念的分析与综合(组配)指对概念的外延而言,外延的融合或分化。


Technorati :