“题库”解答参考(续)
这是简答题部分。有些部分好像不太”简”。
更新说明:2005年9月30日基于李丽同学的提问补充解释部分内容,涉及11、12题。
简答题30道
1. 什么是信息资源?什么是信息资源组织?
信息资源是指人类社会中经过加工处理的大量有序化信息的集合。
从信息资源组织的角度,由于无法判别”信息资源”的价值(判别信息资源价值的主体应该是用户,同样的资源对于不同的用户其价值可能是不一样的。)在这里给出计算机操作意义上的信息资源的定义:
?? “资源是具有标识的任何东西”。
?? 世间万物,只要人能够识别出来的东西,给它一个标识(最常用的标识就是名称),它就成了”资源”
?? 作为元数据描述的对象,DCMI和W3C强调,其”资源”只是在互联网上,由命名域给出URI标识的实体。
信息资源组织即信息资源的有序化的活动:对于信息资源有序化的规律的认识,以及应用认识得来的规律从事有序化工作
利用一定科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无需信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
?? 信息的外在特征:信息的(物质)载体所直接反应的特征;
?? 信息的内容特征:信息所包含和承载的具体内容,即通过信息载体所传递和交流的具体内容。
2. 试论述数据、信息、知识、智慧之间的关系。
?? 数据:离散、互不关联的客观事实,孤立的文字、数据和符号,没有目的性
?? 信息:人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关联
?? 知识:与行动和决策密切相关,人们做决策的行动能力,知识创造与环境相关
?? 智慧:对事务发展的前瞻性看法,智慧得益于人的内在价值观和信仰
单独的数据没有意义,信息= 数据+语境,知识= 信息+判断,智慧= 知识+整合。
3. 试说明信息资源组织的目的和常用方法。
目的:
?? 查找Find
?? 标识Identify
?? 选择Select
?? 获取Obtain
常用方法:
?? 分类法
?? 主题法
?? 字顺法
?? 号码法(赋予号码后的字顺法)
?? 时空法(例如大事记,年鉴等)
?? 序列法(大小/多少/好坏/贵贱…)
?? 超文本法(链接法)
4. 什么是主题法,主题法的特点和功能是什么?
主题法是直接以表示文献主题的语词作标识,提供字顺检索途径,并主要采用参照系统结石词间关系的标引和检索文献的方法。其中的语词可以是自然语言,也可以是受控语言。
主题法有标题法(Subject Heading)、单元词法(Uniterm)、叙词法(Thesaurus)、关键词法(Keyword又称自由词法)等几种类型。其特点如下:
?? 揭示文献的内容属性
?? 以自然语言为基础(不用标记制度)
?? 直接以局部(语词)指代文献
?? 以特性检索为主,族性检索通过词间的关联达到
?? 以明确性的检索为主,模糊检索通过技术的手段达到
主题法的功能:
?? 对信息内容进行标引的功能(指代用以检索);
?? 对主题内容及其相关信息予以集中或揭示相关性的功能;
?? 对大量信息加以系统化或组织化的功能;
?? 便于将标引用语与检索用语进行相符性比较的功能
5. 什么是分类法,分类法有哪些特点?
分类就是按照事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种认识事物的方法。
分类法是指将类或组按照相互间的关系,组成系统化的结构,并体现为许多类目按照一定的原则和关系组织起来的体系表,作为分类工作的依据和工具。
6. 叙词表中词与词之间的关系有哪些?
用代属分参(U、UF、NT、BT、RT)
7. 元数据是不是数据?元数据与数据是什么关系?
元数据是关于数据的数据,其本身也是数据。也可以作为被描述的对象,这时描述它的数据就是元数据。在信息系统中一般把数据看成是独立的信息单元,不管这里的”数据”是一本书、一个网页、或者一个虚拟的URL地址。元数据可以出现在:
?? 数据内部;
?? 独立于数据;
?? 伴随着数据;
?? 与数据包裹在一起。
8. 元数据有哪些功能?
?? 描述(description)
?? 资源发现 (resources discovery)
?? 认证(authentication)
?? 互操作(interoperability)
?? 数据管理(data management)
?? 访问控制(rights management)
?? 数字化保藏(digital preservation)
?? 内容分级(content rating services)
9. 数字图书馆和元数据是什么关系?
元数据提供数字图书馆的语义基础。数字图书馆的基本逻辑构成是”资源”,资源是可以被标识的任何东西,可以是物理的实体,也可以是数字对象或者虚拟的复合对象或对象集合。元数据提供了对资源的各种属性的描述,可以看成是”资源”的替代品。数字图书馆通过管理元数据而管理资源,并提供绝大多数功能。
因此元数据通过定义数字图书馆中资源的信息结构,以及定义由数字对象构成的资源库的组织结构,决定着的数字图书馆的信息组织和利用方式,同时元数据还是实现跨资源库语义互操作的基础。
10. 元数据包括哪些种类?
对于元数据的种类有不同的分类方法。一般分为描述性元数据、管理型元数据、结构性元数据、保存性元数据等等。
a) 描述性元数据(Intellectual Metadata),用来描述、发现和鉴别数字化信息对象,如MARC、DC,它主要描述信息资源的主题和内容特征。
b) 结构性元数据(Structural Metadata),描述数字还信息资源的内部结构,如书目的目录、章节、段落的特征。
c) 存取控制性元数据(Access Control Metadata),用来描述数字化信息资源能够被利用的基本条件和期限,以及这些资源的知识产权特征和使用权限。
d) 评价性元数据(Critical Metadata),描述和管理数据在信息评价体系中的位置。
还可以分为管理性、描述性、保存性、技术性和实用性元数据,如下表所示:
|
类型 |
定义 |
使用实例 |
|
管理 |
用于管理与控制信息资源的元数据 |
• 采购信息 • 版权及复制记录 • 获取权利控制(密级) • 馆藏信息 • 数字化的选择标准 • 版本控制 |
|
描述 |
用于描述与标识信息资源的元数据,一般为手工制作的元数据 |
• 目录记录 • 专门索引 • 资源之间的超链接 • 用户所做的注解 |
|
保存 |
与信息资源的保存管理相关的元数据 |
• 资源的物理状态描述文档 • 有关保存资源物理或数字化版本的文档,例如数据的更新与迁移 |
|
技术 |
与系统功能相关的元数据或元数据行为模式 |
• 硬件及软件文档 • 数字化信息,例如格式、压缩比及缩放比 • 系统响应时间的记录 • 许可及安全数据,例如密码及加密密钥 |
|
使用 |
与用户级别与类型相关的有关信息资源的元数据 |
• 展出记录 • 用户及利用记录 • 内容重用及多版本信息 |
11. 什么是元数据的语义、结构和句法?
属性元素(元素集合)是元数据的语义,例如DCMES的15个元素。Warwick框架或RDF的三元组结构等是元数据的结构,可以提供人类和机器双重理解,编码(置标)语言(如XML、XML Schema、RDF/RDFS等)是元数据的语法,用以传达语义和结构。
举例:
RDF既是一种结构,又是一个语法规则。作为反映语义的三元组形式,它是一种结构,而具体的采用XML/RDF形式编码规则又是一种语法,语法将结构固定下来了,但是RDF并不一定非要由XML/RDF来编码,它还有N3等其它形式的语法规则。
元数据的语义常常由具体的元素代表:作者(元数据理论与应用,张晓林),结构是P(S,O)
,以XML语法表达出来可以为(xml可以有多种表达,下面只是一种形式,且没有注明命名域):
<rdf:Description about=’元数据理论与应用’>
<dc.creator>张晓林</dc.creator>
</rdf:Description>
当然还可以用其他各种形式,例如自然语言、形式逻辑、语义网、以及关系数据库表等形式表达,具有不同的结构,每种结构可以遵循不同的语法。
12. 举例说明什么是元数据标准?如何使用元数据标准?
对资源描述方案进行标准化的成果就是元数据标准,常常需要经过一定的批准或认可程序。
应用元数据标准的基本方法是利用标准的元素来描述资源对象的各类属性,如在数据库中这些属性的大量实例可以表达为关系型数据库中的表,从而能够利用数据库系统或各类应用软件进行管理。如果以XML形式编码,可以把这些元素用作XML的元素标签或者属性名称。注意由于XML非常灵活,许多元数据标准都有一定的应用规则,规定了关于编码的”最佳实践”,以便不同的应用能够在编码上具有一定的一致性,从而保证互操作性。
以下为部分应用领域的元数据标准:
??网络资源:Dublin Core、IAFA Template、CDF、Web Collections
??文献资料:MARC(with 856 Field),Dublic Core
??人文科学:TEI Header
??社会科学数据集:ICPSR SGML Codebook
??博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
??政府信息:GILS
??地理空间信息:FGDC/CSDGM
??数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
??档案库与资源集合:EAD
??技术报告:RFC 1807
??视频图像:MPEG-7
13. 什么是元数据的编码(置标)?
利用置标语言(例如HTML/XML/RDF/XMLs/RDFs/OWL等)将元数据方案形式化,提供机器处理的规范表达,就是元数据置标。
14. 元数据有哪些常用的编码语言?试举例说明。
XML/RDF/XMLS/RDFS以及在SGML基础上发展起来的任何一种置标体系,例如TEI/EAD/METS/MODS等都可以作为元数据的置标语言。
15. 什么是语义万维网(Semantic Web)? 元数据对于语义万维网有什么作用?
语义万维网(Semantic Web)是万维网的发明人Tim-Burners Lee倡导的下一代万维网,旨在赋予万维网上所有资源唯一标识,并在资源之间建立起机器可处理的各类语义联系。元数据是语义描述的基础,因而也是语义万维网的语义基础。
“题库”解答参考(续2)
最近更新:2005年10月22日
16-30道简答题。
16. 什么是DC元数据的1:1(一对一)原则?为什么要有这个原则?
DC元数据描述要求:一条描述中的每个属性必须是所描述资源的一个特性,一条元数据描述仅描述一个资源。这就是通常所说的”1:1 原则”。比较严格的要求是一条属性描述不可描述多个资源对象或其多个属性,例如一条描述描述一个碑帖多个版本(原则上每个版本需要单独的描述)。这是为了 保证描述或记录的可区分性以及系统的可升级、可维护性。一条元数据指向多个数字对象,对于系统的管理(特别是可扩展性方面)会造成难以估计的困难。
17. DC元数据所描述的对象是什么?
DC元数据所描述的对象是”资源(Resource)”,资源是任何可以标识的东西。可以是实体的,也可以是抽象的。常见的例子有电子文档,图像,服务(例如,”洛杉矶今天的天气预报”),还有其他资源的集合。并非所有的资源都是网上可检索的;例如,人,机构,还有图书馆里装订成册的书都可以被认为是资源。
曾经定义为DLO(Document Like Object),由于无法确切定义而放弃。
曾经表述为”数字对象(Digital Object)”,由于将物理资源对象排除在外而缺乏普遍意义。
目前的表述作为语义万维网的概念之一,获得支持和承认。
18. DCMES(都柏林核心元数据集)包括哪15个元素?(请按类别说出英文名称)。

相关文档请参考:http://dc.library.sh.cn/
19. 什么是元数据限定(或称修饰)?什么是编码体系修饰词?
限定词refinements也叫修饰词,是对元数据元素语义的进一步限定和细化,通常通过vocabulary和encoding scheme两种方式。后者称为编码体系修饰词。
20. 什么是限定版(Qualified)DC?包括多少元素?试举例。
目前DCQ已经被全部归到了DCTerms命名域下,共有33个限定词(refinements)和17个编码体系修饰词(encoding scheme qualifier)。详见: http://dublincore.org/documents/dcmi-terms/。(中文翻译参见:http://www.dc.library.sh.cn/DC/dcmi-terms.htm)
21. 什么是DC的类型词表?有哪些类型?
DC对于资源类型建立了一个规范词表,称为DC的类型词表。见:http://dublincore.org/documents/dcmi-type-vocabulary/
目前包括:资源集合Collection, 数据集Dataset, 事件Event, 图像Image, 交互资源InterativeResource, 服务Service, 软件Software, 声音Sound, 文本Text, 物理对象PhysicalObject共十种,其中图像还有静态图像(StillImage)和动态图像(MovingImage)两个下位类型。类型词的中文翻译见:http://www.dc.library.sh.cn/DC/dcmi-type-vocabulary.htm。
22. 什么是DC图书馆元数据应用纲要?与DCMES有什么不同?
DC图书馆元数据应用纲要指以图书馆应用为适用领域的元数据应用纲要,规定了对图书馆资源进行描述所需采用的元素。目前的状态是工作草案。参见:http://dublincore.org/documents/library-application-profile/ 。中文翻译参见:http://www.dc.library.sh.cn/DC/dc_lib.htm
23.什么是DC教育元数据应用纲要?与DCMES有什么不同?
DC教育元数据应用纲要指以教育应用为适用领域的元数据应用纲要,规定了对教育资源进行描述所需采用的元素。目前的状态是工作草案。参见:http://dublincore.org/documents/education-namespace/ 。
24. 什么是DC本地化?客户化?如何进行DC的本地化和客户化?
国际化是DCMI制 定和推广元数据标准和应用的一项基本原则。国际化就是要适应各语种、文化的需要,对其元数据方案进行本地化和客户化。本地化是指使一个通用的元数据方案能 够适用本地语言、规范词表和其它规范的过程,例如元素名称的翻译和显示、本地分类体系的采用等等;客户化指为适应特定应用领域而进行的限定、扩展等,当然 这种限定和扩展要在DC元数据抽象模型的框架之下进行。本地化和客户化都需要制定相应的规则或进行进一步的规范或约束。
25. 什么是元数据标准?什么是元数据方案?他们之间的关系是什么?
元 数据标准是经过标准化组织认可的,用于特定资源类型描述的元数据方案,而元数据方案多指具体应用元数据标准而形成的具体规定,常应用于某一特定的组织、机 构,或特定的资源类型。标准化组织除了具有国际性或国家性的权威标准化机构之外,也包括行业性的、事实上的标准制定、维护机构,例如W3C,DCMI,IEEE-LOM,OMG等。
26. 元数据方案一般包括哪些内容?
一般应该包括:数据元素集合/应用纲要/置标方案/著录规则/应用指南/最佳案例/扩展方案/系统需求。详细说明如下:
|
资源分析文档: |
定义资源类型,确定资源类型的内涵和外延,确定著录级别和著录单位,属性提取,确定著录对象之间以及属性之间的关系,属性的检索要求,核心属性的支持 |
|
元数据元素集及定义: |
按照规范格式定义属性元素,定义限定和扩展规则,定义子元素和编码体系,定义元素之间的关系 |
|
著录规则: |
元数据方案应用于具体资源类型著录时的细节描述 |
|
置标方案: |
采用RDF/XML置标的规则,命名域规定,标签定义,编码规则 |
|
规范控制流程*: |
人名规范档的建立、维护、更新、应用流程和规则 |
|
元数据著录系统需求*: |
开发具体的著录系统所要求的通用和专用需求规范 |
*可选文档,不是所有元数据方案都需要这些文档。
27. 设计元数据方案应遵循哪些原则?
• 简单性与适用性原则
•专指度与通用性原则
•互操作性与易转换性原则
•灵活性与可扩展性原则
•用户需求原则
•遵循现有标准原则
28. 元数据方案的设计流程是什么?
需求分析、对象分析、元数据方案、置标方案、系统需求、系统设计
详如下:

29. 什么是元数据应用纲要(Metadata Application Profile)?元数据应用纲要有相关参考标准或指南吗?
一种元数据标准的应用形式,也可以看成是一种规范的元数据方案(metadata schema)。对于应用系统采用多种不同的元数据标准的内容和方法进行一定程度的规范,其基本思想来自于Warwick Framework,:不同的元数据元素可以集成在一个包中描述一个资源。
具体做法是
首先定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
其次从不同元数据标准规范种选择一些适用的元素,声明这些元素的语义,以及可能存在相互关系,建立相关规则等,这些来自多个元数据标准规范的元数据元素应当有自己的命名域;
然后声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
最后选择置标方案。
元数据应用纲要的欧洲标准为CEN CWA14855。
30. 试简要解释元数据与知识本体的关系。
本体是领域知识的形式化说明,通常由概念、概念之间的关系、公理、规则组成。元数据解决资源的语义描述问题,本体解决资源集合的相互关系问题,他们都需要一定的形式化机制提供”机器运算”的可能性。元数据与本体的关系可以简单地看成是微观与宏观的关系。
10月15日更新:
论述题回答要点:
1. 谈谈企业知识管理的特点、方法。
企业知识管理是对企业生产经营管理活动中所需要和产生的知识的管理,具有一般知识管理的共性,又有非常鲜明的特点。近几年形成一个活跃的研究领域;
其共性在于都是应用知识和信息组织的一般原理和方法进行管理,并利用了计算机及网络作为重要的管理手段;
其不同之处在于:
对于知识的理解有所不同,认为具有“语境”(即在特定环境中具有特定含义)的信息都是知识。其中形成了多个“流派”,例如把与企业活动相关的知识分为“显 性知识”和“隐性知识”,前者可以编码,借助于计算机应用系统处理、保存、利用,后者必须通过一定的管理手段;
内容不同:企业知识管理所涉及的内容不是以学科划分,内容丰富而复杂,文档类型多样、文件格式众多,管理起来有一定的复杂性;
目标不同:企业知识管理的目的是企业效益的最大化,而不是追求知识体系的最佳化和最大程度的有序化。
注重知识管理是对整个企业生产经营管理活动过程的辅助,伴随始终,不能脱离,因而知识管理系统可能针对不同部门、流程具有不同的功能、界面、接口。
企业知识管理从技术方法上与传统的知识和信息管理系统没有什么本质不同,都使用分类法、主题法、全文检索等技术,但在应用的侧重点上有所不同,例如其分类 一般不用学科分类,而根据实际情况采用多种实用分类,近年来许多最新的技术开发成果首先备应用到企业知识管理领域。
2. 知识本体与叙词表的作用和异同。
知识本体的概念:本体是对概念体系的明确的、形式化、可共享的规范说明。叙词表:以规范化的自然语言语词作为文献主题的标识,通过叙词的概念组配表达主题概念。
知识本体的作用:
知识共享:在人、机器(表现为软件代理)以及人与机器之间共享对于信息及结构的共同理解
知识重用:实现一定程度的领域知识的重用
知识推理:知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知
知识的形式化:对于领域知识进行分析、明确,并使其形式化从而可为计算机所操作。
叙词法的作用:
对信息内容进行标引的功能(指代用以检索);
对主题内容及其相关信息予以集中或揭示相关性的功能;
对大量信息加以系统化或组织化的功能;
便于将标引用语与检索用语进行相符性比较的功能
知识本体和叙词表是不同时代产生的知识组织的方法,
其相同点是:
都是从内容上对知识进行抽象;
都强调规范性;
都是在一定领域内的应用。
其不同点是:
叙词表侧重对知识内容的标注,知识本体是对知识内容的直接表达;
叙词表强调主题揭示、族性相关归属,知识本体强调共享与重用;
叙词表强调按学科的规范性,知识本体强调领域知识的规范;
叙词表不一定要求计算机编码实现,知识本体强调形式化一边计算机操作。
由于叙词表也是学科领域知识的系统反映,可以按照一定流程和规范转化成知识本体。
3. 如何创建领域知识本体?
按照图示(见文末)解释(右边“本体操作阶段”可以简化)即可。

4. 元数据应用纲要的组成和设计流程。
元数据应用纲要的组成:
• 名确定义所要描述的资源对象及其属性;
• 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
• 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
– 可以规定元素的编码规则;
– 可以规定元素的值的约束;
– 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
• 如果需要增加“新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
• 规定编码规则(制定置标方案);
• 编写有关应用文档。
设计流程按照下图解释

5. OAI协议的基本内容
OAI的定义:
• Open Archives Initiative Protocol for Metadata Harvesting,(OAI-PMH)简称OAI协议,协议的制定目的是提供具有独立于应用程序的、可互操作的,能夠提供和促进Web上信息资源发布 和共享的社区的应用框架。其主要目标为:
– 简化文件內容的有效传播。
– 促进数字化文件的存取。
– 扩展存取数字化信息的种类和范围。
定义了以下基本内容:
• 定义了一个资料提供者能夠通过HTTP为基础的协议,发布其metadata的机制,即定义了数据提供者(Data Provider)的角色:提供其文件内容,并以OAI作为发布metadata的协议。主要工作为维护一个或一个以上支持OAI协议的、将其内容以 metadata发布的服务器。
• 定义了一个能够从资源库(Repository)获取含有元数据记录的机制,即定义了服务提供者(Service Provider): 通过OAI协议从数据提供者取得数据,并将获得的metadata建库提供增值服务。
• 资源库(Repository):通过HTTP,接受OAI协议所提出存取数据需求的服务器。
• 数据集(Set):非必备功能。为了方便获得所需资料,储存器内可将不同类别的数据区分成不同的子库,并以层次结构表示,以节点(node)作为区分,每一个节点称为数据集。
• 记录(Record):一个数据记录是后台服务器依据OAI协议,从存储器内将资料以XML编码传回前端的元数据。
6. 什么是Z39.50协议?其发展趋势如何?
概念:
Z39.50标准的名称: 信息检索–应用服务定义与协议规范
Z39.50协议是在分布式网络环境下, 用以支持信息搜索和信息检索的计算机系统间的通信协议
该标准规定了数据库管理系统的客户端和服务器端对话的规则。
这种规则建立在客户机/服务器的体系结构基础之上。
数据库客户端和服务器端的通讯通过网络实现。
Z39.50协议由于产生于C/S结构作为主流分布式应用的时代,非常复杂而难于实现,目前产生了SRW/U作为其下一代标准,具有以下特点:
基于SOAP和URL的无状态连接(原来是直接TCP/IP连接,且是有状态的);
支持元数据的XML编码(原来是二进制的)
支持CQL(Common Query Language)查询(原来的查询无标准规定,而且不人性化);
也就是说现在完全支持基于Web的连接和查询了。
7. 什么是DC元数据描述的抽象模型?有什么作用?
DC元数据描述的抽象模型的主要内容如下:
• 一个条描述(description)是由一个或多个陈述(statements)(该陈述仅与一个且唯一一个资源有关),以及零个或一个资源的URI组成(URI用来标识所描述的资源);
• 每个陈述由一个属性URI(这里的URI用于标识一个属性),零个或一个值URI(这里的URI用于标识属性的值),零个或一个编码体系URI(这里的URI标识值的类),零个或多个值的表述(representations)组成;
• 每个属性都是被描述资源的一项特性;每个属性URI可以在多个陈述中重复;
• 值的表述(value representation)可以是字串值(value string)、复合值(rich value)或相关描述(related description)等形式;
作用:
• 明确概念,例如DC的描述对象、描述单元、限定方式等等;
• 能够在一套概念术语的基础之上提供一个抽象的数据模型(概念的坐标参照系),以便在不同的元数据方案(如果都采用或宣称采用基于DC的方案或者AP)之间获得共同的理解;
• 独立于特定的编码语法,约束和补充置标方案的不足;
• 深入理解编码对象的属性,实现元素的映射、翻译和转换,从而实现元数据方案的共享和重用;
• 在语义层实现元数据应用系统(数字图书馆)的互操作
8. 试简要解释元数据与知识本体的关系。
• 元数据方案不具有普遍适用性。无法克服特殊性与一般性的矛盾,而形式化的知识本体可以提供一种在元数据方案之间自动映射的机制,通过语义Web服务的体系架构进行实现;
• 元数据应用难以实现元数据方案本身的进化,而知识本体可以提供信息系统的其它视图,只需要通过自动或半自动的手段应用新的元数据方案;
• 元数据方案自身难以对不同知识体系、不同“粒度”的资源进行描述,而知识本体正是起到这个作用,从而实现异构资源和系统之间的语义联系;
• 单纯的元数据方案对于数字资源的整个生命周期的描述非常困难,而采用以诸如FRBR模型为基础的知识本体,这个问题便迎刃而解,不同生命周期的知识产权属性也非常易于描述;
9. 试论信息资源组织的发展趋势。
(可以自由发挥)
数字化内容
网络化服务
基于内容特征的组织
基于整体的组织而不是基于局部的标注
分面组织
结合上下文组织
结合用户需求动态组织
智能化组织
标准化组织
……
第10题:以Google/Yahoo! 为例,谈谈搜索引擎的信息资源组织。
搜索引擎概念(参见讲课ch1引言及课程框架.ppt中“搜索引擎”部分), Google是目前最受欢迎的搜索引擎之一。(搜索引擎(Search Engines)是对互联 网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包 括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。)
Google如同一般搜索引擎一样,对于所搜集的信息按照关键词在本地服务器上 集中地进行全文索引,提供用户基本的网页查询服务;
目前许多搜索引擎网站利用自身的技术特点和优势提供一些特殊的服务,例如 Google特有的Pagerank技术提供了很好的排序,Yahoo提供了很好的分类浏览功能;
Google等搜索引擎除了网页之外,还能够提供需多其他服务,例如桌面(本地) 查询、各类文件(doc, pdf, ppt, mp3, 图象文件)的查询、数据库查询(与OCLC的 合作查询WorldCat)等等;
总结:搜索引擎是目前对于网络信息资源进行组织和利用的主要手段,而数字 图书馆是以分布式信息的组织为主要特征的网络服务形式,因而搜索引擎可以成为 数字图书馆信息组织的一个组成部分。
11. 数字图书馆如何解决异构系统互操作问题?
主要通过互操作协议和标准规范解决数字图书馆的互操作问题,尤其是与元数据相关的协议和标准规范。
主要通过:
• 各类元数据方案的映射
• 标准的资源描述框架
目前得主要标准有:
• OpenURL标准
• Z39.50 协议标准
• OAI元数据互操作协议
分别解释一下。
12. 元数据方案设计有哪些正在形成或较为成熟参考模型?这些模型分别解决什么
问题?(见讲义Ch3a.ppt)
• RDF数据模型(及Warwick框架)
• OAIS参考模型
• FRBR功能/生命周期模型
• DCMI抽象模型(DCMI元数据方案抽象模型)
• 数字图书馆体系结构模型
台湾大学“知识组织”课件参考- -
因要给研究生班开设”知识组织与元数据”课程,系里没有指定教材,目前似乎也没有合适的教材,最近在准备课程内容时发现台湾大学咨询学系(也就是陈雪华教授那里)2003年就开设了类似的课程,名为”知识组织”,且所有课件都可以下载,狂喜。(参见http: //ceiba3.cc.ntu.edu.tw/course/cb9879/)。
看了台大的课程内容, 总的感觉,台大的”知识组织”更加偏重”知识管理”中所需的知识组织,也就是说时下比较热门的、用于许多知识型企业(咨询公司、 IT 研发企业等)的知识组织,而不是源自于哲学认识论、逻辑学或者计算机科学中的知识表示和操纵。因而看起来像是图书馆学、计算机科学与管理学的交叉。内容非常丰富,也很实用,然而就学科体系来说略感凌乱,如果想通过这门课的教授整理一份教材,还需要下不少功夫。
而且毕竟是2003年以前的内容,”知识本体”这两年进展颇多,课程的资料略显陈旧。
北大要求给研究生上课不必详细讲授知识内容,面面俱到,只要有一个大纲,让研究生掌握框架,然后去自学,并且在实践中总结。台大的课件好像也不太符合这个要求,象是给本科生上课。但是我的教材内容还是要准备得尽可能详尽,讲授的时候可以灵活掌握。这样做一方面便于自己形成一些研究课题,也方便学生拿到课件后能够进行自学,并进一步选择研究方向。
重新看一下我准备的课件,元数据部分还是强调的太多,脱胎于元数据讲座,而不是从知识组织角度,更能讲清楚元数据的作用和来龙去脉。