“图书馆2.0”研讨培训班视频下载
今年5月13日-15日由上海图书馆学会和中图学会数图专委会合办的“图书馆2.0技术与服务应用”研讨培训班,视频已经处理完毕(抱歉拖到现在)。最近很忙,不想再做专门页面了,如果大家不怕浪费时间,请到以下地址下载、观看:
http://www.dlresearch.cn/download/lib08tutorials/video/。
研讨培训班的具体日程安排和课件下载请参考这个帖子:“图书馆2.0技术与服务应用”研讨培训班明日开班“。
如果您对上述培训及内容有任何意见或建议,可以在这里留言,也可以给我发邮件。谢谢!
Popularity: 48% [?]
Tags: 上海图书馆学会, 下载, 图书馆2.0, 培训, 课件Related posts
Andy Powell介绍元数据
志愿者培训课件
以下是本人这次参加志愿者行动的课件,采用“署名-非商业性使用-相同方式共享”授权,欢迎下载使用。
2008年7月13日星期日 14:00-17:00 吉林省长春市解放军某部南湖招待所(长春市工农大路2826号):
基层图书馆的自动化网络化建设与共享工程 之一:图书馆自动化、数字化与网络化(7.7MB);
基层图书馆的自动化网络化建设与共享工程 之二:文化共享工程与公共图书馆总分馆建设(3.1MB);
基层图书馆的自动化网络化建设与共享工程 之三:图书馆2.0(12MB);
基层图书馆的自动化网络化建设与共享工程 之四:影响图书馆未来的十大技术(9.6MB)。
2008年7月20日星期日 14:00-17:00 贵州省图书馆五楼多功能厅:
基层图书馆的自动化网络化建设与共享工程 之一:图书馆自动化、数字化与网络化(11MB);
基层图书馆的自动化网络化建设与共享工程 之二:文化共享工程与公共图书馆总分馆建设(7.2MB)。
另外郭斌馆长非常精彩的“基层图书馆馆长实务”课件因为有网友要,我也特别要来了放在此处。其他老师的课件我一旦征得许可,也会放在这里,敬请留意。
update:李超平老师贵州授课的课件下载:图书馆推广实务。
Popularity: 56% [?]
Tags: 培训, 志愿者, 课件, 链接Related posts
秦健:建立为数据库信息服务的知识网
参加在杭州举办的”长三角数字图书馆技术与规范”高级研讨班的同事带回来一些ppt文件给我们学习。今天学了秦健的《建立为数据库信息服务的知识网》,并随手作了一些笔记如下(带背景色的为原文,仅摘录了认为较有启发的一些Slides)。
建立为数据库信息服务的知识网
- 学术数据库的标引现状
- 商业数据库的标引现状
- 标引深度和广度对检索和结果显示的影响
- 知识组织与表述对标引的支持
-
利用知识组织与表述的方法丰富标引的内容
很有兴趣看看学术与商业数据库对于标引工作的不同做法。再开阔一些视野:像Google们是不屑做”标引”之类的工作的,他们最大的乐趣就是奴役机器,把机器的功能发挥到极致,现在Web2.0又发现人们的个人行为构成的群体社会性行为以及人-人、人-机交互行为能够提取许多有价值的信息,即所谓”社会性网络”,通过这种网络行为模式提取能够使机器做更多的事情,而不必所有的”标引”皆由人工来做。这样,realize the web of its full potential.
• 学术信息标引的主要特点:
- 传统学科分类
• 专业主题分类
• 一文标引多类
• 动态分类链接相关文献
- 横向主题词
• 规范语言
• 一文标引多词
• 动态主题词链接相关文献
学术信息为什么要这样标引?社会经济因素决定了学术研究的模式是角色分工,因而不对等,有人定规则,其他人执行规则,利用规则的产品,才是最经济的。而且学术研究对于客观理性的追求常常把东西弄得过于复杂,成本高到社会能够接受的上限。所以往往只有有钱人才能搞科学研究,而且是labour intensive的。
学术数据库标引趋势
• 分类和规范词标引仍然占主导地位
• 跨数据库检索主要利用顶层主题分类
• 网络技术的渗透对标引的深度和广度既有帮助更有挑战
- 灵活多样的小主题词表
- 自动标引、自动对应主题词与关键词
这是不是暂时的?还是相当长时间都会这样?可能学术数据库已经积累的大量数据,由于添加了”Value-add“的人工标引信息而显得尤为珍贵,但是将来必须利用技术手段(相关反馈等系统交互信息)而”加值”,小的词表必须采用Semantic Web的相关架构和技术,才能够更加灵活、降低成本、符合用户习惯、使系统越用越好越有粘着性。
商业数据库的标引现状
• 厂家、产品信息的标引
- 多面标引(Multi-faceted indexing)
- 厂家与产品之间的连接参照
• 检索界面与标引内容的联系
- 受网络搜索技术的影响,注重检索浏览界面的设计
许多商家的网页不仅仅作为一个数据库,而是作为商家电子商务的一个门户,这种情况下界面的设计有很多功夫用在后台,用在其核心业务流程(B2B/B
商业数据库标引的特点
• 标引的多面化:主题、地区、产品、公司、人名等
• 粗分类与细分类相结合
- 粗分类:利用各种专业分类表
- 细分类:主题的多面性
• 充分利用网络技术的优势,把多面标引和粗、细分类结合灵活应用
• 充分利用情报检索多年的研究成果进行全自动/半自动标引
商业数据库的体系设计与分类表的设计都遵从实用性原则。一些成熟的、优秀的商用数据库在规范控制方面的成就不亚于学术数据库,这虽然看起来成本很高,不可思议,但是将来基于Web Services的电子商务也是需要规范控制的,”信任”是Semantic Web的特点和难点,但却是必须要做的,只是做的方法可能会两样:新方法从整个体系的角度多方位地建设”信任”体系(如对于传输的控制、注册体系的建立、机构中介的认证、历史纪录考察等角度),老的方法只采用以语义规范为主的权威控制。
多面、深标引的语义支持
• 叙词表
• 双语、多语种对应词表
• 主题分类表
- 不同于传统的图书馆分类表
- 分类原则不是那么严格
- 以实用为原则
• 实用分类系统
- 侧重于概念类目之间的联系
- 基于某专业领域(domain specific)
下面讲到新方法比老方法的优点
传统知识结构的局限性
• 有限的概念之间关系的表述
- BT, NT, RT
• 有限的词语语义限制
- USED FOR, USE
• 无法定义数据模型,给实施系统带来很多不肯定性
- 主要靠程序设计人员在程序设计时决定如何连接不同概念
- 无一定的规律,即使在同一系统中,不同数据库的实施经常不同
利用”实用分类系统”*弥补传统知识结构的缺陷(*即我们所说的”知识本体”)
• 主要从两个方面来进行:
- 从不同角度来审视概念及其之间关系
- 从知识模型的角度来构造语义和数据模型
• 什么是实用分类系统?
- 英文:Ontology, ontologies
- 哲学上的含义:本体,本体论
- 信息技术上的含义:对某一特定领域里概念及其相关关系的规定:
• 知识模型构造: 概念定义、结构与类型,词语规范对应,逻辑性
• 实用性:数据模型,数据类型,实例
• 技术性:数据库,表述语言,推理规则,应用程序
对于本体的理解似乎比计算机领域宽泛些,但是又仅仅局限在”领域”应用,且只是一种抽象的概念体系及其关系,并不包含公理逻辑和实例。–看了后面的例子,感觉还是一样的。
实用分类系统的组成部分
• 类目(Class,Concept)
- 类名class name
- 定义definition, documentation
- 类目类型class type
• 特性(Property, Slot, Role)
- 特性名Name
- 特性类型Type
- 特性限制Constraint, Cardinality
- 赋值范围Domain/facets
• 实例(Instance)
• 推理规则(Inference rules)
最后讲了本体的构造过程。以及结论:
• 网络技术对数据库检索既有促进作用,也使索引数据库面临巨大的挑战
• 检索功能和界面的多样化灵活性都要有多样深化的标引为基础
• 开发编制各种专门词表并且使其能够在需要的时候合并
以及如何在专业词表的基础上构建实用分类系统
- 评论人:而立
Sat Jul 09 17:57:21 CST 2005 
制定规则的人应该在什么程度制定规则?是在大量调查研究的基础上吗?执行操作的人在其中能起到多大的分量?谢谢先生!我以前经常拿图书馆分类法去评判商业数据库分类体系,现在看来,是很不准确且不全面的,谢谢点评!
- 评论人:平林新月
Thu Jul 07 09:02:10 CST 2005 
经K先生点评,豁然开朗!
- 评论人:扎根
Thu Jul 07 08:46:50 CST 2005 
K先生莫生气,免费的午餐搭配”博客手拉手”挺正常么。
Popularity: 19% [?]
Tags: 数字图书馆, 知识组织, 秦健, 课件Related posts
“题库”解答参考
这是前两个部分,论述题部分还没有完成。如果其中有错误或更好的答案,请一定告诉我哦。
超长,只好分开贴。下面概念部分。
4月8日21:30修订。
名词解释47个
|
信息资源 |
情报检索 |
XMLS |
复分表 |
规范控制 |
|
知识 |
博客(Blog) |
RDFS |
OAI |
组配 |
|
元数据 |
知识管理 |
Z39.50 |
OWLS |
后控 |
|
知识本体(本体论/Ontology) |
元搜索(Metasearch) |
编码体系EncodingScheme |
万维网服务 (Web Services) |
元数据收割(Harvesting) |
|
叙词表 |
数字图书馆 |
FRBR |
互操作 |
检索语言 |
|
语义万维网 |
元数据登记系统 |
MODS |
Topic Map |
全文检索 |
|
因特网 |
内容管理 |
MARC |
元数据应用纲要 |
OpenURL |
|
搜索引擎 |
DC(Dublin Core)元数据 |
METS |
分面分类 |
相关反馈 |
|
KOS |
数字对象 |
HTML |
万维网WWW |
倒排档inverted file |
|
HTTP |
1. 信息资源
信息资源即”作为资源的信息”,可以理解为有价值的信息。然而信息的价值是体现在使用中的,对于不同的使用者,信息可以有不同的价值,而且信息的不同组合、不同的关联也能使信息具有不同的价值。这反映了信息的特性:信息是具有语境(context,也译成”上下文”)的数据。从计算机操作的意义上说,信息资源可以是任何具有标识的东西,在互联网上,标识通常为由命名域给出的URI。
2. 知识
知识是能够指导思考、行为和交流的正确和真实的观察、经验和过程的总结。知识包含真理和信念,观点和概念,判断和预期,方法和诀窍等内容,也可以理解为用于解决问题的结构化信息。
3. 元数据
元数据是关于数据的结构化数据,或者定义和描述其它数据的数据(data that defines and describes other data (ISO/IEC 11179-3:2003(E))
4. 知识本体(本体论/Ontology)
知识本体是领域概念及概念之间关系的规范化描述,这种描述是规范的、明确的、形式化的,可共享的。”明确”意味着所采用概念的类型和它们应用的约束实行明确的定义。”形式化” 指知识本体是计算机可读的(即能被计算机处理);”共享”反映知识本体应捕捉该领域中一致公认的知识,反映的是相关领域中公认的概念集,即知识本体针对的是团体而非个体的共识。知识本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义。
5. 叙词表
又称主题词表(Thesaurus),指以规范化的自然语言语词作为文献主题的标识,通过叙词的概念组配表达主题概念。能够多向成族、多检索途径、多因素组配、灵活扩检/缩检/改变检索范围,具有专指度好,同时具有一定可扩展性的优点。
6. 语义万维网
语义万维网(Semantic Web)是万维网的发明人Tim-Burners Lee倡导的下一代万维网,致力于开发”以计算机可处理形式表示信息含义的语言”,以在资源之间建立起机器可处理的语义联系。
7. 因特网Internet
采用TCP/IP协议和共享命名系统的全球性网络,由一些独立管理的网络互联组成。是在ARPAnet基础上发展而来的。使用”因特网”常指网络的物理结构,包括以TCP/IP协议连接在一起的所有计算机和网络设备。使用”万维网”常指因特网上的内容信息,包括所有网站、网页、电子邮件以及通过其他各种协议和技术能够获取的信息。
8. 搜索引擎Search engine
搜索引擎(Search Engines)是对互联网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。
9. KOS(knowledge Organization Systems/Structures/Service)
可以指三个相关的概念:知识组织体系(这里system翻译成”体系”比较好)/知识组织服务/知识组织结构。知识组织体系指用于组织知识的各类规范方法,如分类法、叙词表、知识本体等等;知识组织服务指利用知识组织体系实现的具体的应用系统所提供的服务,不同的知识组织体系的服务特点和能力是不同的;知识组织结构指各知识组织体系对于知识关系的表达、揭示时达所表现出来的不同形式。
10. HTTP
超文本信息传输协议(Hyper Text Transfer Protocol),是万维网的基本协议,用于浏览器与服务器之间通信。
11. 情报检索Information Retrieval
搜索信息体,查找与查询请求能够匹配的对象的过程。作为一个信息技术领域它可以指建立情报检索系统所必需的情报存储和查询两个互逆的过程,传统上的”情报”多指二次文献,因此情报检索系统也就是二次文献数据库的建立和用户查询过程。
12. 博客(Blog)
Blog或Weblog,中文称网志或博客,是一种包含RSS元数据描述(RDF Site Summary或者Really Simple Syndication:一种描述网页的元数据方案)的动态网页,使用者可以在万维网上发表自己的日记、文章等。由于使用了RSS,因而能够支持语义链接、聚类功能。
13. 知识管理
机构、组织或个人通过有关知识的评估、获取、学习、传播、整合、保存、创新等活动,将知识视为资产而进行管理,目的是为了有效增进知识资产的价值。
14. 元搜索(Metasearch)
同时利用资源站点自身的检索功能搜索多个站点,并且进行实时动态整理、排序等服务的搜索。
15. 数字图书馆
对以数字化形式存在的信息进行收集、整理、保存、发布和利用的实体,其形式可以是具体的社会机构或组织,也可以是虚拟的网站或者任何数字信息资源集合。通常包括以下内容:
- 数字对象的集合所构成的资源库;
- 描述这些数字对象的元数据库;
- 实用这些数字对象的目标用户;
- 提供各种服务(捕捉、标引、编目、查询、浏览、检索、传递、存档、长期保存等)的系统
16. 元数据登记系统
元数据登记系统(Metadata Registry)是对元数据的定义信息、置标方案、转换规则、著录规则、应用指南等规范进行发布登记管理和检索的系统。
17. 内容管理
内容管理是指对组织机构内部多种格式和媒体类型的信息资源(通常称为信息资产)的组织、分类、管理等有序化过程,常常作为数字图书馆或企业知识管理的一个组成部分。
18. DC(Dublin Core)元数据
数字图书馆中使用的一组简单的包括15个”核心元素”的元数据元素集合,主要用于描述数字对象、馆藏管理和元数据交换。1994年提出,目前由DCMI维护,已成为ISO15836-2003、IETF RFC2413和NISO Z39.85-2001等国际国家标准。
19. 数字对象
存储于数字图书馆中的一个条目,通常由数据、元数据和标识符组成。
20. XMLS
XML是eXtensible Markup Language,即可扩展标记语言,由SGML简化而来,是许多置标语言(例如XMLs/RDF/RDFs/OWL等)的元语言。
XMLS指XML Schema,即XML模式,用于定义XML词表和结构用于机器识别和共享信息的定义语言。
21. RDFS
RDF:Resource Description Framework,即资源描述框架。采用”资源-属性-属性值”的”主谓宾”结构(或称三元组),提供一种框架容器,并通过XML定义了一套形式化的方法,为机器语义理解的结构基础。
RDFS即RDF Schema,用于定义元数据属性元素(例如”创建者”),以描述资源的一种定义语言。
22. Z39.50
允许计算机搜索远程系统上馆藏信息的一种协议,产生可进一步处理的检索结果和检索信息,主要用于检索书目信息。
23. 编码体系Encoding Scheme
元数据修饰的一种方式,用来规定元素取值范围或取值意义的受控词表或规范名称。
24. 复分表
复分表就是将一组可适用于多个类别的子目结构,单独制表。在分类时,若有需要用到這个复分结构时,可以自行组合运用。常见的复分表有形式复分表、时代、国别、语言复分表等
25. FRBR
书目记录的功能需求(Functional Requirements of Bibliographic Records)的简称,是IFLA1998年出版的一份研究报告,对书目记录描述的对象在整个生命周期过程中不同阶段的不同实体类型进行了详细的分析,为这些资源的描述、定位提供了完整的思考框架。
26. MODS
Metadata Object Description Schema是提取MARC记录中的部分内容,用XML模式定义为一个新的元数据对象。
27. MARC
图书馆用于存储和交换书目记录的一种格式。
28. METS
元数据编码与传输标准(Metadata Encoding and Transmission Standard)是一套XML模式,用以编码有关资源对象的描述型、管理型、结构型元数据方案。由美国国会图书馆维护。
29. HTML
超文本标记语言(Hyper Text Markup Language)一种简单的文本置标和排版语言,带有指向其他对象的链接,用于万维网。
30. Markup language
一种嵌入文档中、表示文档结构和/或格式的代码。
31. OAI
全称为Open Archives Initiative Protocol for Metadata Harvesting,简称OAI协议,是一种独立于应用的、能够提高Web上资源共享范围和能力的互操作协议标准。
32. OWLS
万维网本体语言(Web Ontology Language)是描述互联网上信息内容及其相互关系的一种人工语言,是对RDF模式语言的进一步扩充,从本质上是为了计算机处理而设计,而不是为了人理解用的。
33. 万维网服务(Web Services)
Web服务是通过标准的描述性界面(Web Services Description Language) 与SOAP(Simple Object Access Protocol)来设计,开发,管理可编程访问的Web组件的技术 与标准的总称,
是独立的、模块化的应用,能够通过互联网来描述、发布、定位以及调用。
34. 互操作
资源的结构或组件存在技术上或/和语义上差异,但在独立的管理环境中为用户建立一致性服务的工作。
35. Topic Map
主题地图(Topic Maps)是一种类似于语义语意网络的知识表示模式,结合了传统索引、图书馆学与人工智能等领域的优点,可以有效的组织知识以利于探索、推理,解决大量无序信息所带来的问题。
36. 元数据应用纲要
元数据应用纲要是一种元数据标准规范的应用形式,也可以看成是一种规范的元数据方案(metadata schema)。允许在应用中采用组合来自多个不同的元数据标准中的数据元素,并对”混合型”元数据方案从内容和形式上进行规范。
37. 分面分类
经过描述对象的概念的分析与综合,可以把复杂主题概念分析为若干简单的主题概念或概念因素,简单的主题概念可以综合表达复杂的主题。简单主题属性即构成”面”。
38. 万维网(WWW)
World Wide Web的缩写,常指利用因特网可访问的所有网站及其信息内容,也指因特网上用于信息互联的技术,如HTML、HTTP、URL和MIME等。
39. 规范控制
对用于标引的标识(例如主题词、类名、人名或其他名称)进行规范的方法。规范控制是为了完善信息系统的汇集功能和查询功能,保证信息资源组织的整体性、有效性和查询的一致性而进行的工作。也称”权威控制”。
40. 组配
在标引或查询中采用多个标识单元组合成新的概念进行检索的方式。例如利用多个单元词、多个类号,应用一定的语法(例如冒号”;”),组合成表达信息资源的概念,或提问式。
41. 后控
与标引中的规范控制类似,对于情报检索系统的查询提问进行规范的一种方法,以提高查全率和查准率。
42. 元数据收割(Harvesting)
在因特网上分布式检索不同的资源库(repositories),获取元数据在本地集中式建库的一种做法。常常包括对于协议和数据格式的规定。
43. 检索语言
即情报检索语言,是根据信息检索的需要创造出来的一种人工语言。检索语言是一种受控语言,它依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。
44. 全文检索
一种将文件中所有文本与检索项匹配的文字资料检索方法。
45. OpenURL
即”开放链接”,一种解决不同的数字资源系统互操作、进行资源整合的方法,也是一项的技术标准。开放链接(OpenURL)是一种附带有元数据信息和资源地址信息的”可运行”的URL。可用来解决二次文献数据库到原文服务的动态链接问题,服务提供方(通常是图书馆)维护的链接解析器能够在相关服务网页上动态生成开放链接。
46. 相关反馈(Relevance Feedback)
通过与用户交互的方式(包括实时交互或通过用户兴趣文档特征值交互),改善查询效果、提供个性化查询的方法。
47. 倒排档(inverted file)
按文档中出现的单词及其在文档中位置的列表。倒排表能为给定词汇给出它在文档中所有出现的位置。
评论人:门外汉 2005-09-24 11:26:04
|
||||
|
您真是一位好老师,谢谢您在网上给大家教授知识. |
||||
- 评论人:keven 2005-04-07 22:28:18
|
||||
|
确实是没有固定答案。有时很多解释都觉得不合适–并不是说错误,而是语境不对–学生们总是需要一个”标准”答案的,当然标准不标准无法衡量。 |
||||
- 评论人:游园惊梦 2005-04-07 21:35:59
|
||||
|
呵呵,难得keven师花这么长的时间做这个答案,谢谢了。不过名词解释这个东西是没有一个固定的答案的,强烈推荐先生到维基百科(http://zh.wikipedia.org/)去查寻一下这些名词的解释,很有启发的。譬如一个”语义网”的解释便延伸到了很多相关主题。 |
||||
Popularity: 17% [?]
Tags: 知识组织, 课件Related posts
“题库”解答参考(续)
这是简答题部分。有些部分好像不太”简”。
更新说明:2005年9月30日基于李丽同学的提问补充解释部分内容,涉及11、12题。
简答题30道
1. 什么是信息资源?什么是信息资源组织?
信息资源是指人类社会中经过加工处理的大量有序化信息的集合。
从信息资源组织的角度,由于无法判别”信息资源”的价值(判别信息资源价值的主体应该是用户,同样的资源对于不同的用户其价值可能是不一样的。)在这里给出计算机操作意义上的信息资源的定义:
?? “资源是具有标识的任何东西”。
?? 世间万物,只要人能够识别出来的东西,给它一个标识(最常用的标识就是名称),它就成了”资源”
?? 作为元数据描述的对象,DCMI和W3C强调,其”资源”只是在互联网上,由命名域给出URI标识的实体。
信息资源组织即信息资源的有序化的活动:对于信息资源有序化的规律的认识,以及应用认识得来的规律从事有序化工作
利用一定科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无需信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
?? 信息的外在特征:信息的(物质)载体所直接反应的特征;
?? 信息的内容特征:信息所包含和承载的具体内容,即通过信息载体所传递和交流的具体内容。
2. 试论述数据、信息、知识、智慧之间的关系。
?? 数据:离散、互不关联的客观事实,孤立的文字、数据和符号,没有目的性
?? 信息:人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关联
?? 知识:与行动和决策密切相关,人们做决策的行动能力,知识创造与环境相关
?? 智慧:对事务发展的前瞻性看法,智慧得益于人的内在价值观和信仰
单独的数据没有意义,信息= 数据+语境,知识= 信息+判断,智慧= 知识+整合。
3. 试说明信息资源组织的目的和常用方法。
目的:
?? 查找Find
?? 标识Identify
?? 选择Select
?? 获取Obtain
常用方法:
?? 分类法
?? 主题法
?? 字顺法
?? 号码法(赋予号码后的字顺法)
?? 时空法(例如大事记,年鉴等)
?? 序列法(大小/多少/好坏/贵贱…)
?? 超文本法(链接法)
4. 什么是主题法,主题法的特点和功能是什么?
主题法是直接以表示文献主题的语词作标识,提供字顺检索途径,并主要采用参照系统结石词间关系的标引和检索文献的方法。其中的语词可以是自然语言,也可以是受控语言。
主题法有标题法(Subject Heading)、单元词法(Uniterm)、叙词法(Thesaurus)、关键词法(Keyword又称自由词法)等几种类型。其特点如下:
?? 揭示文献的内容属性
?? 以自然语言为基础(不用标记制度)
?? 直接以局部(语词)指代文献
?? 以特性检索为主,族性检索通过词间的关联达到
?? 以明确性的检索为主,模糊检索通过技术的手段达到
主题法的功能:
?? 对信息内容进行标引的功能(指代用以检索);
?? 对主题内容及其相关信息予以集中或揭示相关性的功能;
?? 对大量信息加以系统化或组织化的功能;
?? 便于将标引用语与检索用语进行相符性比较的功能
5. 什么是分类法,分类法有哪些特点?
分类就是按照事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种认识事物的方法。
分类法是指将类或组按照相互间的关系,组成系统化的结构,并体现为许多类目按照一定的原则和关系组织起来的体系表,作为分类工作的依据和工具。
6. 叙词表中词与词之间的关系有哪些?
用代属分参(U、UF、NT、BT、RT)
7. 元数据是不是数据?元数据与数据是什么关系?
元数据是关于数据的数据,其本身也是数据。也可以作为被描述的对象,这时描述它的数据就是元数据。在信息系统中一般把数据看成是独立的信息单元,不管这里的”数据”是一本书、一个网页、或者一个虚拟的URL地址。元数据可以出现在:
?? 数据内部;
?? 独立于数据;
?? 伴随着数据;
?? 与数据包裹在一起。
8. 元数据有哪些功能?
?? 描述(description)
?? 资源发现 (resources discovery)
?? 认证(authentication)
?? 互操作(interoperability)
?? 数据管理(data management)
?? 访问控制(rights management)
?? 数字化保藏(digital preservation)
?? 内容分级(content rating services)
9. 数字图书馆和元数据是什么关系?
元数据提供数字图书馆的语义基础。数字图书馆的基本逻辑构成是”资源”,资源是可以被标识的任何东西,可以是物理的实体,也可以是数字对象或者虚拟的复合对象或对象集合。元数据提供了对资源的各种属性的描述,可以看成是”资源”的替代品。数字图书馆通过管理元数据而管理资源,并提供绝大多数功能。
因此元数据通过定义数字图书馆中资源的信息结构,以及定义由数字对象构成的资源库的组织结构,决定着的数字图书馆的信息组织和利用方式,同时元数据还是实现跨资源库语义互操作的基础。
10. 元数据包括哪些种类?
对于元数据的种类有不同的分类方法。一般分为描述性元数据、管理型元数据、结构性元数据、保存性元数据等等。
a) 描述性元数据(Intellectual Metadata),用来描述、发现和鉴别数字化信息对象,如MARC、DC,它主要描述信息资源的主题和内容特征。
b) 结构性元数据(Structural Metadata),描述数字还信息资源的内部结构,如书目的目录、章节、段落的特征。
c) 存取控制性元数据(Access Control Metadata),用来描述数字化信息资源能够被利用的基本条件和期限,以及这些资源的知识产权特征和使用权限。
d) 评价性元数据(Critical Metadata),描述和管理数据在信息评价体系中的位置。
还可以分为管理性、描述性、保存性、技术性和实用性元数据,如下表所示:
|
类型 |
定义 |
使用实例 |
|
管理 |
用于管理与控制信息资源的元数据 |
• 采购信息 • 版权及复制记录 • 获取权利控制(密级) • 馆藏信息 • 数字化的选择标准 • 版本控制 |
|
描述 |
用于描述与标识信息资源的元数据,一般为手工制作的元数据 |
• 目录记录 • 专门索引 • 资源之间的超链接 • 用户所做的注解 |
|
保存 |
与信息资源的保存管理相关的元数据 |
• 资源的物理状态描述文档 • 有关保存资源物理或数字化版本的文档,例如数据的更新与迁移 |
|
技术 |
与系统功能相关的元数据或元数据行为模式 |
• 硬件及软件文档 • 数字化信息,例如格式、压缩比及缩放比 • 系统响应时间的记录 • 许可及安全数据,例如密码及加密密钥 |
|
使用 |
与用户级别与类型相关的有关信息资源的元数据 |
• 展出记录 • 用户及利用记录 • 内容重用及多版本信息 |
11. 什么是元数据的语义、结构和句法?
属性元素(元素集合)是元数据的语义,例如DCMES的15个元素。Warwick框架或RDF的三元组结构等是元数据的结构,可以提供人类和机器双重理解,编码(置标)语言(如XML、XML Schema、RDF/RDFS等)是元数据的语法,用以传达语义和结构。
举例:
RDF既是一种结构,又是一个语法规则。作为反映语义的三元组形式,它是一种结构,而具体的采用XML/RDF形式编码规则又是一种语法,语法将结构固定下来了,但是RDF并不一定非要由XML/RDF来编码,它还有N3等其它形式的语法规则。
元数据的语义常常由具体的元素代表:作者(元数据理论与应用,张晓林),结构是P(S,O)
,以XML语法表达出来可以为(xml可以有多种表达,下面只是一种形式,且没有注明命名域):
<rdf:Description about=’元数据理论与应用’>
<dc.creator>张晓林</dc.creator>
</rdf:Description>
当然还可以用其他各种形式,例如自然语言、形式逻辑、语义网、以及关系数据库表等形式表达,具有不同的结构,每种结构可以遵循不同的语法。
12. 举例说明什么是元数据标准?如何使用元数据标准?
对资源描述方案进行标准化的成果就是元数据标准,常常需要经过一定的批准或认可程序。
应用元数据标准的基本方法是利用标准的元素来描述资源对象的各类属性,如在数据库中这些属性的大量实例可以表达为关系型数据库中的表,从而能够利用数据库系统或各类应用软件进行管理。如果以XML形式编码,可以把这些元素用作XML的元素标签或者属性名称。注意由于XML非常灵活,许多元数据标准都有一定的应用规则,规定了关于编码的”最佳实践”,以便不同的应用能够在编码上具有一定的一致性,从而保证互操作性。
以下为部分应用领域的元数据标准:
??网络资源:Dublin Core、IAFA Template、CDF、Web Collections
??文献资料:MARC(with 856 Field),Dublic Core
??人文科学:TEI Header
??社会科学数据集:ICPSR SGML Codebook
??博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
??政府信息:GILS
??地理空间信息:FGDC/CSDGM
??数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
??档案库与资源集合:EAD
??技术报告:RFC 1807
??视频图像:MPEG-7
13. 什么是元数据的编码(置标)?
利用置标语言(例如HTML/XML/RDF/XMLs/RDFs/OWL等)将元数据方案形式化,提供机器处理的规范表达,就是元数据置标。
14. 元数据有哪些常用的编码语言?试举例说明。
XML/RDF/XMLS/RDFS以及在SGML基础上发展起来的任何一种置标体系,例如TEI/EAD/METS/MODS等都可以作为元数据的置标语言。
15. 什么是语义万维网(Semantic Web)? 元数据对于语义万维网有什么作用?
语义万维网(Semantic Web)是万维网的发明人Tim-Burners Lee倡导的下一代万维网,旨在赋予万维网上所有资源唯一标识,并在资源之间建立起机器可处理的各类语义联系。元数据是语义描述的基础,因而也是语义万维网的语义基础。
Popularity: 17% [?]
Tags: 知识组织, 课件Related posts
“题库”解答参考(续2)
最近更新:2005年10月22日
16-30道简答题。
16. 什么是DC元数据的1:1(一对一)原则?为什么要有这个原则?
DC元数据描述要求:一条描述中的每个属性必须是所描述资源的一个特性,一条元数据描述仅描述一个资源。这就是通常所说的”1:1 原则”。比较严格的要求是一条属性描述不可描述多个资源对象或其多个属性,例如一条描述描述一个碑帖多个版本(原则上每个版本需要单独的描述)。这是为了 保证描述或记录的可区分性以及系统的可升级、可维护性。一条元数据指向多个数字对象,对于系统的管理(特别是可扩展性方面)会造成难以估计的困难。
17. DC元数据所描述的对象是什么?
DC元数据所描述的对象是”资源(Resource)”,资源是任何可以标识的东西。可以是实体的,也可以是抽象的。常见的例子有电子文档,图像,服务(例如,”洛杉矶今天的天气预报”),还有其他资源的集合。并非所有的资源都是网上可检索的;例如,人,机构,还有图书馆里装订成册的书都可以被认为是资源。
曾经定义为DLO(Document Like Object),由于无法确切定义而放弃。
曾经表述为”数字对象(Digital Object)”,由于将物理资源对象排除在外而缺乏普遍意义。
目前的表述作为语义万维网的概念之一,获得支持和承认。
18. DCMES(都柏林核心元数据集)包括哪15个元素?(请按类别说出英文名称)。

相关文档请参考:http://dc.library.sh.cn/
19. 什么是元数据限定(或称修饰)?什么是编码体系修饰词?
限定词refinements也叫修饰词,是对元数据元素语义的进一步限定和细化,通常通过vocabulary和encoding scheme两种方式。后者称为编码体系修饰词。
20. 什么是限定版(Qualified)DC?包括多少元素?试举例。
目前DCQ已经被全部归到了DCTerms命名域下,共有33个限定词(refinements)和17个编码体系修饰词(encoding scheme qualifier)。详见: http://dublincore.org/documents/dcmi-terms/。(中文翻译参见:http://www.dc.library.sh.cn/DC/dcmi-terms.htm)
21. 什么是DC的类型词表?有哪些类型?
DC对于资源类型建立了一个规范词表,称为DC的类型词表。见:http://dublincore.org/documents/dcmi-type-vocabulary/
目前包括:资源集合Collection, 数据集Dataset, 事件Event, 图像Image, 交互资源InterativeResource, 服务Service, 软件Software, 声音Sound, 文本Text, 物理对象PhysicalObject共十种,其中图像还有静态图像(StillImage)和动态图像(MovingImage)两个下位类型。类型词的中文翻译见:http://www.dc.library.sh.cn/DC/dcmi-type-vocabulary.htm。
22. 什么是DC图书馆元数据应用纲要?与DCMES有什么不同?
DC图书馆元数据应用纲要指以图书馆应用为适用领域的元数据应用纲要,规定了对图书馆资源进行描述所需采用的元素。目前的状态是工作草案。参见:http://dublincore.org/documents/library-application-profile/ 。中文翻译参见:http://www.dc.library.sh.cn/DC/dc_lib.htm
23.什么是DC教育元数据应用纲要?与DCMES有什么不同?
DC教育元数据应用纲要指以教育应用为适用领域的元数据应用纲要,规定了对教育资源进行描述所需采用的元素。目前的状态是工作草案。参见:http://dublincore.org/documents/education-namespace/ 。
24. 什么是DC本地化?客户化?如何进行DC的本地化和客户化?
国际化是DCMI制 定和推广元数据标准和应用的一项基本原则。国际化就是要适应各语种、文化的需要,对其元数据方案进行本地化和客户化。本地化是指使一个通用的元数据方案能 够适用本地语言、规范词表和其它规范的过程,例如元素名称的翻译和显示、本地分类体系的采用等等;客户化指为适应特定应用领域而进行的限定、扩展等,当然 这种限定和扩展要在DC元数据抽象模型的框架之下进行。本地化和客户化都需要制定相应的规则或进行进一步的规范或约束。
25. 什么是元数据标准?什么是元数据方案?他们之间的关系是什么?
元 数据标准是经过标准化组织认可的,用于特定资源类型描述的元数据方案,而元数据方案多指具体应用元数据标准而形成的具体规定,常应用于某一特定的组织、机 构,或特定的资源类型。标准化组织除了具有国际性或国家性的权威标准化机构之外,也包括行业性的、事实上的标准制定、维护机构,例如W3C,DCMI,IEEE-LOM,OMG等。
26. 元数据方案一般包括哪些内容?
一般应该包括:数据元素集合/应用纲要/置标方案/著录规则/应用指南/最佳案例/扩展方案/系统需求。详细说明如下:
|
资源分析文档: |
定义资源类型,确定资源类型的内涵和外延,确定著录级别和著录单位,属性提取,确定著录对象之间以及属性之间的关系,属性的检索要求,核心属性的支持 |
|
元数据元素集及定义: |
按照规范格式定义属性元素,定义限定和扩展规则,定义子元素和编码体系,定义元素之间的关系 |
|
著录规则: |
元数据方案应用于具体资源类型著录时的细节描述 |
|
置标方案: |
采用RDF/XML置标的规则,命名域规定,标签定义,编码规则 |
|
规范控制流程*: |
人名规范档的建立、维护、更新、应用流程和规则 |
|
元数据著录系统需求*: |
开发具体的著录系统所要求的通用和专用需求规范 |
*可选文档,不是所有元数据方案都需要这些文档。
27. 设计元数据方案应遵循哪些原则?
• 简单性与适用性原则
•专指度与通用性原则
•互操作性与易转换性原则
•灵活性与可扩展性原则
•用户需求原则
•遵循现有标准原则
28. 元数据方案的设计流程是什么?
需求分析、对象分析、元数据方案、置标方案、系统需求、系统设计
详如下:

29. 什么是元数据应用纲要(Metadata Application Profile)?元数据应用纲要有相关参考标准或指南吗?
一种元数据标准的应用形式,也可以看成是一种规范的元数据方案(metadata schema)。对于应用系统采用多种不同的元数据标准的内容和方法进行一定程度的规范,其基本思想来自于Warwick Framework,:不同的元数据元素可以集成在一个包中描述一个资源。
具体做法是
首先定义所要描述的资源属性,并采用ER分析方法明确所要描述的资源对象;
其次从不同元数据标准规范种选择一些适用的元素,声明这些元素的语义,以及可能存在相互关系,建立相关规则等,这些来自多个元数据标准规范的元数据元素应当有自己的命名域;
然后声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
最后选择置标方案。
元数据应用纲要的欧洲标准为CEN CWA14855。
30. 试简要解释元数据与知识本体的关系。
本体是领域知识的形式化说明,通常由概念、概念之间的关系、公理、规则组成。元数据解决资源的语义描述问题,本体解决资源集合的相互关系问题,他们都需要一定的形式化机制提供”机器运算”的可能性。元数据与本体的关系可以简单地看成是微观与宏观的关系。
10月15日更新:
论述题回答要点:
1. 谈谈企业知识管理的特点、方法。
企业知识管理是对企业生产经营管理活动中所需要和产生的知识的管理,具有一般知识管理的共性,又有非常鲜明的特点。近几年形成一个活跃的研究领域;
其共性在于都是应用知识和信息组织的一般原理和方法进行管理,并利用了计算机及网络作为重要的管理手段;
其不同之处在于:
对于知识的理解有所不同,认为具有“语境”(即在特定环境中具有特定含义)的信息都是知识。其中形成了多个“流派”,例如把与企业活动相关的知识分为“显 性知识”和“隐性知识”,前者可以编码,借助于计算机应用系统处理、保存、利用,后者必须通过一定的管理手段;
内容不同:企业知识管理所涉及的内容不是以学科划分,内容丰富而复杂,文档类型多样、文件格式众多,管理起来有一定的复杂性;
目标不同:企业知识管理的目的是企业效益的最大化,而不是追求知识体系的最佳化和最大程度的有序化。
注重知识管理是对整个企业生产经营管理活动过程的辅助,伴随始终,不能脱离,因而知识管理系统可能针对不同部门、流程具有不同的功能、界面、接口。
企业知识管理从技术方法上与传统的知识和信息管理系统没有什么本质不同,都使用分类法、主题法、全文检索等技术,但在应用的侧重点上有所不同,例如其分类 一般不用学科分类,而根据实际情况采用多种实用分类,近年来许多最新的技术开发成果首先备应用到企业知识管理领域。
2. 知识本体与叙词表的作用和异同。
知识本体的概念:本体是对概念体系的明确的、形式化、可共享的规范说明。叙词表:以规范化的自然语言语词作为文献主题的标识,通过叙词的概念组配表达主题概念。
知识本体的作用:
知识共享:在人、机器(表现为软件代理)以及人与机器之间共享对于信息及结构的共同理解
知识重用:实现一定程度的领域知识的重用
知识推理:知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知
知识的形式化:对于领域知识进行分析、明确,并使其形式化从而可为计算机所操作。
叙词法的作用:
对信息内容进行标引的功能(指代用以检索);
对主题内容及其相关信息予以集中或揭示相关性的功能;
对大量信息加以系统化或组织化的功能;
便于将标引用语与检索用语进行相符性比较的功能
知识本体和叙词表是不同时代产生的知识组织的方法,
其相同点是:
都是从内容上对知识进行抽象;
都强调规范性;
都是在一定领域内的应用。
其不同点是:
叙词表侧重对知识内容的标注,知识本体是对知识内容的直接表达;
叙词表强调主题揭示、族性相关归属,知识本体强调共享与重用;
叙词表强调按学科的规范性,知识本体强调领域知识的规范;
叙词表不一定要求计算机编码实现,知识本体强调形式化一边计算机操作。
由于叙词表也是学科领域知识的系统反映,可以按照一定流程和规范转化成知识本体。
3. 如何创建领域知识本体?
按照图示(见文末)解释(右边“本体操作阶段”可以简化)即可。

4. 元数据应用纲要的组成和设计流程。
元数据应用纲要的组成:
• 名确定义所要描述的资源对象及其属性;
• 声明元素语义及可能存在相互关系、相关规则等,这些元素可以来自多个不同的元数据标准规范(不同命名域);
• 声明元素限定或修饰。元素的语义可以根据所引用的元数据标准规范进行某种程度的限定,但是不能扩大或交叉;
– 可以规定元素的编码规则;
– 可以规定元素的值的约束;
– 可以规定其他约束:是否必选、可重复、取值范围、数据类型等等
• 如果需要增加“新”的元素,必须自己建立命名域并维护这些新的元素组成的元数据方案;
• 规定编码规则(制定置标方案);
• 编写有关应用文档。
设计流程按照下图解释

5. OAI协议的基本内容
OAI的定义:
• Open Archives Initiative Protocol for Metadata Harvesting,(OAI-PMH)简称OAI协议,协议的制定目的是提供具有独立于应用程序的、可互操作的,能夠提供和促进Web上信息资源发布 和共享的社区的应用框架。其主要目标为:
– 简化文件內容的有效传播。
– 促进数字化文件的存取。
– 扩展存取数字化信息的种类和范围。
定义了以下基本内容:
• 定义了一个资料提供者能夠通过HTTP为基础的协议,发布其metadata的机制,即定义了数据提供者(Data Provider)的角色:提供其文件内容,并以OAI作为发布metadata的协议。主要工作为维护一个或一个以上支持OAI协议的、将其内容以 metadata发布的服务器。
• 定义了一个能够从资源库(Repository)获取含有元数据记录的机制,即定义了服务提供者(Service Provider): 通过OAI协议从数据提供者取得数据,并将获得的metadata建库提供增值服务。
• 资源库(Repository):通过HTTP,接受OAI协议所提出存取数据需求的服务器。
• 数据集(Set):非必备功能。为了方便获得所需资料,储存器内可将不同类别的数据区分成不同的子库,并以层次结构表示,以节点(node)作为区分,每一个节点称为数据集。
• 记录(Record):一个数据记录是后台服务器依据OAI协议,从存储器内将资料以XML编码传回前端的元数据。
6. 什么是Z39.50协议?其发展趋势如何?
概念:
Z39.50标准的名称: 信息检索–应用服务定义与协议规范
Z39.50协议是在分布式网络环境下, 用以支持信息搜索和信息检索的计算机系统间的通信协议
该标准规定了数据库管理系统的客户端和服务器端对话的规则。
这种规则建立在客户机/服务器的体系结构基础之上。
数据库客户端和服务器端的通讯通过网络实现。
Z39.50协议由于产生于C/S结构作为主流分布式应用的时代,非常复杂而难于实现,目前产生了SRW/U作为其下一代标准,具有以下特点:
基于SOAP和URL的无状态连接(原来是直接TCP/IP连接,且是有状态的);
支持元数据的XML编码(原来是二进制的)
支持CQL(Common Query Language)查询(原来的查询无标准规定,而且不人性化);
也就是说现在完全支持基于Web的连接和查询了。
7. 什么是DC元数据描述的抽象模型?有什么作用?
DC元数据描述的抽象模型的主要内容如下:
• 一个条描述(description)是由一个或多个陈述(statements)(该陈述仅与一个且唯一一个资源有关),以及零个或一个资源的URI组成(URI用来标识所描述的资源);
• 每个陈述由一个属性URI(这里的URI用于标识一个属性),零个或一个值URI(这里的URI用于标识属性的值),零个或一个编码体系URI(这里的URI标识值的类),零个或多个值的表述(representations)组成;
• 每个属性都是被描述资源的一项特性;每个属性URI可以在多个陈述中重复;
• 值的表述(value representation)可以是字串值(value string)、复合值(rich value)或相关描述(related description)等形式;
作用:
• 明确概念,例如DC的描述对象、描述单元、限定方式等等;
• 能够在一套概念术语的基础之上提供一个抽象的数据模型(概念的坐标参照系),以便在不同的元数据方案(如果都采用或宣称采用基于DC的方案或者AP)之间获得共同的理解;
• 独立于特定的编码语法,约束和补充置标方案的不足;
• 深入理解编码对象的属性,实现元素的映射、翻译和转换,从而实现元数据方案的共享和重用;
• 在语义层实现元数据应用系统(数字图书馆)的互操作
8. 试简要解释元数据与知识本体的关系。
• 元数据方案不具有普遍适用性。无法克服特殊性与一般性的矛盾,而形式化的知识本体可以提供一种在元数据方案之间自动映射的机制,通过语义Web服务的体系架构进行实现;
• 元数据应用难以实现元数据方案本身的进化,而知识本体可以提供信息系统的其它视图,只需要通过自动或半自动的手段应用新的元数据方案;
• 元数据方案自身难以对不同知识体系、不同“粒度”的资源进行描述,而知识本体正是起到这个作用,从而实现异构资源和系统之间的语义联系;
• 单纯的元数据方案对于数字资源的整个生命周期的描述非常困难,而采用以诸如FRBR模型为基础的知识本体,这个问题便迎刃而解,不同生命周期的知识产权属性也非常易于描述;
9. 试论信息资源组织的发展趋势。
(可以自由发挥)
数字化内容
网络化服务
基于内容特征的组织
基于整体的组织而不是基于局部的标注
分面组织
结合上下文组织
结合用户需求动态组织
智能化组织
标准化组织
……
第10题:以Google/Yahoo! 为例,谈谈搜索引擎的信息资源组织。
搜索引擎概念(参见讲课ch1引言及课程框架.ppt中“搜索引擎”部分), Google是目前最受欢迎的搜索引擎之一。(搜索引擎(Search Engines)是对互联 网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包 括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。)
Google如同一般搜索引擎一样,对于所搜集的信息按照关键词在本地服务器上 集中地进行全文索引,提供用户基本的网页查询服务;
目前许多搜索引擎网站利用自身的技术特点和优势提供一些特殊的服务,例如 Google特有的Pagerank技术提供了很好的排序,Yahoo提供了很好的分类浏览功能;
Google等搜索引擎除了网页之外,还能够提供需多其他服务,例如桌面(本地) 查询、各类文件(doc, pdf, ppt, mp3, 图象文件)的查询、数据库查询(与OCLC的 合作查询WorldCat)等等;
总结:搜索引擎是目前对于网络信息资源进行组织和利用的主要手段,而数字 图书馆是以分布式信息的组织为主要特征的网络服务形式,因而搜索引擎可以成为 数字图书馆信息组织的一个组成部分。
11. 数字图书馆如何解决异构系统互操作问题?
主要通过互操作协议和标准规范解决数字图书馆的互操作问题,尤其是与元数据相关的协议和标准规范。
主要通过:
• 各类元数据方案的映射
• 标准的资源描述框架
目前得主要标准有:
• OpenURL标准
• Z39.50 协议标准
• OAI元数据互操作协议
分别解释一下。
12. 元数据方案设计有哪些正在形成或较为成熟参考模型?这些模型分别解决什么
问题?(见讲义Ch3a.ppt)
• RDF数据模型(及Warwick框架)
• OAIS参考模型
• FRBR功能/生命周期模型
• DCMI抽象模型(DCMI元数据方案抽象模型)
• 数字图书馆体系结构模型
Popularity: 17% [?]
Tags: 知识组织, 课件Related posts
台湾大学“知识组织”课件参考- -
因要给研究生班开设”知识组织与元数据”课程,系里没有指定教材,目前似乎也没有合适的教材,最近在准备课程内容时发现台湾大学咨询学系(也就是陈雪华教授那里)2003年就开设了类似的课程,名为”知识组织”,且所有课件都可以下载,狂喜。(参见http: //ceiba3.cc.ntu.edu.tw/course/cb9879/)。
看了台大的课程内容, 总的感觉,台大的”知识组织”更加偏重”知识管理”中所需的知识组织,也就是说时下比较热门的、用于许多知识型企业(咨询公司、 IT 研发企业等)的知识组织,而不是源自于哲学认识论、逻辑学或者计算机科学中的知识表示和操纵。因而看起来像是图书馆学、计算机科学与管理学的交叉。内容非常丰富,也很实用,然而就学科体系来说略感凌乱,如果想通过这门课的教授整理一份教材,还需要下不少功夫。
而且毕竟是2003年以前的内容,”知识本体”这两年进展颇多,课程的资料略显陈旧。
北大要求给研究生上课不必详细讲授知识内容,面面俱到,只要有一个大纲,让研究生掌握框架,然后去自学,并且在实践中总结。台大的课件好像也不太符合这个要求,象是给本科生上课。但是我的教材内容还是要准备得尽可能详尽,讲授的时候可以灵活掌握。这样做一方面便于自己形成一些研究课题,也方便学生拿到课件后能够进行自学,并进一步选择研究方向。
重新看一下我准备的课件,元数据部分还是强调的太多,脱胎于元数据讲座,而不是从知识组织角度,更能讲清楚元数据的作用和来龙去脉。
Popularity: 24% [?]
Tags: 元数据, 台湾, 知识组织, 知识组织, 课件