对于thema-nomen模型的补充
看了远洋老师新近的博文(一 、二 ),又引发了很多思考,想起做博士论文时参考Sowa “Knowledge Representation“书中的一个模型(C.K Ogden and I. A. Richards. The Meaning of Meaning,1923),不知是不是可以对thema-nomen模型做一点补充?

查到这里有进一步阐释,很有启发。截图两张:
一点感想:概念和概念的表达,是为了交流服务的,模型的建立有助于达成有效的交流,有时不必拘泥于nomen是否表达了正确的thema,正确性判断可以留给系统的建立者和用户,铁路警察各管一段,系统的设计者只要确认交流的成立,nomen肯定是表达了某个thema的,就成了。否则可能把事情弄得很复杂,难以实现,更难推广应用。
(以上两图来自Harold R Solbrig,Christopher G Chute ”A Common Terminology Services (CTS) Back-end to Protégé“,见:http://protege.stanford.edu/conference/2004/slides/3.1_Solbrig_A%20Common%20Terminology%20Services%20(CTS)%20Back-end.pdf)
Popularity: 57% [?]
Tags: nomen, terminology services, thema, 知识组织, 知识组织, 笔记Related posts
今年我要做什么
今天正月十五,年过完了。雨师在网上跳出来关切地询问:博客怎么不更新了?偶支吾着回答说给自己放了个长假。
是的,年关将过的时候突然觉得这一切没有任何意义,“为什么呢~~?” 于是酝酿着将博客转型。然而年都过完了也没想好如何转型,再凑合一段时间吧。
前两年都给自己列过一个新年宏愿,没有一次完成的。前年的还做过一番总结,去年的连总结也省了。反正这个东西不具有任何效力,做到做不到没人用鞭子抽你,甚至没人关心,没人知道,不会有家长或领导贬否,不会有群众监督,写出来不写出来都没关系。但转念一想,既如此,写出来又有何妨?好歹也是对自己的一个督促。
结合专业工作和自己的研究兴趣,今年主要想在以下三个相关的方面进行一些学习,记一些学习笔记。
1、信息组织方面
我一直不敢把这个领域叫做“知识组织”。前些年与复旦计算机系的老师一起想申报“知识库、知识管理与知识挖掘” 方面的项目,才知道“知识”这个词的水有多深。不仅仅是崇拜“知识” ,而是这个词本身歧义太多,人文学科可以通过歧义来做文章,洋洋洒洒,水平很高,而科学研究不行,特别是计算机科学绝对不行。你的知识可以跟别人的知识不是一个知识,但是你昨天讲的知识,与今天讲的知识,应该是一个知识,如果不一样,你一定要说明清楚,不可以“各自表述”,企图以其昏昏使人昭昭。
前两年提出一个信息组织的“元数据方法”,即想把传统的,以编目挂帅和统领的图书馆资源整理方法改造为一套新的、以元数据为核心的方法论体系。这其中当然包括“元数据”、“知识组织系统”(即KOS,沿用国外的术语,就不避嫌用“知识”了)、“知识本体”等一整套静态的规范控制体系,以及实现这一体系的方法、规则、机制(如注册、映射机制)、软件、工具等等。这其实是前些年戏称为“数字图书馆资源描述统一场论”的基础内容。
随着DCMI对于属于体系和抽象模型的大规模改进,Tag、民俗分类法和本体研究与应用的大步推进(如近期多个sw国际会议推出的高水平的研究报告,以及Jane Greensburg等有关书籍的出版),曾蕾、秦建等老师在SKOS/NKOS方面的进展,今年要继续跟踪学习的东西不是一点点。
2、2.0方面
2.0不是技术,但是2.0必须有人搞技术,至少是技术方面的跟踪和引领,当然能不能做到另当别论,这也需要一帮人共同努力,好在2.0更大程度上只是技术应用而已,需要技术方面的悟性和理解力,Geek并不是程序员,可以只是爱好者。
希望依托市图书馆学会技术分会(任大虾和Leon是领导)的努力,以及联合图书馆2.0社区的力量,Web2.0/Lib2.0技术白皮书的事情能够有一个实质性的启动。结合白皮书的编写,考虑将许多2.0的开源工具进行一下评测。
一直有一个看法:2.0不能关起门来做。图书馆2.0正在成为一个孤岛,老陆现在不知道忙什么去了,我们这个圈子本来与外界还是有一些互动的,现在门又关起来了,与Web 2.0的大世界似乎毫无瓜葛,这不是一个好兆头。很希望在网络社区的信息组织方面进行一些探索,就像OCLC的研究选题一样,需要一只眼睛向外看,利用我们的专业知识,主动、积极地投入到Web2.0的探讨和互动中去。
3、数字图书馆跟踪
近十年的跟踪积累了大量的素材,希望重建跟踪网站,能够建设一个数图资料门户,并支持标注、留言等2.0功能,与大家分享信息,有可能的话进行专题研讨,例如元数据、知识组织、知识本体、图书馆集成管理/数字图书馆系统、资源整合。响应老槐号召,“图书馆2.0工作室”又有新的任务了,结合词典编撰工作,将数字图书馆方面的术语词汇做一下整理。
今年在数图方面主要想关注数字化出版,探讨其与数字图书馆的上下游关系,如何契合,需要怎样的体系框架,在几个层面上制订和执行哪些标准规范,等等。这个命题是陈源蒸老师提出,并有许多想法,偶希望今年能投入一些时间向陈老师多学习,把这个主题深入下去。
今年还有一件棘手的事情:承担一门“知识管理”研究生课程的教学。本来安排的是知识组织,现在变成了知识管理,从学科上相差了十万八千里,还要另外学习。如果硬把元数据、本体、知识组织体系等内容结合进去讲,甚至作为主要内容,可能有点太捣浆糊了吧。
Popularity: 100% [?]
Tags: 元数据, 图书馆2.0, 图书馆2.0, 年度计划, 感悟, 数字图书馆, 新年, 知识组织, 知识组织, 研究计划, 笔记, 课题项目Related posts
图书推介
上次在IFLA与曾蕾老师说起,本体研究似乎可以从哲学的角度寻找一些理论依据,虽然目前计算机科学所研究的本体已经与哲学本体离得很远。相比较而言,图书馆学在研究本体时关注更宏观、更本质的问题,而不仅是操作层面的问题,例如,我们究竟应该怎样分类事物?不同的分类思想如何共存?事物的属性能不能穷尽?人类认识世界的目的究竟是什么?认识的各种方式有没有局限?如可看待这些局限?等等。接下来才是如何使我们的知识在更大范围内(因特网)通过计算机更“自然”、更准确地交流和保存的问题。
回来后发现有一些著作已经翻译成了中文,大喜,想就其中的几本写一个书评。刚开了个头,先放在这里,提供大家一个参考。
哲学与计算机科学并非像人们所想的那样毫无瓜葛。人民大学出版社近年出了一套《当代世界哲学名著*哲学》,编选了众多距离我们很近的、当代哲学名家的著作, 其中不乏许多能够提供计算机和认知科学以理论基础的名作。虽然我们不难得到这些著作的原著,然而哲学问题的深奥已经让我们望而却步,不要说还有一层语言障 碍了。十分幸运的是,人大社组织这套丛书非常认真,选题由十二位当代国际顶尖哲学家推荐,在一百多种他们认为五十年来最有影响的著作中精选了12种,邀请国内相关领域的一流专才进行翻译,他们多为横跨大洋、学力充沛正当盛年的中青年学者,从而保证了这套丛书的质量。投放市场后效果立竿见影,多本著作已告售罄。
计算机不谛 是二十世纪人类最伟大的发明。伴随着计算机科学的兴盛和繁荣,提供该学科基础的数学和工程科学显然并不能满足人类的求知欲,为探究人类认知的奥秘,以及计 算机发展的可能性和终极目标,同时作为一种对人类社会和生活产生巨大影响的事物和学科,从哲学层面进行探讨是必然和必需的,忽视或漠视都是不正常的。延续 20世纪末学科边缘、交叉的趋势,这些探讨实际上不可能在任何传统的学科领域内展开,已有的这些探讨许多并未定论,甚至争议很大,但是却提供了全新的想法 或崭新的思路,似乎可以印证,人类的认识可能有局限,然而思想和科学是无疆界和无止境的。
目前这套丛书至少有四本与当下计算机认知领域有关(包括知识建模、描述和本体研究等):
泽农*派利夏恩(Zenon Pylyshyn)《计算与认知–认知科学的基础》
唐纳德*戴维森(Donald Davidson)《对真理与解释的探究(第二版)》
彼得*斯特劳森(Peter Strawson)《个体(论描述的形而上学)》
W.V.O.蒯因(Willard Van Orman Quine) 《语词和对象》


Popularity: 71% [?]
Tags: 专业评论, 哲学, 本体, 知识组织, 知识组织, 计算机科学, 认知科学, 读书, 读网Related posts
板儿砖向迷图君头上拍去
受邀给 迷图 的 一个帖子 扔砖头(这年头什么怪事都有,你说此君是不是欠扁?),一看帖子,不得了,要把k某明后年的饭都要吃了,整个一冤家路窄啊。
不过k某还是非常高兴的。种种迹象表明,知识组织的话题已在我们这个专业内部已经聚焦,成了热门,英雄所见,大家都觉得要变一变了。所以仅仅到迷图那里扔块砖头是肯定不过瘾的,在这里筑好炮台,架上加农炮、迫击炮、榴弹炮、高射炮,先发几个炮弹过去探探虚实,呵呵。
1.首先一个疑问是:这是一本怎样的书?为什么”信息组织与信息构建”这么大的题目在其中只占一章的内容?这本书的读者对象如何定位?是教材还是专著?近几年我们已经看到不少专业教材或专著了,但是应该说还没有看到哪一本是”颠覆性的”,当然”颠覆”谈何容易,但是知识组织的实践已经在颠覆传统了,研究的滞后是否有愧于这个时代呢?在我脑海浮现出不少外学科的颠覆性著作,而图书情报领域似乎很少(张琪玉先生的《情报检索语言》似能够算作一本,另外Modern InformationRetrieval也能算一本?)。这个话题,刚刚研究完”理论史纲”的老槐应该更有发言权。当然一本著作如果颠覆不了什么,态度能够极其认真,象于师姐写《图书馆学导论》一样,应该也是很好的。
2.一些基本概念如何界定?一本著作由多人合作,内容又有紧密的上下关联,最头疼的就是概念体系的一致性问题。知识、信息、语义,尽是些大家都非常熟悉,又都很难说出个所以然的概念,不同学科甚至不同学派都有自己的理解和定义,你是申农的信息还是麦克卢汉的信息,你是亚里士多德的知识还是德鲁克的知识,你是语言学的语义还是可计算的语义,等等,虽然作为”交叉应用”学科的图书馆学或者情报学可以采用拿来主义,也千万不能百家饭百衲衣一锅端,云里雾里,一会儿说这里一会儿说那里,以其昏昏使人昭昭,看似雄辩实则诡辩,那样我们的学科是永远不能成熟的。
3.从章节安排来看,相关内容已保罗万象,够多够全了,但似乎层次关系和逻辑联系还未安排妥贴。
a) 整个安排缺乏一个系统框架能够清晰展示每一部分在其中的位置以及相互关系。记得张琪玉先生《情报检索语言》有一个清晰的情报检索框架,包括情报检索系统的建立和查询两个可逆的过程。张晓林也比较喜欢画框架。信息组织框架实际上还是比较容易画的。
b)与框架有关的是内容安排,从信息到知识到数字仓储到信息构建,四节内容是一种怎样的关系?信息编码如果还要涉及ASCII或GB/UNICODE这一层,那么完全可以编一本手册大全或信息工作百科全书了。我们学科应该以基本的语义单元作为对象基础,而不是毫无意义的代码或数据;另一方面我们也不要奢谈”知识”,知识是依赖于受体的、见仁见智的,当然有关联的信息也可以称之为知识,不管这种关联是隐性的还是显式的,某些语境中声称我们处理”知识”也无不可,但要牢记我们是通过处理有关联的信息而处理知识的,我们处理的并不是”知识”本身,以避免陷入哲学认识论的陷阱之中。
c) 第二节至第四节有不少很成熟的学科知识积淀,也有许多刚刚窥到端倪、属于探索研究阶段的东西(可能是我孤陋寡闻),例如协同智能、知识构建等,放在展望未来的有关文字中比较合适,而作为正式的内容似乎有欠严肃。
d)对于各种分类体系和词表方法应该可以打破传统的认识框架,重新审查一番了。关于这一点我在” 回老槐的一些想法 “、” 分类、主题、元数据与知识本体 “、” Blog、Wiki、del.icio.us、flickr、TAP、FOAF…,再多又如何? “、” 关于RSS应用的断想 “等博文中有所涉及,我的看法是完全不必这样安排,完全可以按照这些方法的作用而重新归纳、总结。因为不光是taxonomy,像ontology、tag、folksonomy等新的方法层出不穷,而老的叙词法、分类法也被用在了完全不同的地方(例如后控,动态分类,相关反馈,相关聚类、排序等等)。
e)各种模型组织得很乱,许多不是一个层次或同一类东西不要放在一起。
f)信息关联方法(各种链接标准)已经成为计算机信息组织的一种基本方法,应该放到显著位置。
g)计算机对于信息系统是否有秩序还有其他的度量方法(大多是矢量、概率方法),也应该并入”信息组织方法”中去。
h)可视化展示、信息挖掘等内容甚广,可作为信息系统的利用方式(或浏览方式)简要介绍。
拍砖(或放炮)先到这里,不知道迷图君是不是已经鼻青脸肿或溃不成军了,相信能写出这样一个大纲也一定练了多年的金钟罩铁布衫功夫了,俺这点雕虫小技只配给你挠挠痒痒。望来年早日读到大作。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=645505
Popularity: 22% [?]
Tags: 书评, 数字图书馆, 知识组织, 知识组织Related posts
谈谈我们的分类主题词表
今天吃了豹子胆,想来炮轰一下我们这个专业的一个重要堡垒:分类主题词表。或者称不上堡垒,是一个Hardcore。炮轰不是目的,偶鼓吹图书情报向来不遗余力,实在因为到了这把年纪,转行已无可能,身家性命在此,哪有不维护的道理?然而要维护首先得让它立得住脚,特别是在这个风起云涌的数字网络时代,得拿得出让人服气的真东西,否则恐怕只能另起炉灶,那就困难多多啦。
看了今次”**分类主题词表”的一本培训教材,算是比较近距离了解了这个东西,补了俺离校快两个decade的课,应该说这还算个不错的东东,起码还在与时俱进:有电子版了。然而看了之后还是有一些话不吐不快,说的不对欢迎大家拍砖。也请我们专家不要生气,我是对事不对人,对于为这个东东做出贡献的所有专家,本人是由衷地敬仰和钦佩有加的。
首先不得不说的是,我们这个学科炼出的这样一套”知识”组织方法,实在是过时了。你可以说它曾经起到多大的作用,但是现在肯定没人会用这个东东了,特别是那些开发各类应用的计算机人士和各行各业的用户,你纵有一万条理由、一万种委屈,他们不会和你争论,不用你就是了。你就慢慢走向坟墓了。
实际上我们奉为圭臬的许多理论是否真是圭臬,还真有疑问呢。窃以为主要有以下问题:
1.编撰、修订的机制和方式已经不合需要了;一个标准规范的生命力在于给大家带来方便、带来价值,网络时代的技术一要简单、门槛低,二要民主、人人参与。什么叫权威?权威不是少数人关起门来说的,而是敞开门由大家在实践中评判的。由少数人把持的东西只有逼着大家说拜拜,如果你想做贡献而不得其门而入。这种东东是没有生命力的。
2.技术背景和应用环境变了,应用目的肯定有所不同,特别是对于Web环境下的信息系统,想要起到规范控制的作用,设计思路一定得跟着变。现在早已经不是靠索引”引得”文献的时代了,现在”基于内容的检索”遍地开花(全文检索实际上就是一种基于内容的文本检索),”微内容”时代已经到来,我们如果仅仅局限于用分类主题词表产生和规范索引,几十年如一日地把它当作标引辅助工具,而不能把它作为内容”导航”和自动链接的工具,毫不奇怪这么好的东东将不名一文。
3.与第一点相关的,开放开放还是开放问题。据说搞了个电子版,然而是个极其封闭的独立系统,甚至在Windows环境下只能通过”复制-粘贴”进行规范标引,这算什么?!据说如果我人工将其输入,建立XML格式(或RDF/OWL)的分类主题词表还算侵权?是不是有专家能够给我澄清一下,我如果用其中多少巴仙能够算”合理使用”?或者我修改其中多少巴仙的内容就算没有侵权?这个东东要给大家用,才能普及,不要管别人用得好不好、规范不规范,让大家随意使用、任意改造、评点,如果大家用你,你应该认为是看得起你,感到高兴才是。不要关起门来自我陶醉,门槛高高,死路一条。
4.我们的分类主题词表要适应网络时代的要求,在设计原则和技术方面可能也可以进行许多改进。传统中我们不满足于分类主题词表体系庞大难于应用,同时又难以对具体学科有专指度很高的应用,很难扩展,我们可以开发一定的工具在网上供人调用、辅助标引(就像现在的PiggyBank插件集成了本体的插件,简单点就像网摘软件支持Tag标注一样),并考虑建立一种开放的自行扩展、维护的机制,例如某些行业领域的自行扩展应该能够公示从而有利于词表的复用和重用((例如在网上公开应用模型和编码格式,开放讨论(例如可以通过在网上公开应用模型和编码格式,开放讨论等方法)。
5.包括分类法、主题法、知识本体等各类具有一定规范的知识组织体系是数字图书馆建设的重要依据和标准,特别在一些需要规范的信息系统/数字图书馆中,例如需要地名、历史纪年规范的家谱数字图书馆或地理信息应用系统、需要植物类属关系、物质命名、生物基因工程的数据库等等,甚至社会科学的研究和资料库、知识库的建立也很需要规范的主题、事件词表。而我国在这方面的成果并不是很多,应该考虑一方面利用现有成果,同时拓展领域,使我们的核心能力发扬光大。
6.现在不光要有电子版,更重要的是应该有网络版。网络版可以实现很多Web2.0的功能。应用工具也可以任由第三方开发。将有望形成一个图书馆方法复兴的局面。其实在国际上将图书馆学传统的规范控制方法应用于网络数字信息已经做得非常先进了,例如NKOS的许多努力,其中作为NKOS主力的曾蕾目前还Chair了FRSAR(主题规范记录的功能需求)(见 编目精灵博客文章 ),我们要学习的话还有现成的老师。我不知道我们是否能在这些方面作些什么。
我在”元数据方法”系列博文( 参考一 , 参考二 , 以及更多 )中也谈到过类似观点。实际上今天想要说的话还有很多,晚上还有事,就此打住,余言就写文章用吧。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=638458
Popularity: 18% [?]
Tags: 主题词表, 分类法, 知识组织, 知识组织Related posts
回老槐的一些想法
受到老槐鼓励,同时也因为准备课件,才对信息组织作了一些思考。看到老槐回帖,仔细读了多遍,虽然有一些还不是太明白,但想根据自己的理解谈点想法,请老槐和其他朋友们继续批评指正。
如老槐所讲,我也认为信息组织完全可以包括分类主题索引编目等内容,此次没有讲编目,而完全用元数据替代,一则因为曾以为编目另有课程,二则本人对中编西编早已荒疏了,如果要讲那真是误人子弟。但编目应该算做信息组织似确凿无疑的,元数据在许多人的眼里就是”数字资源编目”。至于目录学,虽然也可将其作为统领编目、元数据的理论体系,逻辑上并无大碍,但我还是倾向于let it be的,它传统上自成体系,应用实践性的内容只是其中的一小部分,而且让它统领元数据编目在图林可能没什么,其他领域料不会买账,在理论上恐怕也会动摇传统目录学的根基,勉强自圆其说需要多费口舌。
信息化造成世间万物都需要描述,于是”元数据”渐成显学,而编目蜕变为一种元数据的”领域应用”。但是在实践中我们看到,编目的许多方法论在元数据的应用中的到了强烈的体现,北大早期的元数据方法论研究以及科技部的元数据标准规范项目中的许多文档均脱胎自传统的编目经验(例如元数据方案制定的一整套流程,以及关于”元数据著录”规则和应用方案的制定)。而我比较担心的是我们的元数据规范或者方法将因此仍然局限于狭窄的领域应用,而不能成为更为普遍的”元数据方法”。国内目前元数据应用比较成熟的还有远程教育领域(华师大和北师大牵头,祝智庭教授领衔)和国土资源环境(可持续发展)领域,我们这几个领域已呈现老死不相往来的局面,将来还有电子商务、电子政务、电子医疗等领域。科技部项目没有把这些领域纳入进来,不能说不是一个遗憾。所以这其中有对于传统的编目如何继承发扬的”度”的问题,也涉及到一门学科的将来发展和学生获得技能的适应面的问题。曾经许多门户网站很需要我们专业的毕业生,但是他们有多少”核心竞争力”是值得怀疑的。
来自计算机科学的进展无疑会给”信息组织” 带来最大的影响。我在课件中尽可能体现两方面的影响:一是计算机自动处理的趋势(多表现为对”语用信息”规律的认识,发现信息体的潜在”秩序”,并建立数学算法基础),当然也有语义信息自动处理的,如老槐所说,分类主题有许多交给机器来做了。另一方面是通过与用户各种形式的交互(相关反馈)而发现信息体在利用过程中的”秩序”,从而更好地组织信息。这两方面如果讲的过多则太过技术,讲的太少则不利于正确认识我们这个专业在信息组织中的地位作用。
搞计算机的总是一有机会想方设法让他们的宠物来代替人类。元数据的加工处理应用也是这样,到了他们手里,千方百计地发现内在的规律、”模式”,希望计算机能够自动完成,图书馆员在这方面的价值可能是为他们发现”规律”和”模式”提供试验、素材和经验。分类主题属于”语义信息”范畴,对计算机来说是比较困难的,NKOS把这些传统的图书情报的知识组织和规范控制方法介绍到计算机领域,具有一定的影响。
分类主题只是传统的编目工作的一部份–关于内容的标引(传统中好像把关于内容的描述称为标引,而关于形式的描述称为”著录”,或者”著录”包括标引?对元数据来说,好像都是to describe,即著录),在元数据方法里也同样只是一部分。元数据方法在编目的对象、原则、流程、方法方面大大扩展了,只是对于著录对象的外部属性和细节考虑部分,以及手工检索工具的制作方面,可能超出了”元数据”方法关注的范围。图情的信息组织方式可能不能说败下阵来,而是没有迅速地与时俱进。
数字图书馆的案例我主要介绍了数字图书馆的微观、宏观结构,以及内容管理、情报检索、用户特征信息(用户描述)在数字图书馆体系中的地位作用,也是想说明数字图书馆中的信息描述有不同的层次和需求,因而需要有不同的描述,以及不同的技术实现。
情报检索系统的案例我主要介绍了存储过程和查询过程中的规范控制,以及元搜索的四种方式(Z39.50及其下一代、OAI、OpenURL和基于页面分析技术的资源整合,搜索引擎作为其中一个极端例子),所以老槐说的门户网站没有专门讲,但是有关资源整合的主要技术都包括在这里了。企业的知识管理没有什么特殊的理念或者技术内容,只是一个比较热门的应用领域,后来也没有空详细讲了。
汇报到此。上面内容断断续续写成,可能不太连贯,欢迎批评指正。
论人:老槐
Tue Apr 12 07:13:43 CST 2005
K先生说读了我的”一些想法”不明白,的确,我对信息组织没有想明白。
每当与本系或外系学生谈本专业,总要讲讲专业的核心能力。这种核心能力是可清晰定位的,如外语系会说外语,计算机系的会玩计算机,中文系的会写,甚至于哲学系的会”思考”,体育系的能”保彪”,但信息管理专业会什么?我一般只讲两种知识:信息检索,能比别人更有效地获取信息;信息分析,能从别人看上去无用的信息中获取有用的信息。我很想讲信息组织,但在以前,我觉得那些知识离开了那个不怎么受毕业生欢迎的部门,就没有什么用处了。
因此,我主张在信息组织中能发掘传统图书馆和现在信息服务商们的各种活动中的某种精彩的知识,让学生们可以象说我会XXX一样为掌握这种知识或技能自豪。我相信有K先生一样的教授来研究与讲授信息组织,是可以使信息组织达到这个高度的。但在目前的体系中,我还看不出有这种功能。
- 评论人:宛然
Mon Apr 11 15:15:45 CST 2005
这几天一直在跟踪学习题目,虽然是给学生出的,但对普及和整合”信息组织”都比较有利,对实际工作有指导意义。继续…..。
Popularity: 19% [?]
Tags: 知识组织, 知识组织Related posts
小结“信息资源组织”
这几日给研究生班上课,发现图林博客的潜水族还是很多的,一喜。但是为什么大家都只潜水不冒泡?距离产生美?看热闹?不懂。
教学相长,许多学员反馈的信息让我学了不少东西,他们大都来自图书馆一线,熟悉业务工作,知道图书馆究竟需要什么。这一点上,他们是我的老师。
同时我感到”信息资源组织”这门课程改造的必要,也深深感到图书馆学专业的理论其实可以与实际工作结合得很好。
我的课件和题库出好之后,向我的师友征询意见,有人说得比小a更厉害:”哇,你要把这帮学员整死!?”。我的初衷是把我这些年的一些研究心得:元数据方法作为信息资源组织的最一般的方法,统领分类、编目、摘要、索引、编目,不仅适合传统工作,更适合数字图书馆,不仅有理论、有介绍、有现状、有未来,更有方法、步骤、评价、比较等。要求知其然,更知其所以然。当然在课间中只是努力这样做,并没有做得很好。我的课程安排为:
- 课程大纲、引言与课程框架和预备知识
- 信息资源组织方法:分类法
- 信息资源组织方法:主题法
- 信息资源组织方法:元数据法
-
- 元数据基础
- 元数据实践
- 元数据编码
- 信息资源组织方法:本体方法
- 信息组织的模型及领域应用
- 信息组织案例:情报检索系统、数字图书馆、企业知识管理
我担心有些内容太过前沿和抽象。但当我把课程框架告知学员之后,出乎意料,他们对元数据方法的各个方面都非常感兴趣,说他们就是来学习元数据的。让我大喜过望。
如我以前的博客文章所述,我由衷感到信息资源组织的学科体系可以由”元数据方法”一统天下,传统的如图书编目,现代的如知识本体,在其中都能找到恰当的定位。如果上升到理论,就是对目录学的继承和发展。
明天就是授课的最后一天。此次准备的课程内容还是有一些遗憾,一是对这些学员要上的其他课程内容了解的不多,例如他们没有目录学或编目课程,但是有信息技术基础以及看起来很相关,却不知道什么内容的课程(我把他们的课程设置罗列如下);另一个遗憾还是我的课件准备得不十分满意,每次讲座、上课我都匆匆忙忙,过后也没有兴趣好好整理,下一次还是遗憾。猴子掰包谷,老毛病了。明天过后我的”数图笔记”可能要和”知识组织”专题暂时拜拜了(当然我会修改更新维护充实已有内容的)。感谢关注,欢迎留下宝贵意见。
北大硕士研究生进修班课程安排(仅供参考)
(1)信息资源管理专论
(2)元数据与信息资源组织
(3)信息资源检索与利用
(4)网络技术及其应用
(5)数字图书馆专题
(6)信息服务与用户专题
(7)信息传播研究
(8)图书馆评估研究
(9)现代信息机构管理研究
(10)图书馆法治研究
评论人:a
Tue Apr 19 20:12:20 CST 2005
回头我也下载一个啃啃。
- 评论人:candy
Tue Apr 19 12:15:38 CST 2005
在图书馆工作十多年,回头看感觉自己就像一个城外的人,听着别人的这个与那个,自己什么都不懂。心急啊,赶快报名读书。听课是幸福的,考试是痛苦。面对那么多的题目,心里的那个慌。不理解就根本无法背。可是上课明明是明白了呀,可下了课,看见了儿子就什么都不记得的(:这可怎么是好。老师的课件左看右看,心里还是那个慌,后悔那是没把老师的上课录音下来,好时不时再次临听教诲。唉…一声叹息
- 评论人:keven
Tue Apr 19 09:45:14 CST 2005
课程讲义整理好之后我将放在网上,请告知联系方式(mail to kevenlw@gmail.com),我会通知你。
- 评论人:小荷
Tue Apr 19 09:06:52 CST 2005
研究生进修班的讲义可以共享给我们吗?虽然现在在上研究生,但是本科却不是专门学的图书馆学,基础知识不很扎实,希望能够得到老师的帮忙,谢谢!
- 评论人:spring
Fri Apr 15 09:13:31 CST 2005
我无意于批评先生,只是对当前的教育模式及考试方式表示无奈而已。
嘻嘻:)
- 评论人:spring
Fri Apr 15 09:08:55 CST 2005
理解不了的东西自然是记不住的,况且又都是一些技术名词术语,什么本体,什么语义,什么纲要,其实说白了还是传统的那些东西换了个包装而已,为什么总是将容易的东西来复杂化呢?搞得高深莫测的…
- 评论人:keven
Thu Apr 14 17:05:20 CST 2005
师者传道受业解惑也,无意作学生的敌人。如果记不住,理解就成,如果没有理解,就是老师的过错了,可以来信骂我,我会想办法补救的。最后的考试,也不过是象搜索引擎一样,对大家的学习成果排个序,即使不及格,也可能排在第一名呢!(当然这是不可能的)
- 评论人:spring
Thu Apr 14 15:50:02 CST 2005
我也有幸在四年前参加了北大的脱产研究生进修学习,如今可算是脱离了苦海,修成”正果”。每每有朋友向我咨询,我总是先做痛苦状,然后一本正经儿地说:如果你决定选择这条路要走,这是一条不归路,要么成功要么失败,无论哪个结果,都注定要受苦的,你要做好心理准备哟。
今天在网上看到K先生的题库,只感觉浑身颤抖。
三十多岁的人,尤其是女人,(K先生是不是,你班只一男丁吧?)背东西本来就很难,况且又都是如此之多让人难以理解的东东,我只感浑身颤抖。
幸而我读的那个时候,还没有”技术救图”之论也,否则恐怕我也难以”圆满”。
:)
:)
:)
- 评论人:spring
Thu Apr 14 15:23:07 CST 2005
在图书馆专业学习四年,图书馆工作了十年,因为要评职称,才不得不学着写点儿也算是发表了的文章,可是写来写去,总感觉到无法深入。信息技术方面只知皮毛,时尚图书馆学方面的知识也知之甚少,许多高人大作又看不懂。感觉自己真是太差太差,于是乎,急切恶补,什么元数据、什么资源组织、什么数字挖掘… 见到什么看什么,如果看来看去,还是一头雾水。突然又见KEVEN的什么”技术救图”,才豁然明白了。
都是技术惹得祸儿…
- 评论人:monsterbox
Wed Apr 13 20:27:49 CST 2005
我到觉得不用把搜索技术的进步看作是图情界的落后,SE的技术最根本还是在情报检索理论,只是借助的现代的计算机技术实现的更好.觉得如何在现在的计算机技术帮助下,能提出更有前占性的理论才是现在图情界要做的.图情教学倒是该好好改革一下了.
- 评论人:老槐
Sun Apr 10 09:32:56 CST 2005
K先生的信息组织,是一个很好的探索。但愿以后能与图情教学圈子里搞信息组织的老师交流交流,使我国图情教育的信息组织课能上得更好一些。问过不少的毕业于各个学校的学生,信息组织的课发展几乎不能给他们留下什么印象。
信息组织与原图情中分类主题标引编目相关,先生的大纲中分类主题放着,编目完全成了元数据,这里面总是有些没想透的。分类主题应该发展到自动分类、语义识别一类技术,还有先组与后组。Gmail中的某些创意难道不可看作一种后组的”主题标引”吗?而编目知识似乎也不能完全被元数据取代,比如著录的思想。
以往图情的信息组织是一种封闭式信息的组织,或对”拥有”的自有资源的组织,网络信息组织往往要对开放式资源进行组织,或对不拥有的资源的组织。这就要求信息组织要讲组织的效率问题。图情的组织方式不是不科学,而是效率太低在网络中败下阵来的。
三个案例似乎不能尽兴。数字图书馆是一个什么都可装的筐,有可能的话,学科门户(导航)网站应该作为一个案例,哪怕它是笨办法写的,当然最好是技术变成的,图情的信息组织,若不能将专业知识变成一个网站,有些白学了。搜索引擎也应该作为一个案例。图情界任期以来对搜索技术不了解、不学习,导致自己一步步落后,搜索的学科范畴也许是”检索”,但就象以往图情学科中分类主题与检索要重复一样,信息组织也可重信息检索。不了解和研究搜索引擎的组织原理,感觉有些问题。
Popularity: 19% [?]
Tags: 知识组织, 知识组织Related posts
“信息资源组织”题库(修补中…)
全称叫”元数据与信息资源组织”,研究生课程,请各位帮我看看这些题目是不是合适,或者太偏?(特别请老槐、超平等大教授们不吝赐教,其他朋友以及路过的朋友也别不吱声,我就不一一点名了),k某在此谢过!可能还会出一些判断题、选择题之类,出起来太累,范围大致都在这里了。
定下来之后我就要做这些作业了,幸亏偶一为之,当老师真苦啊…
名词解释41个
|
信息资源 |
情报检索 |
XML/XMLS |
复分表 |
规范控制 |
|
知识 |
博客(Blog) |
RDF/RDFS |
OAI |
组配 |
|
元数据 |
知识管理 |
Z39.50 |
OWLS |
后控 |
|
知识本体(本体论/Ontology) |
元搜索(Metasearch) |
编码体系EncodingScheme |
万维网服务 (Web Services) |
元数据收割(Harvesting) |
|
叙词 |
数字图书馆 |
FRBR |
语义互操作 |
检索语言 |
|
语义万维网 |
元数据登记系统 |
MODS |
Topic Map |
全文检索 |
|
因特网 |
内容管理 |
MARC |
元数据应用纲要 |
OpenURL |
|
搜索引擎 |
DC(Dublin Core) |
METS |
分面分类 |
相关反馈 |
|
KOS |
简答题30道
1. 什么是信息资源?什么是信息资源组织?
2. 试论述数据、信息、知识、智慧之间的关系。
3. 试说明信息资源组织的常用方法。
4. 元数据是不是数据?元数据与数据是什么关系?
5. 元数据有哪些功能?
6. 数字图书馆和元数据是什么关系?
7. 元数据包括哪些种类?
8. 什么是元数据的语义、结构和句法?
9. 举例说明什么是元数据标准?如何使用元数据标准?
10. 什么是元数据的编码(置标)?
11. 元数据有哪些常用的编码语言?试举例说明。
12. 什么是语义万维网(Semantic Web)? 元数据对于语义万维网有什么作用?
13. 叙词表中词与词之间的关系有哪些?
14. 什么是DC元数据的1:1(一对一)原则?为什么要有这个原则?
15. DC元数据所描述的对象是什么?
16. DCMES(都柏林核心元数据集)包括哪15个元素?(请按类别说出英文名称)。
17. 什么是元数据限定(或称修饰)?什么是编码体系修饰词?
18. 什么是限定版(Qualified)DC?包括多少元素?试举例。
19. 什么是DC的类型词表?有哪些类型?
20. 什么是DC图书馆元数据应用纲要?与DCMES有什么不同?
21. 什么是DC教育元数据应用纲要?与DCMES有什么不同?
22. 什么是DC本地化?客户化?如何进行DC的本地化和客户化?
23. 什么是元数据标准?什么是元数据方案?他们之间的关系是什么?
24. 元数据方案一般包括哪些内容?
25. 设计元数据方案应遵循哪些原则?
26. 元数据方案的设计流程是什么?
27. 什么是元数据应用纲要(Metadata Application Profile)?元数据应用纲要有相关参考标准或指南吗?
28. 什么是元数据登记系统?有哪些功能?
29. 元数据可以为解决信息系统的互操作性问题提供哪些帮助?
30. 什么是元数据映射?如何进行元数据映射(元数据映射有哪些方法)?
论述题12道
1. 谈谈企业知识管理的特点、方法。
2. 知识本体与叙词表的作用和异同。
3. 如何创建领域知识本体?
4. 元数据应用纲要的组成和设计流程。
5. OAI协议的基本内容
6. 什么是Z39.50协议?其发展趋势如何?
7. 什么是DC元数据抽象模型?有什么作用?
8. 试简要解释元数据与知识本体的关系。
9. 试论信息资源组织的发展趋势。
10. 以Google/Yahoo!为例,谈谈搜索引擎的信息资源组织。
11. 数字图书馆如何解决异构系统互操作问题?
12. 元数据方案设计有哪些正在形成或较为成熟参考模型?这些模型分别解决什么问题?
评论人:kevenlw 2005-05-06 21:34:22 kevenlw的博客
谢谢”新学”先生的批评意见。在接这门课之后有半年多时间,对专业教育中信息资源组织的情况还是有一些了解的,当然内容的选材偏重于元数据,是基于对网络环境下信息资源组织趋势的理解,这在我的其它博客文章中有所提及,授课的主要内容元数据约占一半,另一半为分类、主题、知识本体,现在我还在总结整理以”语用”信息和相关反馈为基础的对信息资源结构化的方法。从计算机角度看传统的”情报检索语言”理论,固然有可取之处,然而实际上谬误也不少。希望能与先生深入讨论。
- 评论人:新学 2005-05-06 20:51:26
看似研究生课程,其实主要就是元数据的基本知识,现在我们本科课程也包含了这些内容。把元数据与信息资源组织挂起来,也只能是挂一漏万,我也不明白信息资源组织就是与元数据有关吗?看来不是无知,而是偷工减料,建议你好好学习一下情报语言学知识,必要的补课也是应该的。
- 评论人:keven 2005-04-06 19:47:08
老槐说”老师的兴趣”,于是”博客”就在这里了。当然博客的编码规范是RSS,而RSS是正宗的”站点描述元数据方案”的成功应用,所以当然是信息组织的一种方式啦。甚至folksonomy可以看成网络上草根关键词法到草根分类法的一种回归,各种信息组织方法相互嵌套、聚类,又结合了丰富的语义链接,真是很有意思。
- 评论人:游园惊梦 2005-04-06 19:01:57
呵呵,如果keven师给出答案,那就不是”数图笔记”而是数图讲义了,^_^。
为什么要把博客放在这里呢,不解的说。从博客讲开到tag,到Folksonomy等等?
- 评论人:keven 2005-04-06 17:57:30
学校没有给大纲,只是审查了讲课的内容计划,本来我都是元数据的内容,提示我要增加些传统的分类主题,就这样。
参考答案贴在这里合适吗?我没有经验,当然我希望得到大家的指正,但是会不会有”漏题”之嫌?或者反正题目都在这里了,不存在漏题的问题了?这应该是10份卷子的量,学校会挑一套考试。
- 评论人:老槐 2005-04-06 16:46:31
题目不是教科书,题目是老师的兴趣,只要不大大的”超纲”,想出什么就是什么,不需要什么道理。因此,象宛然和所有”学生”朋友一样,我也只想看答案。
- 评论人:宛然 2005-04-06 16:36:21
假如能 象”元数据十万个为什么”一样,希望很快能见到标准答案和解释为盼。
谢谢!
- 评论人:a 2005-04-06 15:45:16
做个称职的老师难,做个称职的学生也难。KEVEN先生出那些题够我不吃不喝做好几个月。当然了还得呆在计算机前做,要不然尽瞎掰,呵呵。
- 评论人:keven 2005-04-06 13:16:27
KOS不错,很重要的概念,已经添上。并将 Pagerank改成了”复分表”,以更加传统一些。Pagerank解释起来比较技术性,与学生的专业方向不大对路,复分表的概念类似于元数据的元素修饰词(element refinement,也即词表修饰词),老概念有新意,所以换掉了。
- 评论人:老同学 2005-04-06 12:57:02
KOS: knowledge organization systems/structures/service
Popularity: 20% [?]
Tags: 知识组织, 知识组织Related posts
“知识的接生婆”- -
苏格拉底曾说,他是他的听众的 知识的”接生婆 “。( Socrates said he was the midwife to his listeners, i.e., be made them reflect better concerning that which they already knew and become better conscious of it. If we only knew what we know, namely,k in the use of certain words and concepts that are so subtle in application, we would be astonished at the treasures contained in our knowledge. — Immanuel Kant “Vienna Logic” )知识远比用概念、词汇和句子表达出来的要丰富的多。知识的宝藏需要挖掘。做到这一点对计算机来说将有很长的路要走。
从某种程度上来说图书馆员、教师等作的工作也是”知识接生婆”的工作,他们启迪知识、传播文明、点燃独立人格,使更多的人有尊严地生活。这其中有许多内容是机器永远无法替代的。(当然这只是从职业角度上来说的, 自己是火种才能点燃别人 ,有多少教师、图书馆员有这种职业意识?像 Dead Poets Society里的Keating,或Mona Lisa Smile里的Katherine Watson )?
Popularity: 24% [?]
Tags: 感悟, 知识组织, 知识表达Related posts
情报检索与知识组织(2月25日修订)- -
对于知识的认识(包括”知识组织”)在古代应该属于哲学领域,如果沾得上边,后来的图书馆学可以算是一门。图书馆学通过管理知识载体来反映知识结构,并促进知识的有效传播和利用。其中的核心内容”分类编目”堪当此任。
纸、泥板、羊皮、竹、石以及电光磁等媒介是知识的有形载体,书籍、报刊、杂志、图片、动画等是知识的媒体类型,图书馆、博物馆、大学等社会组织可算是知识的交流机构,也是知识运动国政中不可缺少的一种形式。研究知识,这些方面都值得研究。
二战以后诞生的情报学(或也可称为信息学)专注于知识的内容–信息,而把知识的躯壳留给了图书馆学。信息论走的更远,认为信息是”不确定性的减少”或”负熵”。从这一点说信息学和情报学可以分道扬镳了。二战以后的 情报学受到计算机科学发展的影响,但还是基本上从人的角度去研究情报的规律,无法对只能机械操纵符号的计算机提出任何”智能”一点的要求。人为了充分利用计算机的高速运算、大容量存储能力,以及准确性,发明了一整套情报检索技术。
从穿孔卡片开始,人类最早的计算机奴隶就叫做情报检索。一直到后来的字词索引、匹配、倒排档等等。
计算机就象是上帝给人类的一个魅力无穷的玩具,真的让人能够像上帝一样思考了(不知上帝是否会继续发笑?还是发怒?),人类依靠它,在几十年的时间里除了破解了数据的奥秘(关系型数据库技术),拓展了应用的疆域(Internet和Web技术),甚至创造了人类更加富足的信息化社会。这也再次证明了知识的力量。
目前计算机具有的能力与我们人类的需求之间的鸿沟越来越弥合。然而我们还是不得不为人机之间沟通制定一些原则和模式,这样机器才能更好地模仿人的程序处理信息和知识。元数据和知识本体都是这类工具。
我们现在研究知识组织,已经无法不受到计算机科学已有成果的影响。图书馆情报学知识域中有关信息组织(情报检索)的”话语体系”、”领域本体”必须与计算机科学相关的概念体系进行融合,才能发展。所以我们不得不用计算机科学中在知识组织方面的研究进展取代我们传统的情报检索课程内容。这两个领域的发展速度不是一个数量级的,图书馆学的知识组织能够提供计算机科学许多人文滋养,但是如果不承认计算机科学的主体地位,图书馆学的那点经验学识将会荡然无存。计算机科学的发展有如一辆无可回头的蒸汽机车,在历史的进程中摧枯拉朽、一往无前。
近期大量阅读我图书馆学的情报检索、信息组织教材和计算机科学中的知识库研究成果。
首先对张琪玉、侯汉清编的这本《情报检索语言实用教程》非常感兴趣。一本刚出炉的教材,而且是国内该领域的领衔人物的新作,老树开新花,而且书名冠以”实用”,又是武大出的,让人立刻有探个究竟的愿望。
翻开前言,原来是武大出版社委托编写的,让人感到武大对于传统的图书馆学分支学科已经后继无人了。否则恐怕不会委托早已与武大没有瓜葛的两位老人编写。
前言中还说,本书的编写目的是”减少情报语言学领域诸课程之间的重复,精简讲授内容,突出实用性”,看来传统图书馆学科面临的冲击确实不小。
重复课程大概是指”情报语言学基础”"图书分类学”"主题法导论”之类的课程,与我目前要给北大研究生班上的”信息组织”主题的课程应该有些类似。
减少了不常用的情报检索语言类型和语种、发展历史的讲授。
内容主要包括:
总的看来,体系结构还是比较严谨和全面的。(这本书值得购买收藏)
情报检索语言及情报语言学的基本问题
作者避开情报、信息、文献的概念争论,把这三者的检索和检索系统作为同一概念。也算是一大实用的认识吧。
对于文献的概念,作者没有使用国标中”记录有知识的一切载体”,而解释为:”文献是存储和传递知识、信息的主要载体,所以,利用文献成为获取知识、信息的主要途径。”逃避概念几乎有点过于随意了(捣浆糊)。
对于”情报检索”概念的解释也是非常”图书馆学”化的:”其广义是指通过建立情报检索系统来解决文献查找问题(也就是知识和信息的查找问题)的整个实践,其侠义仅指根据某种需要从情报检索系统中查找出相关文献线索(也称文献检索)或文献中相关内容(也称事实检索、数据检索或全文检索)的操作过程”。可见其感念定义中的同义反复和不严密的地方何其多。并且从计算机界的角度看这些”同类”概念有不少不必要的人为定义和偏差在其中。广义和狭义,到底如何理解?
从作者的角度而言,数字图书馆可以看成是一个情报检索系统,因为是有序的,可以通过多种途径检索的,检索结果也是经过排序输出的,用户能够满足信息需求的。
关于情报检索语言的定义也是本书中非常核心的概念。情报检索语言是根据情报检索的需要而创制的人工语言,专门用于各种手工的和计算机化的情报检索系统,表达文献主题概念和检索课题概念。他作为提供文献内容检索途径的情报检索系统的一个构成因素,在其中起到语言保障的作用。情报检索语言分为分类检索语言、主题检索语言和代码检索语言三大语系。情报检索语言的实质是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统。
作者的一个经典的理论是:情报检索与情报存储是相反过程
情报存储过程:文献的情报内容 – 经过主题分析确立主题概念 – 经过利用情报检索语言的标引过程输入到情报检索系统中。而情报检索过程是一个相反的过程,检索者的情报需要经过主题分析,得出一系列的主题概念,经过情报检索语言的标引之后,通过检索系统进行检索,最后输出检索结果。
情报检索语言的特点:
情报检索语言的基本功能:
术语与情报检索语言是应用于被应用的关系。
概念的概念:概念是事物本质属性的概括。概念的内涵是指它所指事物的本质属性的综合,即概念的含义。概念的外延是它所指的一切事物,即概念的适用范围。
概念之间的关系:
相容关系(概念的外延至少有一部分相重合)
同一关系、属种关系、交叉关系、整体与部分关系、全面与某一方面关系、外延不相排斥的并列关系。
不相容关系:
并列关系(同位关系):同一个上位概念之下的几个下位概念之间的关系;
矛盾关系:并列关系的特殊形式,外延总合等于其上位概念全部外延的两个并列概念之间的关系。如金属材料与非金属材料;
对立关系:外延总合小于其上位概念全部外延的两个并列而且相互对立的概念之间的关系。例如导电体和绝缘体;其上位概念除了这两者之外,还有半导体。
概念的划分与概括(分类)指对概念的内涵而言,内涵的扩大或缩小。
概念的分析与综合(组配)指对概念的外延而言,外延的融合或分化。
Popularity: 24% [?]
Tags: 检索, 知识组织, 知识组织
