网络社区的信息组织模式研究
首次申报国家课题,铩羽而归,留下一些文字碎片放着也是放着,不如贴出来供同行参考,当然也欢迎拍砖(没中总有没中的道理吧)。
论题:网络社区的信息组织模式研究
目录中本来是“信息运动模式研究”,实际上“运动模式”比较玄乎,比较容易写文章、出成果,但是“科学地”进行网络社区信息运动模式研究是非常困难的。网络社区还是一个新的、需要仔细定义的概念,网络社区的信息必然是数字化信息,其相关的“信息运动”势必建立在分析社区信息模型、并对各类相关的、不同“粒度”的信息(实际上是数字对象)进行界定的基础之上。所以研究信息运动首先需要研究信息组织,从某种程度上说,动态的信息组织就是信息运动。
一、本课题的国内外研究现状和意义
“社区”是一个既古老又年轻的概念。自从德国社会学家斐迪南·滕尼斯(F. Tonnies)于1887年提出“社区”(Gemeinschaft)一词以来,这个概念曾被赋予过不下140种定义。英语中的Community一词的翻译来自美国学者查尔斯·罗密斯(C.P.Loomis),而中文“社区”一词则是我国著名社会学家费孝通先生于20世纪30年代的创造[1]。一百多年来,有关“社区”的研究几经浮沉(50-60年代曾经沉寂一时),但伴随上世纪九十年代万维网的诞生,“网络社区”日益彰显,赋予了“社区”全新的含义,以及“社区研究”大量全新的内容和意义。
根据维基百科的定义,社区是指由于共同的地域、环境或兴趣而组成的社会团体或组织,其成员常常具有一致的意愿、信仰、资源、倾向、需求、困难等特征,而使得社区具有一定程度的内聚力。
网络社区,可以认为是以一定的网络设施(平台系统)为基础,基于共同的环境或兴趣,分享一定的共同属性而形成的人群。通常网络社区必须利用一定的网络平台或工具,其社区内聚力表现为具有超出平均水平的联系强度(链接数量或连接频次)。也就是说在网络中具有超出平均水平的联系强度的人群就可以认为是网络社区。
网络社区的研究通常归类于网络社会学的研究范畴,“网络社会学”作为社会学新提出的一门分支学科在国外自九十年代中后期开始有了一些进展,蔡文之[2]作了较为系统的引介。国内有夏学銮[3]、黄少华[4]、邓伟志[5]等,人民大学出版社和社会科学出版社还出版了两本同名专著[6][7],这些成果对于网络社会学的学科框架和基本内容进行了系统的探讨,涉及网络社区在网络社会学中的定位,但大都没有专门论及网络社区,尤其缺乏对于网络社区信息运动规律和信息组织的专门研究。
目前对于网络社区的研究还不多见,较为活跃的领域基本集中于与Web2.0相关的电子商务领域,成果较少以学术文献形式存在,而多见诸于博客、财经报道和各类评述。这类文章的共同特点是对于所论述的对象并无严格定义,例如国内通常把任何网站的注册用户都笼统地作为社区成员[8],而且在这些文章中,也鲜有专门关注社区中信息组织和运动的内容。
与这个主题最为相关的研究,目前集中于有关“标签(tag)”和“民俗分类法(folksonomy)”领域,已形成热潮。但是大多数研究并未从社区信息组织的角度进行探讨,而是从一般知识组织的角度,实际上脱离了种种方法产生的背景和土壤,虽然也取得了一定的进展和大量成果,但如能结合以社区为特征的领域应用,动态地探讨基于标签的信息组织,将更有效并且更有应用前景。
网络世界是一个活生生的有机体,可以作为图书情报相关学科生动鲜活的研究客体,并把在传统社会中总结积累的有关信息和知识组织的方法、经验和知识,经过提炼、改造和实验,应用到新的数字环境中去,为更多的学科和行业借鉴和分享。这对于图书情报等信息资源管理类学科的学科建设,以及使其更具有开放性、实践性和科学性,都具有很强的现实意义。
二、本课题研究的主要内容、基本思路和方法、重点难点、主要观点及创新之处
“交流”是维系社区存在的基础,“信息”则是社区成员之间进行交流的“黏合剂”,网络社区亦然。从传统社区到网络社区,不仅交流的方式发生了重大的变化,交流的范围、内容、类型、深度和广度方面也都是传统社区所无法比拟的,而且交流方式与内容纵横交错、 融合贯通,“媒体就是信息”、“通道决定眼球”等现象越发成为趋势(这种趋势从大众传播时代已经开始了)。因此我们探讨社区信息的组织和传播(在这里传播和交流同义,传统上认为交流和传播的目的是内容的到达)虽然主要是基于信息的内容,但也绝不能脱离传播方式和载体形式,这既是网络社区研究课题的复杂和困难之处,也是一个很好的着眼点和突破口。
网络社区研究的一个最大的优势,除了跨越了“地域性”之外,在于其“可控性”。这里的可控性是指网络社区的所有活动和行为,都需要平台的支持,都是预先设计好的(当然可能会有无数新的组合),都会在网络上留下足迹。但是这并不意味着网络世界就是一个可以预知一切的人造世界,网络社区有自身的发展规律,网络玩家与系统平台的互动,互相影响,使得不同社区得以进化。这些进化既有意料之中的、目的性的,也有意料之外的。本课题的主要目的,就是收集和总结不同类型的网络社区中信息传播、组织和流动现象,总结其区别于传统交流形式的特征和规律,为有目的的社区信息组织提供一些经验总结,同时为信息组织方法和学科体系,增加新的内容。
交流的结果通常表现为社区中各种角色之间的协作或协同,这是交流的价值所在,网络社区由于利用了前所未有的网络平台和工具而使交流带来的协同作用得以放大,成功的Web2.0应用所体现的运作模式(商务模式或者业务模式)常常就是协作的典范,对于社区信息交流所带来的协同和协作,或者基于协作何协同的信息组织,也是本课题的研究内容之一。
本课题希望通过调研一些典型的Web2.0网络社区,首先对网络社区的概念进行定性和定量的分析界定(定性的界定主要采用文献调研和历史研究方法,定量的界定考虑采用链接关系强度的测算和评估来发现和确定社区),重点考察这些社区如何组织各类信息资源(我们把社区内的各类角色成员与所有具有独立标识的“实体”均看作平等的成员)如何组织,它们之间具有怎样的关系,这些关系在社区活动和实现功能的过程中如何流转,发挥怎样的作用等等,然后希望建立不同社区的信息组织模型,并通过对不同社区功能目的的分析,提出优化信息组织模型的大致方向,以及可资采用的新技术新方法等。
从操作上,我们将选择目前主要的网络社区类型进行研究,主要涉及电子商务,BBS,特殊兴趣,学习,交友,分享,游戏,视频,新闻八卦,图片,对等网络等社区类型。本课题打算重点考察的网络社区主要来自于MySpace, Facebook, Flickr, Ning, 43Things, Technorati, Del.icio.us, Youtube, 365Key, 豆瓣, 土豆, 等等,这些著名的Web2.0应用很多不仅仅是网站,而且自身就是社区或者社区平台。我们可能会通过这些网站中的图书情报专业社区,或者在其中建立相应的社区,进行介入性考察。
本课题的研究重点在于系统地归纳和总结网络社区(特别是基于Web2.0的网络社区)的信息活动规律,提出其信息组织的主要模式和发展方向。需要重点解释或解决的问题有:
1、 关于网络社区
- 网络社区的发现与度量;
- 网络社区的类型、目的和功能;
- 网络社区的活动模式;
- 网络社区的主要构成。
2、 关于网络社区的信息组织
- 网络社区的信息资源构成(实体、属性及关系);
- 网络社区的信息流转模式;
- 信息资源的定义(描述和编码)方式;
- 信息资源的组织方式,包括:
- 知识组织体系(NKOS)方法的应用(包括规范词表、分类体系)
- 资源的权威控制;
- 信息的语义标注;
- 本体方法。
3、 关于网络社区信息资源的管理
- 信息在协同中的作用;
- 信息的增值过程和度量;
- 开放性与安全控制;
本课题的难点,也是本课题的主要创新之处,主要有以下三点:
1、 不仅从信息内容本身探讨社区信息的组织模式,而且强调通过信息所负载的媒介类型和传播方法通道的角度,综合探讨信息的组织和交流对于社区实现功能的影响。以此作为优化社区信息组织的出发点;
2、 除了结合规范知识组织体系(NKOS)应用于社区信息组织之外,还强调结合系统的使用情况来挖掘内容的内在秩序,应用于资源的自动的聚类和组织方面;
3、 通过所获得的相关反馈研究进行个性化信息组织和动态优化的可能性。
传统的图书馆学偏重于对于静态的知识组织的研究,特别通常是通过对于信息载体的编目和文献所负载内容的学科属性的分类,达到知识组织的目的。这种方式是静态的、间接的。
而数字图书馆借鉴了传统方法,即通过元数据与知识本体等方法的引入,根据领域应用的具体需求,对数字化信息从形态到内容全面地予以揭示和描述,发扬了传统情报检索系统“组织信息,规范控制,查全查准,权威可信”的优点,并且将数字信息的优势发挥到极致。通过引入了许多动态信息组织的方法(例如采用标签和民俗分类法,收集用户的相关反馈用于系统优化等),提供更加全面的信息组织能力。
动态的信息组织首先需要掌握信息运动的规律,研究的其实就是信息运动。传统情报检索理论中的“先控”和“后控”概念,“语义揭示”和“权威控制”等思想正在为下一代万维网——语义万维网所普遍接受,众多的信息组织理论应该能够纳入到Web2.0社区研究和建设中,使互联网发挥更大潜能,使源自于图书情报科学的许多理论发扬光大。本研究即致力于此目的。
主要参考文献:
[1]费孝通.乡土中国.北京:三联书店,1985
[2]蔡文之.国外网络社会研究的新突破.《社会科学》2007(11):96-103
[3]. A Grand Unified Theory of YouTube and MySpace. http://www.slate.com/id/2140635/(2008-2-11检索)
[4]余建华.网络社会研究向何处去.《发展研究》2007(6):2-6
[5]黄少华.翟本瑞.网络社会学.北京:中国社会科学出版社,2006.5
[6]马丁·奇达夫.社会网络与组织.北京:中国人民大学出版社.2007.1
[7]Wil Harris. Why Web 2.0 will end your privacy. http://www.bit-tech.net/columns/2006/06/03/web_2_privacy/(2008-2-12检索)
Google的社会关系API
Web1.0可以看成文档组成的Web,不论是HTML还是XML,这些文档通过URL定位,其中又有很多Hyperlink(超链接)指向其他的文档。
Web2.0可以看成是众多的“关系”的集合,关系连接的当然也是文档,但是文档中的链接就不仅仅是“甲链接到乙”这样一种一元关系(可以以简单的无环有向图加以表示),而是具有丰富的关系类型,搜索引擎如果能分析、利用这些关系,就能挖到一座大金矿(提高查准率和查询效率等可能还只是其很小一部分价值)。
目前的“关系描述”,主要还是基于某些标准格式的,例如FOAF,XFN等。众多的微格式也都包含了各种关系的描述。
对于社会性网络来说,最重要的资源就是对于“主体(人)”和“关系”的描述(description)或标注(annotation),这些描述或标注,可以人工填写(各种profile),或动态挖掘,但都需要标准格式。
这个领域根据不同应用需求,目前已经有了很多格式标准,例如FOAF, XFN等。
最近特别值得一提的是,Google开放了其 Social Graph API,开始收割FOAF,呈现基于公开信息的“关系”搜索(实际上SPOKEO干的就是这种事情,只不过它用的是email地址簿而不是FOAF,目的是呈现给你看,而不是存储起来,供人随时查询)。目前规模较小,格式还不普及,因而还没什么影响。
这里有关于Google Social Graph API的背景介绍 (URI也是“人”)和一些 例子。
Google的加盟对于RDF和FOAF来说都是绝大的利好。
实际上如果采用RDF来表达所有“关系”,或者所有的关系可以转化成RDF格式,链接就具有了语义,这也就进化到Web3.0了。
社科基金中的2.0项目
“国家哲学社会科学基金”如雷贯耳,但由于与本职工作关系不大,从来没有关心过。前一阵领导提醒,好奇地上去看了一下,以前真是孤陋寡闻,看一看这个目录,至少能感知专业脉搏。今年的目录中确实有不少是值得关注的。
2008年社科基金指南中“图书馆、情报与文献学”部分有77个条目,蔚为壮观。看发布的体例,其中43项属“基础研究”(带有简单的说明),34项属应用研究(带※号,只有标题)。粗粗浏览了一下,数量上仅次于“应用经济”(156)和“法学”(130),在所有22个学科中位列第三,超过“社会学”(71)、“政治学”(57)和“理论经济”(56)。
课题多应该与该类目下包含的学科众多有关。记得在上世纪八十年代,曾有一阵学科大发展的时代,边缘、交叉学科层出不穷,新三论老三论科学学争奇斗艳,图书馆学相关学科也百家争鸣了好一阵,以至于剪不断理还乱,直到现在还理不太清楚。
课题指南中除了图书馆学、情报学、文献学、档案学的传统内容外,知识管理(知识共享、知识服务、知识成本、绩效评 估)、信息资源管理(包括数字内容产业、网络服务、共享评估)的相关内容与时俱进、层出不穷;还有网站分类目录研究,自动分类技术研究等技术类选题(好像应该归入自然科学基金类项目嘛!经费远比社科项目多多了,难怪前些年有不少两头拿项目。陈老师似乎正在寻找这方面的作者);更包括“网络社区”、“信息生态”、“虚拟企业”、“新网络 环境”等时髦内容,一些新兴的网络问题在这里找到了归宿,看来Keso的网论完全可纳入图书情报研究体系而得以招安了(当然,Keso还需要弄一张高级职称的证明来。凑一年的帖子可有8-15万的课题经 费,何乐而不为乎?估计由于价值体系的不同,15万的“重点”课题是绝计拿不到的)。
还看到“知识构建”这样邪乎的名称(应该是从“信息构建”中借用过来的波?google了一下国外还真有这个概念,真是全球同此凉热),仿彿搞图书情报的还真能成为“知识”专家。
与2.0相关的题目似乎有以下一些,不知道花落谁家,相当不错咧!
17、网络社区与信息运动模式研究
研究随着互联网的发展和Web2.0的兴起,网络社区何已成为一种不可忽视的用户生产、获取、交流、共享信息与知识的微观环境;探讨社会网络情景下网络社区的运动规律、用户的价值和作用,以及如何改进网络服务效率,创造新的服务模型和服务系统。18、新一代网络服务体系对情报学的影响研究
研究以Web2.0为代表的新一代网络服务体系对情报学带来的挑战和提供的发展空间,如何以此为契机调整和丰富情报学科体系和理论框架,以及为信息资源开发与管理提供操作指南。21.社会网络与企业内部知识共享研究
研究知识共享的主体和客体,企业内部知识的存在形式和传递方式,社会网络中影响知识共享的因素,判断知识共享效果和衡量指标,优化企业内部知识共享的策略22.信息生态系统构建的理论与应用研究
研究信息生态学的概念、特征及其产生过程和背景,信息生态系统的构成要素及其相互作用关系,信息生态系统形成机理、运行机制及构建方法,信息生态系统下信息组织、知识管理及信息资源优化配置的模式与策略。33.新网络环境下的个人信息组织研究
研究从用户的双重身份角度考虑个人信息组织需求及其特点、对信息组织的影响及相应的信息组织方式、系统研究符合个人信息综合组织与管理需要的方法和工具
数字图书馆与网络社区研究
Web2.0的发展,不仅极大地刺激了语义万维网(某种程度产生了方向性的影响,人们开始重新评估发展目标和进程),同时对于数字图书馆,也正在缓慢地产生影响。可能由于数图研究的广泛性和分散性,这种影响还未见系统的归纳探讨,但是某些局部领域已经发展得很热闹了。
如以前的博文所述,Web2.0给数字图书馆带来的,主要是数据呈现、展示方式和用户交互层面的进展,而数字图书馆本身,是在数字资源组织和管理方面的进展,包括围绕数字资源组织管理所有相关方面的研究(就是说不光是技术)。但是在传统的数字图书馆模型中,主体和客体是分的很清楚的,主体是人,包括用户、管理者、系统操作人员等,客体才是其组织管理的对象,而Web2.0在三个方面带给数字图书馆一些新的观念:
1、既然数字图书馆中“一切皆数字对象”(目前对于广域网环境的计算机模拟,面向对象的思想还是占据主导地位),“一切对象皆生而平等”,因此“用户”对象也不应例外,也可以抽象出来,纳入到一般数字对象的组织管理范畴中去。
2、每一个个体“用户”在数字图书馆系统中有了一种作为独立“资源”的地位(当下的Web认识模型中,“资源”是赋予标识的数字对象的统称),与其它数字对象所不同的,只是其属性和关系描述方面的不同(Web 1.0中“网络上没人知道你是一条狗”,而Web 2.0的狗与狗都是不同的。“太阳底下没有两条相同的狗”)。
3、引入了抽象的“代理”(agent)角色,即在网络系统中任何具有“人”的行为的个体(人–包括用户/管理者/操作人员等等所有系统相关的stakeholder、机构、“机器人”等),都可以称为agent,在系统建模中必须考虑它们的角色和作用。
当下热门的社会关系网络(SNS)被认为是Web2.0的核心,是网络社区的2.0生存形态。其主要特点就是以社区的组成元素—-用户(网民)的属性、关系和活动为对象的组织管理平台。然而我一直很纳闷,网络社区研究似乎从来没有从信息组织模式的角度入手,这是一个奇怪的现象。
目前对于网络社区信息流动的研究的确有很多,例如对于艳照门之类重大事件传播的信息流跟踪等,但总体来说,可能由于目前SNS研究的直接目的就是找金矿,为Web2.0企业寻找商务模式,从而导致了想象力的极度放大和系统性的极度欠缺。大多就事论事,以为掌握了人流,就掌握了眼球,从而就能开辟新“媒体”(以便作广告),期望最大的、最直接的经济利益。
信息组织模式的研究对于网络社区的发展究竟能够起到怎样的作用?我们传统的规范控制方法如何应用到动态的Web2.0信息流程中去?这是一块处女地,有很多非常值得探讨的问题。在这方面,不仅需要2.0的从业者变一变思路,我们也应该主动出击。一直龟缩在传统的领地中希望别人发现我们,绝对是不符合2.0理念的。
什么是“网络社区”?
据说“社区”一词是清光绪13年(1887年)德国社会学家斐迪南·滕尼斯 (F. Tonnies,1855-1936)的发明,写作Gemeinschaft,又译作“共同体”。他的定义是“指那些由具有共同价值取向的同质人口组成的,关系亲密、出入相友、守望相助、疾病相抚的,富有人情味的社会关系和社会团体。”
这一年蒋介石出生,清政府在台湾设立行省。
第一次世界大战之后,美国学者查尔斯·罗密斯(C.P.Loomis)开始了社区研究,将这个词翻译成英语Community。到了1933年,一批即将从燕京大学社会学系毕业的本科生将这个词翻译成了中文“社区”,其中有后来赫赫有名的社会学大师费孝通。当时他还未读清华的研究生,《江村经济》也没有问世,因此还未拿到伦敦大学的博士学位,那段让无数后人感叹唏嘘的生死爱情也正处于萌芽阶段。
“ 社区研究”一百多年以来几经沉浮,如同图书馆学中的许多概念一样,一阵热潮,一阵批判。所不同的,图书馆学中的buzzword后来死翘翘的居多,而被证明没有多大意义的“社区”,由于研究方法的改进,又赋予了新的含义。特别是到了网络时代,有了“网络社区”。
维基百科对社区的定义是:指由于共同的地域、环境或兴趣而组成的社会团体或组织,其成员常常具有一致的意愿、信仰、资源、倾向、需求、困难等特征,而使得社 区具有一定程度的内聚力。(A community is a social group of organisms sharing an environment, normally with shared interests. In human communities, intent, belief, resources, preferences, needs, risks and a number of other conditions may be present and common, affecting the identity of the paricipants and their degree of cohesiveness).
网络社区,可以认为是以一定的网络设施(平台系统)为基础,基于共同的环境或兴趣,分享一定的共同属性而形成的人群(在网络中通常称为“代理” agent)。通常网络社区必须利用一定的网络平台或工具,其社区内聚力表现为具有超出平均水平的联系强度(链接数量或连接频次)。
也就是说在网络中具有 超出平均水平的联系强度的人群,就可以认为是网络社区。 如何区分是不是人群?为什么会超出平均水平?如何测度、衡量?可以看做是网络社区研究的基本问题。