分类目录数字人文

机器时代的人文主义:谁能评价?

外在与本质

2017年10月25日,在沙特首都利雅得举行的“未来投资倡议”大会上,由香港汉森机器人技术公司(Hanson Robotics)制造的机器人索菲娅(Sophia)被沙特政府授予了公民身份,成为世界上第一个受到政府认可的机器公民。这个看似作秀的举动其实蕴涵了一个巨大的跨越,必将成为一个标志性事件,标志着人与机器之间的界限正在被打破。是否意味着源自启蒙运动的“人类中心主义”价值观受到了冲击?人类主体的范围是否应该重新界定?这些问题虽然还有待观察,但已经提上议事日程。

由此看来,对于数字人文而言,定义其为数字技术在人文研究中的应用(或交叉领域)已经远远不够了,人文学科的数字化发展只是其表象,人类数字活动的学科化研究才是其本质。循此方向发展下去,它不仅在颠覆传统人文,而且在创新数字人文。我们现在所认识按传统学科划分的数字人文,难道就是未来数字人文的最终形式?当一个异形的种子刚刚被注入人类体内的时候,你建立怎样的体检标准(即评价体系)都是荒谬和无济于事的。

载体与内容

当我们谈论数字人文的时候,我们通常谈论的是数字方法应用于人文研究,很少谈论人文研究对象本身的数字化形态,印刷时代的人文研究给我们造成一种错觉:似乎文本或文献就是所有人文科学的研究对象。

例如,哲学,研究的应该是思想观念,而不是概念文本;历史学,研究的是历史事实,而不是历史文献;文学,可以算是内容与形式统一的范例,但它并不是语言学;语言学,也不只是文本,而是音形义的交互作用。

这就造成一个奇特的现象:所有的人文学科在外人看来都是研究文本或文献的,而不是其所宣称的真实的研究对象。人文学者在研究时,需要把文本抽象还原成其研究对象本来的状态,这是在人文学者大脑中进行的动作,人脑就是他们的反应器,人脑的记忆衰减、任意联想以及不确定的多巴胺造成人文学者极端的浪漫性,而比较缺乏的就是科学性。这可以看成是印刷技术的局限。要知道传统的自然科学家除了看书之外,不对进行实验研究是不可能得到同行承认的,这也是爱因斯坦并没有因为其最伟大的发现—-相对论理论而获得诺贝尔奖的原因。而人文学者完全不必有此顾虑,这是所有人文学科、中国传统理论和民科都享受到的好处。

而当数字技术参与其中之时,情况就完全不同了。数字技术是可以把研究对象及其现象还原为真实对象甚至真实场景的,是可以基于数据进行实验的。这类似于人类发明了火之后,食物的种类大大增加,因为烧煮过程减轻了人类消化系统的负担,等于体外消化了大部分材料,于是人能够一举跃上了食物链的顶端。对于数字人文来说,不同学科的研究材料就产生了很大的不同,大家不仅烧煮的食物不同,连锅碗瓢盆过程方法都是不同的,你一看就知道哲学家可以用一种叫操作N-Gram的蒸锅进行观念史研究,而历史学家在调试各种佐料的刺激程度以获得不同的中心度指标,来取得人物之间的聚类关系。。。等等,从一开始他们的装备和本领就是不同的,因此到了数字人文时代,可以给不同学科的研究者设计不同的制服,王涛老师可以穿蓝大褂,如果他要经常走访遗址的话;而陈静老师更合适穿汉服或芭蕾舞裙,因为这样她的艺术研究更能激发人的想象。当然这些激动人心的丰富性也会给评价带来难以估量的困难。

模型与镜像

数字技术可以让我们在虚拟世界再造一个人文环境,跨越时空,以不同角度和粒度进行观察、模拟甚至操控。这其实是眼下最时髦的一项技术,所谓“数字孪生”,我觉得它在数字人文领域具有广阔的应用前景,一定能大有作为。

“数字孪生”能够给人文研究带来极大的好处,它并不只是让我们能够通过操控和实验,获得细致入微的因果规律,利用机器的“显宏”能力写出史景迁《王氏之死》这类史学小说,或者黄仁宇《万历十五年》这类远读的历史切片,或者帮胡适续完《中国哲学史大纲》;它同时也带来了很大的困惑,究竟怎样的模型(粒度与视角)才能满足不同学科的实验要求?同样的素材可以提取多种对象,每个对象也可以有不同的形态和版本。

这里正好有个例子。昨天我们吃晚饭【喝茅台】的时候有个会议正在举行:“用方法表达思想,历史书写的可能性”,不去说这样刻意的用词营造出一种模糊而暧昧的氛围,(的确能够勾起人们一探究竟的好奇心,虽然网络时代的标题党早已不这样操作。不去管他,)我们就来分析一下用什么方法能够表达思想?可以说我们当今的时代正在发展各种方法,不仅仅是印刷文本了。数字文本可以表达,数字图像可以表达,各种对象关系模型及其系统实现可以表达,任何信息媒体只要受信端能正确(或故意正确)地解码,都算是从认识论层面或多或少表达了思想,书写历史也是一种表达,不同粒度、不同角度、不同分面,尽管认识的模糊性必然导致表达或书写的模糊性,但这不属于本文的讨论范围。

我不知道历史学家或人文学者意识到当今数字技术所具有的能力没有?我们现在当然还没有做到大规模建模,为人文学者创造一个可以赖以实验的数字孪生出来,我们偶尔会受到指责,说我们的模型根本不是那么回事;我们也会指责回去,认为他们根本没有弄清楚自己在做什么,以及是怎么做的,这是无法建立一个清晰的模型的。当然,是不是机器学习可以不必打开人文学者研究过程的黑箱,而直接模拟得出结论,有待于计算机技术的进一步突破。

对于评价来说,这种情况下我们如何评价,成果的取得是由于模型的精准、人文学者的顿悟还是机器算法的高超?现在都不知道。

现状与未来

我们可以做一个思想实验:当机器时代最终到来,所有的研究素材、对象、方法、过程、工具,都数字化了,我们的人文研究,还有必要冠以“数字”人文吗?

我们正处在大数据和人工智能时代,当所有的人文活动、素材和方法都依赖于计算机和网络之后,其实就无所谓数字人文了。就像纸媒时代我们不会说纸张人文一样。人文就是人文,它可能会改变形态,但本质永远是人性。普适的标签终究会失去意义。我们可以借助纸本文献研究传统人文,也可以借助数字媒体研究数字人文,或者用数字方法研究传统人文,这些都是数字人文作为学科的表现形态。而人文现象作为其研究对象,已经与数字技术融为一体,难分彼此了。

那么,我们数字人文的评价体系,到底是评价什么呢?

前提与假设

本次会议的主题是“数字人文的学术评价体系:定义与规范构建”

从主题中很容易看出出题者的雄心和先验假设。

雄心是:数字人文作为一种学术活动,目前尚未建立适当的学术评价体系,尤其是定义数字人文,并为数字人文构建学术规范。既然没有人做,那我们来做。

假设是:数字人文是一种学术活动,学术活动需要评价体系,数字人文作为一个学术领域是可以被定义的,也是可以建立学术规范的。

真是这样吗?

我有我的答案,但在这里我不想说。希望与大家进行开放式讨论之后我能思考得更加深入,因为评价的前提是需要建立一个领域知识的全景图。这里我只想对我们可能要进行评价的概念进行一些讨论。

定义与规范

什么是人文,什么是人文主义、人文精神、人文科学、人文学科,这些概念其实都没有得到清晰的解释,也没有形成共同的理解。这对于数字人文的界定和精确化是不利的。我们对这些概念进行过一些简单的探讨,今天时间有限,请参见我们的文章《数字人文的理论化趋势前瞻》。

关于什么是数字人文学科,人民大学曾下过一个迄今为止最大胆和清晰的定义,也是我最推崇的。

它说:

数字人文是计算机学科和人文学科交叉研究所衍生的一个新领域,它以涉及针对计算工具与所有文化产品的交叉领域为研究对象, 系统地研究数字与人文相结合的普遍规律和应用方法。具体来说,数字人文学科 以人文科学的基本问题为研究对象,以不断发展进步的信息技术和数字技术等为 主要工具,以数字资源构建、信息资源管理等数据基础设施建设为基础,以计算 分析和案例分析方法等为主要研究手段,通过建立描述学术活动理论、方法和功 能的框架以及各种类型的项目实践,探讨数字技术与人文科学跨学科对话中的方法、过程、特征和相互关系,以及数字人文作为一个整体与社会环境之间的互动与关联,并从中探索、归纳和总结出获得成效、提高效率的一般理论、方法和规 律,以推动知识创新和服务。

当下与终极

虽然我不认为当下有必要甚至有可能建立一个数字人文的学术评价体系,并为其建立学术研究规范,现在还为时尚早,理论体系尚无踪影,领域边界也未形成,学术团体此起彼伏,对话还不充分,学术共同体也在飘摇之中;评价对象、评价方法、评价目的都不确定,过早的评价可能限制其发展,而不能达到我们促进领域发展的目的。但我并不反对这样的探索,更不反对这样的会议能够开诚布公地把问题提出来,进行争鸣。网络时代制造热点通常也是一种很好的促进。

讨论什么不是数字人文以及什么是好的数字人文都是有积极意义的,能够起到引导作用;讨论人文性与研究难度是有一定难度的,但可以把问题引向深入。数字人文区别于传统人文应该保持概念的一致性和精确性,而且在寻求评价方法的同时自身就应该重视指标的可度量性。

当然学术评价如果剔除管理和功利的目的,其终极目的是促进学术发展,最终还是一个定性的事情,同行评议可能是不好的方法当中最好的方法。社会人文科学的任何定量模型,其最初量化数值的获取,都是模拟的、定性的。

启蒙与赋权

数字人文可能而且应该成为又一次人文启蒙运动,以数字工具的兴起为契机,以机器语言为共同语言,引导人们走出模拟时代的蒙昧、盲从、无知、教条、权威崇拜、奴性,以重塑更为普遍的人性、道德、美的理解和思想体系,为未来人类的生活方式和社会形态提供解决框架。

数字时代应该进一步研究何为人性、何为人文,在面临数字技术的冲击下,哪些是解放人类并促进全面发展的必然趋势,哪些又是被别有用心的政客利用来奴役和控制别人的主张。其实评价本身也是一种特权。

数字人文的研究,必然带来后人文时代即数字主义和兴起。

我们当下所有评价的宗旨,是发展数字人文。而数字人文的最终目的,是赋予数字以人性,并因此而保障平等的数字权利。我们未来不仅生产数字,消费数字,因数字而喜乐,用数字获得财富,而且也会困于数字、累于数字,甚至被数字毁灭。

无论如何,现在已到了这样一个新的时代,我们可以喊出这样的口号:天赋数权。

初学者关于数字人文的五个提问

1.近年来,国内外数字人文研究取得了哪些实绩与进展?
1)领域或学科已经得到公认确立。2004年为界前后两个时期
2)学会、期刊、教育都已经建立起来
3)国际和区域性学术交流会议非常活跃
4)学科正在繁荣,各相关学科都有一些成果,虽然没有特别眼睛一亮的成果,但有不少项目也算有影响。国外已有近千种专著,台湾也有20种,但大陆只有翻译的。期刊论文国内每年也有近200篇。
5)范式转型已经开始,但还远没有到位(dark side:晋升、评价等)


2.未来的数字人文研究应该注意哪些问题?或者说要坚持什么原则?
1)“大帐篷”原则,多学科融合,促进交流。目前很不平衡。
2)注重学科建设和理论研究,从教育培训入手。目前刚刚开始。
3)重视基础设施建设,基金进入,项目导向。
4)注重数字人文的本土性和民族特色,价值观引领,传承优秀中华文化非常有必要。

3.数字人文研究,具体会给传统研究范式、方法、视角带来怎样影响和变化?
影响是颠覆性的。两个方面:
1)不同程度改变原有人文社会科学
2)产生很多新的问题,带来交叉边缘领域,甚至创造新学科 不仅仅是方法方面的革新,就像试验设备的提高带来自然科学的进步一样,会造就新的内容。 数字人文也是数据科学的一种实践领域。

4.目前中华优秀传统文化的发展在您看来存在怎样的困境或者问题呢?
1)中华优秀文化的传播需要有两个基础要素:载体和形式,文献典籍文物遗产是载体,数字人文提供新形式。目前这两方面都准备不充分,基础设施、人才培养、工具方法都存在不足。
2)目前的最大问题有两个:源头上无法界定精华和糟粕;传播上缺乏吸引新一代并代表未来的方式方法手段
3)观念上重视、理念上面向未来面向国际,大力投入加强教育和基础设施建设,同时需要有一套指标体系和评价方法

5.如果存在问题,那么数字人文在哪些方面可以有所帮助呢?
简单而言:中国的数字人文一定是基于中国优秀的传统文化才有生命力,中国优秀的传统文化需要借助于数字人文才有未来。

作为数字人文基础设施的图书馆:从不可或缺到无可替代

本文为为《图书馆论坛》2020年数字人文栏目组稿的一期专辑主持人语。

根据CNKI的数据,国内迄今发表的近700篇以”数字人文“为主题的论文中,来自图书情报档案领域的文章大约超过60%。对比国外,Web of Science (Core Collection)收录了1590篇以“digital humanities”为topic的论文,Inforamtion Science Library Science领域的文章约为300篇,占比不到20%。这两组数据显示了国内外数字人文研究学科来源的巨大差异。

这说明了什么呢?虽然我们并不认为国外的比例就是数字人文知识版图的“完美”配方,但我们的比例一定是不合理的。人文学科的数字疆域,第一批居民主要来自图书情报领域,怎么说都不能让人服气。

这其中固然有国内图书情报学者更喜欢追新的原因,也是国内人文领域的学者尚未觉醒、尚未充分准备好的结果。就像当初旧金山发现了金矿,涌入的首批淘金者并没有赚到钱,而各类服务业却异军突起。图书馆行业作为历史文献的主要保留地,由于数字图书馆带来先知先觉,理所当然地成为数字人文最早的基础设施建设者。

传统的文献考据和现代的文献计量学都为数字人文作为一个整体的跨学科研究领域提供了方法论借鉴,书目控制带来的规范控制借助于语义技术,天然地为知识的形式化组织(采用本体技术)和知识服务提供了可信的编码基础,也为机器学习和人工智能的发展提供了宝贵的标注语料库。如果说不了解目录之学就无法窥知传统学术门径的话,不懂得以文献计量为代表的统计分析方法就无法真正从事数字人文研究。当然,当今数字人文的方法体系已经得到了极大拓展,统计分析的对象从文献深入到了语词文本、社会关系、时空关系乃至经过模型化之后的各类关系。但无论多么复杂,数据永远是基础,拥有大量数据的图书馆永远是人文研究的可靠伙伴。

图书馆要提供基于知识的服务还需要在数字图书馆的基础上不断提升水平,包括提升资源加工的语义化水平和提供分析统计及可视化工具。上海图书馆在国内属于对数字人文的先知先觉者之一,借助于20多年前开始的持续不断的数字化,大量的传统文献和特色文献已经搬运到了数字世界,一旦数字人文的研究方法和相关技术得以成熟,很自然地占据了有利的跑道。

本辑的四篇文章虽然反映不了上海图书馆在数字人文领域积极开拓的全貌,但包含了一些新的思考。图书馆这类人类记忆机构在数字人文的发展过程中,固然由于其资源收藏而不可或缺,但真正使其无可替代的,并不是这些馆藏资源,而是其服务能力。在当今以ABCD(人工智能、区块链、云计算和大数据)为特征的数字时代,“知识作为一种服务(KaaS)”才是图书馆的立身之本。本专辑反映了数字人文平台建设的两大趋势:边服务边建设的开放众包思想,和从数字图书馆到数据图书馆的必要升级。这两者是“后数字图书馆时代”我们在面向数据驱动型或数据密集型研究进行转型时必须首先实现和超越的。

  • 贺晨芝和张磊的《图书馆数字人文众包项目实践、分析与思考》重点介绍了数字人文领域的众包应用现状,以及上海图书馆自2016年以来的实践经验。上海图书馆开发了两个独立的众包应用,即抄录平台和验证码应用,都可以以SaaS方式开放给同行使用。
  • 刘倩倩和夏翠娟的《家谱知识服务平台众包模式的设计与实现》针对上海图书馆的家谱特藏,在原来提供基本查询和关联功能的数字人文平台基础上,开发了上传家谱、在线识谱、在线修谱等功能,尝试引入众包模式不断优化系统,并与用户社区积极互动密切合作,使用户不仅作为数据的消费者,同时也作为贡献者。
  • 朱武信和夏翠娟的《命名实体识别在数字人文中的应用—基于ETL的实现》介绍了一种借助于专门词典、批量自动进行名称实体识别的方法(即ETL方法),该方法在上海图书馆的数字人文平台建设中已普遍采用,取得了良好的效果。其原理是将文本中有意义的名称(例如人物、地点、时间、事件、专有概念等)利用程序进行自动析取,经过判断之后进行数据数据化转换(通常是加上URI),并提供丰富的语义关系。
  • 张喆昱和张磊的《记忆机构开放数据建设及数据化转型模式研究》触及了两个关键性主题:数据化和开放服务,试图将上海图书馆的实践进行一般化和通用化,分析了如何通过数据化更加贴近人文学者的需求,让系统更加人性化,然后通过开放服务引入外部资源,反过来促进系统的数据化。

上海图书馆希望通过自己的实践,为人文研究的赛百基础设施建设提供一个参考样本。发表这些做法,并不是说我们的做法有多先进,而只是一种不揣浅陋的抛砖引玉。我们深知,国内的数字人文目前还处于起步阶段,争论大于共识、口水多于实践,但只要大家参与,未来就前景可期。数字人文迄今为止形成的最大共识,就是大家都同意它是一个人人都受欢迎从而能各得其所的“大帐篷”。愿这个大帐篷使我们各门人文学科都得到繁荣兴旺!

“定义数字人文”归来

日前去南大高研院参加了【“定义数字人文”工作坊】,是其“数字人文周”系列活动的一场。南大高研院数字人文创研中心是目前国内最活跃数字人文团体,此次请了Melissa、Edward、Jason等国际大牛,前几天还来上海做了两场交流,受益良多。

下午有一场讨论会,陈静主持,非常国际化,陈述与辩论全程高能,双语全开。主持人给到我的是这个问题:数字人文与大数据、人工智能间是怎样的关系 ?这里对匆匆辞不达意的发言做一个留存。

Melissa今天其实已经介绍了很多,在座也有很多计算机领域的教授,我这里对这一问题谈六个方面,供批评指正:

  1. 数字与人文的关系?digital与paper(指载体,包括甲骨简帛、纸草泥版等)的关系,而不是与print的关系(print只是古登堡印刷术1450年以来的事情,人文早已成型)。数字人文的数字表明其生于斯长于斯,荣于斯毁于斯,或不成功也将“葬”于斯。从这个角度看,数字其实是源自于人文的,而人文又源自于人类发明的文字,没有文字就没有载体,人类文明就不能积累和发展,文化就无法传承(玛雅人结绳记事也算一种载体,但也限制了其文明的发展)。大数据与人工智能是数字技术的最新阶段,还能发展多久?从多大规模上影响人文?将取决于这些技术的发展是否有一个极限。目前看来是没有的,莫尔定律从四十多年一直有效,另有一个奇点理论更说前景无限。因此发展远没有停止,我们不能低估数字技术的影响,而且还在迅速发展。人本身就是技术的产物,数字技术来源于人文,而又反馈于人文,数字人文远没有止境,不能静态来看,数字将给人文带来更多的机会。
  2. 哪些技术将影响人文?技术的潜能是很厉害的。 大数据和AI只是现时代的代表技术,大数据是数据管理技术的进展,人工智能是计算方式的变革,单独说某种技术意义不大,可以讨论所有技术,如OCR、实体识别、Dis Reading、Analytics,Visualization,Creation,其实是背后的所有技术:所有技术都会对人文带来影响、起到作用,例如很多支撑性的技术,如云计算、微服务等。我们要划定一个边界,可能是对人文研究直接有用的技术。
  3. 技术用在哪里?任何计算机问题都可以看成是模型问题,计算机技术发展至今,是对于人脑认识的模拟,而且越来越接近人认知方式。人是否能提出问题、解决问题,主要是能否借助于计算机这种人脑的延伸工具充分地认识问题。现在提出的本体技术就是把领域知识代码化、可计算化。所以说到底数字人文问题既是技术问题(无限逼近领域系统),又是认识问题,应用到具体研究过程中,它也是操作问题,评价问题,方法过程问题,信效度问题。其中核心正是我们对dh核心的认识:如何界定Methodogical Commons,DH的特点是核心清楚,边界模糊,之所以这样,还是因为我们今天对认识论模型认识的不够深刻,所有的技术都是围绕这个模型而来的,不同学科领域(包括未来新产生的人文学科)有不同的模型,从技术方法层面来看,有通用的技术工具方法和特异化的技术工具方法。当前很多社会科学研究方法都可以借鉴。
  4. 技术如何应用?DH和AI相比于硬科学和其他人文科学,都还在婴儿时期。目前的研究是研究吗?还是研究过程的一部分?当前我们普遍人文DH还是工具性的,但远远不止如此,它如果用在人类好奇心的探索,用于提高人类福祉,用于人性的延展,它就不再是工具了,工具与本体就合一了。如前所述的,人即是工具所组成。第一阶段DH可能提供的是扳手,你不需要知道扳手怎么做,你就直接可以用。而未来,你与扳手合一了,你就是扳手,你是一切,任何问题都是数字人文问题了。
  5. 当前DH有什么问题? 问题很多,Melissa提到一部分,如伦理、环保等,还有如隐私、滥用,诚信,遮蔽等。现在影响我们比较大的,是商业化问题,以及可持续性问题
  6. 最后谈一点GLAM的价值和作用。GLAM保存的是我们从哪里来的人文,而未来一定是数字的,我们期待如Edwards所说的,所有问题都是数字人文问题那一天的早日到来。

DH2019敦煌会议发言稿

数字人文的学科化与理论化趋势前瞻

(注:本帖为2019年数字人文敦煌年会本人所做的发言,与上海大学wlh老师共同完成。后扩充内容,即将发表,链接后附。引用请以公开发表内容为准。)

我们目前对数字人文的理解基本都是工具性的,即认为数字人文是信息技术在人文科学中的应用。其定义大致分两种: 广义的和狭义的。广义的如维基百科词条:

数字人文(DH)是计算或数字技术与人文学科交叉的学术活动领域。它包括系统地使用人文科学中的数字资源,以及对其应用的反思。DH可以被定义为进行学术研究的新方式,涉及协作,跨学科和计算参与的研究,教学和出版。它为人文学科的研究带来了数字工具和方法,认识到印刷文字不再是知识生产和分配的主要媒介。

弗吉尼亚联邦大学(Virginia Commonwealth University)的David Golumbia认为上述宽泛的解释就是人们常说的“大帐篷”定义,而人们常常内心认同的都是狭义的数字人文,即专指“工具和档案”。他通过美国人文科学研究基金会历年批准的项目中得到印证。

上述两类定义,尽管广义的“大帐篷”定义并不排斥理论研究,但整个数字人文界对于数字人文的理论研究还是不甚待见的。充斥其间的,是Just do it的论调。没错,数字人文是需要做出来,而不是说出来。我们需要在人文学科的各分支领域广泛采用计算机方法,尝试探索、开展培训,让更多的人进入这个领域,让进入的人有所作为,而不只是争先恐后地摘取低端果实。一个领域能不能立住,主要还是要让成果说话,只有这样,才能向世人证明:未来的人文必须是数字的。

但是一个学术领域如果没有一定的理论思考,没有对自己是什么、做什么、为什么做的研究,这个领域是没有内聚力的,也是走不远的。我们如果不知道为什么会相聚在一杆大旗底下,我们就不知道明天还会不会一起,我们更不知道将来会走向何处。

目前的现状即是如此。表面上看起来轰轰烈烈,但只是提供了一个大帐篷底下大家交流的场所而已【现状也未必尽如人意,很多人感到困惑、乏力】。一个有明确创立时间(1949?)和定名背景(2003)的领域,经过70年的发展和近20年的争论,应该说已不算年轻,成立了很多研究中心、协会学会等组织机构,也具备了学术制度所必须的要素,年会与专业会议一片繁荣,各类基金、教育培训计划等基础设施一应俱全,但还在讨论“dark side”,缺乏“范式”或“纲领”,挣扎在理论“贫困线”上,系统建设多于研究成果,论辩口水多于学科创新,学术产出中得到公认的重大成果基本没有,甚至连从事数字人文的人都不认可数字人文是一个学科,没有形成系统的专业教育体系或职业培训制度。这其实就是我们目前的现状。

一、数字人文属于什么人文?

“人文”一词在我国与众多的其他现代概念一样,是一个舶来品。大约是“五四”运动前后与“德先生”“赛先生”一起引入,被称为“胡先生”,即“Humanism”,只是没有前两位先生有名。与之相关概念有许多,如人文学科、人文科学、人文主义、人文精神、人文素质,以及人道主义(曾经是Humanity的一种翻译)、人本主义等,非常容易混淆,不仅因为含义相近,而且对同一个名词会有许多不同的理解,由于历史的、文化的或语境的原因,造成十分复杂的内涵差异,以至于带来很多理解上的困惑。这对于数字人文的讨论也是十分不利的。我们如果不能对这些概念的前世今生、前因后果和同形异议的情况有一个基本认识,恐怕很难准确把握数字人文的丰富内涵,也很难探究其未来发展。

数字人文中的人文(The Humanities),一般都用作复数形式,是对于各门具体人文学科的总称,主要用于教育学中对教学科目的分类,目的是在教育机构开设相应主题的课程,以提高被教育者的人文素养和人文素质为目的,定位于人文学科的课程建设和教学。

人文科学(Humanity Sciences)则是从哲学的高度对包括人文学科和人文主义在内的人文活动原理进行系统研究的理论体系。人文主义(Humanism)属于思想史范畴,同类概念还有人道主义、人本主义、人文精神等,表现为社会思潮、思想立场和主张等。

尤西林认为人文学科、人文科学和人文主义三类概念不能混淆,更不能互相取代,但它们总是密切相关。人文科学不能代替人文学科的(教育)功能,而依赖于人文学科来发展和阐扬人文科学,同时人文科学所具备的精神不可避免地具有人文主义的价值立场。

数字人文作为各门人文学科应用了数字技术之后产生的新形态,其实就是“人文学科”的延伸和发展,是多门学科共同构成的一个新领域。它既根植于传统的学科(至少目前是),又共同形成一个以“数字技术”作为方法和工具的纽带(是否只是工具方法呢?下文讨论)。数字人文将人文学科也带入了数据驱动型或数据密集型时代。

数字人文是否已经形成一个“科学共同体”了呢?虽然数字人文来自于“方法论共同体(methodological commons)”,但它是否能够作为单数的“数字人文”而存在?也就是说是不是能够作为或形成一门独立的学科?目前争论很大。这需要从三个方面来考察:1.历史的角度;2.“科学学”(或者科学哲学)角度;3.未来发展的角度。

二、数字人文与古典人文是一个东西吗?

从历史上看,人文科学是一切科学之母。从古希腊罗马的七艺(),到中国春秋时期士大夫的六艺(),以及被孔子“学科化”而成为“儒家”六艺(),就反映了当时人类对于自然、社会及自身的认知的总和,并总结为教化人类自身所需的必备素养和学科体系。当然当时只是为了教育贵族子弟或“公民”,下等人和奴隶是不包括的。

据文献记载,汉语中的“人文”最早出自《周易·賁bi卦》:“刚柔交错,天文也;文明以止,人文也。觀乎天文,以察時變;觀乎人文,以化成天下。”这段话引用颇多,当然也有不同理解。中国“人文”本意是以天道信仰为原则而进行礼仪教化,旨在规范人,与西方人文意在解放自然人欲,虽然有很大不同,但总体而言,天人相对,以求致知而达和谐,是相通的。

人文思想到了现代,其内涵和功能有了很大的不同,从主流价值观和意识形态,及其构成的学术形态,蜕变为对现代化的回应,在以印刷术普及为滥觞的五六百年科技和工商业高歌猛进之后,完全呈现为一种防守的态势。在学术与教育思想中反映为人文学科与人文科学与自然科学、社会科学相区别而并列的关系。这一区分是现代化之后才形成的,可以看成是古典人文学科经过现代化而发展、分化所致,因此其内涵与古典人文学科有了很大不同。

现代人文发展到数字时代,更是退化到只见树木不见森林,只有方法而没有灵魂了。

三、人文学科是科学吗?

古典人文与现代人文的最大不同,来自于人们对科学的崇拜,即认为现代人文尚未完成科学化过程。这其实是现代主义对“科学”的一种解释。科学是什么?从库恩、波普尔,到拉卡托斯、费耶阿本德,科学哲学从来没有说清楚科学的本质,因为所有的判断都有反例。这也是在现代性体内长出的后现代特质。

【科学哲学,以及依据科学哲学考察的人文科学】

本意为复兴古典,却带来了现代。科学主义和工业革命一方面给人类社会带来了巨大变化,造就了当今人类的“幸福”生活,另一方面却又戕害了人性,使得人文精神在喧嚣和冷冰冰的大众传播中迷失,社会分工和知识的专门化导致专门家泛滥而真正的知识分子频临灭绝。这都是现代性造成的直接后果。

四、数字人文是工具还是本质?

“数字人文”这个概念的产生,固然是工具论背景的:帮助人们更方便地从事人文研究,而提供索引工具,进而提供基于数据研究或数据驱动型研究的所有设施:资源、平台、工具、方法,一切都是数字化的。

【方法论共同体图】

数字人文的未来具有远超学术研究的广阔天地,当所有的人类活动都基于数字技术时,“数字肥胖”将会是一种普遍的社会病,所有的人文现象都将成为各门人文学科研究的对象,人文科学也将由此得到丰富和发展。数字生活带来的很多新的文化现象,将产生数字现代主义的世界观和价值观。

以网络文学为例,作为一种数字人文现象,既不同于传统文学,又区别于数字人文的学术研究,具有极其丰富的学科内涵,目前暂且可以归入数字文学这一学科门类。而对于其上位学科–数字人文而言,是应该从文学理论角度进行研究呢,还是应该研究其如何助力文学创作?或者这两者无法区分,只好兼而有之。

网络文学从一开始就呈现一种碎片化、新媒介的书写方式,从第一代痞子蔡、安妮宝贝、李寻欢、宁财神等开始,就掀起一种革命性的风潮,发展至今更是丰富多彩。他们的作品多以超文本和网状/非线性、用户交互/协商式情节推进等为特征,在叙事方面也更加后现代,如玄幻、穿越、耽美,无怪不可,做了大量的探索,而且充分利用网络平台的参与性,创造了催更、打赏、接龙等方式,自动筛选出更受欢迎的作品,从而带来巨大的流量,无成本地挖掘出巨大的商业价值。这也使得网络文学与传统文学在理论上分道扬镳,诞生很多超级长篇的作品,永远不可能原样印刷,当然也出现了大量的“太监文”,以及为传统卫道士所不齿的“低俗性”(同人、攻受、鬼畜…)。

其实数字艺术的诸多门类,都存在这种现象。数字莫扎特可以让莫扎特专家难分彼此,数字油画也能唤醒人类心中的艺术激情,数字艺术正在挑战我们对于人文的认识和定义。

按理说艺术作为人类创造力的体现,其创作最具有独特性,似乎只能来自于人类自身的生命体验,取之于人而又被人欣赏,机器(人工智能)似乎是永远无法体会其中的情感和感染力的。而现实似乎正好相反,不仅在绘画、音乐领域,甚至在文学创作方面,完全由计算机程序通过机器学习方式创作出的作品,也越来越能够被人接受,远不是那种粗制滥造或简单拼凑所能解释。机器油画作品已经拍卖出高价,SONY的流行歌曲已经获得非常不错的好评分数,而小说作品完全能够模仿大作家的写作风格和哲学观念,按照一定人群的喜好铺设情节,出品传世佳作。

时至今日,可能还有很多人无法接受数字艺术内容的广泛性和丰富性、以及呈现形式的多样性,但已经没有人能够否认其深刻性和颠覆性了。再以网络文学为例,近年来一些优秀的写手早已不满足浅薄地感官写作和欲望叙事,而直指数字现代主义的无人区,以后现代主义解构一切被广为接受的理论,不断向纵深挺进。沿袭金庸一代开辟的武打文学,英雄长成类作品一直是颇受欢迎的题材,但个体生命在设定宏大背景中的特殊意义,自我与规则的致命冲突中所呈现哲学思考,赋予了作品更深刻的内涵。如《间客》的作者猫腻把康德著名的“星空与道德律”作为卷首语,使康德哲学成为作品中的草蛇灰线;在《朱雀记》中佛主开悟而得出众生皆苦的结论,于是死具有了合理性,而主人公易天行拒绝赴死的抗争也具有了尼采般的英雄主义色彩。这些都使其从后现代的批判和否定中汲取营养,反过来极大地丰富了数字现代主义的内涵。

当数字作用于人文,其所起到的变化应该不是如烹饪中采用了更好的刀具、甚至电动刀具,将食材切得越来越细这样的变化,而是超越了工具甚至方法,将食材腌制、发酵、分解甚至腐烂,更多的时候甚至是把以前不能纳入食材的东西纳入进来,绝不是我们表面上看到的切割形态上的变化,由于有了加工方式的不同,使得装盘呈现的方式也成为其一大特色,造成其最终目标不是为了食客果腹,而是艺术欣赏。久而久之对人的营养结构和文化习俗都会产生变化。这样来看,数字技术所起到的作用远不是物理变化所能涵盖的,而是一种化学、生物、文化的变化,是一种质的变化。

五、超越数字人文

现代主义提供了数字人文兴起的一个深色背景,更具颠覆性的后现代性孕育其中,使数字人文的未来充满不确定性。

发端于启蒙运动的人类现代化过程成功地造就了现代文明。现代性最重要的内涵就是宗教的衰落,启蒙精神的兴起。启蒙精神强调人类理性的重要性,相信凭借人类的理性,可以探究客观世界的真理(笛卡尔:我思故我在),未来是确定的,世界是进步的,找寻规范人类行为的普遍原则,建立公平正义尊重人类尊严的社会,达成对人性和美的终极追求。然而人类发展到后现代,这一切就不是顺理成章的了。
20世纪末兴起的信息革命变本加厉,逐渐赋予人类以几乎超越上帝的能力:改造生命、攫取智能、模拟情感、监控社会,(尼采:上帝死了)人类的欲望可能以更大的规模和范围得到释放,人文主义信仰受到前所未有的威胁。试想,如果我们能够任意编辑生命,甚至像科幻电影中描述的那样,通过体外子宫工场大规模生产人类,科技将能够生产超级人类,我们无需通过婚姻而繁衍后代,机器伴侣也会大行其道,我们的人性该如何定义?我们的伦理道德将会如何发展?是不是人文主义应该扩展为“后人文”(万物平等的泛人文主义),或者退缩为被AI消灭的过时的意识形态?这才是数字人文应该研究的硬核内容。作为现代性的后果之一,后现代即是对现代性的鄙视和摧毁,又蕴含了对古典的呼唤。虽然它无法脱离现代性而独立存在,甚至更多地是一种共生的关系,但却是一种反思、弥补甚至强化。

数字化网络化使现代性登峰造极,而数字人文可以作为一种逆动,成就一种后现代主义。因此,我们不能把数字人文仅仅看成是一个学科领域,而包含了非常丰富和复杂的意义。它首先是一个后现代运动,其次是一种信仰,然后才是一个学科领域和理论学说。

人文科学主要提供思维模式和价值取向,其有古老的一面,即继承自古典人文的基本内核,又有新生的部分,即与自然科学和社会科学抗衡的理论解释。因此它既古老、又年轻,即具有前沿性和探索性,又具有继承性和系统性,虽然面临式微和边缘化,但在人类遭遇危机、困惑或迷失时却成为依靠和灯塔,展示着强大的生命力。

南大428会议小结

很荣幸参加“比较视野中的数字人文反思”学术研讨会。本次会议的两个主题词“比较”和“反思”显示了本次会议比以往的进步。之所以能够比较,归功于本次会议邀请到了三位国外的学者,而需要进行反思,说明我们走得很快,也该停下来想一想了。
十一个发言,涉猎了DH相关的十一个主题词:

  1. 学科建设
  2. 项目组织
  3. 发展前景
  4. 文化记忆
  5. 方法转向
  6. 极简主义
  7. 馆藏再现
  8. 历史地理
  9. 教育实践
  10. 学术交流
  11. 数据设施

最后还有东道主陈静老师,提到了“范式差异”,以及我们如何去做。

会议讨论非常热烈,涉及了几乎DH的所有方面,也提出了更多的问题。我就用更多的问题来总结吧,希望我们下一次开会继续争论。

  1. 数字人文的理论虚无主义是有利的吗?单靠数字(Just make it without thinking)真的能振兴人文吗?
  2. 数字人文的定义一定是排他的吗?大帐篷下不能有小桌子吗?
  3. DH真的已经胜出了吗?前景一定是乐观的吗?What will be left for DH when every Humanity becomes digital?
  4. 人类记忆依靠技术平台是能够长期可持续和经济的吗?
  5. 观念史的数字转向如何保证模型的可靠和有效?
  6. 技术进步是如此之快,如何选择合适的技术?如何让望远镜和显微镜不仅看到原本就有的事实,还能看到新的事实?
  7. 数字呈现在DH中与收集、建模、保存、利用是怎样的关系?花多少钱比较合适?
  8. 大家都需要的GIS平台何时能实现?每个人可以如何贡献?
  9. DH专业教育如何振兴?特别是国内,如何体制化?
  10. 数字学术交流如何更学术、更创新?
  11. 如何建设通用DH的计算设施平台服务?
  12. 东西方数字人文的差异是一种中国特色吗?应该强调还是应该淡化?

本次会议扽主题“比较视野的数字人文反思”其实刚刚开始,恭逢盛事,深感荣幸。我这里代替东道主先要感谢一下 远道而来的Simon、Roopika、Alex,使我们的主题具有了现实性,许多相同的问题让我们感同身受,不同的思考和解决方案也给我们带来了新鲜感,很有启发。

从大家的笑脸我可以感到,这是一次成功的大会,胜利的大会,我们东道主大老板及她的团队付出了辛勤的劳动,表示感谢。期待我们有下一次研讨会,更期待我们能形成一定的共识并开展一定的合作。

只有我们一起努力,DH的未来才会是真正乐观的。让我们共同努力!

21位DH学者谈数字人文

值得一看的一组视频,带中文字幕。需科学上网,工具自备。

My Digital Humanities – Part 1: https://www.youtube.com/watch?v=I8aRtHW3b6g

Stéfan Sinclair – McGill University, 
Geoffrey Rockwell – University of Alberta, 
Laura Mandell – Texas A&M University, 
Bryan Carter – University of Arizona, 
Claire Clivaz – Swiss Institute of Bioinformatics, 
Bill Endres – University of Oklahoma

My Digital Humanities – Part 2: https://www.youtube.com/watch?v=WdSTQwI5Qz4 

Toma Tasovac from the Belgrade Center for Digital Humanities who gives his own definition of Digital Humanities. In this video, Toma addresses both sides of the Digital Humanities coin. On the one hand, he argues that DH runs the risk of becoming a ‘decontextualiser of the traditional humanities turning everything into conveyor belt scholarship’. On the other hand, he believes that DH enables deeper and more meaningful engagements with our (digitised) cultural heritage in ways and forms that were not available before

My Digital Humanities – Part 3: https://www.youtube.com/watch?v=FAODJW5ytd0 

Kenneth Price (University of Nebraska), 
Elena Pierazzo (Université Grenoble Alpes), 
Elli Bleeker (University of Antwerp), 
Patricia Murrieta Flores (University of Chester), 
James Cumming (University of Oxford)

My Digital Humanities – Part 4: https://www.youtube.com/watch?v=iLqEkXvhPu8

Roderick Coover (Temple University),
Angel D. Nieves (Hamilton College), 
Kathryn Sutherland (University of Oxford), 
Marjorie Burghart (Centre National de la Recherche Scientifique),
Paul Eggert (Loyola University Chicago)

My Digital Humanities – Part 5: https://www.youtube.com/watch?v=4Pvi2J61P0g

Joris van Zundert (Huygens Institute for the History of the Netherlands)
Graeme Earl (University of Southampton/King’s College London)
Mathew Vincent (Bruno Kessler Foundation) 
Federico Meschini (Tuscia University).

数字人文系统有没有“需求”?

问:基于自己对现有文献的了解,我有一个基本印象:数字人文的相关研究似乎更侧重在“技术”这件事本身,似乎学者们将研究的重心更多的放在如何去更好的用技术去成就事情。包括您昨天的课,很大程度上也在强调基础设施、平台、资源以及数字人文行为;但是是不是跳过了一个东西,那就是需求呢?所以我的问题是:(1)图书馆在建设关于数字人文相关平台的时候,是如何去权衡这个需求的?是根据人文学者的需求吗?还是图书馆觉得应该有这样一个平台?(2)图书馆建成这个平台后,人文学者的利用率高吗?是人文学者利用的更多,还是普通用户?最后用于人文的学术研究更多还是普及知识的作用更多呢?(3)昨天您也提到了,也是我想问的,图书馆如何去吸引和鼓励人文学者和其他用户使用相关基础设施的?

答:感谢来函提问,非常好的问题,就这个问题我的思考如下,仅供参考。

1.需求分析法是构建一个系统或平台所必须步骤,但却不是做一件创新的事情所必须步骤。科学研究和艺术创作最早完全是因为人类的好奇心使然,是一种娱人娱己,说句直白的话,人文基本上是人吃饱了饭没事干才想到的事情,所以并非所有的事情都由需求来驱动和引导的,那样就非常功利了,与动物就没啥两样了。
2.很多时候需求是创造和引导出来的。英国人喝茶完全是中国和印度带过去的,没有手机的时候怎么知道手机能不能卖掉?
3.图书馆建设数字人文平台时其实一开始是模拟人文学者传统的研究方式,比如检索、比较、统计,等等,用技术能够更快更精确更大范围地检索,就像电子书是对纸本书的模拟一样,一开始总是模仿,然后再有突破。你能够帮到他,那就是满足了他的需求,即便不是所有人都会用,但总有一批先行者,带动研究范式但转变。
4.在开发系统但时候必须要有需求分析的过程,系统设计的依据是需求设计,否则就无法开发出良好的系统。我们数字人文系统平台的研发通常有三类人参与:领域专家、图书馆员和软件开发人员,其中图书馆员往往充当需求设计者,他们把学者的研究行为转化为程序员能够看懂的说明书。
5.人文学者是不是利用率高,首先需要明确的是,未来的人文学者一定是基于数据进行研究的,当所有的素材都是原生数字资源的时候,他们别无选择。至于这个平台是不是图书馆来提供,这其实是不重要的,因为总要有人来做这个事情,目前因为图书馆有大量的人文内容是稀缺资源,是研究者不可或缺的。

爱迪生从来不是根据需求进行发明创造的,乔布斯也不会迎合需求而让自己的产品设计有所妥协,如果说有需求,他们自己就是需求者。一切开发源自需求是一个伪问题,尤其不能让这个问题禁锢思维和束缚手脚。系统好不好是可以迭代开发的,不好了可以推倒重来。