计算机科学对语言的研究

计算机科学对语言的研究(包括对自然语言和对人工语言)大致有三个路向:语法syntax语义semantics语用pragmatics, 语法研究语言的形态结构,语义研究语言与其所指代对象的联系,语用研究语言和其使用者之间的联系(从使用者角度、按使用者的需求对语料进行差异化)。计算 机没有智能,计算机智能都是假的,是人给它安装上去的(像是变魔术,有人创造,目的在骗人,当然达到了目的:娱乐、教育、传递信息等),所以计算机语言最 大的特点是形式化(Formalization,包含规范化Normalization的意思),计算机语言的形式化分为语法形式化和语义形式化两个方面,形式语义学研究语义形式化,包括操作语义学、指称语义学、公理语义学和代数语义学四种。具体可参考:

  • 陆汝钤,计算机语言的形式语义.北京:科学出版社,1992
  • 屈延文,形式语义学基础与形式说明.北京:科学出版社,1998
  • 周巢尘,形式语义学引论,长沙:湖南科学技术出版社,1985

另外上海师范大学物理信息学院陈仪香教授对此也有深入研究。以下对四种语义学的简介来即自陈教授”形式语义的论语理论研究进展”一文(见下列著作第二章:陆汝钤主编,《知识科学与计算科学》.北京:清华大学出版社,2003)

  1. 操作语义的基本思想是建立一个抽象机器以模拟程序在执行过程中如何进行数据处理。
  2. 指称语义的思想是使语言的每一成分对应于一个数学对象,该对象称为该语言成分的指称,程序看作输入域到输出域的映射,输入域和输出域统称为论域。因此论域与映射是指称语义的基本研究对象。
  3. 公理语义实在程序正确性验证的基础上发展起来的,它给出一种方法,使人们在给定的前提下,验证某种特性是否成立。
  4. 代数语义的基本思想是把描述语义的逻辑体系和满足这个逻辑系统的各种模型统一在一起,同时把模型的集合看成是以代数机构,研究这些模型之间的关系。

戴维民主编的《信息组织》一书(高等教育出版社.2004 面向21世纪课程教材)中认为语法、语义和语用信息的分法是按照信息组织的层次分,具体解释如下:
从认知的角度,可把信息分为语法信息、语义信息和语用信息。由于主体具有观察力,能够感知事物运动状态及其变化方式的外在形式,由此获得的信息称为语法 信息;由于主体具有理解力,能够领悟事物运动状态及其变化方式的逻辑含义,由此获得的信息称为语义信息;又由于主体具有明确的目的性,能够判断事物运动状 态及其变化方式的效用,由此获得的信息称为语用信息。
有一定道理,好像又不是很确切。不知道这种理解出自何处?语言学?哲学?认识论?