依存语法的理论与实践

出版时间:2009  出版社:科学出版社  作者:刘海涛  页数:318  
Tag标签:无  

前言

  计算语言学是从多种角度研究如何通过计算机来模仿人类语言处理能力,并用这种能力解决语言交流问题的学科,它的终极目标是构造一个能懂人语、会说人话、可用自然语言进行交流的机器(刘海涛等2005,Hausser2001)。这个定义突出了计算语言学的两个特点:理论性和实践性。前者体现在为了模仿人的语言处理能力,我们必须对这种能力有深刻的认识,而且要把这种认识上升到一定的理论层面。如果这种认识不能用精确的方式表述出来,将会影响到最终目标的实现。后者说的是,计算语言学也应该能够解决实际问题,它是一种“应用驱动”的语言学研究。计算语言学的这种特性也使得技术现实对理论框架产生反作用和限制,说起来近乎完美的理论,如果现有的技术无法实现,那么也难以解决好实际问题。  关于计算语言学和语言学理论的关系问题,我们认为以下几点值得考虑:计算语言学需要语言学理论,这种理论不仅应该能够描述真实语料,而且也能用精确方法来表述;计算语言学有着高远的目标,这种目标虽然在可预见的将来可能难以完全实现,但这绝不意味着研究者可以忘记这种目标,而只满足于一种短视的灵巧做法;计算语言学家的任务不仅仅是构建一些语言信息处理的应用系统,他们也应该有能力从(语言学)理论的角度解释此类人造系统的行为;面向计算语言学的语言学理论是一种可以通过机器来验证的理论,如受技术所限,某些思想一时无法实现,可实现部分不但应能从理论上自圆其说,而且也应有足够的扩展能力。总之,为了让计算机能够处理人类语言,我们需要一套切实可行的(形式)语言学理论。

内容概要

本书的主要目的是,在充分了解前人有关依存关系、配价理论、依存形式化和依存句法分析方法的基础上,归纳出依存语法和配价理论的一般原理和方法,提出一套较完整的基于配价模式的依存语法分析框架,并用实验来证明这一框架的可行性。与此同时,我们也力图用本书提出的理论架构作为主线,将相关领域的主要研究成果串在一起,形成一部配价理论和依存语法研究的简史。    为了让国内读者更好地了解依存语法的一些基本思想和方法,本书在介绍其他学者的观点时,尽可能采用“引”而非“述”的方式,目的是为了更好地表现原义,减少误读率。在写作过程中,我们尽可能采用第一手的文献,所引外文资料一般均由作者自译。在计算语言学方法方面,本书对基于规则的方法和基于统计的方法都给予了足够的重视。理论求高、应用求实,是本书的基本方针。

书籍目录

冯志伟序Foreword理查德·哈德森序前言第1章 依存结构树  1.1  引言  1.2 泰尼埃之前的句法树  1.3 泰尼埃的图式  1.4 泰尼埃之后的依存树  1.5 依存树的一般特性和结构第2章 配价理论与配价词表  2.1  引言  2.2 泰尼埃与早前的配价研究  2.3 现代配价及依存理论研究概览  2.4 配价词典(表)的格式和框架  2.5 配价词表结构框架第3章 依存关系与汉语依存语法  3.1  引言  3.2 摩迪斯泰学派和泰尼埃的早期思想  3.3 其他学者关于依存关系的讨论  3.4 依存关系的属性和依存句法的构建 3.5 汉语依存语法  3.5.1 现代汉语词类体系  3.5.2 现代汉语依存关系 3.6 概率配价模式和汉语配价模式 3.7 汉语依存树库 3.8 小结第4章 依存语法形式化研究 4.1  引言 4.2 语言的形式化 4.3 泰尼埃的依存语法形式化体系 4.4 美国的依存语法形式化模型 4.5 基于特征结构的依存语法形式化体系 4.6 基于树结构的依存语法形式化理论 4.7 基于约束的依存语法形式化研究 4.8 德国的依存语法形式化研究 4.9 基于配价模式的依存语法形式化模型 4.10 依存语法和短语结构语法的等价陛 4.11 小结第5章 依存句法分析  5.1  引言  5.2 句法分析的概念及定义  5.3 基于泰尼埃理论的依存句法分析  5.4 基于上下文无关文法的依存句法分析  5.5 基于扩展上下文无关文法的依存分析  5.6 基于约束的依存句法分析……第6章 基于规则的汉语依存句法分析第7章 基于树库的汉语依存句法分析第8章 基于依存树库的汉语计量研究参考文献结语后记作者简介

章节摘录

  第1章 依存结构树  1.1 引言  计算语言学应用及其研究始于20世纪50年代。近60年来,新的理论和方法层出不穷,但许多人认为学科的实际进展还是过于缓慢。  传统的计算语言学方法是由语言学家人工从大量的语言材料中提取出词汇、语法、语义等各种规则,然后想办法让机器来搞明白这些规则,进而可以处理语言。这种方法的理论基础和哲学根源大致就是经乔姆斯基发扬光大的洪堡特的名言“语言是有限手段的无限运用”。遗憾的是,在大量研究和尝试后,人们发现规则的有限性并不意味着它的普遍可操作性。换言之,在语言分析和生成的过程中,就目前人类对于语言的认知水平而言,所谓的“有限手段”可能仍然是一种理论上的说法。在实践方面,不可控或无法穷尽的“有限”还是一种无限。由于理解(分析)过程和生成过程中涉及的要素有所不同,用“生成”的观点和语言理论来做分析也总是有些捉襟见肘。所有这些问题,导致20世纪90年代以来,在计算语言学界刮起了一股“经验主义”的旋风。所谓“经验主义”就是一种基于数据的方法,一种基于语料库的方法,一种基于概率统计的方法。在我们看来,经验主义方法的本质在于:通过自动的方法从语料中提取出计算机处理自然语言所需要的知识,并且将这些知识用易于计算机操作的方式表示出来。这一过程可以说是对人类语言知识获得过程的计算机模拟。

图书封面

图书标签Tags

评论、评分、阅读与下载


    依存语法的理论与实践 PDF格式下载


用户评论 (总计3条)

 
 

  •   好。速度快。但还来不及看内容。
  •   给别人买的说是不错
  •   内容比较翔实,对于初学者来说可以有个比较全面的了解。但是全书的表述感觉比较拗口,且在术语的使用上有意区别于学界常用的术语,不知为何。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7