统计自然语言处理

出版时间:2008-5  出版社:清华大学出版社  作者:宗成庆  页数:475  
Tag标签:无  

内容概要

本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。    本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。

作者简介

宗成庆,1998年3月毕业于中国科学院计算技术研究所,获博士学位。1998年5月至2000年4月在中国科学院自动化研究所模式识别国家重点实验室从事博士后研究,博士后出站以后留在模式识别国家重点实验室工作至今。曾于1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)

书籍目录

第1章 绪论  1.1 基本概念   1.1.1 语言学与语音学  1.1.2 自然语言处理  1.1.3 关于“理解”的标准 1.2 自然语言处理研究的内容和面临的困难  1.2.1 自然语言处理研究的内容  1.2.2 自然语言处理涉及的几个层次  1.2.3 自然语言处理面临的困难 1.3 自然语言处理的基本方法及其发展  1.3.1 自然语言处理的基本方法  1.3.2 自然语言处理的发展 1.4 自然语言处理的研究现状第2章 预备知识 2.1 概率论基本概念  2.1.1 概率  2.1.2 最大似然估计  2.1.3 条件概率  2.1.4 贝叶斯法则  2.1.5 随机变量  2.1.6 二项式分布  2.1.7 联合概率分布和条件概率分布  2.1.8 贝叶斯决策理论  2.1.9 期望和方差 2.2 信息论基本概念  2.2.1 熵  2.2.2 联合熵和条件熵  2.2.3 互信息  2.2.4 相对熵  2.2.5 交叉熵  2.2.6 困惑度  2.2.7 噪声信道模型 2.3 支持向量机  2.3.1 线性分类  2.3.2 线性不可分  2.3.3 构造核函数第3章 形式语言与自动机 3.1 基本概念  3.1.1 图  3.1.2 树  3.1.3 字符串 3.2 形式语言  3.2.1 概述  3.2.2 形式语法的定义  3.2.3 形式语法的类型  3.2.4 CFG识别句子的派生树表示 3.3 自动机理论  3.3.1 有限自动机  3.3.2 正则文法与自动机的关系  3.3.3 上下文无关文法与下推自动机  3.3.4 图灵机  3.3.5 线性界限自动机 3.4 自动机在自然语言处理中的应用  3.4.1 单词拼写检查  3.4.2 单词形态分析  3.4.3 词性消歧第4章 语料库与词汇知识库 4.1 语料库技术  4.1.1 概述  4.1.2 语料库语言学的发展  4.1.3 语料库的类型  4.1.4 典型语料库介绍  4.1.5 汉语语料库建设中的问题 4.2 词汇知识库  ……第5章 语言模型第6章 隐马尔可夫模型第7章 汉语自动分词与词性标注第8章 句法分析第9章 语义消歧第10章 统计机器翻译第11章 语音翻译第12章 文本分类第13章 信息检索与问答系统第14章 自动文摘与信息抽取第15章 口语信息处理与人机对话系统附录 项目作业名词术语索引参考文献

章节摘录

  第1章 绪论  1.1 基本概念  1.1.1 语言学与语音学  我们知道,语言作为人类特有的用来表达情感,交流思想的工具,是一种特殊的社会现象,由语音、词汇和语法构成。语音和文字是构成语言的两个基本属性,语音是语言的物质外壳,文字则是记录语言的书写符号系统〔黄伯荣等,1991〕。  根据《现代语言学词典》〔克里斯特尔,2002〕的定义,语言学(linguistics)是指对语言的科学研究。作为一门纯理论的学科,语言学在近期获得了快速发展,尤其从20世纪60年代起,已经成为一门知晓度很高的广泛教授的学科。  根据语言学家的注意中心和兴趣范围,语言学可以区分为一些不同的分支,例如,历时语言(diachronic linguistics)或称历史语言学(historical linguistics)、共时语言学(synchronic linguistics)、一般语言学(descriptive linguistics)、理论语言学(theoretical linguistics)、描述语言学(descriptive linguistics)、对比语言学(contrastive linguistics)或类型语言学(typological linguistics)、结构语言学(structural linguistics)等。  语音学(phonetics)是研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。语音学一般有三个分支:①发音语音学(articulatory),研究发音器官是如何产生语音的;②声学语音学(acoustic phonetics),研究口耳之间传递语音的物理属性;③听觉语音学(auditory phonetics),研究人通过耳、听觉神经和大脑对语音的知觉反应。仪器语音学(instrumendal phonetics)则是利用各种物理设备,如测量气流或分析声波的仪器等,来研究上述三个问题的任一方面〔克里斯特尔,2002〕。

编辑推荐

  《中文信息处理丛书·统计自然语言处理》可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。

图书封面

图书标签Tags

评论、评分、阅读与下载


    统计自然语言处理 PDF格式下载


用户评论 (总计69条)

 
 

  •   虽然统计机器翻译已经成为主流,但是系统地把方方面面的最新内容综合在一起的书还确实没有.虽然因为时间原因还没有仔细阅读,但是相信对自然语言处理方面的初学者还是非常有用的.
  •   该书系统介绍了自然语言处理中最新的一些理论和方法,对从事自然语言处理研究的人有很好的理论指导意义。书的封面设计的很有特色,给人一种厚重的感觉,我认为理论著作就应该是这种感觉,文字排版美观大方,纸张质量也不错,读起来感觉很舒适。总之这是一本非常值得收藏的书。
  •   除了国外翻译的书以外,全面系统的专门论述统计语言处理方法的中文图书很少。本书深入浅出的叙述了统计方法在语言处理各个领域的应用,是一本很好的学习资料和参考书。
  •   我一口气看完了这本书,书写的很好!
    内容非常丰富!
    确实是统计自然语言处理方面较全的书,很值得一看!

  •   这本书无论从排版还是内容都属精品。比较适合研究自然语言处理的科研人员使用,里面有很多算法,也有较新的方法。需要代码的就不必买了。
  •   自然语言处理这块有点偏,这本书已经算权威了。
  •   在自然语言处理领域中值得学习,可以考虑购买。

































































  •   对于自然语言处理入门的同学,是本好书
  •   理论性较强,最做自然语言处理有很大帮助
  •   中文信息处理的经典书籍,应该是国内相关领域排名靠前的著作,大家的作品
  •   自然语言的东东讲的比较全面系统,是不多的教材撒~~~
  •   很不错的一本书,尤其机器翻译部分帮助不小。
  •   互联网时代的重要技术。
  •   清华老师的讲义,书很厚很全面,要花大力气研究
  •   介绍得很详细,完全是数学,呵呵!
  •   还没有认真读。书应该不错吧。中文nlp,要认真读。
  •   读过好几章了,觉得很难看懂,很抽象,要是有具体的案例分析那该有多好的。
  •   这书还是很好的,比较全面
  •   有些地方写的有问题。
  •   很喜欢的一本书,虽然图书馆有,还是忍不住入手为私有!
  •   书的品质和内容都不错!学习NLP的好书。
  •   书不错内容也很好
  •   第一版就是我做搜索引擎入门的书,第二版加入了一些新的内容,非常好。尤其是最后一章,性能调试,真的非常棒,受益匪浅。
  •   此书内容丰富,是一本好书
  •   书的内容真的很有真谛!
  •   非常好,很优惠。就是送货图中耽搁了下,没满足我新年看新书的愿望~
  •   国人写的书中相当不错的了。。。
  •   是国内领先的系统性、理论性很强的NLP书籍。
  •   速度快 服务好 质量没的说
  •   送货快,比书店里买还实惠,非常好!
  •   忙过这几天就开读.........
  •   正品,送货效率也不错!
  •   没开发票啊,失误了
  •   需要学一下这书,学长推荐的。
  •   用心写的书啊
  •   服务不错,基本祥实.
  •   主要介绍了当今统计自然语言处理的热门技术及发展现状。但没有对一些技术进行深入讲解,是一本较好的入门级参考文献。
  •   内容很全面,但是基本算法都是点到而止,这样一个厚度的书,也就只能写到这么多了,统计自然语言很多值得研究的地方,不是一本书可以积累的
  •   此书是国内自然语言处理领域第一层次的书了,值得一看
  •   该图书较全面的介绍了汉文信息处理,当然不是中文,对中文和汉文的区别不甚了解,建议您阅读“通用文字法”...
  •   这本书呢 整体上来讲 还不错,虽然绝大部分章节都是按照国外的原文翻译的,但是也有很高的参考价值,只是希望作者能够在外文原文的基础上能给出适当的例子,这样感觉更好些,比如第五章的“语言模型”,虽然,前两个算法有例题,但是后面的平滑算法就没有,当然原论文也是没有的,如果作者能够给予添加适当的例题,这样才是好书,要不就是成翻译书了。
    总体上推荐购买!
  •   还不错,不过需要一些数理统计的知识基础才能看得很明白。在国人写的书里面算是上品了。正在搞文本挖掘的项目,这书给了很大的帮助,顶一个
  •   自然语言类的好书,,是正版的,,值得一看
  •   是本好书,要是把书名改《机器翻译》然后去掉一些根本没有用心写的章节那就经典了!
  •   比较全面的介绍 比较理论 深度不够 具体算法描述的还不够细致
  •   感觉这本书还不错,内容很全面,适合我这样的初学者
  •   内容比较细致,有点教材的感觉,照顾到了初学者。
  •   经典教材,慢慢理解
  •   这本书是相当经典的一本书,我的导师一直推荐我们看这本书。这本书确实很好,很值得一读啊。
  •   纸张 印刷质量都不错,送货也很快,内容更好 。
  •   印刷质量还可以,就是书被压搓变形了
  •   书内页有20多页一摸就掉了,可能装订的时候不太留心。希望能检查书的质量,保证服务的品质。
  •   跟图书馆借来的书刚好形成了对比,不过质量还是过得去的。
  •   书不错,送货很快,态度很好。
  •   刚开始学习,貌似还不错!
  •   帮老师买的,送货很快,态度也不错,书也很好,总体不错啦!
  •   给老公买的,没有听到他说什么不好的
  •   这本书基本上是把一些理论堆砌在了一起,许多只是简单性的介绍,缺少例子,书中的公式缺乏推倒,解释也不全面,如果想真正学会点东西或技术,需要阅读书中提到的相关文献,自学此书有一定困难。可能本人水平有限,缺乏相应基础...
  •   还在看,很多公式感觉写得不严谨。有些解释也写得不够清楚,可能还得再细看理解、参考论文再整理。
  •   教材书,必看的,推荐
  •   刚买回来,还没有仔细看!
    从目录上看,内容很丰富!
  •   前面几个章节还可以,再往后就都是数学公式,讲的比较笼统,不能让人很好地理解
  •   各种定理和大段公式,教科书类书籍,不适合入门阅读
  •   果然是大学教材书,里面全是理论。虽然这些思想很重要,但起码要告诉一点编程的技巧吧~~
  •   自然语言处理经典书籍
  •   统计自然语言处理
  •   不错的书,屯着慢慢看
  •   是正版书,内容不错哦
  •   自然语言处理的入门书
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7