出版时间:2012-3 出版社:清华大学出版社 作者:李航 页数:235
Tag标签:无
内容概要
统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。
作者简介
李航,日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任职于日本NEC公司中央研究所,现任微软亚洲研究院高级研究员及主任研究员。北京大学、南开大学、西安交通大学客座教授。研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘。
书籍目录
第1章 统计学习方法概论
1.1 统计学习
1.2 监督学习
1.3 统计学习三要素
1.4 模型评估与模型选择
1.5 i~则化与交叉验证
1.6 泛化能力
1.7 生成模型与判别模型
1.8 分类问题
1.9 标注问题
1.10 回归问题
本章概要
继续阅读
习题
参考文献
第2章 感知机
2.1 感知机模型
2.2 感知机学习策略
2.3 感知机学习算法
本章概要
继续阅读
习题
参考文献
第3章众近邻法
3.1 k近邻算法
3.2 k近邻模型
3.3 k近邻法的实现:kd树
本章概要
继续阅读
习题
参考文献
第4章 朴素贝叶斯法
4.1 朴素贝叶斯法的学习与分类
4.2 朴素贝叶斯法的参数估计
本章概要
继续阅读
习题
参考文献
第5章 决策树
第6章 逻辑斯谛回归与最大熵模型
第7章 支持向量机
第8章 提升方法
第9章 em算法及其推广
第10章 隐马尔可夫模型
第11章 条件随机场
第12章 统计学习方法总结
附录a 梯度下降法
附录b 牛顿法和拟牛顿法
附录c 拉格朗日对偶性
索引
章节摘录
版权页: 插图: 第1章 统计学习方法概论 本章简要叙述统计学习方法的一些基本概念.这是对全书内容的概括,也是全书内容的基础.首先叙述统计学习的定义、研究对象与方法;然后叙述监督学习,这是本书的主要内容;接着提出统计学习方法的三要素:模型、策略和算法;介绍模型选择,包括正则化、交叉验证与学习的泛化能力;介绍生成模型与判别模型;最后介绍监督学习方法的应用:分类问题、标注问题与回归问题. 1.1 统计学习 1.统计学习的特点 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科.统计学习也称为统计机器学习(statistical machine learning). 统计学习的主要特点是:(1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的;(2)统计学习以数据为研究对象,是数据驱动的学科;(3)统计学习的目的是对数据进行预测与分析;(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析;(5)统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论. 赫尔伯特•西蒙(Herbert A.Simon)曾对“学习”给出以下定义:“如果一个系统能够通过执行某个过程改进它的性能,这就是学习.”按照这一观点,统计学习就是计算机系统通过运用数据及统计方法提高系统性能的机器学习.现在,当人们提及机器学习时,往往是指统计机器学习. 2.统计学习的对象 统计学习的对象是数据(data).它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去.作为统计学习的对象,数据是多样的,包括存在于计算机及网络上的各种数字、文字、图像、视频、音频数据以及它们的组合. 统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提.这里的同类数据是指具有某种共同性质的数据,例如英文文章、互联网网页、数据库中的数据等.由于它们具有统计规律性,所以可以用概率统计方法来加以处理.比如,可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律. 在统计学习过程中,以变量或变量组表示数据.数据分为由连续变量和离散变量表示的类型.本书以讨论离散变量的方法为主.另外,本书只涉及利用数据构建模型及利用模型对数据进行分析与预测,对数据的观测和收集等问题不作讨论。
编辑推荐
《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。
图书封面
图书标签Tags
无
评论、评分、阅读与下载