统计学习方法

出版时间:2012-3  出版社:清华大学出版社  作者:李航  页数:235  
Tag标签:无  

内容概要

  统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
  《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。

作者简介

李航,日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任职于日本NEC公司中央研究所,现任微软亚洲研究院高级研究员及主任研究员。北京大学、南开大学、西安交通大学客座教授。研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘。

书籍目录

第1章 统计学习方法概论
 1.1 统计学习
 1.2 监督学习
 1.3 统计学习三要素
 1.4 模型评估与模型选择
 1.5 i~则化与交叉验证
 1.6 泛化能力
 1.7 生成模型与判别模型
 1.8 分类问题
 1.9 标注问题
 1.10 回归问题
 本章概要
 继续阅读
 习题
 参考文献
第2章 感知机
 2.1 感知机模型
 2.2 感知机学习策略
 2.3 感知机学习算法
 本章概要
 继续阅读
 习题
 参考文献
第3章众近邻法
 3.1 k近邻算法
 3.2 k近邻模型
 3.3 k近邻法的实现:kd树
 本章概要
 继续阅读
 习题
 参考文献
第4章 朴素贝叶斯法
 4.1 朴素贝叶斯法的学习与分类
 4.2 朴素贝叶斯法的参数估计
 本章概要
 继续阅读
 习题
 参考文献
第5章 决策树
第6章 逻辑斯谛回归与最大熵模型
第7章 支持向量机
第8章 提升方法
第9章 em算法及其推广
第10章 隐马尔可夫模型
第11章 条件随机场
第12章 统计学习方法总结
附录a 梯度下降法
附录b 牛顿法和拟牛顿法
附录c 拉格朗日对偶性
索引

章节摘录

版权页:   插图:   第1章 统计学习方法概论 本章简要叙述统计学习方法的一些基本概念.这是对全书内容的概括,也是全书内容的基础.首先叙述统计学习的定义、研究对象与方法;然后叙述监督学习,这是本书的主要内容;接着提出统计学习方法的三要素:模型、策略和算法;介绍模型选择,包括正则化、交叉验证与学习的泛化能力;介绍生成模型与判别模型;最后介绍监督学习方法的应用:分类问题、标注问题与回归问题. 1.1 统计学习 1.统计学习的特点 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科.统计学习也称为统计机器学习(statistical machine learning). 统计学习的主要特点是:(1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的;(2)统计学习以数据为研究对象,是数据驱动的学科;(3)统计学习的目的是对数据进行预测与分析;(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析;(5)统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论. 赫尔伯特•西蒙(Herbert A.Simon)曾对“学习”给出以下定义:“如果一个系统能够通过执行某个过程改进它的性能,这就是学习.”按照这一观点,统计学习就是计算机系统通过运用数据及统计方法提高系统性能的机器学习.现在,当人们提及机器学习时,往往是指统计机器学习. 2.统计学习的对象 统计学习的对象是数据(data).它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去.作为统计学习的对象,数据是多样的,包括存在于计算机及网络上的各种数字、文字、图像、视频、音频数据以及它们的组合. 统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提.这里的同类数据是指具有某种共同性质的数据,例如英文文章、互联网网页、数据库中的数据等.由于它们具有统计规律性,所以可以用概率统计方法来加以处理.比如,可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律. 在统计学习过程中,以变量或变量组表示数据.数据分为由连续变量和离散变量表示的类型.本书以讨论离散变量的方法为主.另外,本书只涉及利用数据构建模型及利用模型对数据进行分析与预测,对数据的观测和收集等问题不作讨论。

编辑推荐

《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。

图书封面

图书标签Tags

评论、评分、阅读与下载


    统计学习方法 PDF格式下载


用户评论 (总计110条)

 
 

  •   介绍的很系统,有理论分析,也有实例分析,对于理解各种统计学习算法很有帮助!
  •   统计学习方法 写的很棒
  •   统计学习方面很好的一本书,个人感觉对于实际应用来说值得一读
  •   书很好,对统计方法讲的很全面。
  •   听很多人推荐。。准备好好学习一下统计的基础知识
  •   对学习方法的总结
  •   这本书对机器学习领域内常见的概念做了简单直观而又清晰的描述。我认为很适合相关人员阅读。
  •   机器学习,数据挖掘必备书,比较好懂
  •   详细的数学推导和算法介绍
  •   这本书给了我很大帮助,尤其是机器学习方面,是我的入门教材,没有废话,全是从简单到复杂很详细很容易理解的公式推导!
  •   李航博士是机器学习领域的牛人啦,书的内容不那么全面和深,但作为一本入门书写到这样很不错了,赞一个!
  •   机器学习数学基础必须得会,书很不错,封面很简洁
  •   书的质量还是很不错的,价格有些小贵。里面全部都是原理的讲解,很适合喜欢数学的程序员的学习。同时,纸的质量非常好。是一本值得收藏的好书。全书言简意赅,概念清楚,有些地方讲的不是很详细。总体来说,非常值得一买
  •   专业性较强,比较适合机器学习专业的人看。作为数学系的看起来很带感……
  •   结合STANFORD的机器学习课程看,很好
  •   学习统计学入门级书。
  •   数据挖掘的老师推荐的入门数学基本!!!
    内容很好!!!书的质量也很好!!!
  •   不错,非常利于现在的学习。
  •   机器学习方面的好书啊
  •   挺好的,适合学习,推荐看一下
  •   这本书适合搞数据挖掘的人看,我同事正在读博士,一口气买了4本。
  •   做数据挖掘的同学一定要看看! 很基础,很好!
  •   每章都是独立的 内容也挺不错 适合自学
  •   公式推导的很详细, 基本上都能看懂
  •   别看封面不就朴素,里面不少干货!
  •   书内内容涵盖比较广,而且单章成书,可以不顺序的看书,想用哪方面的知识都可以在书中查到.留着作为参考用的基础书,确实不错.
  •   需要很多数学知识。。
  •   介绍的有些简略,适合有一定基础的人来看
  •   书讲的很仔细,非计算机专业的也能看懂
  •   当天下单,当天送到。书的内容对于没有数学基础的人有点难啊
  •   好书,清新,干净的感觉。分门类,分主题,快速入门,文献索引。
  •   先前借同学的看过一些,读了感觉很不错,所以自己买一本,可以在书上做些笔记,以后用到还可以翻阅。内容很清楚,有很清楚的证明,还有例子,很喜欢。
  •   这两本书是我最近最期待看的书
  •   这本书短小精悍,内容翔实,比起市面上相关教材真是好的太多太多。说明作者对书中的内容确实是真懂,讲得深入浅出,不像其它的书写的都是一个抄一个,看似厚厚一本,读完毫无收获。强烈推荐
  •   讲的不错,深入浅出,但是,难度有些大,需要花功夫看。
  •   略显枯燥简单,但一本讲理论的书算不错的;这是一本给你理论轮廓的书,我自认读理论书籍,分为两步:1、知道理论的轮廓 2、看清大量的细节。这本书作用就是让你达到第一步的书
  •   李航老师的大作 书比较薄 适合拿在手边经常看下
  •   书的质量很好,送货的速度也挺快的。
  •   适合初学者,很好的书,值得推荐!!!!
  •   书很薄,但含金量高,发货快,好
  •   书是很好的,可能赶上活动物流有点慢,由于换了电话,我给快递打电话,那女的态度实在太差了,气死我了,本来好好的一次购物被那女的搅合了
  •   书是别人推荐的,虽然还没看,不过我相信一定是本好书!
  •   书德内容很好,而且很新。
  •   书很干净,完整。内容上作为一本初级入门书籍,还不错。
  •   国内最好的书,不用多说
  •   开始第一本书拿过来很脏,然后走了换货流程,2天给换了,倍儿新的一本,不错不错
  •   周围很多人推荐这本书,可以当入门书籍。刚到手,看完再分享~~
  •   这本书还是不错的,但是讲得不够细致
  •   配送的好快呀,晚上下单,第二天一早就送达
  •   vip折扣的时候买的可以说很划算了
  •   整体感觉还不错,很满意,配送也很不错~
  •   好书!不得不说是一本写的很好的图书!看起来 很正!
  •   内容写得不错,适合初学者。
  •   java 的经典书籍
  •   非常适合入门级的同学阅读 很好
  •   李航老师的著作,久闻大名,不能不看
  •   讲的很基础,对入门很有帮助!
  •   还没有细看,用的时侯翻阅的
  •   还没开始看,不过翻了一下目录,大致看了一下内容,感觉还不错
  •   关注很久了。上次5折没买,现在8折卖的。噢~
  •   短小精干,挺好的
  •   实用,适合入门。
  •   值得一读,还是比较容易懂涵盖的范围比较广~不过至今仍然有很多不懂>__
  •   越看越想看,越看越爱看
  •   导师推荐的书目之一,写的比较容易看懂,挺好的,发货也很快
  •   看起来像教材,好有压力啊。。
  •   讲解清晰,比较到位。
  •   将各种概念讲的比较清楚。
  •   内容翔实,赞!
  •   相当的不错相当的不错相当的不错相当的不错
  •   对于各种统计学习方法都有较好的介绍,理论性不强,属于入门书籍
  •   是机器学习相关的算法理论的浓缩精品,需要一定基础来阅读,或是在阅读时查阅其他文献,书不厚但是内容充实,建议从事相关研究的研究生或是有志参与进来的本科生阅读。相关方面的理论启蒙丛书仅此一本。
  •   从微博上看到李老师的这本书,看过目录后觉得很喜欢~
    昨天拿到手的,整体感觉没有想象中的内容多,就像李老师自己说的,这是一本入门级的教材。
    书中有大量的数学公式,几乎每一页都是公式公式……如果特别讨厌数学的话,还是不要买了,呵呵
    李老师不愧是在这一行研究了这么久了,书中的内容总结的非常好,叙述也是通俗易懂,没有用很生涩的语言,而且配以实例,更加易懂,想做机器学习方面内容的,还是看看吧
  •   这本书,重点讲了统计学的具体学习方法,能够举一反三
  •   还没有读,不过书中大多是方法以及推导过程的论述,如果多些实例分析更好了。类似于《数学之美》那种
  •   对于想学习自然语言处理的人来说,此书是经典。
  •   关于机器学习关键算法的浓缩版 不错
  •   就有监督学习讲的比较深入,但是国内的书籍大都是教授式的,引人思考的不多
  •   写得不错,适于初学者学习。不过封面上写“著”字就不太厚道了
  •   正版书籍,专业书不能有错。支持正版。
  •   帮女儿买的,她说还不错,她的专业正需要。
  •   因为需要所以买了,没有特价也没啥特别的。
  •   比较简略,需要配合其他的书一起阅读。
  •   还没仔细看,粗略的翻了一下,感觉还不错,不过看这本书还是要有点数学基础的。
  •   书籍很好,还带着一层塑料薄膜纸。具体内容还未仔细看,别人推荐的。
  •   内容全面 质量也不错
  •   基本内容还算全面
  •   购买书的原因是推荐,不过该书对我深了点,暂时没来得及看
  •   导师推荐要看的书,就是现在的图书价格太贵了
  •   本书的受众主要为NLP/IR初学者或基础薄弱的实践者,对有监督学习中一些常用方法提供了深度适中的理论阐释。优点:语言与内容安排相当精炼,数学表达也通俗易懂,特别适合拿不出大把时间去啃Hastie、Bishop或Duda那几本经典砖头的一众苦哔新人拿这本200页的书来在相对经济的时间里补充统计学习基本常识。缺点:本书没有覆盖无监督和半监督学习的常见方法(作者好像在前言中提及可能打算放到以后的写作中)。此外,既然目标是为NLP/IR人士提供参考,希望下一版作者可以根据相关高水平国际会议上的见闻,在每章增加一节专门介绍一下有关方法较为新颖和巧妙的应用。算得上一本值得购买的书,给四点五分四舍五入顺便期待下一版。
  •   很好的数据挖掘分类算法介绍资料
  •   书籍是正版不错,发货速度也可以。价格也做出了优惠~关键是,书的一角已经严重磨损!换书的话太麻烦,但我希望商家本着信誉至上的原则,不能因为是网购就给与磨损的书。而如果给与用户磨损的书,你就应该给与折扣!我经常在亚马逊买东西,但却是为数不多的评论。希望商家改正,不要再出现这样的事情
  •   这本书主要讲统计机器学习中的分类。整本书不厚,讲的比较精炼。包装完好无损,印刷清晰,快递速度满意!
  •   讲的深不深,浅不浅。。。
  •   这本书适合大家学习机器学习的概念
  •   不是很有用的一本书,收藏价值很一般
  •   通俗易懂,介绍了多个经典模型。
  •   送货速度很快,晚上下单,第二天下午就到了。书的内容很好,质量也很好,纸质不错~~
  •   书很给力,是正版的,店家还用了缓冲泡包装袋给装的。但是比较悲剧的是快递有点儿不给力,把书弄折了一点儿。
  •   同学推荐的,很详细很不错
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7