数据挖掘导论

出版时间:2010-12-10  出版社:人民邮电出版社  作者:Pang-Ning Tan,Michael Steinbach,Vipin Kumar  页数:463  译者:范明,范宏建  
Tag标签:无  

前言

自从我和孟小峰等人翻译J. Han和M. Kamber的《数据挖掘:概念与技术》以来,我们高兴地看到数据挖掘的研究正在我国蓬勃开展。许多学者和研究人员都对这个新兴的学科领域表现出了极大的兴趣,他们之中不仅有来自数据库领域的专家,而且不乏统计学、人工智能和模式识别、机器学习等领域的研究者。国内的学者和研究者在数据挖掘方面的研究已经取得了一些令人鼓舞的成果,并且正在逐渐与国际学术界同步。 数据挖掘的产生和发展一直是分析和理解数据的实际需求推动的。数据挖掘研究的进展也正是在于一直重视与其他领域研究者的合作。数据挖掘从工业、农业、医疗卫生和商业的需求中获得动力,从统计学、机器学习等领域的长期研究与发展中汲取营养。我们相信,只要有理解数据的需求,就有推动数据挖掘研究与应用发展的动力;只要依靠多学科的团队,就能应对新的数据分析任务带来的挑战。 P. Tan、M. Steinbach和V. Kumar编写的这本《数据挖掘导论》是继《数据挖掘:概念与技术》一书之后的另一本重要的数据挖掘著作。三位作者都从事数据挖掘研究多年,其中Vipin Kumar教授是数据挖掘和高性能计算领域的国际知名学者。本书原版在正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。J. Han教授也高度评价该书:“这是一本全新数据挖掘的教材,值得大力推荐。它将成为我们的主要参考书。” 本书不需要读者具备数据库背景,只需要少量统计学或数学背景知识,而且取材涉及的学科和应用领域较多,实用性强,因此适合的读者面较广。本书强调如何用数据挖掘知识解决各种实际问题,强调所挖掘的知识模式的评估。例如,就像我们能够从天空中的白云想象出各种动物和物体一样,每个聚类算法能够从几乎所有的数据集中发现聚类。如果数据集合中根本不存在自然的簇,所产生的聚类很难说具有实际意义。 全书共分10章。范明负责第1~8章的翻译,范宏建负责第9章和第10章的翻译。蒋宏杰、贾玉祥、许红涛和温箐笛也参加本书的最初翻译工作。全书的译文由范明负责统一定稿。在翻译的过程中,对发现的错误进行了更正,并得到原书作者的确认。 感谢P. Tan、M. Steinbach和V. Kumar为中文版撰写序言。感谢人民邮电出版社图灵公司的编辑们,他们在第一时间内引进本书,并组织翻译,使得中文版能够如此之快地与读者见面。

内容概要

本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。  本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。

作者简介

陈封能(Pang-Ning Tan)现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。此前,他曾是明尼苏达大学美国陆军高性能计算研究中心副研究员(2002-2003)。
  斯坦巴赫(Michael Steinbach)明尼苏达大学计算机与工程系研究员,在读博士。
  库玛尔(Vipin Kumar)明尼苏达大学计算机科学与工程系主任,曾任美国陆军高性能计算研究中心主任。他拥有马里兰大学博士学位,是数据挖掘和高性能计算方面的国际权威,IEEE会士。
  范明,郑州大学信息工程学院教授,中国计算机学会数据库专业委员会委员、人工智能与模式识别专业委员会委员,长期从事计算机软件与理论教学和研究。先后发表论史40余篇。
  范宏建 澳大利亚墨尔本大学计算机科学博士。先后在WWW、PAKDD、RSFDGrC、IEEE GrC和Australian AI等国际学术会议和IEEE Transactions on Knowledge and Data Engineering发表论文10余篇。目前是澳大利亚AUSTRAC的高级分析师。

书籍目录

第1章 绪论  1.1 什么是数据挖掘  1.2 数据挖掘要解决的问题  1.3 数据挖掘的起源  1.4 数据挖掘任务  1.5 本书的内容与组织   文献注释  参考文献  习题 第2章 数据  2.1 数据类型   2.1.1 属性与度量   2.1.2 数据集的类型  2.2 数据质量   2.2.1 测量和数据收集问题   2.2.2 关于应用的问题  2.3 数据预处理   2.3.1 聚集   2.3.2 抽样    2.3.3 维归约   2.3.4 特征子集选择    2.3.5 特征创建   2.3.6 离散化和二元化    2.3.7 变量变换   2.4 相似性和相异性的度量   2.4.1 基础    2.4.2 简单属性之间的相似度和相异度   2.4.3 数据对象之间的相异度   2.4.4 数据对象之间的相似度   2.4.5 邻近性度量的例子   2.4.6 邻近度计算问题    2.4.7 选取正确的邻近性度量  文献注释  参考文献   习题 第3章 探索数据  第4章 分类:基本概念、决策树与模型评估 第5章 分类:其他技术 第6章 关联分析:基本概念和算法 第7章 关联分析:高级概念 第8章 聚类分析:基本概念和算法 第9章 聚类分析:其他问题与算法  第10章 异常检测 文献注释 参考文献  习题 附录a 线性代数 附录b 维归约  附录c 概率统计 附录d 回归  附录e 优化

章节摘录

插图:空间数据的重要例子是科学和工程数据集,其数据取自二维或三维网格上规则或不规则分布的点上的测量或模型输出。例如,地球科学数据集记录在各种分辨率(如每度)下经纬度球面网格点(网格单元)上测量的温度和气压(见图2-4d)。另一个例子,在瓦斯气流模拟中,可以针对模拟中的每个网格点记录流速和方向。5.处理非记录数据大部分数据挖掘算法都是为记录数据或其变体(如事务数据和数据矩阵)设计的。通过从数据对象中提取特征,并使用这些特征创建对应于每个对象的记录,针对记录数据的技术也可以用于非记录数据。考虑前面介绍的化学结构数据。给定一个常见的子结构集合,每个化合物都可以用一个具有二元属性的记录表示,这些二元属性指出化合物是否包含特定的子结构。这样的表示实际上是事务数据集,其中事务是化合物,而项是子结构。在某些情况下,容易用记录形式表示数据,但是这类表示并不能捕获数据中的所有信息。考虑这样的时间空间数据,它由空间网格每一点上的时间序列组成。通常,这种数据存放在数据矩阵中,其中每行代表一个位置,而每列代表一个特定的时间点。然而,这种表示并不能明确地表示属性之间存在的时间联系以及对象之间存在的空间联系。但并不是说这种表示不合适,而是说分析时必须考虑这些联系。例如,在使用数据挖掘技术时,假定属性之间在统计上是相互独立的并不是一个好主意。

编辑推荐

《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。《数据挖掘导论(完整版)》与许多其他同类图书不同,《数据挖掘导论(完整版)》将重点放在如何用数据挖掘知识解决各种实际问题。只要求具备很少的预备知识——不需要数据库背景,只需要很少的统计学或数学背景知识。《数据挖掘导论(完整版)》中包含大量的图表、综合示例和丰富的习题,并且使用示例、关键算法的简洁描述和习题,尽可能直接聚焦于数据挖掘的主要概念。教辅内容极为丰富,包括课程幻灯片、学生课题建议、数据挖掘资源(如数据挖掘算法和数据集)、联机指南(使用实际的数据集和数据分析软件,《数据挖掘导论(完整版)》介绍的部分数据挖掘技术提供例子讲解)。

图书封面

图书标签Tags

评论、评分、阅读与下载


    数据挖掘导论 PDF格式下载


用户评论 (总计141条)

 
 

  •   《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。很好的书。
  •   开学时买的书,一个学期的学习觉得这本书非常适合初学者。内容注重概念的理解,弱化了数学推理的过程,对于数据挖掘中的基本概念如分类和聚类等都解释的通俗易懂。
  •   数据挖掘上学时没认真听,弄到工作了,需要用到数据挖掘了,还要自己去自学,于是就买一本导论,基础一点的,这样容易上手,往后再买进阶的书籍。现在刚收到书,还没仔细看,但估计书的内容不会差到哪里去的。好好学习!!!
  •   书不错,纸质也不错,比一起买的《数据挖掘概念与技术(原书第2版)》纸质好多了。
  •   国外很多大学用这本书作教材。本人读过好多本数据挖掘方面的书,个人感觉这本比较适合入门,且相关内容解释得恰到好处,既非长篇大论,亦非偷懒引用,可见作者功力非凡。
  •   内容详实,对数据挖掘的概念介绍的很清楚
  •   别看什么《数据挖掘 概念与技术》了
  •   这是一本系统性地介绍数据挖掘理论与技术的图书,非常适合入门到潜心钻研的人士。
  •   书不错,纸张很好。就是送书的时候没包装,导致书脚那块坏了一点。这个核另外一本《数据挖掘概念》都不错。
  •   比较适合想对数据挖掘进行较深入研究了解的人士。
  •   多方位介绍了数据挖掘知识,入门必读。。
  •   数据挖掘系列丛书中质量不错的书,值得购买
  •   从知乎知道的这本书,目前在做数据分析 ,但是想从事数据仓库或挖掘可看,非常经典
  •   学习数据挖掘的童鞋都应该人手一本,这边书算是介绍得比较深入浅出
  •   学数据挖掘的必备教程,理论知识很充足
  •   书非常好 龙星计划数据挖掘的推荐用书
  •   经典的数据挖掘技术宝典,理论性非常强,知识面也很广
  •   适合对数据挖掘有兴趣的零基础的朋友
  •   一本非常好的数据挖掘书籍。 不仅适合初学者,对已经在行业工作的人也非常有帮助。行文流畅,翻译的也很不错。
  •   想了解下 数据挖掘 方面的东西,得好好读读了!
  •   数据挖掘中的好书,有点难度,对数学要求高
  •   这是一本比较经典的数据挖掘的书了吧,感觉很不错!
  •   很不错的书,做数据挖掘一定要看
  •   书不错,翻译的非常不错。质量也不错,是学数据挖掘的好书。。。
  •   学数据挖掘必看的书
  •   数据挖掘方面的入门书~
  •   作为初学数据挖掘的人来说是蛮不错的一本书
  •   这本书很不错,学习一下数据挖掘。
  •   数据挖掘领域不错的一本书
  •   深入浅出,适合刚接触数据挖掘的人
  •   这是一本十分经典数据挖掘书籍
  •   数据挖掘必备
  •   我以为就是一些商业数据的分析。结果里面涉及到数据库,数据结构,等更深的一些算法的东西,俺还消化不了,
  •   书的质量不错,送货也很快,可是使用10元优惠券后居然没有找到发票?
    早就知道这本书,需要了解更多数据挖掘,买来看,应该能有帮助。就是不知道里面一些数学的、计算机的知识能否理解。努力!
  •   大数据是当前比较热的前沿话题。如何研究和熟悉此类这些书是不错的
  •   还没读,感觉不错,对数据分析有帮助
  •   理论加实战的书都是好书。里面以论文和示例的形式阐述推荐算法,对实战有很好的指导意义
  •   书很好,讲得透彻,能实际使用,比那本《概念与技术》要实用得多。
  •   书收到了,服务态度很好,书的质量也很好,内容挺符合我的需求,对算法描述的很多,总之,很满意
  •   书的质量很好,东西很全面。内容还算比较新。算是导论吧!
  •   今天送到了,不愧是当当,送货速度很快啊,而且送货员态度还很好,很满意,收到之后大致翻着看了一下,应该是很不错的一本书,图文并茂的,而且讲的内容很多,很全面,但是看到了很多的数学公式,唉!对数学不感冒啊,真担心后面看起来效果会如何!但是书是好书,这点不容置疑!
  •   看得出是位认真的作者,每一章结尾有超多外文参考文献。作为研究生的入门教材不错
  •   作为初学者,看这本书实在是太好了,给我奠定了这门课很多的基本概念,对学习很有帮助!
  •   这本书介绍的知识比较广泛
  •   真是我们学校的研究生教材,老师推荐的。的确很好。
  •   我研究生导师推荐读的书,很不错哦
  •   对于专业人士可以研究研究非专业的只能了解
  •   比较深奥的书,需要花时间看
  •   这本书不需要说太多,大家都懂的.
  •   讲原理和简单应用,适合我这种初学者
  •   很不错,老师推荐的教材,摸起来纸质非常好,很有看的欲望!
  •   老师推荐的教材~中文版挺不错的~就是价格略高~
  •   由于要做毕业设计买的书,据说是很不错的教材,特地买回来看的。刚拿到手,很厚,400多页,印刷很不错。会好好看的。
  •   有用,不过对于没有数学基础的,确实难了!
  •   不错, 纸质厚实,摸起来感觉很舒服,具有一定的数学数学基础的人读起来会更容易一些。
  •   这本书是上课时用的自己充电的补充教材。
  •   不错,图书管里的书,都借走了,只好来买了,不过这么好的书也应该有自己的一本
  •   到货很快,书的质量很好,是正版,我在当当上买这本书比亚马逊上便宜,很开心!
  •   质量很棒,更重要的是,内容很好!
  •   少有的资料类书籍
  •   介绍很详实,有一定的难度,坚持看完会有收获,送货速度快!
  •   感觉内容比较全面
  •   帮老公买的,书的质量不错,他说挺专业的,有用
  •   书挺好,就是书在运送过程中被磕坏了,皱了
  •   纸质好,内容好。老师推荐的
  •   老师上课的教材,内容易懂,翻译的也不错。对于初学者和研究者都是很好的教材。
  •   发货速度还是一如既往的快,书的质量不错,就是封皮设计的不喜欢。内容肯定没的说,赶紧啃书了~~~
  •   书印刷和纸张都很好,内容还要细看
  •   书的味道有点重,内容没仔细看,不过感觉很全,但是不够详细
  •   内容挺细致的,书的质量也不粗
  •   书的内容不错,纸质也好,当当买书感觉持续良好
  •   挺好,挺全面
  •   非常好送货快,推荐大家
  •   上课要用,老师指定教材。就买呗。好坏不评论。
  •   指定教材~ 快递速度不错~
  •   一本有全局视野的入门型好书。即便是入门型,其提到的数学也足以让人对数学充满了敬意
  •   很好哦。下次买书就在这啦。
  •   书有一点难,但是质量很好,纸张很厚
  •   书不错 质量什么的都很满意
  •   新手接触,还不知道能接受到什么程度,但是书的目录和质量感觉都不错
  •   书纸质真好,看上去就特有质感。。。喜欢,嘿嘿
  •   书是正品,质量非常好
  •   书质量不错。。。,看了一部分了,挺好的
  •   大牛写的书,非常好。正在读。
  •   书的翻译质量很好,看得出来译者是行家。浅显易懂。
  •   书挺好的!送货速度也很快!
  •   浅显易读,循序渐进,翻译得也不错。可读性很强。是一本不错的书。
  •   书时好书,但貌似看不太懂,对我来说有点深奥了!
  •   第一次在当当上买书,感觉不错!
  •   买来看看,对这方面比较有兴趣,书不错,不是很枯燥。
  •   质量不错,是我要的书~很棒!
  •   书很好很正版,服务很贴心,以后会再来的
  •   人很好,书也很好,收藏。
  •   书还是很不错的,基于要有一定的水平才能读懂,请书友们慎重!
  •   很不错,已经在看了呢~
  •   给同事买的,同事反馈不错,很值的阅读的一本书。
  •   这本书很不错,很实用。当当价格很优惠
  •   本书逻辑体系严密,比较细致
  •   挺好的一本书,正在看
  •   是老师让买的,但是这本书是讲什么的以前没有接触。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7