数据挖掘

出版时间:2012-3  出版社:机械工业出版社  作者:(美)Jiawei Han,(加)Micheline Kamber,(加)Jian Pei  页数:703  
Tag标签:无  

内容概要

  当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
  本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那这本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。
  本书特点
  引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
  讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。
  全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。  

作者简介

  Jiawei Han(韩家炜) 伊利诺伊大学厄巴纳-尚佩恩分校计算机科学系Abel
Bliss教授。由于在数据挖掘和数据库系统领域卓有成效的研究工作,他曾多次获得各种荣誉和奖励,其中包括2004年ACM
SIGKDD颁发的最佳创新奖,2005年IEEE Computer Society 颁发的技术成就奖,2009年IEEE颁发的W.
Wallace McDowell奖。他是ACM和IEEE Fellow,同时还是《ACM Transactions on
Knowledge Discovery from Data》杂志的主编(2006-2011),以及《IEEE Transactions
on Knowledge and Data Engineering》和《Data Mining and Knowledge
Discovery》杂志的编委会成员。
  Micheline Kamber 拥有加拿大康考迪亚大学计算机科学硕士学位,她是NSERC
Scholar,现在加拿大麦吉尔大学、西蒙-弗雷泽大学及瑞士从事研究工作。
  Jian Pei(裴健) 目前是加拿大西蒙-弗雷泽大学计算机学院副教授。2002年,他在Jia wei
Han教授的指导下获得西蒙-弗雷泽大学博士学位。

书籍目录

Foreword to Second Edition
Preface
Acknowledgments
About the Authors
Chapter 1 Introduction
Chapter 2 Getting to Know Your Data
Chapter 3 Data Preprocessing
Chapter 4 Data Warehousing and Online Analytical
Processin
Chapter 5 Data Cube Technology
Chapter 6 Mining Frequent Patterns, Associations, and Correlations:
Basic Concepts and Methods
Chapter 7 Advanced Pattern Mining
Chapter 8 Classification: Basic Concepts
Chapter 9 Classification: Advanced Methods
Chapter 10 Cluster Analysis: Basic Concepts and I~ethods
Chapter 11 Advanced Cluster Analysis
Chapter 12 Outlier Detection
Chapter 13 Data Mining Trends and Research Frontiers
Bibliography
Index

章节摘录

版权页:插图:

媒体关注与评论

 我们生活在数据洪流的时代。本书向我们展示了如何从这样海量的数据中找到有用知识的方法和技术。最新的第3版显著扩充了数据预处理、挖掘频繁模式、分类和聚类这几个核心章节的内容;还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。本书将是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材。 —— Gregory Piatetsky-Shapiro, KDnuggets的总裁 Jiawei、Micheline和Jian的教材全景式地讨论了数据挖掘的所有相关方法,从聚类和分类的经典主题,到数据库方法(关联规则、数据立方体),到更新和更高级的主题(SVD/PCA、小波、支持向量机),等等。总的说来,这是一本既讲述经典数据挖掘方法又涵盖大量当代数据挖掘技术的优秀著作,既是教学相长的优秀教材,又对专业人员具有很高的参考价值。 —— 摘自卡内基-梅隆大学Christos Faloutsos教授为本书所作序言

编辑推荐

《数据挖掘:概念与技术(英文版•第3版)》最完整、最全面地讲述了数据挖掘领域的重要知识和技术创新。相比内容已经相当全面的第1版,第2版展示了该领域的最新研究成果,例如挖掘流、时序数据和序列数据以及挖掘空间、多媒体、文本和IWeb数据。《数据挖掘:概念与技术(英文版•第3版)》是数据挖掘和知识发现领域内所有教师、研究人员、开发人员和用户部必读的一本书。

图书封面

图书标签Tags

评论、评分、阅读与下载


    数据挖掘 PDF格式下载


用户评论 (总计68条)

 
 

  •   这本书在数据挖掘领域很经典,对于了解数据挖掘的内容十分有用!
  •   在计算机系旁听了一学期《数据挖掘》课程,觉得受益匪浅。
    更重要的是,觉得这样一个新兴的交叉性学科,可以挖掘的地方太多了。
    比较了下老师的Publication List和自己专业某大牛的,觉得还是这个方向出文容易。
    于是果断买下这本书细读。
  •   本书是数据挖掘的经典之作,有电子版了,希望能继续研读,所以购得纸版此书。
  •   此书是数据挖掘中比较基础的一本,现在看书,有时需要要看英文原版,才不至于落后。正在研读中……
  •   这本书是数据挖掘方面的经典之作,不错,是一本好书。
  •   数据挖掘方面书籍的经典。
  •   边学数据挖掘,同时还可以练练英语
  •   数据挖掘圣经
  •   Jiawei Han's Data Mining:Concepts and Techniques is a greet book.And of course, it is genuine.
  •   英文版原著很好,比翻译版更经典
  •   全面,实用,经典。
  •   经典书,知道阅读和学习
  •   英文版毕竟是原创作,可以通过中英对照着看,比较出不同来,且能够通过对比加深理解
  •   先看了书的目录 大致了解结构和内容安排 很清晰 不愧是经典教材 好好研读!
  •   老好的一本书了 外国人写书比较好理解啊 呵呵
  •   内容很全面,很好。英语学的不好的同学就不要买了。
  •   很好的书,内容很全面,不过看起来比较吃力
  •   书自然是绝好的,英文版就是比中文版的好
  •   这本书还不错,比翻译过来的好多了
  •   本书非常好。
  •   推荐越读下,不懂对照中文版,英语啊
  •   刚拿到书 开始学习
  •   很好,正版很给力。
  •   英文不好,还没看完。感觉还行
  •   书不错,送货速度快。以后还会再来买的
  •   书质量挺好的,物流速度也很快。
  •   很厚,纸质很好,建议和中文版一起看
  •   数据挖掘方面的经典
  •   因为在图书馆看过,就是感觉不是自己的书看得不方便,书还是很好的
  •   纯英文,比较有挑战性啊~
  •   书的质量不错,内容也很好,讲得非常细,也很明白
  •   书还可以,老师指定的,还不错
  •   书很好,质量也很好!
  •   质量非常好,书的纸张很厚
  •   从了解概念开始。
  •   别人介绍的挺好的
  •   虽然是全英的,但是讲的比较详细,要有点耐心去看
  •   送货,和包装都很给力
  •   一共买了9本新书,估计是库存不够,但是也不能拿旧书充数啊
  •   经典原版书库·数据挖掘:概念与技术
  •   数据挖掘:概念与技术(英文版·第3版)
  •   包装很好,全新的,不错哈
  •   非常好的书!!!!强烈推荐
  •   原版书!
  •   书很厚很专业
  •   这方面的经典书籍
  •   韩老师的经典书
  •     推荐几个数据分析网站
      
       随着数据的数量级增长,促进了数据分析的火热。但很多数据分析从业人员却感觉没有很好的获取行业资讯、技术交流的平台,今天就推荐几个经常上的觉得很不错的网站给大家。大数据时代已经来临,我们一起感受数据的力量吧!
      
      数据分析交流群推荐:165678692
      来源:corn整理
      
      
       1、商业数据分析论坛[dp论坛] http://www.datapanda.net/forum.php
      由一群热爱数据行业的大学生在11年创立,内容更新快,资源涵盖面广,从数据分析软件学习,到数据资源分享等应有尽有,通过几年的发展,积累庞大的会员群,一起交流分享数据资讯。
      
      2、人大经济论坛-计量经济学与统计区 http://www.pinggu.org/bbs/index.php?gid=148
      业内人士都应该去过的门户,主要涉及计量经济学、统计学、数据挖掘、统计软件、数据等经济学相关问题交流统计软件交流
      
      3、中国统计论坛 http://bbs.itongji.cn
      属于中国统计网的交流论坛,中国统计论坛-BBS.iTongji.CN 提供统计软件,统计教程,统计年鉴,统计论文,统计资料下载,统计认证,培训就业资讯,技术文章学习等的专业数据分析技术论坛。
      
      4、数据挖掘学习交流论坛 http://www.businessanalysis.cn/
      统计软件CRM,Data Mining,Data analysis,SPSS,SAS,SAP ,数据挖掘学习交流论坛。
      
      5、数据分析论坛 http://www.spsschina.com/
      SPSS论坛,主要涉及数据分析,数据调查,市场调研,SPSS相关软件交流的平台。
      
      6、网站数据分析 http://webdataanalysis.net/
      通过网站分析与数据分析实现网站优化,主要涉及网站分析的一些维度和分析模型,互联网从业者可以去看看,类似的还有“网站分析在中国”、“网站分析二三事”等。
      
      7、数据分析 http://www.shujufenxi.com/
      数据分析网是中国行业数据的分析家,免费提供统计数据、分析软件、数据分析方法学习资料,并代写数据分析报告,致力为广大数据分析爱好者提供信息咨询服务。
      
      8、数据挖掘研究院 http://www.chinakdd.com/
      数据挖掘研究院,比较早的一个门户,内容比较丰富,但是欠系统性的整理,主要涉及一些工具的使用和算法的研究,有兴趣的可以去找找看。
      
      9、S-PLUS、R统计论坛 http://www.magnsoftbi.com/forum/default.asp
      是北京宏能畅然数据应用有限公司旗下的一个门户,专注于数据分析、数据挖掘与商业智能应用,S-PLUS和R软件的技术交流平台。
  •     作者是FP-Growth的发明人之一,本身实力不弱。但看了国内外的一些评论后,觉得此书偏向文献综述的类型,适合当作参考手册。
      
      
      亚马逊地址:
      http://www.amazon.com/Data-Mining-Concepts-Techniques-Management/dp/0123814790/ref=cm_rdp_product
      
      
  •     这本书是准备跟随浙江大学的课程学习而购买的课本,里面的知识比较全面。部分比较深入的知识由于课上没有 讲解,因此我也将它跳过了。因为这学期选修了数据挖掘的课,需要一个中文版的课本进行学习,选择这本书还是不错的。
      这本书很适合自学,因为是将理论与算法相结合讲解的。如果想要自学,推荐配合浙江大学的课程进行学习
  •     原书很经典,毋庸置疑,不做评论。
      主要是翻译,两个自称教授博导的家伙能把英语翻译成这样,这是了不起啊!很多都是直译,定语从句连句子的顺序都不改一下!!!难不成你们平时也这样跟人讲话?
      中国的学术界啊!!!真人点踏实点行不?
      以后这两位活宝( 范明, 孟小峰)的书定死是不买的了
  •     首先我承认我的E文不算太好。我最近在读两本E文原版的技术书籍,《分布式系统原理与范型》、《数据挖掘概念与技术》。都是E文书,但是前者作者是老外,后者作者是中国人,两本书的风格明显差异很大。
      
      《数据挖掘概念与技术》的大量专业词汇给我很大的打击,但是大量非专业词汇我认为用的也不太好,这可能是中国人的通病吧,很多中国人写的E文连老外看的时候也要查单词,这应该能反映出一些问题。相比之下《分布式系统原理与范型》用词就很简单,鲜见生僻单词。
      
      除此之外,《数据挖掘概念与技术》的内容组织也有待商榷,很多术语不管三七二十一先列出来,然后下面一条一条的解读或者说这个内容超出本书范围或者说这个内容稍后章节会讲等等,这对读者是很不友好的。相比之下,《分布式系统原理与范型》的内容组织由浅入深、并伴随着一些实例,读起来就轻松明快。
  •     这个是数据挖掘方面的基础,国外的思维方式和咱们这个有点差异,所以觉得有点怪,但是大部分翻译书籍都是这样。而且范明是我的老师,在数据库反方面造诣很深,待人很不错。
  •     浙大的王灿老师的讲课视频:
      
      http://www.businessanalysis.cn/viewthread.php?tid=13320&extra=&page=1
      
      韩家炜自己的讲课视频:
      
      http://v.youku.com/v_playlist/ct250f1903290o1p0
  •     本书从内容上看还是比较全面的,但是中文版的翻译实在是差,基本上感觉没有几句话是读了一次后可以理解的,建议读英文版
  •     数据挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。特征化和区分是数据汇总的形式。
      
      数据分类(data classification)是一个两步过程:1)建立一个模型,描述预定的数据类集或概念集。通过分析由属性描述的数据库元组来构造模型。2)使用模型进行分类。
      “预测和分类有何不同?”预测(prediction)是构造和使用模型评估无标号样本类,或评估给定样本可能具有的属性值或值区间。在这种观点下,分类和回归是两类主要预测问题,其中分类是预测离散或标称值,而回归用于预测连续或有序值。然而,我们的观点是:用预测法预测类标号为分类,用预测法预测连续值(例如使用回归方法)为预测。这种观点在数据挖掘界被广泛接受。
      7.3用判断树归纳分类
      判断树(decision tree)是一个类似流程图的树结构,气质每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个树叶节点代表类或者类分布。
      chp8 聚类分析
      将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。
      聚类的方法有:
      1)划分方法 partitioning method
      2)层次方法hierarchical method
      3)基于密度的方法 density-based method
      4)基于网格的方法grid-based method
      5)基于模型的方法model-based method
      
  •   确实!!专业词汇这么的多!!!
  •   我也觉得不是很好读,老喜欢把简单的东西讲的那么复杂,语言不够简练和易懂
  •   请问,对于data mining还有更好的入门书籍吗?就是很经典的教材,最好是英文的,现在我们正在上这门课,可是老师讲的不是很好,我想找一些经典教材看看,本来是在看这本,但是我也觉得很不好读,打击的我很没信心,请楼主推荐一本好的教材。谢谢
  •   听LZ这么一说,我不想买这本书了。我也有点刻板印象,感觉中国人写书把简单的东西搞复杂了。
  •   我现在也是在啃这本书的e文版,啃了前两章,啃得我对自己的e文都没信心了
  •   后者也是美国人,美国信息网络学术研究中心主任,uiuc的正教授,只不过后者出生在中国
    这本书是数据挖掘领域最著名的入门书之一,美国人上课也是用这本书
  •   我很想研究一下数据挖掘和数据统计方面,您是否可以给我推荐几本书?电子版更好了。呵呵。
  •   第一个视频不太容易看到呢
    还需要人工验证
  •   视频里的内容远远超过书的内容。正好也说明书不够细。
  •   看看韩的视频, 感觉讲课比书易理解
  •   第一个视频,需要什么权限吗 还是无效了
  •   。。视频都没了
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7