数据挖掘技术

出版时间:2009-1  出版社:水利水电出版社  作者:谭建豪 等编著  页数:285  
Tag标签:无  

前言

  数据挖掘是一门综合性学科,借鉴了多门学科的概念、理论、方法和技术。这些学科包括数据库系统、专家系统、机器学习、统计学、模式识别、信息检索、人工神经网络(正文中简称神经网络)、支持向量机、遗传算法、模糊优化、高性能计算和数据可视化等。数据挖掘旨在发现隐藏在大型数据集中的知识模式,其基本问题是可行性、实用性、有效性和可伸缩性问题。  数据挖掘出现于20世纪80年代后期,随着国内外研究的深入,已经取得了一批有价值的成果,并展现出良好的发展势头。本书较系统地阐述了该领域目前的研究状况,介绍了几种典型的数据挖掘技术和系统,并讨论了数据挖掘的应用情况和研究方向。  与数据挖掘有关的一些书籍主要是关于数据库方面的。随着大规模数据库(或信息库)的广泛应用,人们已不满足于仅对数据或信息进行查询和检索,因为简单的查询和检索一般不能使用户直接获得带有结论性的信息。因此仅仅依靠查询和检索的手段,数据库蕴藏的知识是得不到充分发掘和利用的。  另外,人工智能、专家系统和机器学习方面的书籍对数据挖掘也有所论述。研究虽然取得了一定的进展,但是知识获取仍然是瓶颈问题,知识工程师从专家那里获取知识的方式仍然带有很强的个体性和随机性,没有统一的方法。  知识发现与数据挖掘是一门新的技术学科,其理论框架与技术原理尚处于研究的初级阶段,还没有形成完整的理论体系。尽管如此,仅从已有的研究成果看,也足以展示其广阔的研究领域和应用前景。本书拟在阐述知识发现与数据挖掘原理的基础上,探索将其用于复杂工业系统的原理、方法和技术。  目前,许多学校正在对传统的教学内容进行改革,自动化、电子信息、测控技术与仪表、电气工程、系统工程、机电工程等专业迫切需要较多与信息相关的知识。由于这些专业的学生在本科阶段已较为扎实地掌握了数据库系统的知识,在研究生阶段便转入人工智能理论与技术的学习。如何将数据挖掘技术及人工智能理论在一个大的框架内以统一的视角用于解决工程实际问题,是本书着力的方向。  本教材是为电子信息及相关专业编写的。作为一门技术基础课,它以“数据库技术”及“人工智能”课程为先修课。既要学时少,又要让学生对数据挖掘原理及其在复杂工业系统中的应用建立较全面的印象,同时还应该使学生学有所用,并为今后的发展打下基础,这是本书编写的指导思想。编者力求避免本书与先修课程内容重复,对书中必不可少的相关知识只作简单介绍。

内容概要

本书较为系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的最新进展,并以较大篇幅叙述了数据挖掘在复杂工业系统中的应用情况。    本书深入而系统地阐述了数据挖掘的研究历史和现状、数据挖掘与数理统计的关系、数据挖掘技术(包括语义网络、智能体、分类、预测、复杂类型数据等基础概念和技术)、数据库系统及专家系统中的数据挖掘方式、数据挖掘的应用及一些具有挑战性的研究课题,对每类问题均提供了代表性算法和具体应用法则。全书共分7章,主要内容包括数据挖掘综述、从数理统计到数据挖掘、语义网络挖掘及其应用、智能体挖掘及其应用、分类挖掘及其应用、预测挖掘及其应用和复杂类型数据挖掘及其应用。    本书可作为高等院校自动化、电子信息、测控技术与仪表、电气工程、系统工程、机电工程等专业的本科生和研究生教材,也可作为相关专业工程技术人员的自学参考书。

书籍目录

前言第1章 数据挖掘综述  1.1 数据挖掘的研究历史和现状  1.2 数据挖掘定义    1.2.1 技术角度的定义    1.2.2 商业角度的定义    1.2.3 数据挖掘与传统分析方法的区别    1.2.4 数据挖掘和数据仓库    1.2.5 数据挖掘和在线分析处理    1.2.6 数据挖掘、机器学习和统计    1.2.7 软硬件发展对数据挖掘的影响  1.3 数据挖掘研究内容    1.3.1 数据挖掘所发现的知识    1.3.2 数据挖掘的功能    1.3.3 数据挖掘常用技术    1.3.4 数据挖掘中的数据仓库  1.4 数据挖掘系统工作原理    1.4.1 数据挖掘系统结构    1.4.2 数据挖掘流程  1.5 小结 习题1第2章 从数理统计到数据挖掘  2.1 数理统计与数据挖掘的关系    2.1.1 数理统计的性质    2.1.2 数据挖掘的性质    2.1.3 从数理统计到数据挖掘  2.2 数理统计与数据库技术的结合  2.3 回归分析的基本概念  2.4 线性回归方程  2.5 线性相关的显著性检验    2.5.1 线性回归的方差分析    2.5.2 相关系数的显著性检验  2.6 非线性回归分析    2.6.1 化非线性回归为线性回归  2.6.2 多项式回归  2.7 多元线性回归分析    2.7.1 多元线性回归方程    2.7.2 多元线性回归的方差分析  2.8 一般情况下的回归分析    2.8.1 一般情况下的回归方程    2.8.2 一般情况下的参数估计  2.9 逐步回归分析的软件设计  2.10 锻模设计准则的制定    2.10.1 研究的内容    2.10.2 资料收集与数据处理    2.10.3 飞边尺寸设计准则的制定    2.10.4 飞边金属消耗设计准则的制定  2.11 小结  习题2第3章 语义网络挖掘及其应用  3.1 语义网络概念    3.1.1 概述    3.1.2 知识的表示    3.1.3 搜索原理    3.1.4 语义网络及其特性    3.1.5 语义网络的推理及其特点  3.2 语义网络挖掘原理    3.2.1 概述    3.2.2 归纳学习中的实例学习    3.2.3 类比学习  3.3  基于AutoCAD的注塑模架设计专家系统    3.3.1  注塑模架设计专家系统总体方案设计    3.3.2 模架设计专家系统的组成    3.3.3 系统模架生成模块的设计    3.3.4 系统数据库模块的设计    3.3.5 注塑模架CAD设计系统的实现  3.4 小结  习题3  第4章 智能体挖掘及其应用  4.1 智能体概念    4.1.1 概述    4.1.2 分布式问题求解    4.1.3 面向对象表示法 ……第5章 分类挖掘及其应用第6章 预测挖掘及其应用第7章 复杂类型数据挖掘及其应用参考文献

章节摘录

  第1章 数据挖掘综述  1.1 数据挖掘的研究历史和现状  数据挖掘其实是一个逐渐演变的过程。电子数据处理的初期,人们就试图通过某些方法来实现自动决策支持,当时机器学习成为人们关心的焦点。机器学习的过程就是将一些已知的并已被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有通用性,使用它们可以解决某一类的问题。随后,随着人工神经网络(以下简称神经网络)技术的形成和发展,人们的注意力转向知识工程。知识工程不同于机器学习,它是直接给计算机输入已被代码化的规则,而计算机是通过使用这些规则来解决某些问题。专家系统就是用这种方法所得到的成果,但它有投资大、效果不甚理想等不足。20世纪80年代,人们又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成果应用于处理大型商业数据库。  随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。  数据仓库技术的发展与数据挖掘有着密切的关系。数据仓库的发展是推动数据挖掘技术发展的原因之一。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。  确切地说,数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database—KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。

编辑推荐

  《数据挖掘技术》特色:  系统阐述数据挖掘基础理论、基本方法和成熟技术,着眼热点、难点、疑点问题,把握未来发展趋势;将数据挖掘技术与人工智能理论统一在一个大的框架内;知识点环环相扣,形成循序渐进的知识链,精选相应实例,供读者加深理解;配有多种类型习题100多道,供读者练习与自测;提供教学相关资源(电子教案、教学网站等);既可作为高年级本科生、研究生教材,又可作为科研和工程技术人员参考资料。

图书封面

图书标签Tags

评论、评分、阅读与下载


    数据挖掘技术 PDF格式下载


用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7