出版时间:2010-8 出版社:科学 作者:倪志伟//倪丽萍//刘慧婷//贾瑞玉 页数:254
Tag标签:无
前言
随着计算机技术、网络技术和通信技术的发展,各行各业获取数据的能力得到了极大的提高,数据呈现出海量、高维、动态的特点。传统的数据挖掘技术很难有效地对这些数据进行分析,这成为商务智能、决策支持以及知识管理等系统中的一个主要瓶颈,影响了管理决策的效果。为解决这一瓶颈,动态数据挖掘技术应运而生,成为当前研究的热点问题。动态数据挖掘是集过去、现在与未来于一体的动态过程,其动态性体现在数据的采集、处理等环节。动态数据挖掘通常以动态数据库和实时数据库为数据的主要来源。数据处理是动态数据挖掘的核心部分,为了适应数据的动态变化特点,更好地挖掘动态数据中隐含的事先未知的有用信息和知识,必须改进传统的或设计新颖的数据挖掘技术。本书介绍了近年来应用于动态数据挖掘领域中的几种较为新颖的挖掘技术,包括数据流挖掘、分形数据挖掘、联机分析挖掘、经验模态分解以及联系发现技术,研究了它们的原理、特点、性能及应用情况。全书共分为六章:第一章概述传统的数据挖掘技术和动态数据挖掘技术,重点介绍动态数据挖掘技术产生的背景、发展概况和未来研究方向;第二章探讨数据流挖掘技术及其应用、数据流挖掘算法以及数据流管理系统;第三章介绍分形数据挖掘技术,基于分形维数的约简、聚类、分类及其改进算法;第四章研究联机分析挖掘中的三个重要技术组成,即数据立方体的构建和优化技术、联机分析处理查询技术及联机分析挖掘调度机制和挖掘算法;第五章介绍经验模态分解技术的基本原理、算法思想以及与其他算法结合的应用情况;第六章介绍联系发现技术的发展现状、应用情况和发展趋势。各章内容相对独立又相互联系,较为系统地阐述了动态数据挖掘技术的研究现状。本书是合肥工业大学管理学院智能管理研究所全体研究人员近年来对动态数据挖掘技术研究与应用中的一些研究和成果的系统总结,得到了国家高技术研究发展计划(863计划)“面向制造业售后服务的商务智能关键技术研究”和国家自然科学基金“商务智能中的动态数据挖掘与分形技术的研究”两个项目的资助。在撰写书稿的过程中得到了王超、高雅卓、胡汤磊、伍章俊的大力支持和帮助。倪志伟教授负责全书策划和大纲的制订,并负责全书的统纂和修改。安徽大学刘慧婷、贾瑞玉和合肥工业大学倪丽萍为本书的校对和排版做了大量的工作。
内容概要
动态数据挖掘是针对动态数据库和实时数据库进行知识提取的数据挖掘技术。随着信息技术的进一步发展,对知识新颖性的需求越来越强,采用传统的静态数据挖掘技术来分析不断产生的信息无法满足现实应用的要求,对实际应用数据源在其运行的同时进行动态数据挖掘得到相关知识显得日益重要。 本书是关于动态数据挖掘相关技术及其应用的著作,涉及数据流挖掘、分形数据挖掘、联机分析挖掘、经验模态分解和联系发现技术等。本书内容新颖,融入了近年来在学术界和工程界普遍关注的诸多热门课题,是作者及其课题组几年来完成国家级科研项目的成果结晶。 本书可作为管理科学与工程、计算机应用技术等学科高年级的本科生和研究生用书,也可供相关研究人员参考。
书籍目录
前言第一章 绪论 1.1 引言 1.2 数据挖掘概述 1.2.1 数据挖掘的基本概念 1.2.2 数据挖掘技术 1.3 动态数据挖掘 1.3.1 动态数据挖掘的产生 1.3.2 动态数据挖掘技术概述 参考文献第二章 数据流挖掘技术 2.1 概述 2.2 数据流挖掘技术 2.2.1 窗口技术 2.2.2 动态抽样技术 2.2.3 概要数据结构 2.2.4 更新策略 2.3 数据流挖掘算法 2.3.1 数据流聚类算法 2.3.2 数据流分类算法 2.3.3 数据流频繁项集挖掘算法 2.3.4 多数据流挖掘算法 2.4 数据流挖掘技术的应用 2.4.1 数据流管理系统 2.4.2 案例推理在数据流管理中的应用 参考文献第三章 分形数据挖掘技术 3.1 概述 3.2 数据集的分形维数 3.2.1 数据集分形维数的含义 3.2.2 数据集分形维数的计算方法 3.3 基于分形维数的约简技术 3.3.1 分形属性选择及其改进算法 3.3.2 基于分形维数的案例库维护算法 3.4 分形聚类算法 3.4.1 基于网格和分形维数的聚类算法 3.4.2 基于分形维数的数据流聚类算法 3.4.3 基于多重分形的聚类层次优化算法 3.5 分形分类与预测技术 3.5.1 分形分类技术 3.5.2 分形预测技术 3.6 分形数据挖掘技术的应用 3.6.1 金融数据分析 3.6.2 网络入侵检测 参考文献第四章 联机分析挖掘 4.1 概述 4.2 数据立方体 4.2.1 数据立方体简介 4.2.2 数据立方体优化方法 4.2.3 数据立方体物化方法研究 4.3 联机分析处理 4.3.1 OLAP概念及分类 4.3.2 支持OLAP查询的索引技术研究 4.3.3 OLAP动态查询方法 4.4 联机分析挖掘 4.4.1 联机分析挖掘简介 4.4.2 联机分析挖掘体系结构 4.4.3 OLAP与数据挖掘技术的结合方法 参考文献第五章 经验模态分解技术 5.1 概述 5.1.1 经验模态分解基本理论 5.1.2 经验模态分解研究现状 5.2 基于经验模态分解的序列趋势的提取 5.2.1 引言 5.2.2 基于EMD方法的序列趋势的提取 5.3 基于经验模态分解的时间序列匹配算法 5.3.1 引言 5.3.2 基于交叉覆盖算法的序列匹配算法 5.3.3 基于经验模态分解和覆盖算法的序列匹配算法 5.4 基于经验模态分解的聚类算法 5.4.1 引言 5.4.2 基于经验模态分解的数据降维技术 5.4.3 基于经验模态分解和K-means聚类算法 5.5 基于经验模态分解的流数据挖掘技术 5.5.1 引言 5.5.2 基于经验模态分解的数据流概要生成技术 5.6 经验模态分解动态数据挖掘技术的应用 5.6.1 引言 5.6.2 基于经验模态分解和交叉覆盖算法的个人信用的评估 5.6.3 基于经验模态分解和K-means算法的客户行为聚类 参考文献第六章 联系发现技术 6.1 概述 6.2 基于图挖掘的联系发现 6.2.1 图挖掘的相关概念和定义 6.2.2 基于图论的无监督的联系发现算法 6.3 基于一阶谓词逻辑的联系发现 6.3.1 一阶谓词逻辑的相关概念和定义 6.3.2 基于ILP的联系发现算法 6.4 基于联系发现的结合型数据挖掘方法 6.4.1 基于相关分析和联系发现的结合 6.4.2 图熵和联系发现的结合 6.4.3 概率统计方法和联系发现的结合 6.5 联系发现技术的现实应用 6.5.1 联系发现在反恐中的运用 6.5.2 联系发现在金融反洗钱中的运用 参考文献
章节摘录
插图:当前基于数据流的数据挖掘任务,例如数据流聚类、数据流分类等,大多是传统静态方法的改进,其挖掘效果很难令人满意。因此,未来的研究重点应该根据流数据的独特性,结合计算理论、近似算法以及寻优算法等,开辟一条新的思路;探索一种合适的模式结构以加速整个系统挖掘进程,优化整个挖掘任务或系统;设计满足数据流挖掘需求的系统模型以提高数据流挖掘的效率和精度。数据流挖掘有非常广泛的应用领域,如检测互联网上的极端事件、欺诈、入侵、异常、实时交通监控、趋势监控、探查性分析等。本书第二章将主要介绍一些经典的数据流挖掘算法,在此基础上结合数据流的数据形式和特点,提出一些高效的数据流挖掘算法,并将对数据流挖掘的特点和应用进行深入的研究。2.分形数据挖掘分形数据挖掘技术也可以称之为基于分形维数的数据挖掘技术,即利用数据集分形维数的意义对数据集进行挖掘。数据挖掘的主要任务是从海量复杂的数据中挖掘出有用的知识从而辅助人们更好地做出决策。然而高维、动态、复杂的数据特性给数据挖掘工作带来了很大的挑战。分形技术的运用,为更好地进行挖掘提供了一个新的可行思路。首先,自然界中存在着很多混沌现象,在混沌的背后,又往往表现出规律性和自相似性。类似地,反映这些现象的数据集也存在着混沌性和自相似性,即具有分形特征。分形理论提出了一套定量描述自然界中不规则、复杂现象的强有力工具,该定量指标为分形维数。因而利用分形维数可以更好地对数据集进行描述。其次,分形维数所描述的是分形体的填充程度,在数据挖掘中它反映的是数据在多维空间中的分布特性,因而当有新的数据加入之后,其分布会或多或少地发生一定的变化,相应的分形维数也会随之发生一定的变化。因而,利用分形维数的这种动态变化特征对数据集进行动态挖掘是合理有效的。近年来分形数据挖掘技术的研究已经取得了一定的成果。如果从数据挖掘研究的方向来看,目前已在属性约简、分类、聚类、关联规则挖掘、预测、离群点分析、空间数据分析等方向中有了一定的运用,并形成了相关的典型算法。如果从应用的角度来看,分形数据挖掘技术在网络数据挖掘、金融数据分析、地理信息挖掘等领域有了一定的应用。分形数据挖掘技术在运用时主要是利用分形维数进行的。例如,在属性约简中,当属性分形维数对整个数据集的分形维数产生很大影响时,则该属性为关键属性;在聚类分析时,同一类的区域,其整体与局部具有极强的相似性,不同类之间则相似性较弱,因而可以利用分形维数度量值作为聚类的标准。在分类分析中,可以根据类间的不同分形维数值来判断新的数据点属于哪一类。
编辑推荐
《动态数据挖掘》是由科学出版社出版的。
图书封面
图书标签Tags
无
评论、评分、阅读与下载