出版时间:2008-2 出版社:上海科学技术 作者:章鲁等 页数:118 字数:145000
Tag标签:无
前言
当前,人类社会面临的是一个住处爆炸的社会。信息是事物状态和特征的反映,它和材料及能量一起构成社会的三个要素。但是,住处具有一些不同于能量的特征。
内容概要
数据挖掘是在统计分析、模式识别、机器学习及数据库技术等基础上发展起来的一门独立学科。该新兴学科具有很强的理论性和实用性,其应用价值体现在:与包括生物医学在内的其他学科相结合,为这些学科的发展提供了新颖的研究方法。 本书将数据挖掘的理论和实践相结合,着重介绍数据挖掘的基本概念及其在生物医学领域内的各种实际应用,旨在使读者能熟悉并理性地应用这种方法,解决医学基础科研及临床研究中的实际问题。本书的第一章介绍了数据挖掘的基本概念;第二章介绍了进行数据挖掘所必需的数据采集和数据清洗的方法;从第三章~第八章,结合国内外的应用实例,分别介绍了回归分析、关联规则、时间序列分析、序列分析、分类和聚类分析等数据挖掘的常用方法,并在参考文献中列出了这些应用实例的引文出处:第九章简单介绍了数据挖掘软件。 本书适合于医学院校本科生及研究生、医学基础科研及临床科研工作者、生物医学工程专业学生及技术人员作为教材及参考资料使用。
书籍目录
第一章 概论 1.1 什么是数据挖掘 1.1.1 数据、信息和知识 1.1.2 数据挖掘的定义 1.2 数据挖掘的应用 1.2.1 应用 1.2.2 方法 1.3 生物医学数据挖掘的特殊性 1.3.1 医学数据的特殊性 1.3.2 伦理、法律和社会等方面对私密敏感的问题 1.3.3 医学的特殊性质 1.4 数据挖掘的评价 1.4.1 样本的组织 1.4.2 有指导学习的评价 1.4.3 无指导学习的评价 1.5 数据挖掘的过程第二章 医学数据采集与准备 2.1 数据的采集与组织 2.1.1 数据的采集、存储和管理 2.1.2 数据的组织 2.2 数据预处理 2.2.1 数据预处理的目的 2.2.2 数据的分布特性 2.2.3 数据清洗 2.2.4 数据整合 2.2.5 数据变换 2.2.6 数据精简第三章 回归分析 3.1 回归分析的功能 3.2 常用的回归分析方法 3.2.1 线性回归 3.2.2 Logistic回归 3.2.3 人工神经网络 3.2.4 回归树 3.3 回归分析的应用一子宫颈癌患者生存率的预测. 3.3.1 研究目标分析 3.3.2 数据采集及预处理 3.3.3 数据挖掘与分析 3.3.4 性能评价与比较 3.4 回归分析的应用一乳腺癌患者的预后分析 3.4.1 研究目标分析 3.4.2 数据采集及预处理 3.4.3 数据挖掘与分析 3.4.4 性能评价与比较第四章 关联规则 4.1 关联规则的功能 4.1.1 关联规则的定义 4.1.2 关联规则的质量和重要性 4.2 关联规则的分析方法 4.2.1 关联规则分析的基本方法 4.2.2 剪枝和合并 4.3 关联规则的应用——睹尿病患者的筛查 4.3.1 研究目的分析 4.3.2 数据采集及预处理 4.3.3 数据挖掘与分析 4.4 关联规则的应用一院内感染监测控制 4.4.1 研究目的分析 4.4.2 数据采集及预处理 4.4.3 数据挖掘与分析第五章 时间序列分析 5.1 时间序列分析的功能 5.1.1 什么是时间序列数据 5.1.2 时间序列分析的功能 5.2 时间序列分析的方法 5.2.1 时间序列数据的精简和变换 5.2.2 时间序列数据的趋势分析 5.2.3 时间序列数据中的相似性 5.3 时间序列分析的应用——I型糖尿病患者血糖水平变化规律 5.3.1 研究目标分析 5.3.2 数据的采集、处理及挖掘第六章 序列分析 6.1 序列分析的功能 6.1.1 序列数据的基本概念 6.1.2 序列数据分析的功能 6.2 生物医学中的序列分析方法 6.2.1 生物医学中的序列数据 6.2.2 生物医学序列数据的比对 6.3 序列分析的应用一妊娠期药物副作用研究 6.3.1 研究目标分析 6.3.2 数据采集及预处理 6.3.3 数据挖掘与分析第七章 分类 7.1 分类的功能 7.1.1 分类的定义和功能 7.1.2 分类的一般方法 7.2 分类的方法 7.2.1 分类方法的关键技术 7.2.2 特征属性的选择 7.2.3 分类器的选择 7.3 分类的应用一冠心病预测 7.3.1 研究目标 7.3.2 数据采集与处理 7.3.3 数据挖掘与分析 7.4 分类的应用一失语症分类 7.4.1 研究目标 7.4.2 数据采集与处理 7.4.3 数据挖掘与分析第八章 聚类分析 8.1 聚类分析的功能 8.1.1 聚类分析的定义和作用 8.1.2 聚类分析中的相似性度量 8.2 聚类分析的方法 8.2.1 聚类分析方法 8.2.2 高维特征空间中的聚类 8.3 聚类分析的应用——住院患者人群分类 8.3.1 研究目标 8.3.2 数据采集与处理 8.3.3 数据挖掘与分析第九章 数据挖掘软件 9.1 数据挖掘软件产品 9.1.1 数据挖掘系统产品 9.1.2 如何选择数据挖掘软件 9.2 数据挖掘软件的运行环境 9.2.1 输入数据形式 9.2.2 数据输出形式 9.3 数据挖掘软件的功能构成 9.3.1 SAS/Enterprise Miner功能简介 9.3.2 SPSS/Clementine功能简介参考文献
章节摘录
第一章 概论 1.1 什么是数据挖掘 1.1.1 数据、信息和知识 数据(data)是对客观事物特征状态的记录。例如,商店内某种商品的销售量或销售额、医院内某类药物的使用数量、某临床科室的床位周转率、患者的心率和血压等生理参数…..这些都是数据。客观事物某些特征状态的记录还受制于技术。例如,在X线及其医学应用被认识以前,人体内各种组织对x线的不同衰减特征就无法记录。因此,随着人类生产能力和科学技术的进步以及人类社会活动的发展,数据的种类、形式和数量日益增多。同时,以计算机和网络为代表的信息技术的发展,使数据的采集、存储、管理和重用更为简便和规范(例如,通过数据库管理系统以一定的格式或结构来存储和组织数据),使数据的流通和共享性增大(例如,通过因特网共享数据)。在这样的背景下,“人类被淹没在日益增长的数据之中”正成为当前社会的特征之一。 另一方面,数据是信息(information)及知识(knowledge)的载体。信息和知识才是真正有意义的。然而,相对于数据的急速增长,人类从数据中提取有用的信息,并将这些信息归纳上升为知识的能力却极大地滞后(见图l.1)。
图书封面
图书标签Tags
无
评论、评分、阅读与下载