出版时间:2006-2 出版社:高等教育出版社 作者:梅长林,范金城 页数:286
Tag标签:无
内容概要
本书是为高等院校信息与计算科学专业本科生“数据分析课程”编写的教材,内容涉及常用统计数据分析的基本内容与方法,包括数据的描述性分析、线性回归分析、方差分析、主成分分析和典型相关分析、判别分析、聚类分析、Bayes统计分析等。另外,对SAS软件的基本内容以及与以上内容有关的SAS过程做了简介,以便于各方法的实际应用。各章均配备了丰富的有实际应用背景的习题。 本书也可作为高等院校统计专业的本科生和非数学类硕士研究生教材以及数据分析工作者的参考书。
书籍目录
第1章 数据描述性分析1.1 一维数据的数字特征1.1.1 表示位置的数字特征1.1.2 表示分散性的数字特征1.1.3 表示分布形状的数字特征1.2 数据的分布1.2.1 直方图、经验分布函数与QQ图1.2.2 茎叶图1.2.3 数据的分布拟合检验与正态性检验1.3 多维数据的数字特征及相关分析1.3.1 二维数据的数字特征及相关系数1.3.2 多维数据的数字特征及相关矩阵1.3.3 总体的数字特征、相关矩阵及多维正态分布习题1第2章 线性回归分析2.1 线性回归模型及其参数估计2.1.1 线性回归模型及其矩阵表示2.1.2 参数估计及其性质2.2 统计推断与预测2.2.1 回归方程的显著性检验2.2.2 回归系数的统计推断2.2.3 预测及其统计推断2.2.4 与回归系数有关的假设检验的一般方法2.3 残差分析2.3.1 误差项的正态性检验2.3.2 残差图分析2.3.3 Box-cox变换2.4 回归方程的选取2.4.1 穷举法2.4.2 逐步回归法习题2第3章 方差分析3.1 单因素方差分析3.1.1 单因素方差分析模型3.1.2 因素效应的显著性检验3.1.3 因素各水平均值的估计与比较3.2 两因素等重复试验下的方差分析3.2.1 统计模型3.2.2 交互效应及因素效应的显著性检验3.2.3 无交互效应时各因素均值的估计与比较3.2.4 有交互效应时因素各水平组合(AiBj)上的均值估计与比较3.3 两因素非重复试验下的方差分析习题3第4章 主成分分析与典型相关分析4.1 主成分分析4.1.1 引言4.1.2 总体主成分4.1.3 样本主成分4.2 典型相关分析4.2.1 引言4.2.2 总体的典型变量与典型相关4.2.3 样本的典型变量与典型相关4.2.4 典型相关系数的显著性检验习题4第5章 判别分析5.1 距离判别5.1.1 两个总体的距离判别5.1.2 判别准则的评价5.1.3 多个总体的距离判别5.2 Baves判别5.2.1 Bayes判别的基本思想5.2.2 两个总体的Beyes判别5.2.3 多个总体的Beyes判别习题5第6章 聚类分析6.1 样品间相近性的度量6.2 快速聚类法6.2.1 快速聚类法的步骤6.2.2 用Lm距离进行快速聚类6.3 谱系聚类法6.3.1 类间距离及其递推公式6.3.2 谱系聚类法的步骤6.3.3 变量聚类习题6第7章 Bayes统计分析7.1 Baves统计模型7.1.1 Bayes统计分析的基本思想7.1.2 Bayes统计模型7.1.3 Bayes统计推断原则7.1.4 先验分布的Bayes假设与不变先验分布7.1.5 共轭先验分布7.1.6 先验分布中超参数的确定7.2 Baves统计推断7.2.1 参数的Bayes点估计7.2.2 Bayes区间估计7.2.3 Bayes假设检验习题7第8章 SAS软件及有关数据分析过程简介8.1 SAS基本内容简介8.1.1 数据的输入与输出8.1.2 利用已有的SAS数据集建立新的SAS数据集8.1.3 SAS系统的数学运算符号及常用的SAS函数8.1.4 逻辑语句与循环语句8.2 与本书内容有关的SAS过程简介8.2.1 几种描述性统计分析的SAS过程和作图过程8.2.2 回归分析的SAS过程——PR0C REG过程8.2.3 方差分析的sAS过程——PR0C ANOVA过程8.2.4 主成分分析的SAS过程——PROC PRINc0MP过程8.2.5 典型相关分析的sAS过程——PROC CANC0RR过程8.2.6 判别分析的SAS过程——PR0C DISCRIM过程8.2.7 聚类分析的SAS过程8.2.8 SAS系统的矩阵运算编程语言——PROC IML过程简介主要参考文献
章节摘录
版权页:插图:人类认识世界往往首先将被认识的对象进行分类,例如,在经济学中,为了了解不同地区城镇居民的收入及消费情况,往往需要划分不同的类型去研究;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品、二等品等;在生物学中,要根据各生物体的综合特征进行分类;在考古学中,要将某些古生物化石进行科学的分类等等。聚类分析即是研究分类问题的数据分析方法。聚类分析与判别分析都是研究分类的,但它们有所区别。聚类分析一般寻求客观的分类方法,在进行聚类分析以前,对总体到底有几种类型并不知道。判别分析则是总体分类已给定,在总体分布或来自总体训练样本基础上,对当前的新样品判定它们属于哪个总体。然而,聚类分析与判别分析有一定联系,判别分析中的训练样本往往是从聚类分析得到的。聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是通过定义样品或变量间“接近程度”的度量,以此为基础,将“相近”的样品或变量归为一类。本章首先以样品聚类为主,介绍两种常用的聚类方法——快速聚类法与谱系聚类法。最后,对变量聚类也作了简单讨论。
编辑推荐
《数据分析方法》为普通高等学校信息与计算科学专业系列丛书,普通高等教育“十一五”国家级规划教材之一。
图书封面
图书标签Tags
无
评论、评分、阅读与下载