分类数据分析

出版时间:2012-1  出版社:重庆大学出版社  作者:阿兰·阿格莱斯蒂  页数:503  译者:齐亚强  
Tag标签:无  

内容概要

  由于分类数据分析技术的发展以及分类数据在现实应用中的独特价值,许多统计系或生物统计系都开设了有关分类数据分析的课程。这《万卷方法:分类数据分析》可以用作该类课程的教科书。《万卷方法:分类数据分析》的第1-7章涵盖了该类课程的核心内容。其中,第1-3章介绍分类结果变量的分布以及传统的二维列联表分析方法。第4-7章介绍关于二分和多项分布结果变量的logistic回归以及相应的logit模型。第8章和第9章的内容则是用于分析列联表数据的对数线性模型。随着时间的推移,对数线性模型的重要性似乎有所降低,所以本版在一定程度上缩减了对该模型的讨论,并相应增加了有关Iogistic回归的内容。
  在过去10年间,这一领域的新发展主要集中于对重复测量和其他形式的群组分类数据的分析方法。第10-13章讲述这些方法,其中包括边际模型和具有随机效应的广义线性混合模型。第14-15章介绍本书所使用的最大似然估计的理论基础以及其他可供选择的估计方法。第16章简单回顾了分类数据分析技术的发展历程,并介绍了诸如皮尔逊和费舍尔等著名统计学家的贡献,他们的开创性工作为分类数据分析方法的发展奠定了基础。

作者简介

作者:(美国)阿兰•阿格莱斯蒂(Alan Agresti) 译者:齐亚强

书籍目录

1 引言:分类数据的分布与统计推断
 1.1 分类数据
 1.2 分类数据的分布
 1.3 分类数据的统计推断
 1.4 二项分布参数的统计推断
 1.5 多项分布参数的统计推断
 注解
 习题
2 对列联表的描述
 2.1 列联表的概率结构
 2.2 两个比例的比较
 2.3 分层2x2表格中的偏关联
 2.4 扩展到/xJ表格
 注解
 习题
3 列联表的统计推断
 3.1 关联参数的置信区间
 3.2 二维列联表的独立性检验
 3.3 对卡方检验的进一步分析
 3.4 定序变量的二维表格
 3.5 小样本的独立性检验
 3.6 2x2表格的小样本置信区间
 3.7 对多维表格以及非表格形式结果变量的扩展
 注解
 习题
4 广义线性模型简介
 4.1 广义线性模型
 4.2 二分数据的广义线性模型
 4.3 计数数据的广义线性模型
 4.4 广义线性模型的矩量和似然函数
 4.5 广义线性模型的统计推断
 4.6 广义线性模型的拟合
 4.7 类似然函数与广义线性模型
 4.8 广义可加模型
 注解
 习题
5 Logistic回归
 5.1 Logistic回归参数的解释
 5.2 Logistic回归的统计推断
 5.3 包括分类预测变量的Logit模型
 5.4 多元Logistic回归
 5.5 Logistic回归模型的拟合
 注解
 习题
6 Logistic回归模型的构建与应用
 6.1 模型选择的策略
 6.2 Logistic回归诊断
 6.3 2x2 xK表格中条件关联的统计推断
 6.4 利用模型提高推断效能
 6.5 样本规模与统计效能
 6.6 Probit模型和补余双对数模型
 6.7 条件Logistic回归与精确分布
 注解
 习题
7 关于多项结果变量的Logit模型
 7.1 定类结果变量:基线类别Logit模型
 7.2 定序结果变量:累积Logit模型
 7.3 定序结果变量:累积连结模型
 7.4 关于定序结果变量的其他模型
 7.5 Ix jxK表格中的条件独立性检验
 7.6 离散选择多项Logit模型
 注解
 习题
8 关于列联表的对数线性模型
 8.1 关于二维表格的对数线性模型
 ……
9 对数线性模型和Logit模型的构建与扩展
10 关于配对数据的模型
11 对重复测量的分类结果变量的分析
12 随机效应:关于分类结果变量的广义线性混合模型
13 关于分类数据的其他混合模型
14 参数模型的渐近理论
15 参数模型的其他估计理论
16 分类数据分析的历史回顾
参考文献
例子索引
主题索引

章节摘录

版权页:插图:定类变量是定性的变量——它的不同取值之间存在质的区别,而不是量的差异。定距变量是定量的变量——其不同取值表示所关注的特质的量的多少。至于定序变量到底属于定量的还是定性的变量并不是很明确。数据分析者经常将其视为定性的变量,并利用定类变量的分析方法来处理定序变量。但是在许多方面,定序变量实际上更接近于定距变量而不是定类变量。定序变量包含了重要的量化特征:每一类别都比其他类别具有较多或较少的特质。而且,尽管无法测量,一般都认为在定序变量背后隐含着潜在的连续变量。例如,对政治倾向的定序测度(开放、中间、保守),可以看作是对一个内在的连续特质的一种粗糙测量。数据分析者常常利用定序变量所具有的量化特征,对其类别赋以确定的数值或假定存在一个潜在的连续分布而加以分析。这样做往往需要很强的判断能力以及有经验的研究者的具体指导,不过其好处在于可以借用许多针对定距变量的分析方法。1.1.5 本书的结构本书所讨论的关于分类结果变量的模型与用于连续性结果变量的回归模型相似;其主要区别在于,分类结果变量的模型假定二项、多项或者泊松分布而不是正态分布。在这里我们将重点讨论两种模型:logistic回归和对数线性模型。普通的logistic回归模型(logistic regression models),也称为Logit模型(Logit models),应用于二分的(binary)结果变量(即具有两个类别),并假定该变量服从二项分布。扩展的logistic模型可应用于包括多个类别的结果变量,假定相应变量服从多项分布。对数线性模型(1oglinear。models)应用于计数数据(count data),并且假定服从泊松分布。Logistic回归与对数线性模型之间存在着一定的等价性。

编辑推荐

《分类数据分析》是万卷方法之一。

图书封面

图书标签Tags

评论、评分、阅读与下载


    分类数据分析 PDF格式下载


用户评论 (总计9条)

 
 

  •   社会科学研究方法的经典
  •   书有点旧,看起来不新
  •   《万卷方法:分类数据分析》的第1-7章涵盖了该类课程的核心内容。其中,第1-3章介绍分类结果变量的分布以及传统的二维列联表分析方法。第4-7章介绍关于二分和多项分布结果变量的logistic回归以及相应的logit模型。第8章和第9章的内容则是用于分析列联表数据的对数线性模型。
  •   对于数据分析的人来说,挺实用的
  •   但是里面的纸质一般般
  •   基本满意,纸质感觉容易破损
  •   需要一些深入的数学知识才能看懂
  •   阿兰·阿格莱斯蒂序言是2001年11月的,此系列书的总序没有时间落款,但其中提到2004年至今,不知这个今是指05年,还是2011年,但2012年1月第一版。佩服这样的出版社,买它的书绝对要慎之又慎。
  •   有点深奥,过于理论,不是那种操作型的书
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7