出版时间:2013-3 出版社:科学出版社
内容概要
《线性和广义线性混合模型及其统计诊断》系统介绍线性混合模型和广义线性混合模型的基本理论和方法。主要包括两类模型的参数估计、假设检验、置信区域和统计诊断问题。重点是两类模型的统计诊断分析,采用数据删除方法研究两类模型影响点的探测问题,基于EM算法中的Q函数,来构建影响度量——广义Cook统计量,解决了一般方差结构的两类混合模型统计诊断的困难。而且,获得的影响度量有很好的统计意义,能够方便地用于全参数(均值参数与方差参数)和部分参数(均值参数或方差参数)的诊断分析。
《线性和广义线性混合模型及其统计诊断》可以作为统计专业高年级本科生及研究生的教材和参考书,也可以作为数学、生物、医学和经济等领域教师和研究人员的参考书。
书籍目录
前言 第1章引论 1.1线性模型简介 1.1.1普通线性模型 1.1.2广义线性模型 1.1.3线性混合模型 1.1.4广义线性混合模型 1.2统计诊断概述 1.2.1统计诊断的含义 1.2.2统计诊断的主要方法 1.3预备知识 1.3.1矩阵代数 1.3.2矩阵微商 第2章线性混合模型 2.1模型简介 2.2线性混合模型的常见类型 2.2.1方差分量模型 2.2.2纵向模型 2.3参数估计 2.3.1最大似然估计 2.3.2限制最大似然估计 2.3.3非正态假定下方差分量参数的估计方法 2.4假设检验和置信区域 2.4.1假设检验 2.4.2置信区域 2.5随机效应的预测及模型选择 2.5.1随机效应的预测问题 2.5.2模型选择 2.6模拟分析 第3章线性混合模型的统计诊断 3.1Cook统计量和文献回顾 3.2基于似然函数的影响分析 3.2.1基于似然函数的Cook距离 3.2.2实例分析 3.2.3模拟分析 3.3基于Q函数的影响分析 3.3.1基于Q函数的Cook距离 3.3.2实例分析 3.3.3观测值水平的影响分析 3.3.4模拟分析 第4章广义线性混合模型 4.1模型简介 4.2参数估计问题 4.2.1边际似然函数的数值计算 4.2.2基于EM—算法的最大似然估计 4.2.3基于条件似然的参数估计 4.2.4基于广义矩方法的参数估计 4.3估计量的大样本性质 4.3.1当随机效应维数固定时固定效应和随机效应的最大似然/分层最大似然估计的大样本性质 4.3.2当随机效应维数发散时固定效应和方差分量参数的最大似然估计的大样本性质 4.4区间估计、预测误差和假设检验 4.4.1固定效应的区间估计和随机效应的预测误差 4.4.2固定效应和方差分量参数的假设检验问题 4.5模型选择:从条件模型出发 4.6实例分析:离散时间序列模型的参数估计 第5章广义线性混合模型的统计诊断 5.1基于似然函数的影响分析 5.2基于Q函数的影响分析 5.2.1基于EM算法对模型进行参数估计 5.2.2基于Q的COOk型统计量QD 5.2.3基于丑臼的COOk型统计量QD 5.3随机效应是交叉的情况 5.3.1实验介绍 5.3.2对蝾螈数据的影响分析 5.4扰动选择问题 附录 A.1第3章附录表 A.2第5章附录表 参考文献 索引
章节摘录
版权页: 插图: 4.5模型选择:从条件模型出发 在现有的参数估计问题的研究中,研究者通常假定产生数据的真实模型的形式是已知的,但现实问题中,由于问题的复杂性,产生数据的机理往往是不清楚的(Burnham and Anderson,2002),换句话说,也就是研究者在很多情况下不清楚真实模型的参数形式(甚至可以认为产生数据的真实模型根本就没有有限维的参数形式)。上述论证清楚地表明,有必要在备选模型中选择最优的模型使得该模型能够最好地近似潜在的未知模型,该过程被称为模型选择。具体而言,如果真实模型没有被包含在备选模型集合中,则这类问题被称为非套嵌的(non—nested)模型选择问题,对于非套嵌的模型选择问题,研究者通常使用AIC准则fAkaike information criterionl 作为研究工具。本质而言AIC是Akaike信息量的渐近无偏估计fAkaike,1973)。估计出了工作模型(working model)与真实的、产生数据的模型之间的Kullback—Leibler离差(Kullback—Leibler divergence)。与其他模型选择/比较工具不同的是,AIC并没有假定真实模型被备选模型集合所包含(Konishi and Kitagawa,2008),这种优良特性使得AIC成为最为重要、且应用范围最为广泛的模型选择工具之一。 但是,通常使用的Akaike信息量度量的是边际模型(marginal model)与真实的边际模型之间的Kullback—Leibler离差,若要在广义线性混合模型的体系下使用这种度量,需要克服很多理论上和数值方面的困难。这些困难主要包括以下两点。第一,广义线性混合模型的边际似然函数通常没有显式表达式,需要通过数值方法求取。第二,当随机效应本身也为感兴趣的研究对象时(Vaida and Blanchard,2005;Jiang,2007),如何度量因为预测随机效应所带来的自由度损失是比较困难的问题。值得指出的是,这里的自由度损失无法用常规的自由度去度量,原因是随机效应是受到其概率密度函数的约束,而不是在欧氏参数空间中自由变换的。为克服第一个困难,Ibrahim等(2008)在EM算法的框架下提出使用截柱型Hermite展开(truncated Hermite expansion)的方式逼近边际对数似然函数,进而给出广义线性混合模型的边际AIC。由于Ibrahim等(2008)的方法本质上是一种边际的方法,所以无法解决第二个问题。对于混合效应模型,Vaida和Blanchard(2005)系统地讨论了第二个困难,他们认为这涉及到了广义线性混合模型建模本质的问题,也就是建模到底是为了考察总体层面(polulation level)的性质还是需要具体研究到各个区组的层面fcluster level)。显然,后者更能体现混合效应模型的精髓,原因是后者更能反映更多的信息(总体层面的参数和随机区组效应)。在此框架下Vaida和Blanchard(2005)提出使用条件Akaike信息量(conditional Akaike information,cAI)度量研究者使用的条件模型与真实的、产生数据的模型之间的离差程度。
编辑推荐
《线性和广义线性混合模型及其统计诊断》可以作为统计专业高年级本科生及研究生的教材和参考书,也可以作为数学、生物、医学和经济等领域教师和研究人员的参考书。
图书封面
评论、评分、阅读与下载