广义线性模型

书籍:现代科技综述大辞典上 更新时间:2018-09-11 01:52:08

出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第68页(2529字)

线性模型是统计学中应用最广泛的分支之一,广义线性模型则是经典的线性模型的推广。

在经典的线性模型中,我们用刺激变量X的线性函数Ŷ=XTβ来拟合响应变量Y,称为拟合误差。高斯(Gauss)在1809年首先引进了正态分布来描述误差,后来,他抛弃了正态假设而仅用固定方差这一假定得到了参数β的无偏估计类中有最小方差的估计,即由极小化eTe来估计β,这就是着名的最小二乘法。

广义线性模型放宽了Yi有固定方差这一假定,减弱了Yi的均值μi为Xi的各分量的线性组合这一限制,仅假定Yi的方差为V(μi),即为均值的函数,也称为方差函数,还假定μi的函数g(μi)为Xi的线性函数,即g(μi)=XiTβ,这里函数g(μi)被称为联系函数。这样,广义线性模型把非线性限制在联系函数和方差函数之中,保留了对预报量有贡献的成分,从而把那些不满足经典线性模型假定的数据分析纳入广义线性模型的框架之中。

20世纪以来,人们在分析变量之间的相互关系时提出了许多新的统计模型和统计分析的方法。1922年费歇尔(Fisher)在考察培养盘上的媒体生长情况时,提出了重对数线性模型;1935年伯尼斯(Bliss)对响应变量是属性变量的情形提出了Probit分析方法;在考察与寿命等有关的生存数据时,考克斯(Cox)于1972年提出了对生存数据的回归模型。在所有这些模型中,一个显着的特点是它们都不满足经典线性模型的假定。耐尔德和魏德朋(Nelder and Wedderburn)于1972年提出了广义线性模型,它不但涵盖了前面所提到的各种模型,而且由于联系函数和方差函数选择的灵活性,使其应用的范围大大拓宽。

当联系函数η=g(μ)取不同的形式时,则可得到不同的统计模型。

若η=μ,则得到经典的线性模型;若η=log(μ/(1-μ)),则得到logit模型;若η=Φ-1(μ),这里Φ是标准正态分布之分布函数,则得到Probit模型;若η=log(-logμ),则得到重对数线性模型;若取η=1ogμ,则得到对数线性模型。

我们不再一一列举了,由此可以看出,广义线性模型所包含的内容之丰富。

广义线性模型用加权最小二乘迭代求参数的最大似然估计。

魏德朋(Wedderburn)和哈伯蒙(Habermon)于1976年和1977年几乎同时给出了最大似然估计存在的充要条件,且表明如果参数θ的最大似然估计θ存在,则θ唯一确定。最大似然估计的渐近性质也有很多学者进行了研究。法玛亚(Fahrmeir)和考夫曼(Kaufmann)于1985年给出了最大似然估计渐近性质的一些最新的重要结果,在很一般的条件下证明了最大似然估计的渐近存在性、相容性及渐近正态性。魏德朋在1974年在对广义线性模型进行参数估计时,还引入了拟似然函数这一概念,它基于这样的考虑,若响应变量Y的分布属于指数族分布,则其对数似然函数的导数即得分函数仅与Y的均值和方差有关,此时,我们虽然不知道Y的分布的具体形式,却可以由令其得分函数为零得到最大拟似然方程,这样,我们只需要知道二阶矩假设而不必考虑分布的具体形式,就可以得到参数的拟似然估计。

在广义线性模型的研究中另一个重要课题是模型检验。卜瑞盖绷(Pregibon)在广义线性模型的模型检验方面做了一些开创性的工作。

这方面的工作主要集中在两个方面,一是检验数据与模型中的假定是否相符(模型诊断),另一个是如何把对拟合影响显着的观察值分离出来(数据诊断)。人们已构造了各种形式的残差、偏差、距离等统计量用于模型诊断和数据诊断,利用图形分析进行诊断也是一个直观明了的方法。

近年来,有关广义线性模型的理论和应用成果不断涌现,由于这门理论还很年轻,故有很多领域有待进一步研究和开发。一是改进模型的适用性。

在广义线性模型中我们假定各响应变量是相互独立的,方差也仅与均值有关,如何将这一限制取消,考虑各Yi是相关的,方差和其它变量的均值也有关,将会大大拓广模型的实用性。还可考虑线性预报量中既含有参数的线性形式,又含有变量的非参数形式的半参数广义线性模型.还可以考虑随机效应模型。

另一个重要的方向是对病态数据的处理。由于病态矩阵使得迭代过程不收敛,许多学者提出了将岭估计、压缩估计、主成分估计等有偏估计推广到广义线性模型的参数估计上来。此外,诸如刀切法(Jacknife)、投影追踪法(Bootstrap)、随机过程统计等现代统计方法应用于广义线性模型也都是很有意义的研究方向。

【参考文献】:

1 Nelder J A,et al. J R Statist Soc,A,1972,135:370~384

2 Pregibon D. Ann Statist, 1981,9:705~724

3 McCullagh P, et al. Generalized linear models. London Chapman and Hall, 1983

4 McCullagh P. Ann statist,1983,11:59~67

5 Fahrmeir L,et al. Ann Statist, 1985,13:342~368

6 Johnson W,et al. J of statist. Planning and Inferencell,1985,33~56

(安徽师范大学郭大伟副教授撰)

分享到: