Stein估计

书籍:现代科技综述大辞典上 更新时间:2018-11-16 21:26:26

出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第52页(3288字)

设随机向量X服从多元正态分布N(β,In),考虑参数β的估计问题。

在二次损失下,当n≤2时,人们证明X是β的容许估计。从直观上看,似乎很有理由猜想这个结论对n≥3仍成立。

但出人意料是:Stein(1956)否定了这一猜想,他找到了X的一个改进估计

δ(x)=[1-(n-2)/‖X‖2]X。

Stein这一估计除了使人们进一步认识到低维与高维的质的区别外,其意义和作用主要在如下3个方面:(1)由Stein估计得知,协方差已知的多元(维数大于2)正态均值参数的常用(在诸优良性下均优的)估计——样本均值,在二次损失下,不再是一个好的估计(就判决理论而言)。由此而引起了人们对其他常用估计的反思。(2)Stein估计是一有偏估计,但它控制了最小二乘(LS)估计X,这一最佳无偏估计。

这就引起了人们对有偏估计的研究。(3)Stein估计在容许性理论中的作用可以说是历史性的,它是这方面许多研究工作的起点。

自Stein估计以后,人们开始对常用估计进行反思,在一定意义下,改进了一些常用估计(主要是多维的常用估计)。Hudson(1978)利用分部积分法,给出了指数族

f0(x)=exp{θx-ψ(θ)}k(x),-∞<x<+∞

的一个自然的恒等式,即对任一绝对连续函数g(x)来说,如果E|g′(x)|<+∞,则有

E[-k′(x)/k(x)-θ]g(x)=Eg′(x)。

并利用此恒等式,在二次损失下,得到了多元(维数大于2)指数族参数的一致最优无偏估计T(x)=(-k′(x1)/k(x1),…,-k′(xn)/k(xn)′的改进估计。该改进估计把正态分布下的Stein估计推广到了指数族这一更大而又常用的分布类。

Haff(1979)利用给出风险函数无偏估计的方法,改进了Wishurt分布的协方差逆阵的常用估计。Hudson和Haff的这两种方法在研究常用估计的改进估计中至今仍很活跃,例如,haff(1980)利用这两种方法获得了多元正态协方差阵常用估计的改进估计,BiLodeau等(1989)在矩阵损失下,利用这两种方法给出了多元正态均值的常用估计的改进估计。除了上述两种方法外,利用变换群下不变性理论来改进常用估计也是一重要方法,Shorrock等(1976)利用该方法改进了正态方差的常估计,中国王静(1984)将其推广到多元正态的协方差阵。从有关这方面的研究工作来看,研究常用估计的改进是十分困难的问题,它依赖于方法的突破和创新。

以Stein估计为开端,人们后来提出许多新的有偏估计。Hoerl等(1970)提出了线性模型

Y=Xβ+e,E(e)=0,Cov(e)=σ2I

的回归系数β的岭估计

β(R)=(X′X+kI)-1X′Y,

自那时以来,这种估计的研究和应用得到了广泛的重视,成为目前最有影响的一种有偏估计。

主成分估计是Massy(1965)提出来的另一种有偏估计,但它与Stein估计和岭估计提出的背景不同,它主要是基于多元分析中一个重要概念——主成分分析而提出出来的。进一步,Webster(1974)推广了主成分估计这一概念,他提出了特征根估计,这一估计引人注目的地方是:它不象主成分估计那样只限于考虑自变量部分(在回归分析中),而是把因变量也放在一起来考虑。

以上提到的这些有偏估计都在一定的意义上改进了LS估计。虽然这些有偏估计都是非线性的,但计算机的发展使得它们的使用成为可能。有关这方面的研究结果表明,在非线性估计类中改进LS估计的潜力很大。但在关于这些估计优良性的进一步研究中,目前所作比较多的是计算机模拟试验,且在这些众多的有偏估计中,还没有一个估计被认为是优于其它有偏估计的。

因此,从理论上对这些有偏估计优良性的进一步研究,以及寻找新的更优的有偏估计将是今后的一个重要课题。

Stein估计使容许性理论有了长足的发展。

Cohen(1966)在二次损失下,利用Bayes理论和Stein估计给出了方差已知的多元正态均值β的线性估计AY可容许的特征——A对称,A的特征根均在[0,1]内,且当维数n≥3时,A最多只有两个特征根1。

继此以后,人们开始考虑线性模型参数估计的可容许性问题。

对均值参数而言,一个自然的估计类是线性估计类,C.RRao(1976)利用矩阵理论获得了均值参数线性估计在线性估计类中可容许的特征。对方差参数来说,二次型估计类是一自然估计类,中国吴启光等(1982)利用矩阵理论研究了方差二次型估计在二次型估计类和一般估计类(在正态假定上)中的可容许性,得到了深刻的结果,徐兴中最近获得了二次型估计在二次型估计类中可容许的特征。

陈平等(1983)考虑了二阶原点矩的二次型估计的可容许性,在较特殊的线性模型下,得到了深刻的结果。对于多元线性模型来说,此时型式上的二次损失是一矩阵,有关其风险矩阵的比较有许多种不同的标准,对每一个标准都对应的有一容许性定义。

谢民育(1990)利用多重线性代数理论研究了均值参数线性估计在线性估计类中关于诸容许性的分类问题,并获得关于各类可容许的特征。谢民育继而(1993)在误差服从正态的假定下,研究了均值参数线性估计在一般估计类中关于诸容许性的分类问题,也得到了关于各类可容许的特征。谢民育(1991)还考虑了协方差阵的二次型估计在二次型估计类中关于诸容许性的分类问题,并找到了关于各类可容许的充要条件。最近谢民育等(1993)利用优良设计理论提出了关于多元的泛优良性和泛容许性的概念,并获得了多元线性模型均值参数线性估计在线性估计类中泛容许性的特征。

从上面的研究工作可以看出,到目前为止,容许性理论的发展模式是:研究一自然估计在自然估计类和一切估计类中的可容许性的特征。

。【参考文献】:

1 Stein C. Proc Third Berkeley Symp Math Statist Prob. U-niv of California Press,1956:197 - 206

2 Cohen A. AnnMathStutist, 1966,37:458~463

3 Hoerl A E , Kennard R W. Technometrics,1970,12:55~ 88

4 RaoCR. Ann Statist, 1976,4:1023~1037

5 Shorrock R W, Zidek T V. Ann Statist,1976,4:627~638

6 Haff L. Ann Statist 1979,7:1264~1276

7 吴启光,成平,李国英.中国科学,1981,7∶815~825

8 Xie Minyu. Chinese Science Bulletin, 1990,35:881~883

9 Xie Minyu. J Multivariate. Anal, 1993,44:220~226

10 Xie Minyu , Zhang Yaoting. Chinese Science, Bulletin, 1993,38:1071~1074

(华中师范大学谢民育撰;夏明远审)

上一篇:现代位势论 下一篇:弱P叶函数
分享到: