回归预测置信区间与区间估计

出处:按学科分类—经济 中国财政经济出版社《中国物资管理辞典》第574页(726字)

置信区间是为进行回归预测区间估计,由各估计值、标准误差和显着性水平等参数确定的上置信限和下置信限在回归直线两侧所构成的预测区间。

利用建立的回归线性方程,对给足的Xu,可作出对Y0的点估计。但在以样本估计值推断总体参数Y0时,需要知道Y0的可能取值范围及其可信程度,以作出区间估计。为此,可寻找两个正数δ和α,使总体参数Y0包含在区间内的概率为1-α,即

上式:就是Y0的置信区间,1-α表达了区间估计的可靠概率(又称置信度或置信水平);α称为显着性水平,表达了区间估计不可靠的概率,按照一定的要求,预先给定。

通常采用0.5,0.01,0.001三个标准。

如选用α=0.05,即1-α=0.95,表示总体参数Y0将有95%的可能性包含在由样本估计值计算的置信区间内,有5%的可能性落在置信区间之外。假设和Y0服从正态分布,则Y0的误差δ,也服从正态分布。

经过演算得出:

在小样本容量(nt<30)情况下,δ服从t分布,如取显着性水平为α,则置信度为1-α的置信区间为:

以上公式适用于对给定的X0值,预测Y0个别值的置信区间。从上式可以看出,置信区间的范围,不仅与α和n有关,而且与给定的自变量X0也有关。

在图形上,置信区间呈中间窄、两头宽的喇叭形。所以,如果给定的X0值与样本平均值距离越远,预测误差的方差愈大,样本回归直线的预测能力将显着下降,预测的结果就愈不可靠。当样本容量n相当大,而且X0的取值又在X附近时,上式中的根式近似等于1,利用正态分布性质,可采用下述公式近似地进行区间估计:

分享到: