虚拟变量

出处:按学科分类—经济 经济科学出版社《西方经济学大辞典》第270页(858字)

有许多例子可以说明一个样本可以分成两段或更多段,使得一些(或所有)位置参数都有所不同。

常见的有季节模型,其中解释变量对一年的季节有不同的影响;还有对地理区域有行为差别的模型;允许在反常时期(如战争年份)有不同响应系数的模型;以及对基于定性因素(如性别,种族,受教育程度及婚姻状况等)的个体有不同行为参数的模型等等。

具体地,考虑线性统计模型

yt01x1t+…+βkxkt+et

t=1,…,T (1)

其中x1t,…,xkt是非随机的,et~N(0,σ2)。

为了简单而又不失一般性,假设观测值是有序的,使得参数结构对观测值t=1,…,T1(第一样本段)与t=T1+1,…,T(第二样本段)不同。

为允许截距对不同样本段可以不同,定义一个虚拟变量

然后,可以重新将统计模型写为:

yt0+δDt1x1t+…+βkxkt+et

t=1,…,T (3)

除了截距参数可能有差别外,也可允许一部分(而非全部)斜率参数可变化。

为了简单起见,不妨设x1t的斜率变化。这样,模型相应变为:

yt01Dt1x1t2x1tDt

+…+βkXkt+et

t=1,…,T (4)

分享到: