截取与断尾变量

出处:按学科分类—经济 经济科学出版社《西方经济学大辞典》第273页(603字)

微观经济数据中一个非常普遍的问题是因变量的截取,当因变量被截取(censored)时,某一特定范围内的值全被报告为一个单一值。

称这种被截取的变量为截取变量。例如,我们对一家体育馆的比赛项目的门票需求量感兴趣,建立模型需要门票需求量,但我们仅有的度量是实际卖出的数量而不是门票需求量。

然而,无论何时一个比赛项目的门票售缺,我们都知道真实的需求大于卖出的数量,当门票需求量报告为获取的售出数量时,它被截取。实证文献中已出现的其他例子如下:耐用品的家庭购买量、劳动力中妇女劳动的小时数、从监狱获释后又被捕的数量、各种商品组上的家庭支出。

断尾分布是未断尾分布在某一特定值之上或之下的那部分。例如,超过2万元年收入的分布(断尾分布),仅是整个分布(未断尾分布)的一部分。称分布为断尾分布的随机变量为断尾(truncate)随机变量。

若连续随机变量y的概率密度函数为f(y)且a是个常数,则若随机变量x的概率密度为

则x为断尾随机变量。

当样本数据抽取自一感兴趣大总体的一个子集中时会出现断尾(truncation)的结果。例如,根据高于或低于某种贫困线的收入而做的研究。

上一篇:截取回归 下一篇:断尾回归
分享到: