回归分析
书籍:统计辞典
出处:按学科分类—社会科学总论 上海人民出版社《统计辞典》第239页(780字)
指对具有相互联系的现象,根据其关系形式,择一合适的数学模式,用来近似地表达变量间平均变动关系的一种统计分析方法。
十九世纪英国遗传学家高尔登(Francis Galton)首创。最初用于对血缘关系的研究,继后成为统计研究事物相互关系的通用语。
回归分析是研究两个或两个以上变量间的关系形式,在分析研究时,不论研究的变量多少,应择其中之一,作为因变量,其余当作自变量。
如果因变量与自变量的关系是线性的,则称线性回归分析;反之,称非线性回归分析。
在研究一个因变量只与一个自变量的关系,就叫一元线性回归分析。其回归方程最简单的,也是最常用的模式是:
y=a+bx
式中x为自变量,y为因变量,a为常数,b为回归系数。应用最小二乘法,求得a和b值和回归方程式,根据此式,在有效区间内,可由x取值来预测y的值和估计误差。
在研究一个因变量与多个自变量的关系,就叫多元线性回归分析,其模式为:
y=a+b1x1+b2x2+……+bnxn
式中:a为常数,b1,b2……bn分别为y对x1,x2……xn的回归系数。
在多元线性回归中,可采用最小二乘法一次回归,也可在所研究的全部因素中,按其y的相关程度的大小,逐个把自变量引入模式,这就叫做逐步回归。
回归分析已广泛应用于生物、教育、经济、医药等各方面,尤其应用多元回归进行经济预测,已在生产实践、科学管理和科学研究中,取得了较好的效果。