路径分析

书籍:现代科技综述大辞典上 更新时间:2018-10-01 05:51:06

出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第107页(2861字)

又称通径分析,是线性回归分析的一种。

路径分析研究的是通过建立与观测数据一致的“原因”、“结果”的路径结构,对变量之间的关系作出合理的解释。它被应用于群体遗传学、生物社会科学、各种经济关系的分析及多元系统分析等领域,特别是,它对传统的回归分析、相关分析方法无法作出合理解释的一类问题,提供了一种有效的手段。

1921年Sewall Wright最早提出路径分析法,并利用它解决了不少群体遗传学中的问题。1934年Wright在《The Method of Path Coefficients》中正式作为一种统计方法介绍路径分析。

1948年李景均(C.C.L1)所着《群体遗传学引论》有一章介绍路径分析,该书首次把路径分析引入中国。1977年他在另一本着作《Path Analysis》中全面介绍了路径分析及其在各个领域的应用和发展。

80年代以来这种方法逐步被广泛应用于生物、社会、经济等领域。

路径分析方法主要是建立在线性回归模型的基础上。

下面通过一实例说明该方法的特点。

为了确定人类品质的数量指标——智商(IQ),研究环境因素与遗传特征之间的重要关系。资料包括调查100个家庭(父母、子女)的IQ值,这些家庭环境指标测量值、养父母及养子女的IQ值,这两组父母在家庭环境与IQ方面极其相似,根据测量数据得如下相关系数:

其中.P.O分别代表亲父母与其后代;F,C分别代表养父母及养子女。对于亲父母组,父母与家庭环境之间的相关系数为0.86,而对养父母组则假定与亲父母组相同,按线性回归模型可作如下路径图(图1)。

a

b

图1

图中O.C为结果变量,从原因变量到结果变量用单箭头联起来的为路径线,其上数字为路径系数,即标准化变量之偏回归系数。双箭头联起来的为相关线,其上数字为相关系数。

由图1(a)家庭环境E到子女O的路径系数PoE=-0.133,这意味着家庭好的子女其IQ低,对应的偏回归系数自然也是负值。显然,无法作出合理的解释,它与我们一般的观察结果矛盾。

图1(b)有类似的情况,说明回归模型无法合理分析此类问题。

若用偏相关分析的方法,可求得消除了父母IQ的影响后,家庭环境与子女之间的相关系数γoE.P=-0.086,也出现负值,同样无法得到合理的解释,在父母IQ相同的条件下,为什么家庭好的子女其IQ低,这也是毫无道理的。

出现上述情况的原因何在?注意到路径系统图1(a)(b)中的残差变量之路径系数可求得都比较大,说明可能在残差变量中还有其它未考虑到的变量,为此必须重新建立与生物遗传学理论一致的因果系统,如下图(图2)。

a

b

图2

比较图2与图1,先不管路径上的数值,我们发现其间有重要的区别,首先,前面已指出所谓家庭环境因素广义来说包括除遗传因素以外的所有其它因素,因此,可以认为个体之IQ完全由遗传力与环境因素确定。

图2无残差因子到子女IQ的路径,此其区别之一。其次,图2中父母IQ到子女IQ之间无直接路径,甚至父母与其亲生子女亦无直接路径。

在纯粹回归问题中,为了描述与预测的目的,总可以建立父母关于子女的回归。但是从生物遗传学的角度,父母的表型与子女表型之间并无直接的联系,两者只能通过遗传机制(H)联系,它是表型相关的原因。

于是在图2中引入了在图1中缺漏的子女的遗传机制(H)。这也是路径分析方法的一个优点,它能帮助我们在作分析时寻找隐蔽的因子。

通过路径系数运算法则可得图2中各路径之数值。由图2(a)知家庭环境E对子女IQ无负影响,其直接影响为其上路径系数值0.27,而由家庭环境E通过遗传机制H对子女IQ的间接影响则为Q.9×0.24=0.22。同样由图2(b)知,养父母对养子女的影响不再是负值,其影响是通过家庭环境因子E达到的,等于0.79×0.29=0.23,这与观测资料相符。因此路径分析方法得以较恰当地处理了上述问题。

近来,程新意(1984)等在研究棉花产量与单位面积的株数、每株结铃数、单铃重、衣分等的关系时,用路径分析法得出单位面积株数对皮棉产量的直接影响不大,其影响主要通过单铃重的间接作用。同样,孙德林于1991年研究经济关系时应用逐步路径分析法,把那些高度相关而对结果变量的直接作用较小的变量舍弃后得一逐步回归方程。

这种方法用于预测,取得了良好的效果。

路径分析方法大多建立在线性驾归模型的基础上,目前已逐步发展到各类回归模型,并且着眼于应用方面,但大多还停留在作为处理实际问题的一种手段。在理论上至今仍未能建立严格的统计量,自然也无法作相应的统计检验,这是今后研究工作中的一个努力方向。

【参考文献】:

1 WrightS. JAgric Res,1921,20,557~585

2 Wright S. Ann,MtahStat 1934,5:161~215

3 Li C C. An introduction to population genetics. National Peking Univ Press, 1948

4 Li C C. Assortative mating in man proc 2nd meeting of Mexico Society of Genetics, 1975

5 Li C C. Path Analysis -a Primer. The Boxwood Press. 1977

6 程新意,等.数理统计与管理,1984,6

7 古华民.数学的实践与认识,1988,1

8 孙德林.中国现场统计研究会第5届年会论文集,1991

(华南师范大学古华民教授撰)

分享到: