模糊线性回归分析
出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第125页(3089字)
经典的线性回归分析是数理统计中最重要的内容之一,是一种十分重要的数据处理方法。
但是在含有人为影响在内的实际问题中,由于人心观察的模糊性,这种仅考虑随机性在内的回归分析方法便失去了它应有的作用。模糊线性回归分析就是考虑模糊性的一种统计方法,是模糊数据处理的一种不可忽视的手段,在不确定环境下的预测方面,为决策人提供辅助决策等方面有着重要作用。
第1类模糊线性回归模型于1982年由田中英夫(Tanaka)等人引进。在这类模型中回归方程中自变量是实值变量,因变量是模糊值变量,参量为模糊数。
这种回归方法不认为变量的估计值与观察值之间的差异是系统的随机误差引起的,而认为是由于系统的不确定性或系统参数的模糊性造成的,且反映在一个表示模糊现象的模糊线性函数上,这种模糊线性函数由扎德(L.A.Zadeh)的扩展原理定义。模型的模糊参数意味着一个表示系统模糊性的可能性分布,通过定义模型的拟合度及模型的模糊性程度,其模型参数的估计问题可化为一个线性规划问题,规划的目标函数为模糊性程度,约束为拟合度不小于某给定的阈值,这类线性回归模型对发现估计系统中的模糊结构是很有用的。
田中英夫等人将上述模型应用到了预定房地产的价格体系中,解释了价格体系中存在的不确定性。
应用第一类模糊线性回归模型,可以构造不确定环境下的预测模型。
1985年,海什马提(B.Heshmaty)与康德尔(K.Kandel)应用上述第一类模糊性回归模型构造了美国从60年代中期到80年代初期电子工业市场中计算机及外部设备的销售价格的预测模型。
由于对测量模型中的每一个独立变量均没有先验的知识可寻,因此应用第一类线性回归分析可以检验那些独立变量在测量模型中最为活跃,对测量模型的贡献成分最大。
这些筛选出来的变量可以认为是影响计算机及外部设备的销售价格的主要因素。通过求解上述回归问题,回归参数的估计值可以给出。
最后通过分析这些模糊参数的中心,宽度解释相应变量的效能,通过代入相应变量的值可以计算售价的预测值以及这些预测值的模糊程度。由于计算机及外部设备的销售价的预测值是由模糊集给出的,决策人可以根据模糊集的三角隶属函数决定一个预测区间,从而给决策留有一定的余地。
从理论上谈,第1类模糊线性回归模型可以认为是一种可能性线性系统,因而第1类线性回归又称为可能性线性回归模型。
模糊集可以认为是一种可能性分布,可能性分布与可能性测度可以在一定条件下相互决定。
对于一个可能性线性系统来说,输入值为非模糊的,但其输出值是模糊的,称为可能性输出。可能性输出一般可以通过可能性测度来计算,其计算方法类似于用概率测度计算随机输出。
第1类模糊线性回归模型的一般形式由巴道西(A.Bardossy)于1988年给出,设回归参数为L-R型模糊数,一般回归模型的模糊性可分为极大型、平均型、积分型3种。通过在一些约束下极小化模型的模糊性,第一类回归的参数估计问题可化为某些数学规划问题或优化问题。
其结果当然依赖于L-R型模糊数的选取及模糊性度量的选取。
第2类模糊线性回归模型于1987年由王震源引进。
这类模型中,回归参数是实参量,而变量是取值为模糊数的变量,因而这种线性回归又称为模糊值变量线性回归。在这种方法中变量的观察值与估计值之间的差异仍认为是系统的模糊性造成的,但这种模糊性反映在变量取值为模糊数上。
第2类模糊线性回归的一些参数估计原则,可借助可能性理论给出,类似于随机变量,可以定义可能性变量的分布函数,讨论可能性变量代数运算的分布,并可建立可能性的母体、子样等统计概念。由于第2类模型中变量取值为模糊数,因此建立模型的第1步需通过每个自变量的母体分布估计出L-R型模糊数的参数,通过模糊数之间的线性运算,可得到因变量母体分布形式,其次需规定母体的模糊性程度,其参数估计原则可由子样出现的可能性最大及母体分布的模糊性最小给出。最后这种估计原则导致的计算问题仍为一系列线性规划问题。
这种参数估计方法可认为是经典的极大似然估计在可能性变量中的推广。
第3类模糊线性回归模型是前两类的综合,它是指线性系统本身带有不确定性即参量是模糊的且变量是取值为模糊数的变量,从理论上看这种模型含有第1、第2类作为特例,因而有着较前两类更为广泛的运用。由于模糊数的运算关于乘法就某一类来讲不是封闭的,这给第3类模型的讨论带来很大困难。
哈明虎和王熙照1990年对这类模型作了初步探讨,指出了用阶梯型模糊数近似代替模型的模糊参量及模糊变量,可得到一个运算封闭的近似系统。利用可能性理论,可对此近似模型提出Minmax估计即极小化最大损失量的参数估计原则,将估计问题转化为一系列无约束优化问题求解。
第3类模糊回归模型是目前研究的难点,主要体现在以下几个问题上:(1)母体估计的优良性准则。(2)模型参量及变量均取值为一般的模糊数时的参数估计问题。
(3)由于最终的计算问题大多化为一些特殊类型的优化问题,对这些特殊的优化问题需给出经济的计算方法。(4)参数检验问题及逐步筛选变量的施使。
(5)一般非线性模糊回归模型的建立及计算方法。
由于第3类模糊回归模型从理论上可以概括经典的回归,能将随机性、模糊性综合于一起考虑,并且可广泛应用于价格预测、综合评判、数据处理等领域,因而能促使在其各个方面都能迅速发展。
模糊线性回归研究的热点为:(1)模糊线性回归一般理论的建立。(2)模糊回归同模糊聚类、模糊判别等问题联系的研究。
(3)模糊线性回归的计算方法问题。(4)对众多实际问题的具体应用。
。【参考文献】:1 Tanaka H,et al.IEEE,Trans Systems Man Cybernet,1982,12:903~907
2 Heshmaty B,et al.Fuzzy Sets and Systems,1985,15:159~191
3 哈明虎,等.河北大学学报,1989,5:15~19
4 Bardossy A.Fuzzy Sets and Systems,1990,37:65~75
5 Wang Zhenyuan,et al.Fuzzy Sets and Systems,1990,36:225~336
6 哈明虎,等.模糊系统与数学成果会论文集.长沙:湖南科学技术出版社,1991.19~21
7 Wang Xizhao,et al.Fuzzy Sets and Systems,1992,51:179~188
(河北大学哈明虎博士、王熙照副教授撰;吴从炘审)