分解聚类法

书籍:心理学大辞典上卷 更新时间:2018-09-13 00:06:30

出处:按学科分类—哲学、宗教 上海教育出版社《心理学大辞典上卷》第350页(620字)

聚类分析的一种方法。

其做法:先将全部样品当作一类,然后分成两类、三类,……,直至每个样品自成一类为止。常用一分为二的做法,其思想是每次只将一个类分成两个类,使一分为二后类内样品间的离差平方和尽可能小。

设全部样品xi=(xi1,xi2,…,xip)′,i=1,…,n,所成的类为G,分成两类G1,G2。要使分成的两类的离差平方和最小,等价于使目标函数L(G1,G2)=()′()达到最大。式中分别为G1,G2的重心(即均值向量),n1,n2分别是G1,G2中的样品数。具体步骤:(1)将n个样品看成一类G,并从中选出一个样品作为G2类,剩下的样品作为G1类,使目标函数L(n;G1,G2)=()′()达到最大。

如将xi1划入G2,G2={xi1},对应的目标函数值记为L1。(2)从G1中选第二个样品归入G2,使L极大,如xi2归入G2,G2={xii,xi2},对应的目标函数值记为L2。(3)如此反复进行,直至G2={xi1,xi2,…,xin-1},相应的目标函数值依次为L1,L2,…,Ln-1,然后从中选取最大的L值,如Lk,则将前k次归入G2的样品作为一类,余下的n-k个样品作为另一类G1。(4)对G1与G2分别施以(1),(2),(3)的步骤,得两个相应的最大目标函数值,再取较大者对应的类分成两类,这时全部样品已分成三类。

如此反复进行,直至每一个样品自成一类为止。

分享到: