当前位置:首页 > 经典书库 > 方法大辞典

群分析法

书籍:方法大辞典

出处:按学科分类—自然科学总论 山东人民出版社《方法大辞典》第282页(779字)

又称聚类分析法,是多元数据的分类方法。

跟多元分析的其他方法相比,聚类分析方法是很粗糙的,理论上很不完善,但由于它能解决许多实际问题,所以很受人们的重视。为了将样品(或指标)进行分类,就需要研究它们之间的关系。一种方法是用相似系数,性质越接近的样品,它们的相拟系类越接近于1(或-1),而彼此无关的样品的相似系数则越接近于0,比较相似的样品归为一类,不怎么相似的样品属于不同的类。另一种方法是将每一个样品看作m维空间的一个点,并在空间定义距离,距离较近的点归为一类,距离较远的点应属于不同的类。

系统聚类法 先将n个样品各自看成一类,然后规定样品之间的距离和类与类之间的距离,选择距离最小的一对并成一个新类,计算新类和其他类的距离,再将距离最近的两类合并。这样每次减少一个类,直至所有的样品都成一类为止。类与类之间的距离有许多定义的方法,不同的定义就产生了系统聚类的不同方法,如最短距离法、最长距离法、中间距离法等。

动态聚类法 用系统方法聚类,样品一旦划到某一个类以后就不变了,要求分类的方法比较准确,能否先给一个粗糙的初始分类,然后用某种原则进行修改,直至分类比较合理为止。

采用类方法的步骤:(1)凝聚点的选择;(2)初始分类;(3)修改分类的原则。

分解法 系统聚类是将类由多到少;分解法的思想是类由少到多,开始全体样品全为一类,然后分成两类,三类,……,直至所有的样品各自成一类。最简单的是一分为二法,是将某一类分解为两个子类的方法,然后对其子类又可一分为二。

有序样品的聚类 样品是有次序的,分类时不能打乱。

上一篇:群辩法 下一篇:方法大辞典目录
分享到: