学员登录 用户名: 密  码: 登陆状态: 免费注册 
 
招生简章 >>
您现在的位置: 中华心理教育网 >> 心理学论文 >> 心理统计 >> 文章正文
文章 书籍视频 图片

聚类分析(Cluster Analysis)的特点和方法

作者:佚名    文章来源:本站原创    点击数:    更新时间:2007-11-7
聚类分析(Cluster Analysis)是物以类聚的一种统计分析方法。用于对事物类别的面貌尚不清楚,甚至在事前连总共有几类都不能确定的情况下进行分类的场合。
  聚类分析可分为对变量聚类(如在儿童的生长发育研究中,把以形态学为主的指标归于一类,以机能为主的指标归于另一类等)和对样品聚类(如解剖学上依据骨骼的形状和大小等,不仅可以区别样品是人还是猿,还可以区别性别、年龄等)。
  聚类方法大致可归纳如下:
  ①系统聚类法 先将n个元素(样品或变量)看成n类,然后将性质最接近(或相似程度最大)的2类合并为一个新类,得到n-1类,再从中找出最接近的2类加以合并变成了n-2类,如此下去,最后所有的元素全聚在一类之中。
  ②分解法 其程序与系统聚类相反。首先所有的元素均在一类,然后用某种最优准则将它分成2类,再用同样准则将这2类各自试图分裂为2类,从中选1个使目标函数较好者,这样由2类变成了3类。如此下去,一直分裂到每类中只有1个元素为止,有时即使是同一种聚类方法,因聚类形式(即距离的定义方法)不同而有不同的停止规则。
  ③动态聚类法 开始将n个元素粗糙地分成若干类,然后用某种最优准则进行调整,一次又一次地调整,直至不能调整了为止。
  ④有序样品的聚类  n个样品按某种因素(时间或年龄或地层深度等)排成次序,要求必须是次序相邻的样品才能聚在一类。
  其他还有加入法、有重叠的类、模糊聚类等。
  聚类分析实质上是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。常用的聚类统计量有距离系数和相似系数2类。距离系数一般用于对样品分类,而相似系数一般用于对变量聚类。距离的定义很多,如极端距离、明考斯基距离、欧氏距离、切比雪夫距离等。相似系数有相关系数、夹角余弦、列联系数等。

精选博客

 
最新心理书籍
最新心理视频

热点文章

频道精选

关于我们 | 媒体报道 | 联系方式 | 免责声明 | 合作加盟 | 招聘信息 | 投诉建议 | 友情链接 | 广告刊例
学校地址:南京市白下区常府街85号新大都广场写字楼乙幢27楼A座 客户服务 电话:025-84293096 025-84293828 025-86663472
在线视频客服 点击进入 中华心理教育网 心理咨询师QQ群号 ①:16494228 ②:21757909 ③20413498
版权所有 Copyright @ 2006-2008 中华心理教育网(浏览本网主页,建议将电脑显示屏的分辨率调为1024*768)
苏ICP证06011946号