关键词不能为空

当前您在: 主页 > 英语 >

第九讲-系统聚类

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-12 21:45
tags:

-

2021年2月12日发(作者:conner)


第九讲



系统聚类分析



人们往往会碰到通过划分同类属性的对象很好的解决问题的情形,


而不论这些对象是个


体、公司、产品甚至行为。为此常用的技巧是聚类分析。聚类分析 将个体或对象分类,使得


同一类的对象之间的相似性比与其他类的对象的相似性更强。< /p>


目的在于使类间对象的同质性


最大化和类与类间对象的差异性最大 化。



一、



导言



近些年类,

统计学的多元分析方法有了迅速的发展,


多元分析技术自然被引用到分类学


中,于是从数值分类逐渐分离出聚类分析这个新的分支。



我们认为,所研究的样品或指标(变量)之间存在着程度不同的相似性(亲疏关系)

< br>。


于是根据一批样品的多个观测指标,


具体找出一些能够 度量样品或指标之间的相似度的统计


量,以这些统计量为划分类型的依据,把一些相似度 较大的样品(或指标)


,聚合为一类,


把另一类彼此之间相似程 度较大的样品


(或指标)


又聚合为另一类,

关系密切的聚合到一个


小的分类单位,


关系疏远的聚合到一 个大的分类单位,直到把所有样品


(或指标)


都聚合完


毕,


把不同类型一一划分出来,


形成一个由小到 大的分类系统。


最后把整个分类系统画成一


张分类图(又称谱系 图)


,用它把所有样品(或指标)间的亲疏关系表示出来。


< /p>


在经济、社会、人口研究中,存在着大量分类研究、构造分类模式的问题。过去人们主


要靠经验和专业知识,


作定性分析处理,


致 使许多分类带有主观性的任意性,


不能很好的揭


示客观事物内在 本质差别和联系,


特别是对于多因素、


多指标的分类问题,


定型分类更难以


实现准确分类。



为了克服定型分类时存在的不足,


统计学这个有用的工具逐渐被引进到分 类学中,


形成


数值分类学。


随着多元分 析的引进,


聚类分析可以用来对案例进行分类,


也可以用来对变 量


进行分类。对样品的分类常称为


Q


型 聚类分析,对变量的分类常称为


R


型聚类分析。与多

< p>
元分类的其他方法相比,


聚类分析的方法是很粗糙的,

理论上还不完善,


但由于它能解决许


多实际问题,很受人们 的重视,和回归分析、判别分析一起被称为多元分析的三大方法。



SPSS for Windows


的系统聚类分析其统计结 果与图形有凝聚顺序表、相似矩阵、聚类


成员结果的范围;且可绘制垂直冰柱图、水平冰 柱图或树状结构图等。



聚类分析根据用户选择不同的聚类方法 、不同的量度、是否标准化、不同联结的图形,


其分类的结果是不尽相同的。

< p>


二、



样品(


Q


型)聚类分析



以地 级行政单元作为区域分析的对象,利用多元统计分析方法对河北省


11

< br>个地级市的


农村基础设施状况进行分析。


其指标的选择主 要根据代表性原则、


综合性原则、


系统性原则、


易获得性原则,


选取


2007


年河北省社会经济发展指标因子


8


项,


组成一个原始数据矩阵


X



作为分析的 依据。所选取的指标有:乡村劳动力资源(


x


1



、农用机械总动力(


x


2< /p>



、农村用


电量(


x


3



、农村社会总产值(


x


4



、自来水受益村


(x


5


)


、通 电话村


(x


6


)


、有效灌溉面积


(x


7


)

< p>


农村运输业固定资产(


x


8












9-1


指 标数据表


















源(人



































农村社会


量< /p>









< p>









624877



113192


448244


241519


321625


68599


121829


537227


386814


267634





















通电村



























(




) < /p>







3980


3785


847


4590


4954


4116


2863


1620


5679


3164


4933


4418


5020


2262


5347


5172


6210


4067


2552


5741


3222


4982


495628


499068


124364


535707


553587


655113


249021


138738


561042


283788


473719


525146


547760


138657


435227


379118


431368


159708


182419


332882


280718


138165


城市



石家庄



唐山



秦皇岛



邯郸



邢台



保定



张家口



承德



沧州



廊坊



衡水



资料来源:

2008


年河北农村统计年鉴



(一)



打开


SPSS 11.5


输入数据后选 择


Analyze/Classify/Hierarchical Cluster...


得到




9-1





9-1


单击打开系统聚类分析主对 话框见图


9-2






Variable


(变量)列表,进行聚类分析的变量。本例为


x


1


--


x


8





Lable Cases by


(识别个案)


,本例为城市





Cluster

< br>(聚类方法)


,可以选择


Case


(样本聚类)或


Variables


(指标聚类)

< p>





Display


(显示)



?



Statistics

< p>
(统计量)


,系统分析的统计量。



?



Plots


(图形)


,冰柱图(


Icicle



、树状图(


Dendrogram


)等





9-2


(二)单击


Statistics


打开 系统聚类分析统计量对话框见图


9-3




9-3


?



Agglomeration


schedule


(凝聚顺序表)


,显示每阶段中结合的个案(分类)的距离及每


个引入聚类的个案(变量)的最终聚类水平,本案例选择此项。



?



Proximity matri x


(相似性矩阵)


,显示项目间的距离或相似性。本案例选择此 项。



Cluster Membership


(聚类成员)


,显示各个案分配到


1

< br>个或


1


个以上级别的聚类结合。



?



None


(不显示聚类成员)


。这是默认格式。



?



Single solution


(单一聚类成员)


。若选此项,应设定


Number of cluster(


聚类数


)


,必须输


入一个大于


1


的整 数。



?



Range of solutions


(某范围聚类成员)< /p>


,若选此项应设定


Minimum number of cluster



Maximum number of cluster


(最大聚类数)



< /p>


(三)单击


Continue/Plots


,打开


Hierarchical Cluster Analysis



Plots


(系统聚类分析:图形)


对话框,见图


9-4




9-4


?



Dendrogram


(树形图)


,树 形图可直观的表示系统聚类分析过程每步结合的聚类及


聚类系数值。

竖线的连接表示个案的结合,


树状图将实际距离按比例赋值为


0~25



并隐藏每步的距离比。


树 状图可用于评估聚类模型的凝聚性,


并且提供保持适当聚


类的信 息。树状图是


SPSS


的独特风格,一般均选择此项。




Icicle


(冰 柱图)


,显示包括所有聚类和聚类范围冰柱图。可显示个案合并到聚类的


过程,在图形的底部未合并任何个案,从下往上阅读时,通过


X


或条进行聚类合并,不同


的分类通过项目间的空格表示。冰柱图显示分析中每次 迭代的个案结合到聚类的信息。



?



All cluster(


所有聚类的冰柱图

< br>)


,这是默认格式



?



Specified range of cluster


(某指定范围的冰状图)



应当设定


Start Cluster


(起始分类)



Stop cluster


(结束分 类)


,及


By


(间隔)




?



None


不显示冰状图。




Orientation


(方向)

< p>
,可选择


Vertical(


垂直冰状图


)



Horizonal


(水平冰状图)




(四)单击


Continue/Method


,打开(系统聚类分析:方法)对 话框,见图


9-5


Cluster Method


(聚类方法)下拉菜单



Between-gropes linkage


(组间均联法)




Within-groups linkage(


组内均联法


)


Nearest neighbor


(近邻法)又称最短距离法或单联法



Furthest neighbor


(远邻法)又称最长距离法或完全关联法



Centroid Clustering


(重心聚类法)又称质心法



Median Cluster(


中位数聚类法


)


Ward


'


s Methord(Ward



)


-


-


-


-


-


-


-


-



本文更新与2021-02-12 21:45,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/646049.html

第九讲-系统聚类的相关文章

  • 余华爱情经典语录,余华爱情句子

    余华的经典语录——余华《第七天》40、我不怕死,一点都不怕,只怕再也不能看见你——余华《第七天》4可是我再也没遇到一个像福贵这样令我难忘的人了,对自己的经历如此清楚,

    语文
  • 心情低落的图片压抑,心情低落的图片发朋友圈

    心情压抑的图片(心太累没人理解的说说带图片)1、有时候很想找个人倾诉一下,却又不知从何说起,最终是什么也不说,只想快点睡过去,告诉自己,明天就好了。有时候,突然会觉得

    语文
  • 经典古训100句图片大全,古训名言警句

    古代经典励志名言100句译:好的药物味苦但对治病有利;忠言劝诫的话听起来不顺耳却对人的行为有利。3良言一句三冬暖,恶语伤人六月寒。喷泉的高度不会超过它的源头;一个人的事

    语文
  • 关于青春奋斗的名人名言鲁迅,关于青年奋斗的名言鲁迅

    鲁迅名言名句大全励志1、世上本没有路,走的人多了自然便成了路。下面是我整理的鲁迅先生的名言名句大全,希望对你有所帮助!当生存时,还是将遭践踏,将遭删刈,直至于死亡而

    语文
  • 三国群英单机版手游礼包码,三国群英手机单机版攻略

    三国群英传7五神兽洞有什么用那是多一个武将技能。青龙飞升召唤出东方的守护兽,神兽之一的青龙。玄武怒流召唤出北方的守护兽,神兽之一的玄武。白虎傲啸召唤出西方的守护兽,

    语文
  • 不收费的情感挽回专家电话,情感挽回免费咨询

    免费的情感挽回机构(揭秘情感挽回机构骗局)1、牛牛(化名)向上海市公安局金山分局报案,称自己为了挽回与女友的感情,被一家名为“实花教育咨询”的情感咨询机构诈骗4万余元。

    语文