聚类分析原理及步骤_高中生题库网|高考真题|高考试题-「密云二中」

聚类分析原理及步骤

作者：高考题库网

来源：https://www.bjmy2z.cn/gaokao

2021-03-02 13:06

tags:

-

2021年3月2日发(作者：fruit)

聚类分析原理及步骤

——将未知数据按相似程度分类到不同的类或簇的过程

》

传统的统计聚类分析方法包括系统聚类法、分解法、加入法、

动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用

均值、

中心点等算法的聚类分析工具已被加入到许多著名

的统计分析软件包中，如

SPSS

、

SAS

等。

典型应用

》

动植物分类和对基因进行分类

》

在网上进行文档归类来修复信息

》

帮助电子商务的用户了解自己的客户，向客户提供更合适

的服务

主要步骤

》

数据预处理——选择数量，类型和特征的标度（

（依据特

征选择和抽取）特征选择选择重要的特征，特征抽取把输

入的特征转化为一个新的显著特征，

它们经常被用来获取

一个合适的特征集来为避免“维数灾”进行聚类）

和将孤

立点移出数据

（孤立点是不依附于一般数据行为或模型的

数据）

》

为衡量数据点间的相似度定义一个距离函数——既然相

类似性是定义一个类的基础，

那么不同数据之间在同一个

特征空间相似度的衡量对于聚类步骤是很重要的，

由于特

征类型和特征标度的多样性，距离度量必须谨慎，它经常

文档可自由编辑

依赖于应用，例如，通常通过定义在特征空间的距离度量

来评估不同对象的相异性，

很多距离度都应用在一些不同

的领域一个简单的距离度量，如

Euclidean

距离，经常被

用作反映不同数据间的相异性，一些有关相似性的度量，

例如

PMC

和

SMC

，能够被用来特征化不同数据的概念相似

性，在图像聚类上，子图图像的误差更正能够被用来衡量

两个图形的相似性

》

聚类或分组——将数据对象分到不同的类中【划分方法

（划分方法一般从初始划分和最优化一个聚类标准开

始

，

Crisp Clustering

和

Fuzzy Clusterin

是划分方法

的两个主要技术，

Crisp

Clustering

，它的每一个数据都

属于单独的类；

Fuzzy

Clustering

，它的每个数据可能在

任何一个类中）和层次方法（基于某个标准产生一个嵌套

的划分系列，

它可以度量不同类之间的相似性或一个类的

可分离性用来合并和分裂类）是聚类分析的两个主要方

法，另外还有基于密度的聚类，基于模型的聚类，基于网

格的聚类】

》

评估输出——评估聚类结果的质量

（它是通过一个类有效

索引来评价，

，一般来说，几何性质，包括类间的分离和

类内部的耦合，一般都用来评价聚类结果的质量，类有效

索引在决定类的数目时经常扮演了一个重要角色，

类有效

索引的最佳值被期望从真实的类数目中获取，

一个通常的

文档可自由编辑

 决定类数目的方法是选择一个特定的类有效索引的最佳

值，

这个索引能否真实的得出类的数目是判断该索引是否

有效的标准，

很多已经存在的标准对于相互分离的类数据

集合都能得出很好的结果，但是对于复杂的数据集，却通

常行不通，例如，对于交叠类的集合。

）

聚类分析的主要计算方法原理及步骤

划分法

》

将数据集分割成

个组

（每个组至少包含一个数据

且每一个数据纪录属于且仅属于一个分组）

，每个

组成为一类

2

》

通过反复迭代的方法改变分组，

使得每一次改进之

后的分组方案都较前一次好

（标准就是：

同一分组

中的记录越近越好，而不同分组中的纪录越远越

好，使用这个基本思想的算法有：

K-MEANS

算法、

K-MEDOIDS

算法、

CLARANS

算法）

层次法

1
》

“自底向上”方案——将每个数据单独作为一组，

通过反

复迭代的方法，把那些相互邻近的组合并成一个组，直到所

有的记录组成一个分组或者某个条件满足为止，

代表算法有：

BIR CH

算法、

CURE

算法、

CHAMELEON

算法等

2

》“自顶向下”方案

主要算法原理及步骤

3

/

6

文档可自由编辑

-

-

-

-

-

-

-

-

本文更新与2021-03-02 13:06，由作者提供，不代表本网站立场，转载请注明出处：https://www.bjmy2z.cn/gaokao/689737.html

返回列表：英语

上一篇：TC混响参数
下一篇：常见词根词顺序表

当前您在：主页 > 英语 >

聚类分析原理及步骤

-

-

-

-

-

-

-

-

-

返回列表：英语

聚类分析原理及步骤的相关文章

余华爱情经典语录,余华爱情句子

心情低落的图片压抑,心情低落的图片发朋友圈

经典古训100句图片大全,古训名言警句

关于青春奋斗的名人名言鲁迅,关于青年奋斗的名言鲁迅

三国群英单机版手游礼包码,三国群英手机单机版攻略

不收费的情感挽回专家电话,情感挽回免费咨询

新婚贺语怎么说祝福语,新

适合小学生包容的句子经

开启美好一天的句子,开启

林徽因传,林徽因传主要内

结婚祝福语句句暖心,结婚

正能量的句子经典简短1

沈从文语录经典语录关于

史铁生的简介和作品,史铁

打动人心的爱情句子:我的

平凡的生活.简单的幸福的

母爱的最经典金句,母亲的

相守一生不离不弃的句子

余华的作品值得初中生看

奇妙萌可珍珠公主变好,彩

喝酒后的心情经典句子,适

努力挣钱的霸气图片,努力

有深度有涵养的句子精选

高情商女人分手说的话,高

当前您在： 主页 > 英语 >

-

-

-

-

-

-

-

-

-

聚类分析原理及步骤的相关文章

当前您在：主页 > 英语 >