(1)聚类的简介:
聚类是一种无监督学习方法,试图将数据集中的样品划分为若干个通常不相交的子集。
(2)聚类的两个基本问题:
①性能度量:
用于度量聚类结果的好坏,即相同簇样本尽可能相似,不同簇样本尽可能不同。性能度星可分为两类,一,外部指标,将聚类结果与外部指标相比较,二,内部指标,直接考察聚类结果。
②距离计算:
我们常用基于某种形式的"距离"的概念来定义"相似度度量" ,距离越大,相似度越小,但此"距离"未必满足距离度量的所有基本性质。
(3)原型聚类:
①原型聚类的简介:
原型聚类假设聚类结构能通过一组原型刻画,采用不同的原型表示,将产生不同的算法。
②几种著名原型聚类:
1) k均值聚类(k-means) 【这是我要用到的聚类方式】
<1>k-means聚类简介:
k-means聚类最小化聚类所得簇划分的平均误差,平均误差越小,也就是簇内样本相似度越高。
<2>k-means聚类的算法流程如下:
输入样本集对均值向量进行初始化;
样本集中随机选取k个样本作为初始向量;
对簇进行划分;
对均值向量进行迭代更新,知道迭代更新后均值向量不变,则将当前簇划分结果输出.
2)学习向量量化(LVQ)
3)高斯混合聚类
(4) k-means聚类的halcon实现:
cluster model components:把用于创建模型组件的新参数用于训练结果。
inspect clustered components:检查从训练中获得的刚性模型部件。
class 2dim unsup:将两幅图像以聚类分割。
class 2dim sup:利用二维空间像素分类分割图像。
histo 2dim:计算二通道灰度图像的直方图。
————————————————
版权声明:本文为CSDN博主「小娜美要努力努力」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_39504171/article/details/94552921

