更新时间:2024-05-21 13:15
AGNES可以指一种算法,算法难易程度为比较简单,算法复杂度为较高。
AGNES(AGglomerative NESting)算法是凝聚的层次聚类方法。AGNES最初将每个对象作为一个簇,然后这些簇根据某些准则被一步一步地合并。例如,在簇A中的一个对象和簇B中的一个对象之间的距离是所有属于不同簇的对象之间最小的,AB可能被合并。这是一种单链接方法,其每一个簇都可以被簇中所有对象代表,两个簇间的相似度由这两个簇中距离最近的数据点的相似度来确定。聚类的合并过程反复进行直到所有的对象最终合并形成一个簇。在聚类中,用户能定义希望得到的簇数目作为一个结束条件。
输入:包含n个对象的数据库,终止条件簇的数目k
输出:k个簇,达到终止条件规定簇数目
(1)将每个对象当成一个初始簇;
(2)Repeat
(3) 根据两个簇中最近的数据点找到最近的两个簇;
(4) 合并两个簇,生成新的簇的集合;
(5)Until 达到定义的簇的数目
AGNES算法比较简单,但经常会遇到合并点选择的困难。如果在某一步没有很好地选择出合并点,很可能导致低质量的聚类结果。而且此算法没有良好的可伸缩性,算法复杂度较高。