选择聚类数目

选择聚类数 没有所谓最好的选择聚类数的方法,通常是需要根据不同的问题,人工进行选择的。选择的时候思考我们运用 K-均值算法聚类的动机是什么,然后选择能最好服务于该目的标聚类数。

“肘部法则”: 改变 聚类数k 值,运行K-均值聚类方法,然后计算成本 函数或者计算畸变函数 J。

我们可能会得到一条这样像肘部的曲线,这就是“肘部法则”所做的。这种模式下,它的畸变值会迅速下降,从 1 到 2,从 2 到 3 之后,你会在 3 的时候达到一个肘点。在此之后,畸变值就下降的非常慢,看起来就像使用 3 个聚类来进行聚类是正确的,这是因为那个点是曲线的肘点,那么我们就选 k 等于 3。

当你应用“肘部法则”的时候,如果你得到了一个像上面这样的图,那么这将是一种用来选择聚类个数的合理方法。