k-meansはデータを事前に指定したk個の重心(セントロイド)に基づいてクラスタリングを行うアルゴリズムで、高速かつ大規模データにも対応可能です 。しかし、球状・凸状のクラスターにしか対応せず、初期値や外れ値に敏感という制約があります 。
クラスタの形状を問わないDBSCAN(Dentisy-based Spatial Clustering Application with Noise)とは、データポイントの局所的な密度に基づいてクラスタラベルを割り当てる方法で、データポイントを三つのカテゴリに分ける。 core point: 半径$${\epsilon}$$内に指定された定数以上の ...