クラスター分析とは、データ内の類似したグループ(クラスター)を見つける手法です。
クラスター分析の目的は、データ内の自然なグループ構造を発見することです。データ内に潜む様々な特徴を持つサブグループを見つけ出し、それらを意味のある単位としてまとめあげることが目的となります。
クラスター分析の方法としては、主に幾何学的距離に基づく手法と、統計的な関係性に基づく手法があります。幾何学的距離に基づく手法は、データ点間の距離を計算し、近接したデータ点をまとめあげていくというアプローチです。一方、統計的な関係性に基づく手法は、データ間の相関や共分散といった統計的特徴に基づいてグループ化を行います。
クラスター分析の適用例としては、商品の市場セグメンテーション、顧客の嗜好分類、生物学的な分類など、さまざまな分野で活用されています。