クラスター分析とは|市場調査のデータを類型化する分析の種類と手順
クラスター分析は、市場調査やマーケティング調査のデータなどを「似たもの同士」でグルーピングする手法です。複雑なデータを共通項でわかりやすく整理することができるため、効果的な施策の検討に役立ちます。本記事では、クラスター分析の概要や種類、基本的な分析手順について解説します。市場調査のデータ分析手法「クラスター分析」とは
まずは、クラスター分析がどのような分析手法なのかを見ていきましょう。
クラスター分析とは
クラスター(cluster)は「集団・群れ」を意味します。クラスター分析とは、多種多様なものが混在した集団の中から「似たもの同士(クラスター)」を仕分けてグループ化する手法です。分析対象は人間に限らず、企業、商品、地域など様々なものを共通項で分析・分類することが可能です。
マーケティングにおいては、主にアンケートなどの市場調査の分析やビッグデータの解析などで用いられます。なお、クラスター分析における共通項は、性別や年齢、居住地域などの属性情報ではなく、価値観や嗜好、意識、態度など心理や行動に基づいて分類する点が大きな特徴です。
クラスター分析では、そのままでは扱いづらい複雑なデータを目的に応じてわかりやすく分類・整理することができるため、精度の高いマーケティング施策の検討に役立ちます。
クラスター分析の活用例
マーケティングにおけるクラスター分析の活用例には、以下のものが挙げられます。
●市場の細分化
●顧客の分類
●商品・サービスのポジショニング分析
●商圏の特性分析
●企業イメージやブランドイメージの分類
●ダイレクトメールや広告の配信ターゲットの分類
●新たな顧客像(ペルソナ)の発見
●店舗で取り扱う商品のカテゴリー分類
例えば、新商品開発にあたって市場を細分化したい場合、生活者にアンケートで「〇〇を購入する際に重視する点」を聞き、回答データをもとにクラスター分析を行うと、「機能重視層」「価格重視層」「ブランド重視層」「低関心層」などにグルーピングすることができます。
クラスター分析の手法は2種類
クラスター分析は「階層クラスター分析」と「非階層クラスター分析」の2種類に大別されます。
それぞれの特徴を見ていきましょう。
階層クラスター分析
階層クラスター分析とは、すべてのデータ間の類似度を特定の「距離測定方法」で算出したうえで、最も似ている(データが近い)順にまとめて階層化していく手法です。類似した項目をまとめていくと、トーナメント表のような「樹形図(デンドログラム)」が生成され、どのクラスター同士が類似・併合されたかを一目で把握することができます。
<階層クラスター分析のイメージ>
上記の例では、データの類似度から「AとB」→「CとD」の順に同じクラスターに分類されます。次に、ABおよびCDのクラスターがひとつのクラスターにまとめられ、最後に最も類似度が低い(データの距離が遠い)Eが併合されます。
樹形図は、低い位置でつながるほど類似度が高く、高い位置ほど類似度は低いことを示しており、分析後に何個のクラスターに分類するかを決めることが可能です。上記例では、AB・CD・Eの3つ、もしくはABCD・Eの2つのクラスターに分類できそうです。
展開する施策や目的に応じて、分析後にクラスターを分類できる点が階層クラスター分析のメリットです。一方で、データ量が多過ぎると計算が困難になることがあるため、ビッグデータなどの解析には不向きです。
なお、データ同士の類似度を算出する距離測定方法には、以下のような種類があります。
<主な距離測定方法>
ウォード法 | クラスターの結びつきが最小値になるように平方和(データと平均値との差の2乗の和)を算出する |
最長距離法 | 距離が遠いクラスターから順に併合する |
最短距離法 | 距離が近いクラスターから順に併合する |
群平均法 | 各クラスターの全データ間の距離の平均値をもとに併合する |
重心法 | 各クラスターの重心からの距離をもとに併合する |
最もよく用いられるのはウォード法です。計算量が多い手法ですが、精度が高く、全体的にデータの偏りが少なくバランスよく分類されます。
非階層クラスター分析
非階層クラスター分析は、事前に何個のクラスターに分類するかを決定し、それに従ってグルーピングしていく手法です。
例えば、100個のサンプルを5つのクラスターに分類する場合、非階層クラスター分析では下図のような分析結果となります。
<非階層クラスター分析のイメージ>
非階層クラスター分析における代表的な距離測定方法は「k‐means法」です。k‐means法では、全データの距離を総当たりで計算するのではなく、各クラスターの重心(平均値)間の距離をもとにクラスターの数を分類していきます。
この手法のメリットは、階層クラスター分析より少ない計算量で分類でき、サンプル数が多い市場調査やビッグデータの分析でも安定した結果が得られる点です。ただし、事前にクラスターの分類数を決める必要があるため、予想に近い分析結果が得られるまで再計算をくり返すなど試行錯誤を要する場合があります。
以下の記事も参考にしてください。
知っておくと便利なアンケート分析の手法8つ|分析の質を高めるポイント
市場調査の分析手法|定量・定性データを分析して市場構造を把握しよう
クラスター分析の基本手順
基本的に、クラスター分析は以下のような手順で進めます。
分析目的を明確にする
最初に、クラスター分析を行う目的を明確にします。例えば、「広告配信に向けて顧客を分類したい」「自社商品と競合他社商品のブランドイメージを比較したい」などです。
目的が定まっていないと、適切な分析手法を選定できず、期待する結果が得られないことがあります。まずは以下の点を検討し、クラスター分析のアウトラインを明確にしましょう。
●なぜクラスター分析を行う必要があるのか
●どのような分析結果を得たいのか
●分析結果をどう活用するのか
分析するデータを決める
分析目的に沿ってクラスター分析の対象データを決定します。例えば、生活者の意識調査や顧客満足度調査、会員登録時のデータ、アクセス解析のデータなど、目的に合ったデータを用意しましょう。
分析対象のデータが不足している場合は、アンケート調査などを実施してデータを収集する必要があります。
分析手法を決める
次に、「階層クラスター分析」と「非階層クラスター分析」のどちらの手法で分析するかを決めます。一般的には、以下のようにサンプル数を基準に選定します。
サンプル数 | 適した分析手法 |
---|---|
100以下 | 階層クラスター分析 |
100~300 | 階層クラスター分析と非階層クラスター分析を併用する |
300以上 | 非階層クラスター分析 (サンプルを抽出すれば階層クラスター分析も実施可能) |
サンプル数が少ない場合は階層クラスター分析、多い場合は非階層クラスター分析が適しています。サンプル数が100~300程度の場合は、2つの手法を併用すると効果的です。
また、どちらの分析手法でも重要となるのが「何をもってデータ同士の類似度が高い・低いかを定義するのか」という点です。データ同士の類似性を数値的に定義する方法には以下のものが挙げられます。
●ユークリッド距離
●マンハッタン距離
●チェビシェフ距離
●ミンコフスキー距離
代表的なのはユークリッド距離で、変数間に相関性がある場合に用いられます。
データを分析する
クラスター分析は複雑な計算を要するため、表計算ソフトの標準機能だけで計算処理を行うことは難しく、一般的にはExcelのアドインソフトや統計解析ソフトを用います。『R』『SPSS』などの統計解析ソフトであれば、高度なクラスター分析にも対応できます。
クラスター分析に対応したソフトウェアには、階層クラスター分析におけるウォード法や最短距離法、非階層クラスター分析におけるk‐means法などのアルゴリズムが搭載されており、必要なデータを入力・設定することで効率的に分析することが可能です。
各クラスターの傾向をプロファイリングする
統計解析ソフトなどで得られる分析結果は、類似性をもったクラスターの抽出・分類に留まります。各クラスターの特性や傾向までは把握できないため、分析者がクラスターを解釈(プロファイリング)する必要があります。例えば、分析結果から顧客を4つのクラスターに分類できた場合、以下のようにクラスターの特徴をまとめます。
<プロファイリングの例>
クラスター1 機能重視ミニマリスト層 |
・デザイン性より機能性やコストパフォーマンスを重視する ・服装はシンプルで良いがダサいとは思われたくない |
クラスター2 トレンド重視層 |
・国内外のファッション情報をSNSなどでチェックする ・トレンドのアイテムを先取りしたい |
クラスター3 無関心層 |
・ファッションへの関心が低く、毎日コーディネートを考えるのが面倒 ・最低限の身だしなみが整っていれば良い |
クラスター4 一点豪華主義層 |
・服装に大きなこだわりはないが、時計や靴、アクセサリー類は良質なものを身に着けたい ・気に入ったものにはお金をかける |
プロファイリングの結果をもとに、各クラスターの特性に応じたマーケティング施策を検討していきます。
マーケティングにクラスター分析を取り入れよう
ライフスタイルやニーズが多様化している現代では、市場・顧客を細分化したうえでセグメントごとに適切な施策を展開することが効果的です。複雑なデータを共通項で分類・整理できるクラスター分析を用いれば、アンケート調査などのデータをもとに市場や顧客を複数のクラスターに分類し、各クラスターの特性に応じた施策を検討しやすくなります。
クラスター分析は、商品のポジショニング分析やブランドイメージの比較、広告配信のターゲット分類など様々な用途に活用できます。マーケティングの精度を高めたい方は、クラスター分析を取り入れてみてはいかがでしょうか。