アンケート結果の集計はどうする?回答データを読み解く集計のキホンを解説

アンケートの結果を活用するには、適切な集計・分析が欠かせません。しかし、アンケート調査に不慣れだと、集計の段階でつまずいてしまうこともあるでしょう。今回は、アンケート集計の基本である単純集計・クロス集計のほか、フリーアンサーの集計方法を解説します。

最低限知っておきたい「単純集計」と「クロス集計」

最低限知っておきたい「単純集計」と「クロス集計」

アンケート調査で集めた回答は、未加工のローデータのままでは役に立ちません。回答全体の傾向をつかむには、適切な集計方法でローデータを加工し、数値や割合に置き換える必要があります。

集計方法は「単純集計」と「クロス集計」の2種類に大別されます。

単純集計

単純集計(Grand Total:GT)は最もベーシックな集計方法です。アンケートの設問ごとに合計を出し、回答全体の大まかな傾向を把握するために用いられます。

例えば、商品Aのユーザー150人に使用満足度を5段階で聞いたとします。回答を単純集計し、表にまとめるとすると以下のようになります。なお、単純集計表はGT表とも呼ばれています。

Q:商品Aにどの程度満足していますか?

                     
人数
とても満足している2818.7
満足している5436.0
どちらとも言えない4127.3
あまり満足していない1812.0
全く満足していない96.0
合計150100.0

集計の際は、項目別の回答人数のほか、全回答者を100とした割合(%)も算出し、集計表に併記します。

この例では、「とても満足している」「満足している」とポジティブな回答した人が全体の約半数を占めることが分かりました。集計結果をどう捉えるかは、調査の目的や仮説にもよります。「全く満足していない」「あまり満足していない」が18%いることを高いと見るか、許容範囲と見るかによって、次の施策も変わってくるでしょう。

ただし、単純集計はあくまでも全体傾向をつかむ方法なので、回答者の属性などは考慮されていません。

また、集計データはグラフ化すると一目で理解しやすくなります。

グラフ化した集計データ


設問に対して1つだけ回答を選ぶ「シングルアンサー(SA)」の場合は、円グラフや帯グラフを用いるのが一般的です。回答を複数選べる「マルチアンサー(MA)」であれば、折れ線グラフや棒グラフが見やすいでしょう。

クロス集計

男女別や年代別など、一歩踏み込んだ傾向をつかみたい場合は、クロス集計を行います。先ほどの例を男女別にクロス集計すると、以下のようになります。

                            
男 性
()内は%
女 性
()内は%
男 女 計
()内は%
とても満足している10(13.3)18(24.0)28(18.7)
満足している23(30.7)31(41.3)54(36.0)
どちらとも言えない24(32.0)17(22.7)41(27.3)
あまり満足していない12(16.0)6(8.0)18(12.0)
全く満足していない6(8.0)3(4.0)9(6.0)
合計75(100.0)75(100.0)150(100)

「とても満足している」「満足している」の割合を見ると、男性44.0%、女性64.3%と20ポイント以上の差があることが分かります。単純集計では「約半数の人が満足している」とざっくりと傾向をつかみましたが、クロス集計によって男女による満足度の差が浮き彫りになりました。

このようにクロス集計は、単純集計だけでは分からなかった属性別の傾向比較が可能になります。調査の目的に合った切り口でクロス集計をすれば、より実態に則したデータを把握でき、戦略の精度も高まるでしょう。

なお、クロス集計をグラフ化する場合は、シングルアンサーなら帯グラフ、マルチアンサーなら折れ線グラフと棒グラフを組み合わせると分かりやすいです。

棒グラフイメージ


アンケートの集計にはエクセルが便利です。エクセル集計に役立つ関数などを知りたい場合は、以下の記事を参考にしてください。

関連記事
エクセルを使ったアンケート結果の集計方法|関数から結果の活用方法まで詳しく解説

フリーアンサー(FA)の集計方法

フリーアンサー(FA)の集計方法

アンケートには選択式の設問が多いですが、記述式のフリーアンサー(FA)もあります。記述式の回答には数値と文章(テキスト)の2パターンがあり、ここではテキストによる回答の集計方法について説明します。

テキストが記入された回答を集計する際は、「アフターコーディング」や「テキストマイニング」を用います。

アフターコーディング

アフターコーディングとは、フリーアンサーのテキストを内容や単語で仕分け、分類コード(選択肢)に置き換える作業のことです。自由に記入された回答をグループに分類することで、定性データを定量的に把握できるようになります。

必要に応じて文章または単語のコード化が可能です。類似の回答をまとめることで、意見や感想の傾向をつかめます。ただし、分類コードへの置き換えは基本的に手作業となるため、手間と時間がかかります。

テキストマイニング

テキストマイニングは、フリーアンサーに記入された文章を単語(名詞・動詞・形容詞)や文節に分解し、出現頻度や語句どうしの相関関係などを分析する手法です。構文がシンプルな英語と比べ、日本語のテキストマイニングは難しいとされていましたが、近年の自然言語処理技術の発達により実用性が高まっています。

テキストマイニングの分析には専用ツールを用いるのが一般的です。テキストマイニングを実施すると、単語の出現率が高い順にランキング化したり、特徴別に単語を整理してマッピングしたりできます。

図のように、視覚的に出現傾向を捉えることも可能です。

テキストマイニング

テキストマイニング


アフターコーディングやテキストマイニングを活用すれば、選択式の回答では得にくい知見を抽出できるようになります。

アンケート集計時の注意ポイント

アンケート集計時の注意ポイント

アンケートを集計する際は、以下の点に気をつけましょう。

平均値・中央値・最頻値の違い

アンケート集計では「平均値」を求めることがありますが、「中央値」を確認する場合もあります。平均値も中央値もデータの特徴を示す代表的な値ですが、全く異なるものなので注意が必要です。

例えば、7人に実施したテスト(100点満点)の点数が以下だったとします。

85点、63点、69点、56点、98点、77点、65点

平均値は(85+63+69+56+98+77+65)÷7=73.3点です。

中央値は、データを順番に並べたときに真ん中にくる値を指します。テスト結果を点数の低い順に並べてみましょう。

56点、63点、65点、69点、77点、85点、98点

中央値は69点で、平均値と4点の差が出ました。

データに外れ値(突出して大きい値、小さい値)があると、平均値に影響を与えます。そのため、外れ値がみられる場合は中央値も確認しましょう。なお、データが偶数個ある場合は、真ん中に位置する2つの値を2で割ったものが中央値となります。

「最頻値」は文字通り、最も頻度が高い値のことです。例えば、20人に5点満点のテストを実施し、5点2人、4点4人、3点8人、2点3人、1点3人だった場合、最頻値は3点となります。

集計ミスがあるとデータの信頼性が低下する

アンケート結果を集計表にまとめたときは、ミスや矛盾がないか確認するようにしましょう。「合計が100%になっていない」「データの合計が回答数と合わない」などのミスがあると、集計表全体の信頼性が低下してしまいます。

「エクセル関数で自動計算しているから大丈夫」と思っても、参照する値を間違っていたりすると元も子もありません。クロス集計やマルチアンサーの集計など、複数の項目を取り扱う際は特に注意が必要です。

集計結果をビジネスに役立てよう

アンケートのローデータに単純集計やクロス集計を施せば、統計的に意味のあるデータを抽出できます。さまざまな意見・感想が得られるフリーアンサーも、アフターコーディングやテキストマイニングによって定量的な分析が可能です。適切な集計方法を用いてデータの傾向をつかみ、商品開発やサービス改善などに役立てましょう。多彩な集計が可能なアンケートツールを活用するのもおすすめです。

Twitter:ツイート Facebook:シェア はてなブックマーク:ブックマーク pocket:あとで読む
アンケートツールの最新活用事例をご紹介!資料ダウンロードはこちら

イベント・セミナー情報