【市場調査】テキストマイニングとは|活用例や分析方法・手順を解説
テキストマイニングとは
まずは、テキストマイニングの概要や活用方法を見ていきましょう。
テキストマイニングの概要
テキストマイニング(text mining)とはデータマイニングの一種で、大量の文章・文字列(テキストデータ)から有益な情報を抽出するための分析手法です。自然言語処理技術を用いて構造化されていない文章を名刺・動詞・形容詞などに分解し、出現傾向や単語間の関連性などを可視化することができます。
テキストマイニングの対象データの例を以下に挙げます。
- 市場調査(アンケート)の自由記述の回答データ
- SNSや口コミサイトの投稿内容
- コールセンターでのやりとりをテキスト化したデータ
- 問い合わせフォームに寄せられた問い合わせや意見
- SFA/CRMのデータや営業日報
- 会議の議事録
昨今は多様なタッチポイントで顧客の声が蓄積されており、そこには商品開発やマーケティングのヒントが隠されている可能性があります。しかし、膨大なテキストデータをひとつずつ読み込んで分析することは難しいため、多くの企業ではうまく活用できていません。
テキストマイニングを用いれば、さまざまな定性データをスピーディに分析して得られた知見をビジネスに役立てることができます。
主な目的・活用方法
テキストマイニングは以下のような目的で活用されています。
顧客ニーズの発見
市場調査の自由回答データや、コールセンターや営業部門に蓄積されている顧客からの意見・クレームなどをテキストマイニングで分析すると、新たなニーズを発見できることがあります。Excelなどでの集計だけでは気づきづらい顧客の深層心理(インサイト)を抽出し、深い洞察を得ることが可能です。
また、SNSの投稿を分析すれば、非ユーザーや潜在顧客など自社と直接接点がない人の意見をもとに新たなアイデアを発掘できる可能性もあります。
以下の記事も参考にしてください。
顧客インサイトを探るソーシャルリスニングとは|やり方と役立つツール6選
顧客インサイトを探るエスノグラフィとは|活用事例と実施の流れ
業務改善・ノウハウの共有
企業で日々やりとりされている営業日報や報告書などの社内文書には、業務効率化に役立つノウハウが含まれています。優秀な社員の業務プロセスや営業のアプローチ方法、特定の社員しか知らない効率的な手順などをテキストマイニングで発見・共有することで、業務の属人化防止や業務改善につなげることができます。
将来の市場動向を予測
インターネット上に刻々と投稿されるSNSやブログなどの情報はビッグデータとしてビジネスに活用できます。ビッグデータには多種多様な情報が混在していますが、テキストマイニングで分析することで、最新トレンドや今後の市場動向をいち早くとらえて需要予測やマーケティング施策などに活かすことが可能です。
テキストマイニングの代表的な分析方法4つ
テキストマイニングには主に4つの分析方法があります。ひとつずつ見ていきましょう。
センチメント分析
センチメント分析は「ネガポジ分析」とも呼ばれ、文章に込められた感情に着目して分析する手法です。テキストデータを「肯定的(ポジティブ)」「否定的(ネガティブ)」「中立的」の3つに分類し、出現傾向から商品・サービスに対してユーザーがどのような感情を抱いているかを把握します。自分の感情や気持ちが反映されやすいSNSや口コミ、ブログなどの分析に多く用いられます。
コレスポンデンス分析(対応分析)
コレスポンデンス分析は、複数の設問をかけ合わせたクロス集計の結果や、集計前のローデータなどを「散布図」であらわす手法です。集計項目が多いクロス集計では傾向や結果を読みとることが困難ですが、コレスポンデンス分析を用いれば項目間の関係性が散布図で視覚化されるため、集計結果をスムーズに解釈できるようになります。
アンケートの自由回答データの分析にも有用で、たとえばコメントの傾向を性別・年代別に分析して差異や類似点を見つけ出すことが可能です。
以下の記事も参考にしてください。
【市場調査】コレスポンデンス分析とは|やり方と注意点をわかりやすく解説
主成分分析
主成分分析は、テキストデータの分析を簡便化するために、多数の変数を3つ程度の合成変数(主成分)に置き換える手法です。出現頻度や関連性が低い単語を除外して主要な要素のみを抽出するため、データを解釈しやすくなります。
<主成分分析のイメージ>
主成分分析はビッグデータのような膨大なデータの解析に適していますが、データを要約する過程で失われる情報も少なからず存在します。分析結果はすべてのデータを反映しているわけではない点に注意しましょう。
共起分析
共起分析は、文章の中で同時に出現しやすい単語の組み合わせを抽出する手法です。たとえば、「桜」が使われる文章では「春」も一緒に出現する頻度が高いなど、関連性の高い単語をセットで把握することができます。マーケティングにおいては、商品名を軸に共起分析を行えば商品に対する評価やイメージを把握する一助となります。
専用のツールを用いると共起ネットワークが生成され、単語間の結びつきの強さなどを視覚的に理解することができます。
以下の記事も参考にしてください。
市場調査の分析手法|定量・定性データを分析して市場構造を把握しよう
テキストマイニングの手順と効率化に役立つツール
テキストマイニングでは、分析に入る前にデータの処理などを行う必要があります。ここでは、テキストマイニングの基本的な流れと効率化に役立つツールについて見ていきます。
1.データ収集
まず、分析対象のテキストデータを収集します。SNSやWebサイトなどのデータを収集する場合はAPIを使用すると効率的です。
2.データの前処理
日本語の文章は英文のようにスペースがないうえ、同音異義語や表記ゆれなども多く、明確な切り分けが難しい特性があります。収集したデータのままでは分析しづらいため、あらかじめ自然言語処理を施して分析できる状態にします。
前処理では主に「形態素解析」が用いられます。形態素解析は、テキストデータを最小単位(形態素)に分割する手法です。たとえば、「私は毎朝ヨーグルトを食べます」という文章に形態素解析を施すと以下のようになります。
私(代名詞)/は(副助詞)/毎朝(名詞)/ヨーグルト(名詞)/を(格助詞)/食べ(動詞)/ます(助動詞) |
このように品詞単位で分割することで、単語の出現頻度などを集計しやすくなります。
また、「リンゴ」「りんご」のような表記ゆれに対しては、データクレンジングを施して表記を統一します。大文字・小文字や全角・半角についても表記を整理することで分析精度を高めることができます。
3.データ変換
テキストデータは規則性がなく分析しづらい非構造化データであるため、構造化データに変換する必要があります。具体的には、形態素解析で分割したデータをもとに「構文解析」などを行うことで文章の構造を明らかにします。構文解析は修飾・被修飾などの相互関係を分析する手法で、単語や文節の関係性をツリー状に可視化することができます。
4.分析
データの前処理や構造化が完了したら、コレスポンデンス分析や主成分分析など目的に合った手法で分析を行います。
テキストマイニングツールで効率化
テキストマイニングはExcelやプログラミング言語のPythonでも分析可能ですが、専門的な知識やマンパワーを要するため、テキストマイニングツールを活用することをおすすめします。
テキストマイニングツールにはさまざまな機能が備わっており、統計の専門知識がなくても膨大なテキストデータを効率的に分析することができます。
主な分析機能を以下に挙げます。
- 形態素解析
- ワードクラウド
- 構文解析
- 頻度分析
- 時系列分析
- センチメント分析
- 主成分分析
- 共起分析
- コレスポンデンス分析
機能はツールごとに異なり、SNSの分析機能が強化されているものや、表記ゆれや同義語などを登録できる辞書機能が備わっているものもあります。無料・有料など料金にも幅があるため、まずは自社の分析目的を整理したうえで適したツールを選びましょう。
最後に、おすすめのテキストマイニングツールを4つ紹介します。
<見える化エンジン>
特徴:・11年連続国内シェアNo.1
・最新のトレンド用語にも対応可能
・コンサルタントによる丁寧なサポート
料金:要問い合わせ
公式サイト:https://www.mieruka-engine.com/
<AIテキストマイニング>
特徴:・暗号化による高いセキュリティ性
・ディープラーニングによる感情認識にも対応
・辞書カスタマイズ機能
料金:要問い合わせ(個人向けは無料)
公式サイト:https://textmining.userlocal.jp/enterprise_textmining/
<YOSHINA>
特徴:・音声データのテキスト化・分析が可能
・分析フェーズに合わせたきめ細やかなサポート
・定点観測や深堀分析やなど豊富な分析機能
料金:初回2ヵ月トライアル 月額15万円~
年間契約プラン 月額30万円~
公式サイト:https://yoshina.retrieva.jp/
<TextVoice>
特徴:・直感的に使えるわかりやすい操作性
・類似語を自動で辞書化
・6種類の分析結果を自動出力
料金:初期費用20万円
基本プラン 月額10万円
SNSデータ取得オプション付き 月額13万円
公式サイト:https://www.textvoice.jp/info/
テキストマイニングで新たなニーズや課題を発見しよう
アンケートの自由回答やコールセンターに寄せられる声、インターネット上の口コミ投稿などの定性データには、商品開発やビジネスの改善につながる情報が含まれています。テキストマイニングでセンチメント分析やコレスポンデンス分析などを行えば、大量のテキストデータから有益な情報を抽出し、新たなニーズや課題を発見することができます。
ただし日本語の特性上、分析前に自然言語処理を施して定量的に分析しやすく加工する必要があります。Excelやプログラミング言語による分析が難しい場合は、目的に合った機能が備わったテキストマイニングツールを活用しましょう。