エクセル2013には無料で使える「twitter分析アプリ」がある。特定の言葉をtwitterでツイートされた膨大なデータから最大18000ツイートをエクセル形式で抽出できる。そのままだと分析はなかなかむずかしい。そこでテキストマイニングを試してみた。
このエクセルデータを分析で使えるようにノイズを消して整えてからテキストマイニングにかける。テキストマイニングは無料で使える「KHコーダー」を使ってみた。共起ネットワークの図を見ると、それだけでテキストマイニングっぽくなるのがすごい。
エクセル2013のTwitter分析アプリでデータ取得
Twitter分析アプリで蕎麦関連のツイートを取得した。そのままだとRT(リツイート)回数が多いツイートが多数出現してしまうので、代表的なツイートを一つ残しその行にリツイート数を記録することにした。直近1週間のツイートでノイズを除去すると約1400行ほどになった。
KHコーダーで共起ネットワークを表示
KHコーダーを使ってこのエクセルを読み込んで分析する。xlsのままだと文字コードをうまく読んでくれなかったので、エクセルをcsv形式にしてシフトJIS設定で読みこませた。
出現頻度の多い文字を大きくしたり、共起される言葉のつながりの線を太くするなど設定をもっと進めると、目に見えてわかりやすい共起ネットワーク表ができる。
なんとなく関連性の強さがわかるのがおもしろい。使えるAIとまではいかないかもしれないが、もう少し使い込んで実際のビジネスに使えるようにしてみたい。
▼KH Coder (http://khc.sourceforge.net/より)
KH Coderとは、テキスト型(文章型)データを統計的に分析するためのフリーソフトウェアです。アンケートの自由記述・インタビュー記録・新聞記事など、さまざまな社会調査データを分析するために制作しました。「計量テキスト分析」または「テキストマイニング」と呼ばれる方法に対応。
▼ウィキペディアより一部引用
KH Coderを用いて行われた研究としては、アンケートの自由回答項目・新聞記事・インタビューデータなど様々なデータを分析した事例がある。
KH CoderはPerlによって作製されており、バックエンドとしてChaSen・MeCab・MySQL・R言語・Stanford POS Tagger・Snowball Stemmer・TermExtractなどを利用している。すべての機能をマウス操作で利用することができるが、より高度な検索・分析のために直接MySQLにアクセスして独自の検索を行ったり、R言語に修正を加えることで統計分析をカスタマイズすることができる。また短いPerlスクリプトを書くことでプラグインを作成し、独自の機能を付け加えることもできる。
この記事を書いた遠田幹雄は中小企業診断士です
遠田幹雄は経営コンサルティング企業の株式会社ドモドモコーポレーション代表取締役。石川県かほく市に本社があり金沢市を中心とした北陸三県を主な活動エリアとする経営コンサルタントです。
小規模事業者や中小企業を対象として、経営戦略立案とその後の実行支援、商品開発、販路拡大、マーケティング、ブランド構築等に係る総合的なコンサルティング活動を展開しています。実際にはWEBマーケティングやIT系のご依頼が多いです。
民民での直接契約を中心としていますが、商工三団体などの支援機関が主催するセミナー講師を年間数十回担当したり、支援機関の専門家派遣や中小企業基盤整備機構の経営窓口相談に対応したりもしています。
保有資格:中小企業診断士、情報処理技術者など
会社概要およびプロフィールは株式会社ドモドモコーポレーションの会社案内にて紹介していますので興味ある方はご覧ください。
お問い合わせは電話ではなくお問い合わせフォームからメールにておねがいします。新規の電話番号からの電話は受信しないことにしていますのでご了承ください。
【反応していただけると喜びます(笑)】
記事内容が役にたったとか共感したとかで、なにか反応をしたいという場合はTwitterやフェイスブックなどのSNSで反応いただけるとうれしいです。
遠田幹雄が利用しているSNSは以下のとおりです。
facebook https://www.facebook.com/tohdamikio
ツイッター https://twitter.com/tohdamikio
LINE https://lin.ee/igN7saM
チャットワーク https://www.chatwork.com/tohda
また、投げ銭システムも用意しましたのでお気持ちがあればクレジット決済などでもお支払いいただけます。
※投げ銭はデジタルコンテンツ購入という通販のしくみにしました。
※投げ銭は100円からOKです。シャレですので笑ってください(笑)