これは実験(実証)段階ではあるんですけど、参考データにはなるんじゃないですかね。
データマイニングの手法の一つであるテキストマイニングを使ってSEOやリスティング広告のワードを抽出する方法です。
これを試してみようと思った経緯は、会社のサイトの効果測定をやっていた際に、検索クエリを提出したところ、「似たようなワード、同じ意味合いのワードなどを1種類としてカウントできないか」「どのワードがどのくらいあるのかを調べたい」といった要請をもらった際に、それはテキストマイニングだよなーと思って調べたのがきっかけでテキストマイニングのフリーソフトを見つけてやってみたらちょっと面白いかも?と。

検索クエリのダウンロードをします。
Adwordsのキーワードプランナーを使ってもいいんでしょうけど、多方面からの検証は悪いことではないので。
00000


エクセルでダウンロードします。そのエクセルを開きます。

ws000028


今回欲しい情報は単語、文字群のみなので、A列だけを全選択して、テキストエディタにコピー%ペースト。

ws000027


.txt形式で保存します。ひとまず、使うデータはこれでOK

次に、テキストマイニングを実行するソフトをインストールします。
KH CORDERで検索するとすぐ見つかると思います。
ws000031


このソフトをダウンロードしてインストールします。インストール方法はこちらのページに記載されています。
インストールが終わったらexeファイルからソフトを開きます。

ws000026


開発された方が作られたチュートリアルが非常にわかりやすいので、設定はそちらを参照してください。
インストールが終わったら、新規プロジェクトで先程.txtで保存したファイルを読み込ませます。
次に前処理を実行したら終わりです。
あとは集計結果を出力するだけです。

とはいえ、色々と抽出条件が選べるようなんですが、条件としてはツール→抽出語→階層的クラスター分析と共起ネットワークですかね。
ほかはパッと見てすぐに単語がわかる(わかる方が見ればわかるのかもしれませんが、僕レベルですと見た目ですぐわかるようなものでないと駄目でして・・・)感じではなかったので。自己組織化マップも面白いんですけど、処理が重たいみたいでちょっと時間を要します。

kurasuta


階層的クラスター分析
クラスター分析とは・・・クラスター分析とは、異なる性質のものが混ざりあっている集団(対象)の中から互いに似たものを集めて集落(クラスター)を作り、対象を分類しようという方法を総称したものです。このクラスター分析を用いると客観的な基準に従って科学的に分類ができるため、マーケティングリサーチにおいては、ポジショニング確認を目的としたブランドの分類や、イメージワードの分類、生活者のセグメンテーションなどに用いられます。(マクロミル:クラスター分析参照)

%e5%85%b1%e8%b5%b7


共起ネットワーク
共起ネットワークとは・・・文書からその文書を特徴づける語の抽出を行い、特徴語同士の共起関係をネットワーク図にするものである。(あんちべKH Coderによる共起ネットワーク作成参照)

特に共起ネットワークは視覚的であり、ラインの太さや円の大きさ、色がボリュームに依って変わるため、非常にわかりやすい。

で、実際に会社のサイトでもやってみて、広告運用のチームに見せたところ手動で抽出したワードとほぼ内容が一緒だった、という結果もあり、この手法は使えるんじゃないか、と僕は思ってます。

広告運用とSEOをしっかりやりたいならば検索クエリと、自然流入のワード、検索にかけたい言葉の整合性が取れていなければいけなくて、更に言うと、今ある検索で出したいページの本文やメタ文書もこれらと比較する必要もあると思ってます。めちゃめちゃ地味に細かい作業ですけどね。

実際に「あれ」「それ」「コチラ」などの言葉が非常に多い場合はそれらを固有の名詞や動詞(要は検索にかけたいことば)に置き換える必要はあります。例えば、検索にかけたいページを全選択して、文書を抜き取ったあと、テキストをコピペしてテキストデータをKHCORDERに読み込ませるとそのページで使われている言葉の内容がわかります。
その比重も。それによってそのページに使われている言葉が果たして検索エンジンに対して最適なのかどうか、そういった検証にも使えると思います。各ページの単語構成はアナリティクスでは出せませんからね。

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください