リスティング広告における形態素解析の知識を持っておくと便利かもしれない件

4915677457_f11c4c9e07

僕が前職でリスティング広告を運用していた時に、こんな話を聞いたことがあります。

それは「複合キーワードにおけるスペースの有り無しは広告表示に影響しない」というお話。

そうなんだぁとずっと思ってきたのですが、現職になってからは、いやいや関係ないこともないだろうと思うところがあり、記録に残しておきたいと思います。

とはいえ、そんなに実例をあげられるほどの数には遭遇していませんし、スペースの有り無しで広告表示に影響がありそうな場合、キーワードの掛け合わせ方に問題があったりする場合が多いのではないかと感じております。

ちなみに、本記事の内容は検索エンジンから提供されるデータに基づいて推測も交えた検証を行った結果を元にしておりますので、あくまでも参考程度のネタとして捉えておいていただけると嬉しいです。

Contents

スペースの有り無しが広告表示に影響しそうなキーワードって?

私が、遭遇したパターンから感じたのは、次のように1語のキーワードが複数の名詞で構成されるパターンです。

キーワード要素キーワード1要素キーワード2
腕時計時計
水鉄砲鉄砲
AKB48AKB48

 

「腕 時計」「水 鉄砲」のようにスペースが入ることで違和感を感じる複合キーワードを登録することはないと思いますが、「AKB メンバー名」のような複合キーワードの検索は一般的だったりしますので、機械的にキーワードの掛け合わせを行った場合、「AKB 48」のようにスペースが入ることはありうるわけであります。

 

スペースの有り無しによる影響の有無はどう見極めるか

スペースの有り無しによって、広告表示に影響が出てくるのであれば、検索エンジンがスペースの有り無しを区別しているということになりますので、その上でそれぞれが別キーワードだと判断されるのであれば、検索ボリュームに差が出てくるはずです。「AKB48」「AKB 48」と打ち分けて検索される比率は統計をとっても5:5にはならないはず。ほとんどが前者で入力すると考えられるからです。

なので、Googleキーワードツールで見て見ました。

まずはスペース無しのキーワード

Google AdWords キーワード ツール 2013-04-06 00-14-43

続いてスペース有りのキーワード

Google AdWords キーワード ツール 2013-04-06 00-15-29

いかがでしょうか。

検索ボリュームだけでこれだけ差がでるということは、こういったキーワードについてはスペース有り無しで異なるキーワードと認識されるようです。しかも、おおよそのクリック単価もキーワードによって異なるものもあり。

ちなみに、よくありがちなキーワードで試してみると、

Google AdWords キーワード ツール 2013-04-06 00-19-39

スペースの有り無しで検索ボリュームやおおよそのクリック単価が変わらないので、おそらくこれはスペースの有り無しは関係ないと判断出来ます。

 

なんでこのような事が起こるのか

これは、検索エンジン側が日本語を理解するために、形態素解析というものを行なって、検索キーワードを言葉と捉え、その言葉を分解して理解しているからになります。

Wikipediaによると、形態素解析とは…

形態素解析(けいたいそかいせき、Morphological Analysis)とは、コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつ。かな漢字変換等にも応用されている。

対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い、自然言語で書かれた文を形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの品詞を判別する作業を指す。

難しい説明ですね…。噛み砕くと、文章を最小の品詞単位まで分解するということなのですが、事例などは、こちらの言語郎というサイトが参考になるかもしれません。

 

なぜ形態素解析が広告の表示に影響しそうなの?

「腕時計」と「腕 時計」の事例で見てみましょう。

 

「腕時計」の場合・・・「腕時計」という単語だけで1つの名詞と捉えられて、これ以上分解されない。

「腕 時計」の場合・・・キーワードの間にスペースが有ることで、「腕」という名詞と「時計」という名詞の2つに分解された。

 

つまり、スペースの有り無しによって、形態素解析結果が異なり、それぞれが異なるキーワードとして検索エンジンに認識されてしまうことが、広告表示に影響するであろうという理由です。また、この際のマッチタイプはキーワードツールのデータを見ると関係ない模様です。

 

リスティング広告の検索クエリレポートは形態素解析後のキーワードが表示される

リスティング広告の検索クエリレポートを見ていて、1語のキーワードで入札しているはずなのに不自然なスペースが入っていることありませんか?それこそ、検索エンジン側が認識したキーワードになる…のだと思います。

なので、形態素解析後のキーワードを見ると、除外キーワードの選定なども行いやすかったりします。

 

もしかして自然検索結果(SEO)も影響ありそう?

YESかNOでいうと、限りなくYESだと思います。

それぞれの検索エンジンで「AKB48」と「AKB 48」で検索してみてください。微妙に順位が異なったり表示される情報も異なったりしているところをみると、影響はゼロではないかなと思います。

 

つまりどうしたら良い?

キーワードを洗い出し、掛け合わせによる複合キーワードを作成するときに、スペースの有り無しによって検索エンジンからの捉えられ方が異なっていないかを気をつけること、という他ありません。

「腕時計」「腕 時計」のように本来は前者で使われることが多いようなキーワードの場合は、スペース無しも登録するべきだと思いますし、取りこぼしを防ぐという意味では両方あっても良いかなとも思います。

ただし、機械的に掛けあわせた結果「腕 時計」だけになってしまうようなキーワードの洗い出し方やかけあわせ方、キーワードグルーピングは避けたほうが良いと思っております。

また、形態素解析のために様々なアルゴリズが存在しており、検索エンジンがどのアルゴリズムを採用しているかは非公開ですので、ここも注意する必要があるということを付け加えておきます。