グーグル(Google)

グーグル検索の仕組みはgoogle.comの検索サービスのページに概要がわかりやすく説明されている

この記事は約4分で読めます。

Google_apamグーグル検索の仕組みはgoogle.comの検索サービスのページを見るとよい。「検索の仕組み」の概要がわかりやすく説明されている。検索の仕組みを知る上で重要な3つの項目がある。その3項目とは「クロールとインデックス」「アルゴリズム」「スパム」である。とくに「スパム」に関しては、より厳しくなったグーグルの姿勢が現れている。アルゴリズムでの対策だけではなく、手動による対策も組み合わせてスパム排除していることが明記されている。

驚いたのは、実際のスパム判定したサイトを公開していることだ。

実際のスパム判定したサイトを公開している。しかも、これらのスパムサイトのスクリーンショットは「手動」でスパム判定をしていることが明記されている。
このことは、アルゴリズムが卓越したグーグル自体が、アルゴリズム判定だけではスパム撲滅が難しくなってきているのではないかということと、晒し者にすることにより「スパムは許さない」というグーグルの姿勢が強く感じられる。

スパム判定されないためには、価値あるコンテンツを提供することだ。

スパム判定されたサイトは、「自動生成された意味不明の文字列、クローキング、他のウェブサイトからのコンテンツのスクレイピングなど、攻撃性の高いスパム技術が使用」ということである。
スパムから逃れるもっとも間違いない方法は、自分でオリジナルの文章を書くことである。
情報を探している人が喜ぶような価値ある情報を提供し続ければ、自然と検索にヒットするようになり、アクセスが増加する。無駄なSEO対策に時間とコストを費やすよりも、ブログなどで価値あるコンテンツを提供することが有効である。

以下引用(引用URLはhttp://www.google.com/intl/ja/insidesearch/howsearchworks/fighting-spam.html)

スパム対策

毎日、数百万件に及ぶ無用なスパムページが作成されています。Google では、コンピュータのアルゴリズムと手動による対策を組み合わせて、スパムを排除しています。
スパムサイトは、キーワードを何度も繰り返したり、PageRank を転送するリンクを購入したり、隠しテキストを画面に埋め込んだりするなどの手法を使って、何とか検索結果の上位に入ろうとします。これにより、関連性の高いウェブサイトの順位が下がるため、検索結果に悪影響を及ぼします。また、関連性の高い正当なウェブサイトが見つかりにくくなるため、それらのサイト所有者に不利益をもたらします。
Google のアルゴリズムでは、大半のスパムを検出して自動的にそれらの順位を下げることができます。対処できないスパムについては、Google のチームが手動でサイトを確認しています。

スパムを識別する

スパムサイトは、その手法も異なれば規模も異なります。中には、自動的に作成された意味不明で人間がまったく理解できないものもあります。もちろん、一見するだけでは判断が難しいような巧妙なスパムの手法を使用しているサイトもあります。
ここでは、非常に悪質なスパム手法を使用している「純粋なスパム(pure spam)」の例を挙げます。これらは、Google が手動で特定して削除したために最近では検索結果に表示されなくなった、実際のスパム サイトのスクリーンショットです。

Spam01

Spam02

Spam03

Spam04

自サイトがスパム判定されているかどうかの確認

自サイトがスパム判定されているかどうかの確認はウェブマスターツールで行うことができる。ダッシュボードの「検索トラフィック」→「手動による対策」をクリックし、なにも記載されていなければOKである。なんらかのメーセージがあればグーグルからWEBスパムの判定を受け、ペナルティが課せられていることを表す。

手動対策ビューアに出てくる手動の対策の対象になるウェブスパムは以下の10種類。

グーグルのSEO最高責任者のマッツカット氏がWEBスパムのひとつ「不自然なリンク」についてユーチューブで直接説明している。丁寧に日本語の字幕付きである。

不自然なリンクはスパム

この動画は、http://www.youtube.com/watch?v=6UFHCw4Q_FQ#t=38 から見ることができる。