spam?

マルコ式ネット白書で、以前、BloggerとWord2007の親和性という記事を書きましたが、内容は全く親和性とは関係のない焼酎の製造方法が掲載されています。
しかし、word2007で検索をかけると、Yahoo!では2番目に出てきますし、Googleでは検索結果のTopに表示されます。

一見するとスパムにしか見えませんし、書いた本人も一瞬スパムかシステムエラーか?と思ってしまうほどです。

他のMicrosoft word2007を差し置いてこの上位表示結果は、いろんな意味で刺激になること間違いなしです。
まず、Word2007を調べた人が全く内容の違うコンテンツがトップで表示されるという不可思議な現象にさいなまれますし、検索エンジンとしての機能を疑ってしまいます。
スパム対策で幾度となくアルゴリズムを変更してきたにもかかわらず、こうしたことが起こってしまうのはなぜなのか?ちょっといろいろと考えてみました。
どちらにも共通していることは、
bloggerword2007.html
と、タイトルに含まれる単語がそのまま2つもドメインにも含まれているということです。
これは、bloggerの自動生成プログラムによるもので、意図してそのようなファイル名にしているわけではありません。英語表記のタイトルに関しては、ファイル名もそのタイトル通りの名前が自動的に付くようになっています。
ただ、日本語の場合、作成年月日が入るようになっているようです。
こうした機能によって自動生成されたファイル名とタイトルの一致が上位検索結果を導き出しているのではないか?と推測されます。

そのほかでは、Web2.0について掲載したときは、

というURLになっており、タイトルはそのままずばりWeb2.0でした。

今でももはや60番台まで落ちてしまいましたが、Web2.0が話題になっていた時は有名社長のブログよりも上位に表示され、10番以内にまで入っていました。

こうしたことを踏まえると、検索結果で自分のサイトを上位に表示されるには以下のことが最も重要だと考えられます。

  • ドメインとタイトルの一致
  • コンテンツ量
  • コンテンツの内容
  • 他ページのアクセス状況

ロボットが最も評価しているポイントは、ドメインとタイトルの一致だと考えられます。
特にYahoo!では、その傾向が強くドメイン名とサイト名が一致していれば簡単に上位表示されます。

また、コンテンツの量も必要なのではないか?と考えます。これも以前サイトボリュームをみているのではないか?と推測した内容通りで、1ページあたりの文字数も換算しているのではないでしょうか?

そして、コンテンツの内容についてはどの程度信ぴょう性があるのか、今回の検索結果を見ていささか疑問を持ってしまいましたが、それでもコンテンツの内容が一致していなければ、アクセス数は伸びません。なぜなら、ロボットに見てもらうことを前提としているわけではなく、あくまで人(ユーザ)に対しての情報発信なのですから。
「ロボットはだませても、おいらはだませないぜ!」というように、Word2007というタイトルにもかかわらず、焼酎の作り方が書いてあったら誰もが「スパム?」と思ってしまうはずです。案の定、このページにトラックバックをかけたところ、スパムはやめてくれとのコメントをかなりいただきました。

最後に他のページのアクセス状況についてですが、これもやはり影響は強いと考えています。
というのも、もともと上位表示結果であったはずのWeb2.0のページがいきなり下がってきた理由の一つに、よりアクセス数のあるサイトがその内容について言及し始めたからです。
もともとアクセス数のあるサイトやブログであれば、おのずと上がってくるのではないだろうか?と考えています。特にHowTo系サイトやニュースサイトでも取り上げられるようになると、一人でちまちま書いているブログでは到底太刀打ちできません。実際にGoogleの検索結果で最近上位表示になっているのは、やはりこうしたHowTo系サイトやニュースサイトでした。

今最も気がかりなのは、Word2007のページがスパムと判定されサイト全体に影響が及んでしまうことです。
でも、やってしまったことなので検索にかからなくなってしまったらそれまで。。と腹をくくってこれからも連載していく所存でございます。