2010年3月15日を持ちまして、当ブログは終了し、「SEMアドバイザーの揺さBrain!」へ移行しました。

 なお、移行後の当ブログへのコメント、及び、トラックバックは全て非掲載とさせていただきます。何度も送信されるブログには禁止設定をさせて頂きます。また、コメントを書き込みましても、当方は一切チェックをしておりません。

2008年11月01日

スキャン文書の検索も可能になったGoogle、Yahoo!は追いつけるのか!?

 やはりグーグルは恐るべき進歩をすごい勢いでしております。

 Official Google Blogの10月30日の記事によると(もちろん英語です)、OCR(新聞などをスキャンしたものをデータとして認識したりすることができる技術です。光学文字認識。)を利用してテキストデータを認識して、きちんとインデクシングをするとのことです。

 これについては10月31日のMarkeZineの記事にも書いてありますが、すごいことですね。言い換えれば画像化しているテキストを読んでしまって、検索にひっかかるようにしてしまったということです。

 ヤフーが古き悪きスパムプログラムをいまだに見抜けないのに対し、グーグルは何歩も前を進んでいます。

 とはいえ、一つ気になるのがOCRの認識率はいかなるものなのか?ちなみに、例えば99%の認識率だとした場合に、皆さんはどれくらいのイメージがわくでしょうか?

 冷静に考えれば100文字に1文字は違うと言うことで、普通の文章ならば100文字なんてことはなく、かなりの文字数の文書が多いわけです。とすると、意外と間違いも多いということです。

 それでも現在は99%以上のOCRというのは以前の96%などに比べてはるかに精度が高く、全てを入力しなおすならば、ミスをチェックするほうが早いくらいの精度だといえます。

 いずれにせよ、グーグルは常にユーザーが求める可能性があるものは、できるだけインデクシングをするという姿勢で進化をしていると考えます。ヤフーが技術で進歩をするときには、グーグルは常に前を進んでいます。

 そう、考えるとヤフーの進む道は、グーグル以上に「ユーザーの検索したい内容に近いものを事前に想定し、ユーザーの希望にあったものを結果として表示する」という道しかないのかもしれません。

 日本での支持率が高いことに満足せずに、この地盤を揺ぎ無いものにヤフーは日々努力をしてほしいものです。(インタレストマッチのような利益ばかり考えているのではなく・・・・。)

 ちなみにヤフーに厳しく書いていますが、私はヤフーでの検索が全体の9割程度で、残りがグーグルです。つまりヤフー贔屓なんですね。だからこそ、苦言を呈しております。頑張ろう!ヤフー。

◆SEO・SEMのコーチングのご相談・ご依頼はSEO対策指導の公式サイトより承ります。

今回の記事が参考になった方はここをクリックお願いします
はてなブックマークへ登録はてなブックマークへ登録
ブログランキング【くつろぐ】
posted by kame at 23:53 | Comment(0) | TrackBack(0) | Google対策