BLOOM journal

検索エンジンのインデックスの仕組みとチェック方法

投稿日:2015年03月16日
SEOの知識

  • このエントリーをはてなブックマークに追加

どうも、ブルームプロモーションの高橋です。

前回の検索エンジンの仕組みを知る第一歩 GoogleクローラーがWebサイトの情報を収集する仕組みに続き、今回は二歩目の「インデックス」の仕組みと、自社サイトのインデックスのチェック方法をお伝えします。

インデックス=索引

まず「インデックス」とはなんなのでしょうか?辞書によると【《index》索引。見出し。】 とあります。「索引(さくいん)」という言葉も、普段あまり聞きなれないかも知れませんが、図鑑や長編小説などの巻末についていて、本の内容やページをキーワードから探すために活躍する、とても便利な機能です。

Googleのインデックスも正にこの索引と同じ機能を作っていくプロセスです。

index

検索エンジンにページを登録して情報を整理する

googlebotなどのクローラーが持ち帰ったwebページの情報量はあまりにも膨大です。
クロールとインデックス – 検索サービス -Googleの中でも「インデックスは 100,000,000 ギガバイトを超え、その構築に費やした処理時間は 100 万時間を超えています。」と、その苦労を語っています。単位が大き過ぎて正直ピンときません。

とにかくとんでも無いコストが掛かってるのは理解できますが、いくら世界中の情報を集めていると言っても、情報は使えなければなんの意味もありません。この、集めた情報を検索結果として使うための整理整頓の作業が、インデックスです。

 

 Googleは超巨大図書館

Webサイトを本に見立てると、Googleは図書館と言えます。GoogleはWeb上に散らばった本(WEBサイト)の中にクローラーを忍び込ませ、ページ単位の情報をかき集めページのひとつひとつを調べます。

・どんなテーマのWEBサイトのページなのか?
・どんな内容のページなのか?
・いつ書かれたページなのか?
・画像や動画は入っているページなのか?
・Webサイトの中のどの階層のページなのか?

など、ページに関する情報をジャンルやカテゴリー別に分け、きれいに整頓して並べ把握していきます。ユーザーがGoogle図書館に、情報を探しに来た時に、サッ!と取り出せるようにするためです。

 

Googleのインデックスも、本と同じくキーワード(単語)を軸にページの内容をまとめます。各ページに付けられたタイトルが、探す時に役立ちます。SEOではキーワードやタイトルが重要視される理由です。

超巨大図書館であるGoogleは検索したユーザーにとって最適な結果を返す準備のため、このインデックスという本の整理作業を日夜続けているのです。

googleは図書館

インデックス(登録)されなければ「無い」と同じ

Googleは基本的にインデックス数が多いサイト、つまりページ数が多いサイトを評価する傾向にあります。薄っぺらい本より、厚い本の方が内容も濃く、より詳しいはずなので、何かを探している人にとって有益な確率が高いはず。というのが基本的な考えです。

ちなみに過去記事、惜しい!SEO「Webサイトのページ数は多いほど良い?」でも説明しましたが、ページの質もとても重要ですのでお忘れなく。

 

さて、インデックスのことは大体わかったところで、忘れてはいけない事実があります。それは、Google図書館に並んでない本は、ユーザーがいくら探していようとも、検索結果として出てこないということです。

つまり、クローラーに見つかっていないページはインデックスされず、検索するユーザーにとっては無いに等しいのです。

そこでまずは検索される準備、ページがインデックスされているかどうか?の簡単チェック方法をお教えします。

 

ページのインデックス確認方法

ページがインデックスされているかどうかのチェック方法は、Googleの検索窓に調べたいページのURLを打ち込み、その結果ページが表示されればOKです。Google図書館に並んでいます。

もし表示されなければ、Googleが提供するWebマスターツールを使ってgooglebotに来てもらう必要があります。

インデックスチェック

 Webサイトのインデックス数の確認方法

自分のサイトのインデックスされているページ数を調べるためには、検索窓に「site:」と打ち、その後にサイトtopページのURLを打ち込みましょう。すぐ下に出る約◯◯件というのが、インデックス数です。

サイト内でブログを書いている方は、更新のたび、インデックス数が増えていくはずです。
どんなサイトのインデックス数も調べられますので、競合調査としても役立ちます。

siteコロン

まとめ

・インデックスとは、索引。クローラーが持ち帰った情報を整理するプロセス
・インデックスされていなければ、検索上は「存在していない」と同じ
・インデックスされているかの確認は、Goolge検索でURLを打ちましょう
・インデックス数の確認は、Goolge検索でsite:URLを打ちましょう

 

次回はGoogle検索エンジンの仕組みの最後の記事です。

Google検索のアルゴリズム(検索順位の決め方)を理解しよう。

アルゴリズム漫画

  • このエントリーをはてなブックマークに追加