こんにちは!ブルームプロモーションの大井です。
「インデックス」という言葉を聞いたことはあるでしょうか?
索引(さくいん)や見出しという意味を持つ言葉で、中には目次のことを英語で「INDEX」と表示しているページもありますよね。
それも正しい「インデックス」ですが、SEOにおいては、ちょっとだけ違う意味を持ちます。
SEOに関わるなら、Googleの「インデックス」についてはぜひ知っておいてほしいところ。
今回は、そんなインデックスについて紐解いていきます!
SEOでのインデックスとは何を指すか、なぜインデックスが重要なのか、インデックスの確認方法など、詳しく解説します。
目次
「インデックス」とはGoogleの索引のようなもの!その仕組みもチェック
まず「インデックス」とは何なのでしょうか?
「インデックス」を辞書で引くと【《index》索引。見出し。】 とあります。
「索引(さくいん)」は、図鑑やテキストなどの巻末についていて、本の内容やページをキーワードから探すためのものです。
Googleのインデックスも、この索引と同じ機能を持つものです。
少しだけ違うところを挙げると、一般的には”索引そのもの”を「インデックス」と呼びますが、SEOにおいては、Googleの”索引(データベース)にWebページの情報が登録されること”を「インデックス」と呼びます。
Webページは、Googleにインデックスされることで初めて検索結果に表示されるようになります。
Googleのインデックスの仕組みとは?
Googleのインデックスの仕組みをざっくりお伝えすると以下の通りです。
- クローラー(※)が新しく公開されたページを発見する
- クローラーがページの内容を確認し、Googleによって評価が行われる
- インデックスされる
- 検索結果にインデックスされたページが表示されるようになる
※クローラー:Web上を泳ぎ回り情報を収集するロボットのことで、Googleのロボットは「Googlebot」と呼ばれる。また、クローラーが情報を収集することは「クロール」という
Googlebotなどのクローラーが持ち帰るWebページの情報量は膨大で、今やGoogleの検索インデックスに含まれるページ数は数千億(サイズにして100,000,000ギガバイトを超えるほど)といわれています。
とにかくとんでもないコストが掛かってるのは理解できますが、いくら世界中の情報を集めているといっても、情報が使えなければ何の意味もありません。
この集めた情報を検索結果として使うための整理整頓の作業としてインデックスが必要です。
インデックスの仕組みは図書館をイメージすると理解しやすい
Webサイトを本に見立てると、Googleは大きな図書館のようなもの。
1つのWebサイトが1冊の本、そしてそのWebサイトの1ページが、その本の中の1ページというイメージです。
例えばこのページは、『株式会社ブルームプロモーション』という本の中の「Googleの「インデックス」とは?SEOで押さえておきたい検索の仕組み」というページ、という感じです。
インデックスは、Googleという図書館の蔵書に本(Webサイト)を加える作業に似ています。
図書館の蔵書にない本は読むことができないように、GoogleにインデックスされていないWebサイトは見ることができないんです。
そして、Google図書館の蔵書に加える(インデックスする)ためには審査があります。
内容が薄かったり信頼性に欠ける本ばかりを扱っていては、人々が利用してくれません。
人々のためになるような本を扱うために、本の中にクローラーを忍び込ませ、ページの一つひとつを調べます。
チェック項目はたくさんありますが、代表的なのは以下のような項目です。
- どんなテーマのWebサイト/Webページなのか
- いつ、誰によって書かれたものか
- 画像や動画が入っているか
- Webサイト/Webページの構成がわかりやすいか
- 閲覧に支障はないか
- モバイルに対応しているか など
これらの項目をクローラーが収集し、Googleによって問題ないと判断されて初めてGoogle図書館へのインデックスが許され、検索結果にも表示されるようになります。
「閲覧に支障がないか」というのは、本の開きやすさ的なところ。
立派な素材で本を作ったとしても、重すぎて開きづらい本は読むのが嫌になってしまいます。
それと同じように、あまりに開きづらいWebサイトはユーザーに嫌われがちなので、Google図書館で扱ってもらえない可能性があります。
また、2023年10月からGoogleは完全に「モバイルファーストインデックス」に移行しました。
「閲覧に支障がないか」という点とも重なりますが、多くのユーザーがスマートフォンからWebサイトを閲覧するため、スマートフォンで見やすい環境を整えることも重要です。
もし、ご自身が公開したページが検索結果に表示されないとしたら、それはGoogle図書館の蔵書に加えられていない可能性があります。
そこでまずは検索される準備、ページがインデックスされているかどうか?を簡単にチェックする方法をお教えします。
ページがGoogleにインデックスされているか確認する方法
ページがインデックスされているかどうかのチェック方法は、Googleの検索窓に調べたいページのURLを打ち込むだけでOKです。
その検索結果にページが表示されれば、インデックスされている状態です。
より確実な方法として、Google Search Console(サーチコンソール)を使った確認方法があります。
- Google Search Consoleにログインする
- 左メニューから「URL検査」を選択する
- 確認したいページのURLを入力してEnterを押す
以下のように、「URLはGoogleに登録されています」と表示されれば、インデックスされています。
インデックスされていない場合は、「インデックス登録をリクエスト」ボタンをクリックすることで、Googleにインデックス登録を依頼できます。
インデックス登録をリクエストしたからといって必ずインデックスされるわけではないこと、またリクエストできる回数には制限がある点には注意が必要です。
Webサイトのインデックス数の確認方法
自分のサイトのインデックスされているページ数を調べるためには、検索窓に「site:」と打ち、その後にサイトのTOPページのURLを打ち込んでみましょう。
右上部の「ツール▼」を押すと、その右下に約◯◯件というのが出ます。
それが、インデックス数です。
サイト内でブログを書いている方は、更新のたび、インデックス数が増えていくはずです。
どんなサイトのインデックス数も調べられますので、競合調査としても役立ちます。
この「site:」コマンドを使えば、特定のディレクトリやカテゴリに限定したインデックス状況も確認できます。
例えば、弊社のブログは全て(https://www.bloom-promotion.jp/journal/)配下に入っていますが、「site:https://www.bloom-promotion.jp/journal/」と入力すれば、/journal/ディレクトリ内のインデックス数がわかります。
このsite:検索は、だいたいのインデックス数を知るための方法なので、きちんとインデックス数を調べたいときは、Google Search Console(サーチコンソール)を使用しましょう。
左メニューの「インデックス作成>ページ」から確認できます。
Googleにインデックスされない原因として考えられること
インデックスされないページがある場合、以下のような原因が考えられます。
原因① 新しいドメインやサイトである
新規サイトの場合、クローラーが巡回してくるまで時間がかかります。
数週間から数カ月かかる場合もあります。
いろいろと対策できることはあるものの、ここはどうしてもコントロールができない部分です。
きちんと対策を行なったとしても、新たに作ったお客様のページがなかなかインデックスされない…というケースは弊社でも珍しくはありません。
インデックスされないうちはWebからの集客ができない状況が続き不安になってしまいやすいですが、数カ月もインデックスされないという例はあまり多くないので、どっしり構えておいてほしいなと思います。
原因② 内部リンクが不足している
クローラーは、内部リンクを辿って新しく公開されたページにやってきます。
そのため、どこからもリンクがない孤立したページはクローラーに発見してもらえず、なかなかインデックスしてもらえません。
原因③ robots.txtによりブロックされている
robots.txtファイルの設定により、クロールが行われないケースもあります
robots.txtファイルとは、クローラーに対して「このページはクロールしてOK」「このページはクロールしちゃダメ」と、指示を伝えるファイルです。
このrobots.txtファイルでクロールを禁止している場合、クローラーがページの中身を確認できないため、Googleがページ内容を評価できず、インデックスが行われません。
原因④ noindex設定がされている
ページのHTMLにインデックスしないよう指示する「noindex」タグが設定されていると、インデックスから除外されます。
noindexは、意図的に検索結果に表示させたくないページに使用する設定のため、表示させるべきページに設定していないか確認してみてください。
原因⑤ 重複コンテンツになっている
他のページと内容が似ている場合、Googleは重複と判断してインデックスしないことがあります。
SEOにおいては、「1つのWebサイトに同じ内容のページは1つだけ」というのが原則です。
本でも同じ内容のページは2つもいらないですよね。
他のページと内容が被っているページは質の低いコンテンツとみなされ、インデックスする価値なしとGoogleに見捨てられてしまいます。
Googleのインデックスを早める方法は?
ページをより早くインデックスさせるために、以下の方法を試してみましょう。
XMLサイトマップの作成と登録
XMLサイトマップは、サイト内のページ一覧をGoogleに伝えるためのファイルです。
サイトマップを作成してGoogle Search Consoleから送信することで、クローラーにサイト構造を効率的に伝えることができます。
質の高い内部リンク構造の構築
関連するページから積極的にリンクを設置し、クローラーが巡回できる道筋をたくさん作ってあげましょう。
クローラーの巡回ルートは多いほうが良いですが、関連性の薄いページとのリンクには要注意。
関連性の薄いページからのリンクは、ユーザーにとっても使い勝手が良くなく、低品質のリンクと見なされてしまう可能性があります。
そのほか、トップページからのリンクや、パンくずリスト(※)の実装も効果的です。
※サイトの階層を示し、自身のいる場所を直感的に伝えるナビゲーション
▼パンくずリスト
ページの高速化
表示速度が遅いページはインデックスされにくい傾向があります。
表示速度を速めるには、次のような対策ができます。
- 画像サイズの縮小
- ブラウザキャッシュの活用
- CSSやJavaScriptなどの外部ファイルの縮小
- サーバースペックの向上 など
一番実践しやすいのは画像サイズの縮小です。
技術的な知識がなくても簡単に対応できるので、ページの表示速度が遅いと感じたら、画像サイズの見直しから行なってみましょう。
わかりやすいタイトルの設定
クローラーにしっかりページの内容を伝えて評価してもらうために、わかりやすいタイトルをつけることも重要です。
Googleはページに関する情報をジャンルやカテゴリ別に分け、きれいに整頓して検索結果に並べます。
ユーザーがGoogleという巨大な図書館に情報を探しに来たときに「サッ!」と取り出せるようにするためです。
例えば、「SEO インデックス」と検索したユーザーに対しては、SEOにおけるインデックスについて解説されたページをまとめ、検索結果に出します。
もしタイトルが「SEO業者の仕事日記①」など内容をイメージできないものだったら、検索語とタイトルの関連性が掴めず、Googleとしては図書館に並べづらく、ユーザーにも手に取ってもらいづらいでしょう。
そのため、Googleが「図書館に並べない=インデックスしない」と判断する可能性があります。
GoogleのインデックスはSEOのスタートライン!仕組みを理解し適切に対応を
インデックスとは、GoogleのデータベースにWebページの情報が登録されること。
このインデックスのおかげでWebページが検索結果から閲覧できるようになります。
反対に言えば、インデックスされなければ検索結果に表示されず、「ページの順位が上がった!下がった!」を気にすることさえできません。
そういう意味でも、インデックスはSEOにおいてとても重要な要素といえます。
インデックスの状況を知りたい場合は、Google Search Consoleを利用するのが確実ですが、Googleの検索窓にページのURLを入力してインデックスされているかを確認したり、「site:」コマンドを使ってサイト全体のインデックス数をざっくり把握することもできます。
インデックスされない主な原因には、新しいサイトであること、内部リンクの不足、robots.txtによるブロック、noindex設定、重複コンテンツなどがあります。
XMLサイトマップの作成、質の高い内部リンク構造の構築、ページの表示速度向上、わかりやすいタイトル設定などでインデックスを早められる可能性もあるため、なかなかインデックスされない場合は試してみてくださいね!
ブルームプロモーションでは、さまざまなSEO施策をご提案しております!
SEOにお悩みの方は、お気軽にブルームプロモーションにご相談ください。