「クロール済み インデックス未登録」とは? 原因と改善方法について

シェアする

「クロール済み・検出インデックス未登録」とは? それぞれの原因と対応方法について

「クロール済み インデックス未登録」があると頭に来るワン。さっさと直してスッキリするワン!

avatar

イッヌさん

Google Search Console(サーチコンソール)を使用していると「クロール済み インデックス未登録」のステータスに頭を悩ませることは珍しいことではありません。

せっかく作成した記事やページが、インデックスされていないわけですから、一刻も早く解消したい問題ではないでしょうか。

「クロール済み インデックス未登録」は原因を理解し対策することで、大抵は改善することができます。

このページでは、「クロール済み インデックス未登録」の原因、改善方法について解説しています。また、後半では「検出 インデックス未登録」それぞれの原因と解決方法についても解説しています。

かずたか@ウェブ解析士

SEO、MEO、コンテンツマーケティングが専門のWEBディレクターです。オウンドメディア集客が得意で、1年間でPV数200%UP、問い合わせ数270%UPなど実績も多数。中小企業や個人向けの集客ノウハウを発信しています。 【保有資格】ウェブ解析士協会 認定ウェブ解析士、全日本能率連盟登録資格 Web検定 Webディレクター、Google アナリティクス個人認定資格(GAIQ)
Twitter:‎ @kazutaka_wmn

「クロール済み インデックス未登録」とは?

Search Console「クロール済み インデックス未登録」とは?

「クロール済み インデックス未登録」はGoogle Search Console、インデックス カバレッジの項目に表示されるステータスの一つです。

意味は、以下の通りです。

「Googleは既にページの中を見たけど、何らかの原因がありインデックス(※)はしなかったページ」です。

※インデックス…Google検索の検索結果に表示されるよう、記事やページが登録されること。

ちなみに、Search Consoleヘルプには、以下のように記載されています。

ページは Google によりクロールされましたが、インデックスには登録されていません。今後、インデックスに登録される可能性がありますが、登録されない可能性もあります。この URL のクロールのリクエストを再送信する必要はありません。

引用:「インデックス カバレッジ レポート – Search Console ヘルプ

「クロール済み インデックス未登録」となる原因は?

「クロール済み インデックス未登録」となる原因は?

「クロール済み インデックス未登録」の原因は主に4つです。

  • 情報が少ない価値のないページ
  • 他のページと内容が重複している
  • すでに存在しない404ページ
  • サイト内で孤立した構造になったページ

情報が少ない、価値のないページ

「クロール済み インデックス未登録」の原因で最も多いのが、Googleによって「情報が少なく、価値のないページ」と判断されているケースです。

この原因でインデックス未登録になっている場合、早急に対処が必要です。

なぜなら、Googleから「価値が低いページがあるサイト」と認識され、サイト全体の評価が下がってしまう可能性があるからです。

例えば、

  • 画像だけしか無いページ
  • 数行しか書かれていないブログ
  • PDFなどのリンクを貼り付けただけのページ
  • 用語集など情報量の少ないページ

などが、価値の低いページと判断されることがあります。

他のページと内容が重複している

続いて多いのが、Googleによって「他のページと内容が重複している」と判断されているケースです。

例えば、Googleで検索したときに同じ内容のページばかりが並んでいると、検索エンジンを利用しているユーザーとしては不便ですよね。このような理由で、Googleは“内容が重複しているページがあった場合、いずれか一つしか、インデックスしない”仕組みになっているのです。

Googleが重複していると判断するページは、全く同じ内容のページだけではなく、

  • titleタグやH1タグが全く同じ、もしくは、ほぼ同じページ
  • 言い回しや細かな内容は違うが、大筋の内容がほぼ同じページ
  • 他のサイトやブログのページと、重複する文が複数ある

といった場合もあります。

すでに存在しない404ページ

サイト上のページを何らかの理由で削除し、そのURLを検索する「そのページは存在しません」という意味の”ステータスコード404″が表示されます。

404ページも、「クロール済み インデックス未登録」に表示されることがあります。

ステータスコード404とは、ホームページやブログなどのリンクをクリックしたときに「ページが見つかりません」と表示されたページのことです。

一度Googleに登録されたページは、定期的にGoogleのロボットが中身を確認にきます。何らかの理由でページを削除した場合、Googleはページが削除されたことをすぐには知ることができませんので、いつもどおりそのページを確認しにきます。

このときGoogleが、

「ページを見ようとアクセスしたところ、ページがなくなっていたので、インデックス未登録にしました」

というのも「クロール済み インデックス未登録」に表示されるのです。

もし、意図的に削除したページの場合、「クロール済み インデックス未登録」のエラーは無視して大丈夫です。

サイト内で孤立した構造になっている

CMS(WordPressなど)やブログツールを利用してサイトを制作している場合には、あまり発生することはありませんが、サイト内で孤立した構造になっているページも「クロール済み インデックス未登録」のエラーとして表示されることがあります。

具体的には、「ページを制作したが導線の設置を忘れ、サイト内のどこをたどっても、たどり着かないページ」がこれに該当します。

「クロール済み インデックス未登録」の改善方法

「クロール済み インデックス未登録」の対応

「クロール済み インデックス未登録」が出てしまった場合、どういった改善方法があるのでしょうか。

先程紹介した「クロール済み インデックス未登録」となる原因ごとに解説します。

「クロール済み インデックス未登録」の解決策は、ほとんどの場合『リライト』だワン。だけど、そうじゃないケースもあるからしっかり読んで対策してほしいワン!

avatar

イッヌさん

情報が少ない、価値のないページ

そもそも、「情報が少ない、価値のないページ」は、以下の2つに分けることができます。

  • ページの性質上、情報量が少なくなりがちなページ
  • コンテンツを見直すことで、価値ある内容へ修正できるページ

「ページの性質上、情報量が少なくなりがちなページ」の場合

ページの性質上、情報量が少なくなりがちなページでは、ページにnoindexタグを設置し、そもそもインデックスさせないという改善策があります。

noindexタグとは、Googleに対して「このページはインデックスしなくてもいいですよ!」と伝えるためのHTMLタグのことです。

情報が少ないからといって、せっかく作ったページがインデックスされないのは、もったいないと思う方もいると思います。

しかし、情報が少ないページは仮にインデックスされたとしても検索結果の上位に表示されることはありません。つまり、インデックスされてもアクセスアップにはつながらないということです。

noindexタグの具体的な記述方法としては、Googleに表示させたくないページの、<head>~</head>の間の部分に、以下のようなコードを記述します。

<meta name=”robots” content=”noindex” />

▼<head>~</head>の見本

head部分の見本

また、WordPressやその他ブログツールなどの場合には、各ページの設定部分に、

インデックスしない(noindex)

というようなチェックボックスがあるはずですので、そちらにチェックすればOKです。

noindexタグを設置することで、Googleはそのページをサイトの評価から除外してくれます。そのため、価値のないページがあってもサイトに悪影響が出にくくなります。

ちなみに、「ページの性質上、情報量が少なくなりがちなページ」には、

  • HTMLサイトマップ
  • 一覧ページ
  • 用語集
  • お知らせページ

などがあります。

HTMLサイトマップ

HTMLサイトマップとは、サイト内にどんなページがあるかをまとめているページです。サイト内にあるコンテンツのリンク集なので、基本的にはページの特性上、情報を増やすことができません。

一覧ページ

一覧ページとは、サービス一覧やカテゴリ一覧のように、そのページ自体の情報に価値はなく、先のページヘ遷移するためのリンクをまとめたページです。このようなページも性質上、情報量が増やしずらいページです。

用語集

用語集は、サイトのテーマと関係のある用語の解説をするページのことです。ひと昔前はページを増やすことがSEOで有利になるという理由でよく作成されていました。

しかし、1ページあたりの文字数が少なくなりがちで、低品質なコンテンツと判断されることが多くなったことから、近年では安易に作成しないほうが良いコンテンツと考えられています。

お知らせページ

お知らせページは、主に企業サイトなどにある「年末年始のお知らせ」「夏季休暇のお知らせ」「事務所移転のお知らせ」といったページのことです。お知らせページも、基本的に文字数が少なくなりがちなため、低品質コンテンツとして除外されることがよくあります。

企業の場合、低品質コンテンツとして判断されたとして、サイト上に記載したほうが良いお知らせもあると思いますので、必ずしもページを削除したり、noindexタグを設置する必要はありません。

「コンテンツを見直すことで、価値ある内容へ修正できるページ」の場合

「コンテンツを見直すことで、価値ある内容へ修正できるページ」の場合、コンテンツを見直し、リライトをすることで対応します。

具体的にこのケースに当てはまるのが、内容(文字数)が少ないブログ記事が挙げられます。

ブログなどの記事コンテンツは、最低でも3,000文字くらいの情報量がないと、低品質なコンテンツとみなされてしまう可能性があります。

もし、文字数が少ない記事ページがある場合は、内容を充実させるようにリライトをしましょう。

なお、リライトについては、

で詳しく解説しています。参考にご覧ください。

他のページと内容が重複している

「他のページと内容が重複している」と判断されている場合、まず”本質的にページの内容が重複しているかどうか”を判断する必要があります。

細かな部分は違えど、本質的に内容が重複しているのであれば、どちらか片方を削除します。もし、何らかの理由で削除できない場合には、noindeタグを設置して対応します。

例えば、

「問い合わせフォームが2つある」
「記事が全く同じ内容で2つ掲載されてしまっている」

といった場合が、このパターンです。

全く同じ記事ではないのに、重複していると判断されてしまう場合もあります。こういったケースでは、本文が同じではなくとも「titleタグやH1タグが全く同じ、もしくは、ほぼ同じになっている」ということがほとんどです。

よくある例としては、

  • 年末休暇のお知らせ
  • 誕生日会を開催しました

というような、繰り返し行われるイベントに関するページが考えられます。

また、専門的な話になりますが、ブログなどで記事の一覧画面が自動で生成される仕組みの場合、「ブログ一覧一覧1ページ目、2ページ目、3ページ目…」といったtitleタグやH1タグが複製されてしまうことがあります。

こういった場合は、実質的にページの内容が異なっても、「ブログ一覧ーサイト名」というようなページが大量に生成されてしまうことになりますので、重複していると判断される原因となってしまいます。

これらの対応方法としては、

年末休暇のお知らせ

20xx年 年末休暇のお知らせ

誕生日会を開催しました

20xx年 xx歳の誕生日会を開催しました

ブログ一覧ーサイト名

ブログ一覧1ーサイト名、ブログ一覧2ーサイト名

という具合に、titleタグ、H1タグが重複しないようすることが重要です。

すでに存在しない404ページ

すでに存在していない404ページの場合は、特に対応することはありません。

基本的にはしばらく待てば、ステータスが変更され「クロール済み インデックス未登録」から除外されます。

どれくらいの期間がかかるかについては、サイトの規模や更新頻度によるため、一概に言えませんが、通常1週間~1ヶ月程度あればステータスから除外されるはずです。

とはいえ、このケースの場合は待つしか対策がありませんので、気長に待ちましょう。

サイト内で孤立した構造になっている

サイト内で孤立した構造になっているケースとは、例えば、

  • WordPressで固定ページを公開したけど、ナビメニューなどに導線を設置していないケース
  • 静的に作ったサイトで、導線の設置を忘れてしまったケース

などが、該当します。

改善方法は、サイト内からそのページへの導線を設置し、重要なページであるということを検索エンジンに伝えることです。

具体的には、関連ページからインデックスさせたいページに向かって内部リンクを設置したり、サイトのトップページの新着情報などに「記事更新のお知らせ」としてリンクを設置するといった対策が必要です。

リンクを設置するときは全く関連のないページからではなく、できるだけ内容が近いページから設置すると良いでしょう。

また、ヘッダー、フッター、サイドナビなどの全ページ共通で表示されている場所ではなく、メインのコンテンツに設置するほうが良いです。

「検出 インデックス未登録」とは?

「検出 インデックス未登録」とは?

「検出 インデックス未登録」については「「検出 インデックス未登録」の原因と対策!改善のためにやったこと」で詳しく解説しています。こちらもご覧ください。

「検出 インデックス未登録」も「クロール済み インデックス未登録」と同様、Google Search Consoleのインデックス カバレッジの項目に表示されるステータスの一つです。

意味は、

「Googleはページの存在を知っているけど、中身はまだ見ておらずインデックスはしていないページ」です。

ちなみに、Search Consoleヘルプでは以下のように記載されています。

ページは Google により検出されましたが、まだクロールされていません。これは通常、Google が URL をクロールしようとしたものの、サイトへの過負荷が予想されたため、クロールの再スケジュールが必要となった場合です。そのため、レポート上で最終クロール日が空欄になっています。

引用:「インデックス カバレッジ レポート – Search Console ヘルプ

「検出 インデックス未登録」となる原因は?

「検出 インデックス未登録」となる原因は?

「検出 インデックス未登録」となる原因について、Googleは以下の4つの原因があるとしています。

  • サイトへの過負荷を予想しクロールを中止した
  • 内部リンクが張られていない「孤立したページ」と見なされた
  • 「低品質コンテンツ」と見なされた
  • 「重複コンテンツ」と見なされた

サイトへの過負荷を予想しクロールを中止した

そもそも、サイト上にあるコンテンツは定期的にGoogleのロボットが閲覧しにきています。

Googleが新しくページを閲覧しようとしたときに、何らかの原因でサイトに過負荷(アクセスが集中するなどして動作が重くなっている状態)がかかっていると、中を閲覧するのを諦め帰ってしまうことがあります。

これが、サイトへの過負荷を予想しクロールを中止した状態です。

内部リンクがない「孤立したページ」

先述の通り、Googleのロボットは定期的にページを閲覧しにきます。

ではどうやってロボットはそのページにたどり着くかというと、基本的には、すでにインデックスされているページからリンクをたどってやってきます。

しかし、サイト内のどこからもリンクされていないページの場合、スムーズにGoogleのロボットがページを閲覧できません。

このように、内部リンクがない孤立したページは検出はされたもののクロールされず、その結果インデックスされないことがあります。

「重複コンテンツ」と見なされた

ページを公開したときすでにあるページと酷似したURLだった場合、CMSなどで自動生成されるURLをだった場合など、Googleはなんらかのシグナルを受け、既にあるページと重複したコンテンツだと判断することがあります。

検索エンジンの原則として、重複したコンテンツはインデックスしませんので、検出はしたもののクロールはせず、インデックスもしなかったという状況になることがあります。

「検出 インデックス未登録」の改善方法

「検出 インデックス未登録」の対応方法

「検出 インデックス未登録」の対策方法について紹介します。

サイトへの過負荷を予想しクロールを中止した

この症状では、「Googleがクロールしようとしたところ、たまたまページに過負荷の可能性があった」という状態ですので、数日経てばクローラーが再度ページを訪れ、インデックス登録してくれることがほとんどです。

もし、数日経っても改善されない場合は原因が他にあるか、サーバーなどに技術的な問題が発生している可能性があります。

内部リンクが張られていない「孤立したページ」と見なされた

内部リンクが貼られていないことが原因でインデックスされていない場合は、内部リンクを設置することで改善が可能です。

もし、何らかの事情があって内部リンクの設置ができないという場合は、サイトマップにページを追加し、サーチコンソールから情報を送信することでクローリングを促し、ページをインデックスできます。

なお、サーチコンソールでサイトマップを送信する方法については、同じサイト内の「サーチコンソールのXMLサイトマップ登録方法!作成ツールや更新方法も解説」で解説しています。

「重複コンテンツ」と見なされた

URLが重複していたなどで重複コンテンツとみなされていた場合は、Googleのガイドラインに即したURLに変えることで改善できます。

Googleが運営する「SEO スターター ガイド: 基本 | Google 検索セントラル? |? Google Developers」でURLの付け方について、”コンテンツの情報を伝えるわかりやすい URL”で有ることを推奨しています。

単なる文字の羅列ではなく、ページの内容を言い表す単語を使ってURLを作成することでインデックスさせることができます。

「インデックス カバレッジ」とは?

あわせて理解したい「インデックス カバレッジ」とは?

ここまでで、Google Search Consoleの「クロール済み インデックス未登録」、「検出 インデックス未登録」の原因と対応方法について解説をしました。

ここからはSearch Consoleの重要な項目である、「インデックス カバレッジ」について解説したいと思います。

もし、「インデックス カバレッジの見方が良くわからない」という方は、参考にご覧ください。

SEO対策でも重要な項目

Search Consoleの機能である「インデックス カバレッジ」とは、サイトの各ページが正しくGoogleにインデックスされているかを確認するための機能です。

せっかく作った記事やページが、Googleにインデックスされていなければ、Googleの検索結果に表示されません。Googleの検索結果に表示されないと、検索エンジンからの流入がなくなってしまうため、サイトやブログのアクセスが増えません。

そのため、検索エンジンから流入を獲得するSEOでは、非常に重要な項目の一つとなります。

インデックス カバレッジの確認方法

インデックスカバレッジを確認するにはまず、サーチコンソールにログインします。
そして、左側にあるサイドナビより、「カバレッジ」をクリックします。

インデックスカバレッジイメージ

ここに表示されているエラー、有効(警告あり)、有効、除外の4つの情報がインデックスカバレッジでわかる情報です。左側に行くほど重要度が高い項目になりますので、左から順番に対応するようにしましょう。

インデックス カバレッジでわかる情報

インデックス カバレッジでは、以下の情報を一覧で確認することができます。

エラー
なんらかの原因でインデックス登録されなかったページ

有効(警告あり)
一応インデックス登録されているが、何らかの問題があるページ

有効
問題なくインデックス登録されているページ

除外
何らかの理由でインデックス登録されていないページ

例えば、ページが100ページあっても、何らかの原因で「エラー」に含まれているページが50ページあれば、実質、Google検索からは50ページ分しかアクセスされません。

そのため、「エラー」、「有効(警告あり)」に該当するページがある場合は、早急に原因を確認し、対処するようにしましょう。

ちなみに「除外」については少し注意が必要です。というのも、そもそもブログやホームページ上のページにはインデックス登録されなくても問題無いページが存在します。

「除外」に含まれるページは、そもそもインデックス登録されていなくても問題無いページなので、基本的には対応する必要はありません

SEOを専門で行っているコンサルタントなどは「除外」の項目も確認しますが、ほとんどの方は気にする必要はありません。

「クロール済み・検出インデックス未登録」の原因と対策まとめ

このページでは、Google Search Consoleの意味深なステータスの一つである「クロール済み インデックス未登録」、「検出 インデックス未登録」について原因と対策を解説しました。この項目は、特に問題ない場合もありますが、何かしら不備を知らせてくれている場合もあります。

せっかく作った記事やページが、Google検索に登録されていなければ、これほどもったいないことはありません。本ページを参考にしていただき、適切に対応してください。