SEO最前線

SEOコンサルタントが最新のSEO情報をお届けします

技術SEO監査の新しい層:AI時代に対応

概要

従来のテクニカルSEO監査は、クローラビリティ、インデックス可能性、ウェブサイトの速度、モバイルフレンドリーさ、構造化データをチェックし、主にGooglebotに焦点を当てていました。しかし2026年現在、ウェブサイトにはAIクローラー(GPTBot、ClaudeBot、PerplexityBotなど)やユーザーエージェント(Google-Agent、ChatGPT-Userなど)といった、多くの人間以外の消費者が存在します。

2026年第1四半期のCloudflareの分析によると、全ウェブトラフィックの30.6%がボットによるもので、AIクローラーとエージェントの割合が増加しています。これらの新しい消費者のために、テクニカルSEO監査に5つの層を追加する必要があります。

  1. AIクローラーアクセス: robots.txtはGooglebotだけでなく、GPTBotやClaudeBotなどAIに特化したユーザーエージェント向けに個別のルールが必要です。デフォルト設定に頼らず、クローラーごとの目的(モデルトレーニング用、AI検索結果用、ユーザーエージェント)に応じてアクセスを意識的に決定することが重要です。特に、Google-Agentrobots.txtを無視し、サーバーサイド認証でのブロックが必要です。

  2. JavaScriptレンダリング: 多くの主要なAIクローラー(GPTBot、ClaudeBot、PerplexityBot、CCBot)はJavaScriptをレンダリングしません。コンテンツがクライアントサイドJSに依存している場合、AIモデルには見えません。サーバーサイドレンダリング(SSR)静的サイト生成(SSG)は、AI検索における可視性の必須要件です。curlコマンドや「ページのソースを表示」で静的HTML内の重要コンテンツを確認すべきです。

  3. AI向け構造化データ: スキーママークアップは、「AIシステムがコンテンツを理解し引用するのに役立つか」という観点で評価される必要があります。JSON-LDを推奨し、Organization、Article、Productなどのスキーマタイプ、sameAsやauthorなどのエンティティ関係、そしてプロパティの完全な入力が重要です。スキーマはAIによるLLMの理解や検索結果、データ密度向上に寄与するとされていますが、特定のAI引用率に関する学術研究はまだありません。

  4. セマンティックHTMLとアクセシビリティツリー: ChatGPT AtlasのようなAIエージェントは、ページの視覚的スタイルを除いたアクセシビリティツリーを読み取ります。これは、スクリーンリーダーが使用するのと同じ構造であり、AIエージェントの理解と効率的なやり取りに不可欠です。適切な見出し階層(H1-H6)<nav><main>などのセマンティック要素、そしてフォームのラベルやボタンの記述が重要です。ウェブアクセシビリティとAIエージェントの互換性は同じ領域となり、誤ったARIAの使用は逆効果になり得るため、適切なセマンティックHTMLから始めるべきです。

  5. AIディスカバラビリティシグナル: llms.txtはLLMによって推奨されますが、その影響は未確認です。AIボットトラフィックの監視エンティティ定義(OrganizationやPersonスキーマでビジネスや人物を明確にする)は、AIがブランドを信頼し推奨するために不可欠です。また、コンテンツの配置が重要で、AIの引用の44.2%はページの最初の30%から来ています。文章が単独で意味をなすコンテンツの抽出可能性も、AIによる引用の鍵となります。

これらの層を追加することで、テクニカルSEOのスキルが、AI時代におけるウェブサイトの基盤を築く上で最も適したものであると結論付けられています。AIの応答で引用され、AIが駆動するブラウザで機能するウェブサイトは、コンテンツの質だけでなく、その技術的基盤によってAIがコンテンツにアクセスしやすい状態にあるものとなるでしょう。

解説

このSEJの記事は、テクニカルSEOが直面する大きな変化を示しています。従来のGooglebot中心のアプローチから、多様なAIクローラーユーザーエージェントに対応する必要があるという認識が非常に重要です。ボットによるトラフィックが全体の30%以上を占め、AI関連のボットが増加しているという事実は、もはや無視できない現実であり、サイト運営者はこの変化に積極的に対応しなければなりません。

robots.txtの設定は、これまで以上に戦略的である必要があります。特に、モデルトレーニング用のクローラーとAI検索結果用のクローラーでは、アクセスの是非を判断する基準が異なります。Cloudflareのデータが示すクロール対参照の比率は、どのクローラーにサイトのデータを提供するかを決定する上で非常に実践的な指標となります。見返りの少ないクローラーをブロックすることで、不要なリソース消費を抑えることも可能です。また、Google-Agentがrobots.txtを無視するという点は、将来的にサイトの認証やアクセス管理において新たな課題を提起するでしょう。これに対しては、サーバーサイドでのより高度な対応が求められます。

JavaScriptレンダリングの問題は、多くのAIクローラーがJSをレンダリングしないという点で、これまで以上にクリティカルです。特にReact、Vue、AngularなどのSPA(シングルページアプリケーション)は、サーバーサイドレンダリング(SSR)静的サイト生成(SSG)を導入しなければ、主要なAIシステムにとって「見えない」存在になってしまう可能性があります。curlコマンドや「ページのソースを表示」機能を使った確認方法は、実装上の盲点を見つけるための手軽で効果的なチェック方法です。これは、もはや選択肢ではなく、AI時代におけるコンテンツの可視性を確保するための必須要件と捉えるべきです。

構造化データは、単にスキーマが存在するかどうかではなく、「AIシステムがコンテンツを理解し、引用するのに役立つか」という視点で評価する必要があります。JSON-LDの完全な実装、エンティティ間の関係性を明示すること、そしてデータ密度の高さは、AIによる引用の可能性を大きく高めます。特に、組織や人物、製品などの主要なエンティティを詳細に定義し、sameAsなどのプロパティで他の信頼できる情報源とリンクさせることは、AIが情報の信頼性を判断する上で非常に有効です。学術的な裏付けがまだ不十分であるという注意書きはありますが、先行する業界データに基づき、積極的に導入を進めるべきでしょう。

最も大きなパラダイムシフトの一つは、セマンティックHTMLとアクセシビリティツリーに関する議論です。AIエージェントが、ページの視覚的スタイルを除いたアクセシビリティツリーを読み取っているという事実は、ウェブアクセシビリティが単なる規範遵守や特定のユーザー層への配慮だけでなく、AI互換性のための必須要素になったことを意味します。適切な見出し構造(H1-H6)<nav><main>などのセマンティック要素の使用は、人間にとっての読みやすさだけでなく、AIがコンテンツの構造と意味を正確に理解するための直接的な信号となります。div要素をボタンのように見せるのではなく、<button>を使用するなど、HTMLの本来のセマンティクスに忠実であることが重要です。また、ARIAの誤った使用がアクセシビリティを悪化させる可能性も指摘されており、まずは基本的なセマンティックHTMLの原則に立ち返ることが、AIエージェントへの最適な情報提供に繋がります。

最後のAIディスカバラビリティシグナルでは、エンティティ定義の重要性が強調されています。AIがあなたのブランドやコンテンツを信頼し、推薦するためには、機械が認識できる形で「何者であるか」を明確にすることが不可欠です。これは、単なるマーケティングコピーではなく、構造化データとして提供されるべきです。また、コンテンツの配置(ページの最初の30%に主要な情報を集中させる)や抽出可能性(文が単独で意味をなすように記述する)は、AIによる引用に直接影響するため、コンテンツ戦略にも大きな変更を促す可能性があります。これは、テクニカルSEOとコンテンツSEOの境界がさらに曖昧になり、両者の密接な連携が求められることを示唆しています。

この記事が示すように、従来のテクニカルSEOのスキルセットは、新しい「消費者」(AI)に対してどのように適用されるべきかを示しています。ランキングやキーワード順位といった従来のSEO指標だけでなく、AIシステムがコンテンツを理解し、アクセスし、引用できる基盤を構築することが、これからのテクニカルSEOの主要な役割となるでしょう。この新しい監査レイヤーを導入することで、ウェブサイトはAI時代において競争力を維持し、新たな可視性を獲得できるはずです。


  • 掲載元: Search engine journal
  • 公開日: 2026-04-27T12:00:10+00:00

The Technical SEO Audit Needs A New Layer via @sejournal, @slobodanmanic