概要
AIエージェントは、人間とは異なる方法でウェブサイトを閲覧します。主要なAIプラットフォームは、自律的にウェブサイトを閲覧できるようになりました。
2024年には自動化されたトラフィックが初めて人間のトラフィックを上回り、総ウェブインタラクションの51%を占めました。この非人間的なオーディエンスはすでに人間のオーディエンスよりも大きく、増加し続けています。
AIエージェントがウェブサイトを認識する方法には主に3つのアプローチがあります。1つ目は、AnthropicのClaudeやGoogleのProject Marinerに見られるようなビジョン(スクリーンショットの読み取り) です。これは視覚コンテンツを分析しますが、計算コストが高く、レイアウト変更に敏感です。
2つ目は、OpenAIのChatGPT Atlas やMicrosoftのPlaywright MCP が採用するアクセシビリティツリー(構造の読み取り) です。これはスクリーンリーダーと同じくARIAタグ を利用し、ページの構造やインタラクティブ要素を解釈します。
3つ目は、OpenAIのCUAやPerplexityのCometのようなハイブリッド アプローチで、スクリーンショット分析とアクセシビリティツリー解析を組み合わせ、アクセシビリティデータを優先します。信頼性と効率性を最適化するプラットフォームは、アクセシビリティツリーを重視する傾向にあります。
この研究の核心は、ウェブサイトをAIエージェント互換にする上で最も効果的なことは、ウェブアクセシビリティ推進者が長年提唱してきた取り組みと同じであるということです。アクセシビリティツリー は、AIエージェントとウェブサイト間の主要なインターフェースになりつつあります。
アクセシビリティツリーは、ブラウザが支援技術のために生成する、ページのDOMを簡素化したものです。完全なDOMがすべての要素を含むのに対し、アクセシビリティツリーはノイズを取り除き、インタラクティブ要素とその役割、名前、状態のみを公開します。これはAIモデルが限られたコンテキストウィンドウ内でウェブページを処理する際に非常に有効です。
OpenAIは、WAI-ARIAベストプラクティス に従い、ボタンやフォームなどのインタラクティブ要素に記述的な役割、ラベル、状態を追加することを明確に推奨しています。これにより、ChatGPTは各要素の機能を認識し、サイトとより正確にやり取りできるようになります。
研究データもこれを裏付けています。UC BerkeleyとUniversity of Michiganの共同研究では、アクセシビリティ条件によってAIエージェントのタスク成功率が大幅に低下することが示されました。適切に構造化されたアクセシビリティツリーを持つウェブサイトは、エージェントが成功するために必要な情報を提供します。
セマンティックHTML は、アクセシビリティツリーの基盤となります。ネイティブのHTML要素を使用することで、ブラウザは自動的に有用なアクセシビリティツリーを生成します。例えば、要素は自動的に「button」として認識されますが、はそうではありません。
フォームの入力には常に を関連付け、autocomplete 属性を使用します。また、論理的な見出し階層(h1~h6) を確立し、ランドマークリージョン(, など) を使用することが推奨されます。MicrosoftのPlaywrightテストエージェント は、デフォルトでアクセシブルなセレクターを使用しており、これは信頼性が高いためです。
ARIA は、ネイティブHTMLが不十分な場合の補完として有用ですが、万能ではありません。W3Cの第一原則は「ネイティブHTML要素で十分な場合はそちらを使用する」です。ARIAの誤用は、ウェブサイトのアクセシビリティを低下させる可能性があります。
コンテンツページはサーバーサイドレンダリング またはプリレンダリングを行うべきです。多くのAIクローラーはクライアントサイドJavaScriptを実行しないため、コンテンツが初期HTMLに含まれていない場合、AI検索エコシステムからは見えなくなります。重要な情報はアコーディオンやタブの裏に隠さず、初期HTMLで可視化することが重要です。
AIエージェントがウェブサイトをどう認識するかをテストするには、スクリーンリーダー によるテストが最も良い代理手段です。また、Playwright MCPアクセシビリティスナップショット を生成することで、エージェントが「見る」構造化された表現を直接確認できます。Lynxのようなテキスト専用ブラウザも非視覚的な解析のヒントを与えます。
開発チーム向けのチェックリストとして、ネイティブHTML要素の使用 、フォーム入力のラベリング 、コンテンツページのSSR は高影響・低労力です。ランドマークリージョンの実装 、見出し階層の修正 、隠されたコンテナからの重要コンテンツの移動 は高影響・中労力、動的コンポーネントへのARIA状態の追加 は中影響・低労力とされています。
解説
今回の記事は、AIエージェント時代におけるウェブサイト最適化の方向性を明確に示しています。最も重要な点は、ウェブアクセシビリティ の取り組みが、単なるコンプライアンス要件ではなく、AIエージェントとの効果的なインタラクションのための必須要件 に変化していることです。これは、アクセシビリティの価値を再認識させ、その実践を加速させる強力な動機となるでしょう。
特に強調されているのはセマンティックHTML の重要性です。正しいHTML構造は、アクセシビリティツリーを自動的に生成し、AIエージェントがコンテンツの意図と機能を正確に理解するための基盤となります。これは費用対効果の高い最初の一歩であり、既存のウェブサイトでも比較的容易に改善できる部分も多いはずです。
ARIA の使用については、注意が必要です。強力なツールではありますが、ネイティブHTMLで実現できることをARIAで代替しようとすると、かえってアクセシビリティを損なうリスクがあります。W3Cの第一原則を守り、「まずセマンティックHTML、次にARIAで補完」という姿勢が重要です。
また、サーバーサイドレンダリング(SSR) の必要性が「パフォーマンス最適化」から「可視性要件」へと変わった点は非常に示唆的です。AIクローラーがJavaScriptを実行しない場合、SSRされていなければコンテンツは存在しないも同然です。コンテンツの可視性はAI時代におけるSEOの生命線となります。
重要な情報を隠さない という原則は、AIエージェントだけでなく、Google検索のランキング要因としても重要性が高まっています。価格や仕様などの核心的な情報を初期HTMLで提供することは、ユーザーにとってもAIにとっても利便性を高めます。
ウェブサイトのテストにおいても、スクリーンリーダー の使用が推奨されているのは実用的です。アクセシビリティツリーを介してサイトを認識するという点で、AIエージェントとスクリーンリーダーは共通の基盤を持っています。QAプロセスにスクリーンリーダーテストを組み込むことは、AI時代への対応として非常に有効な手段となるでしょう。Playwright MCP のようなツールを活用すれば、より直接的にAIエージェントの視点を確認できます。
今回の記事は、ウェブ開発者やSEO担当者に対し、「ユーザーファースト」という長年の原則が、今やAIエージェントファーストにも繋がる という強力なメッセージを送っています。人間にとってもAIにとっても使いやすいウェブサイトを構築することが、これからの成功の鍵となるでしょう。
掲載元: Search engine journal
公開日: 2026-04-12T12:00:14+00:00
How AI Agents See Your Website (And How To Build For Them) via @sejournal, @slobodanmanic