SEO最前線

SEOコンサルタントが最新のSEO情報をお届けします

AIエージェントがウェブサイトをどう認識するか(そして対応策)

概要

AIエージェントは、人間とは異なる方法でウェブサイトを閲覧します。主要なAIプラットフォームは、自律的にウェブサイトを閲覧できるようになりました。

2024年には自動化されたトラフィックが初めて人間のトラフィックを上回り、総ウェブインタラクションの51%を占めました。この非人間的なオーディエンスはすでに人間のオーディエンスよりも大きく、増加し続けています。

AIエージェントがウェブサイトを認識する方法には主に3つのアプローチがあります。1つ目は、AnthropicのClaudeやGoogleのProject Marinerに見られるようなビジョン(スクリーンショットの読み取り)です。これは視覚コンテンツを分析しますが、計算コストが高く、レイアウト変更に敏感です。

2つ目は、OpenAIのChatGPT AtlasやMicrosoftのPlaywright MCPが採用するアクセシビリティツリー(構造の読み取り)です。これはスクリーンリーダーと同じくARIAタグを利用し、ページの構造やインタラクティブ要素を解釈します。

3つ目は、OpenAIのCUAやPerplexityのCometのようなハイブリッドアプローチで、スクリーンショット分析とアクセシビリティツリー解析を組み合わせ、アクセシビリティデータを優先します。信頼性と効率性を最適化するプラットフォームは、アクセシビリティツリーを重視する傾向にあります。

この研究の核心は、ウェブサイトをAIエージェント互換にする上で最も効果的なことは、ウェブアクセシビリティ推進者が長年提唱してきた取り組みと同じであるということです。アクセシビリティツリーは、AIエージェントとウェブサイト間の主要なインターフェースになりつつあります。

アクセシビリティツリーは、ブラウザが支援技術のために生成する、ページのDOMを簡素化したものです。完全なDOMがすべての要素を含むのに対し、アクセシビリティツリーはノイズを取り除き、インタラクティブ要素とその役割、名前、状態のみを公開します。これはAIモデルが限られたコンテキストウィンドウ内でウェブページを処理する際に非常に有効です。

OpenAIは、WAI-ARIAベストプラクティスに従い、ボタンやフォームなどのインタラクティブ要素に記述的な役割、ラベル、状態を追加することを明確に推奨しています。これにより、ChatGPTは各要素の機能を認識し、サイトとより正確にやり取りできるようになります。

研究データもこれを裏付けています。UC BerkeleyとUniversity of Michiganの共同研究では、アクセシビリティ条件によってAIエージェントのタスク成功率が大幅に低下することが示されました。適切に構造化されたアクセシビリティツリーを持つウェブサイトは、エージェントが成功するために必要な情報を提供します。

セマンティックHTMLは、アクセシビリティツリーの基盤となります。ネイティブのHTML要素を使用することで、ブラウザは自動的に有用なアクセシビリティツリーを生成します。例えば、