SEO最前線

SEOコンサルタントが最新のSEO情報をお届けします

ChatGPT検索の内部構造:web.runとファンアウトクエリがAIの視認性をどう形成するか

概要

新たな研究により、ChatGPTがどのようにウェブページを取得し、情報源を選択し、コンテンツを要約するかの内部メカニズムが明らかになりました。これにより、AIによるコンテンツの可視化の仕組みが詳細に解明されています。

2026年3月4日、ChatGPTのデフォルトモデルがGPT-4o/5.2からGPT-5.3 Instantに切り替わったことで、回答あたりの引用ドメイン数が19から15へと20%以上減少しました。引用されたURL数も同様に減少しています。

この現象は、Googleが過去に単一ドメインを検索結果ページの大部分に表示させた「Bigfootアップデート」にちなんで「Bigfoot Effect」と名付けられています。これは、引用されるウェブサイトが少なくなり、より高権威のソースへの構造的なシフトが起きている可能性を示唆しています。

GPT-5.4 Thinkingはさらに引用元の集中を強め、「site:」オペレーターを使用して信頼できるドメインに検索を制限し、10以上の「ファンアウトクエリ」を各回答に分散させて、特定の情報源を対象としています。

モデルの切り替え後、ChatGPT-Userボットのクロール量は減少しており、無料プランユーザーの増加がウェブ検索回数や引用数の減少に寄与しています。

研究では、ChatGPTの内部検索システムweb.runの完全なリバースエンジニアリングも行われました。GPT-5.3以降、モデルはコンパクトなテキストコマンドではなく、型付きパラメータを持つ構造化されたJSONオブジェクトを送信するようになり、ウェブ操作のアーキテクチャが変化しています。

web.runツールは現在、search_queryopenfindclickscreenshotなど12の操作をサポートしています。GPT-5.4は5〜10回以上の検索を連鎖させクエリを洗練させますが、GPT-5.3 Instantは通常2〜3回です。

Googleの痕跡strlidトラッキングマーカーなど)は依然として見られ、バックエンドがサードパーティの検索プロバイダー(Google)に依存していることが示唆されています。また、5.4 Instantの製品クエリに特化した新しいファンアウトタイプbrowse_rewritten_queriesも発見されました。

ハニーポット実験により、会話中にChatGPTがウェブを閲覧する際、実際のページコンテンツを取得するのはChatGPT-Userクローラーであり、ChatGPTの検索インデックスを構築するOAI-SearchBotではないことが確認されました。

驚くべき発見として、「namespace blind spot」があります。ChatGPTの内部ツール設定層には保護がなく、「system prompt」という言葉を避ければ、モデルはツールスキーマや操作リスト、名前空間構造を自由に開示します。これにより、誰でもChatGPTの内部環境を監査できるプロンプトが公開されています。

再構築されたシステムプロンプトからは、Redditが著作権の文字数制限から免除されていること、禁止製品のリスト、1〜10段階の「verbosity score」、購読ティアに応じた広告表示を規定する広告ポリシーが存在することなどが判明しました。

このweb.run構文は、JSONコマンドを直接チャットに貼り付けることで、ChatGPTが自社コンテンツとどのように相互作用するかをテストするために実用的に使用できます。これにより、AIがコンテンツにアクセスできるか、何を抽出し、どう解釈するかを「ChatGPTの目を通して」確認できます。

GPT-5ファミリーの異なるモデル(5.2、5.3、5.4)は同じ知識カットオフ(2025年8月)を共有しているにもかかわらず、RLHF報酬形成、微調整データ、システムプロンプト構成、推論時の計算予算といった要因により、異なるファンアウトクエリ、情報源、および最終回答を生成します。特にGPT-5.4 Proは、より多くの計算資源が与えられています。

研究では、AIの視認性をパラメトリック視認性動的視認性の二つのタイプに分類するフレームワークを提唱しています。

パラメトリック視認性は、LLMにおけるE-E-A-Tに相当し、トレーニングデータから学習された権威を指します。これは安定しており、API監査で測定可能です。パラメトリックメモリに存在しないブランドは、検索候補としてすら考慮されません。

動的視認性は変動が大きく、モデルに依存し、継続的なモニタリングが必要です。これは従来のSEOに近く、モデルアップデートによって一夜にして失われる可能性があります(Bigfoot Effect)。

知識カットオフの更新はLLMの「Google Dance」のようなもので、年に約1回、パラメトリックなランキングが再分配されます。この知識カットオフ期間の間に、ブランドがモデルにどのように認識されるかを戦略的に影響与えることができます。

解説

この画期的な研究は、これまで不透明だったChatGPTがコンテンツをどのように収集し、評価し、表示するかのプロセスを詳細に明らかにしました。これは、AI時代のSEO戦略とコンテンツ戦略を再考する上で極めて重要な情報源となります。

引用ドメイン数が20%以上減少したという事実は、AIからのトラフィックや視認性の獲得がより競争的になっていることを示唆しています。「Bigfoot Effect」が示すように、ChatGPTの応答で引用されるサイトは限られるため、自サイトがその「選ばれし者」となるためには、コンテンツの質と権威性をこれまで以上に高める必要があります。特に、GPT-5.4「ファンアウトクエリ」で高権威サイトを優先しているとすれば、E-E-A-T原則に基づいた専門性と信頼性の構築はAI時代において不可欠な要素です。

web.runシステムがJSONオブジェクトベースに移行し、より多くの操作をサポートしていることは、ChatGPTがコンテンツをより構造的かつ精密に理解し、利用できるようになったことを意味します。この変更は、ウェブサイトが構造化データを活用し、コンテンツを明確で論理的な階層で提供することの重要性を強調しています。AIが理解しやすい形式で情報を提供することが、AIによるピックアップの可能性を高めるでしょう。

「namespace blind spot」の発見は、私たちにとって大きなチャンスです。ChatGPTの内部ツール設定が公開されているということは、自社のコンテンツがAIにどのようにリーチされ、解釈されているか能動的に監査し、改善策を講じることが可能になったことを意味します。公開されているプロンプトを活用し、定期的に自サイトのAIクロール可視性監査を行うことを強く推奨します。もしChatGPTがページにアクセスできなかったり、内容を正しく理解していなかったりすれば、それは即座に修正すべきシグナルです。

パラメトリック視認性動的視認性という二層構造は、AI時代における視認性戦略の基本的なフレームワークを提供します。長期的な視点では、ブランドのE-E-A-Tを高め、トレーニングデータに組み込まれるような権威ある存在となることが、AIからの「選好」を得る上で不可欠です。一方で、動的視認性はモデルのアップデートで一夜にして変動する可能性があり、継続的なモニタリングと、異なるモデル(GPT-5.3 Instant, 5.4 Thinkingなど)でのテストが不可欠です。特に、知識カットオフの更新という「LLMのGoogle Dance」の時期は、ブランド情報をAIに浸透させる戦略的な機会となります。

この研究は、単に技術的な興味を超え、AIが情報をどのように処理し、コンテンツを評価するかという根本的な理解を深めるためのロードマップを提供しています。SEO担当者やコンテンツクリエイターは、これらの知見を活用し、AIファーストの視点でコンテンツ戦略と技術的SEOを適応させることで、AI時代における競争優位性を確立できるでしょう。


  • 掲載元: Search Engine Land
  • 公開日: 2026-05-14T12:00:00+00:00

Inside ChatGPT Search: how web.run and fan-out queries shape AI visibility