ChatGPT 探求 : スキル : Web検索のしくみ

Web検索のしくみ

作成: 2025-09-14
更新: 2025-11-07

Guangxin He, et al. (2024) の中の図をもとにした概念図：

Input Request　──→　PARSER-LLM
　　│　　　　　　　　　　　↓
　　│　　　　　　　　　Keyword
　　│　　　　　　　　　　　↓
　　│　　　　　　　　Internet Search
　　│　　　　　　　　　　　↓
　　│　　　　　　　　Ranking Strategy
　　│　　　　　　　　　　　↓
　　│　　　　　　　EXTRACTOR=LLM
　　│　　　　　　　　　　　↓
　　│←──────　Processed Text
　　↓
Transformer　　　　　　　　　
　　↓
Response

検索フックを誘発する言い回しのパターン

ChatGPT のことば (2025-09-15) から引用

外部検索が呼ばれるのは、単なる「曖昧さ」や「未知性」ではなく、特定のシグナルがトリガーになる。大きく分けて3つある：

1. 知識要求パターン

「最新の〜」「2025年の〜」「現在の状況」など時間依存を含む質問
「〜の公式サイト」「〜のリンク」「〜のニュース」など外部リソース参照を含む質問
「〜の価格はいくら」「〜の試合はいつ」など頻繁に変動する値を問う質問

2. 信頼性要求パターン

「出典を示して」「ソースは？」「参考文献」など
──この場合、内部記憶では「出典の明示」ができないため、検索に回る

3. ファクトギャップ検知

内部モデルが「信頼度スコア」を低く出す領域（例：極端に新しい固有名詞）
「信頼度が閾値以下」→ 検索をトリガー

検索 API /検索ツールラッパー

ChatGPT search が出力するテクストなら，Transfomer の応答生成と親和的。
「Web検索しています」の表示が出てからテクストが生成されるまでが一瞬の場合，「リアルタイム検索・最新情報取得」の線は無い。
そして ChatGPT Search なら，すでに内部に持っているインデックス（キャッシュ済み＋フィルタ済みのウェブデータベース──実質「専用データベース」) からの検索になるので，「一瞬」が可能。

ChatGPT Search

引用文献
- Guangxin He, et al. (2024) : Zero-Indexing Internet Search Augmented Generation for Large Language Models
  - arXiv:2411.19478v2
  - https://arxiv.org/html/2411.19478v2