ChatGPTの会話に組み込まれる広告の仕組み:OpenAIの高度なトラッキング技術を分析
本記事は、ChatGPTがどのように広告をユーザーの会話に組み込み、そのクリック行動を追跡しているかという、OpenAIの広告プラットフォームの内部構造を詳細に分析したものです。このシステムは、大きく「ChatGPT側(バックエンド)」と「マーチャント側(ブラウザ)」の二つの部分から構成されています。
**【広告の挿入プロセス】**
ユーザーがChatGPTにメッセージを送信すると、バックエンドはSSE(Server-Sent Events)ストリームを開き、モデルの応答データの中に`single_advertiser_ad_unit`という構造化された広告ユニットオブジェクトを注入します。このオブジェクトには、広告主(例:Grubhub)のブランド情報、キャッチコピー、そして具体的なリンク情報(`target`)が含まれています。この広告は、単なる表示に留まらず、特定のコンテキスト(例:北京旅行の計画、NBAのプレイオフなど)に合わせて動的に選定されています。
**【トラッキングの仕組み】**
広告のクリック時には、単なるURL遷移ではなく、高度なトラッキングメカニズムが働きます。広告には「Fernet暗号化されたクリックトークン」が4種類(`ads_spam_integrity_payload`、`oppref`、`olref`、`ad_data_token`)付与されています。特に`oppref`はフォワードアトリビューショントークンとしてURLに埋め込まれ、マーチャント側のトラッキングSDK(OAIQ)がこれを読み取り、720時間の有効期限を持つファーストパーティクッキー`__oppref`に書き込みます。その後、ユーザーがマーチャントのウェブサイトにアクセスし、OAIQ SDKが実行されることで、製品閲覧などのイベントがOpenAIのサーバーにPOSTされ、広告のクリックから実際のコンバージョンまでの一連の流れが追跡されます。
**【ターゲティングの精度】**
分析された事例では、同じアカウントに対して、会話のトピック(例:北京旅行、ファッション、生産性)が異なると、異なる広告主(Grubhub、GetYourGuide、Aritziaなど)の広告が提供されており、コンテキストに基づいた高度なターゲティングが行われていることが示されています。この仕組みは、OpenAIがユーザーの行動データを極めて詳細に収集し、広告収益化を最大化するための包括的なエコシステムを構築していることを示唆しています。
背景
近年、生成AIの普及に伴い、プラットフォームの収益化が大きな課題となっています。OpenAIは、ChatGPTの強力なユーザーエンゲージメントを維持しつつ、広告収入を組み込むことで、この課題に対応しようとしています。本記事は、その広告挿入とトラッキングの技術的な詳細を、内部構造の分析を通じて明らかにしています。
重要用語解説
- SSE (Server-Sent Events): サーバーからクライアントへ、リアルタイムで一方向のデータストリームを送信する技術。ChatGPTの応答データの中に広告ユニットを注入するために利用されています。
- Fernet暗号化: Pythonで用いられる、AES-128-CBCとHMAC-SHA256を組み合わせた対称鍵暗号化方式。広告のクリックトークンに用いられ、データの改ざん防止と機密性を高めています。
- OAIQ SDK: OpenAIが開発したトラッキング用JavaScriptライブラリ。ユーザーが広告経由で遷移したマーチャントサイト上で、製品閲覧などの行動データを収集し、OpenAIのサーバーに送信する役割を担います。
今後の影響
この高度なトラッキング技術の公開は、AIプラットフォームにおける広告の透明性に関する議論を加速させます。ユーザーは、AIとの会話が単なる情報取得ではなく、詳細な行動追跡の場となっていることを認識する必要があり、プライバシー保護やデータ利用に関する規制強化が求められる可能性があります。企業側は、このモデルを参考に、より深いユーザー行動分析に基づく収益化戦略を構築すると予想されます。