国際注目度 85

中国AI企業3社による『蒸留攻撃』でAnthropicのモデルデータ不正利用

米国のAI企業Anthropicは2月23日、中国のAI企業3社（DeepSeek、Moonshot AI、MiniMax）が自社の言語モデル「Claude」の能力を不正に抽出して自社のモデルを向上させる「蒸留攻撃」を大規模に実施していると発表しました。これらの企業はAnthropicの利用規約や地域的なアクセス制限に違反し、約2万4000の不正アカウントを通じて1600万回以上のやり取りを行っていました。

蒸留とは、高性能なモデルの出力結果を利用して、より低性能なモデルを訓練する手法です。悪用すれば、本来なら自社開発にかかる時間とコストを大幅にカットして高性能なAIを不正に構築できるため、国家安全保障上のリスクを生む可能性があります。

Anthropicは、これらの企業がClaudeの推論能力や強化学習用のデータ生成などを標的にし、検閲を回避できる安全な応答の生成にも利用していたと指摘しています。また、こうした攻撃は、米国の技術的優位性を維持するために設けられているAI半導体などの「輸出管理体制」を根底から揺るがすものだと警告しています。

Anthropicは、APIトラフィックから攻撃パターンや推論データの抽出プロセスを識別する分類システムなどを構築するなど防衛策に多額の投資を行っていますが、業界全体や政策立案者との協調的な対応を呼びかけています。

背景

近年、AI技術の進化は目覚ましく、その応用範囲も広がっています。しかし、同時にAI技術の悪用によるリスクも高まっており、国家安全保障上の懸念材料となっています。今回の事件は、中国企業によるAI技術の不正利用と輸出管理体制への影響を浮き彫りにし、国際的な議論を喚起する可能性があります。

重要用語解説

蒸留攻撃: 高性能なAIモデルの出力結果を利用して、より低性能なモデルを訓練する手法。悪用すれば、本来なら自社開発にかかる時間とコストを大幅にカットして高性能なAIを不正に構築できる。

Claude: Anthropicが開発した言語モデル。高度な自然言語処理能力を持ち、様々なタスクに対応できる。

ハイドラクラスター: 多頭の蛇になぞらえ、次々とアカウントを切り替える手法。大量の不正アカウントをネットワーク化して攻撃を行う。

輸出管理体制: AI半導体などの高度な技術の輸出を規制する制度。米国の技術的優位性を維持するために設けられている。

APIトラフィック: アプリケーションプログラミングインターフェース（API）を通じて送受信されるデータの流れ。

今後の影響

今回の事件は、AI技術の不正利用による国家安全保障リスクの高まりを改めて認識させるものであり、国際的な協力体制の強化や輸出管理規制の見直しなどが求められます。また、企業側もセキュリティ対策の強化と倫理的なAI開発への取り組みが重要となります。

Information Sources:

https://www.itmedia.co.jp/aiplus/articles/2602/24/news060.html