テクノロジー注目度 88

限定公開のAIモデル「Mythos」に不正アクセスか：非セキュリティ目的での利用が懸念

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

米Bloombergが4月21日（現地時間）、「Anthropic」が開発した新しいAIモデル「Claude Mythos Preview」（Mythos）に対し、少数の不正ユーザーがアクセスしていたと報じた。Mythosは、サイバーセキュリティの脆弱性発見という防御的用途に限定し、一部の企業にのみ限定公開されている。Anthropicは、このモデルを「Project Glasswing」の一環として、AIによるサイバー攻撃への対策を進めるために提供している。

報道によると、Mythosが発表された4月7日当日に、プライベートなオンラインフォーラムに所属するユーザーグループが、不正にアクセス権を獲得した。このグループはその後もMythosを日常的に利用しているが、その用途はサイバーセキュリティの目的ではないと報じられている。Anthropicの広報担当者は「サードパーティベンダー環境を経由した不正アクセス」について現在調査中であるとコメントしている。

Mythosは、脆弱性を自律的に発見し、攻撃エクスプロイトを作成できるなど、極めて高いサイバー攻撃性能を持つため、規制当局から懸念が示されている。不正アクセスを行ったグループは、「未公開のAIモデルに関する情報探索に特化した非公開のDiscordサーバー」に参加しており、Anthropicが公開した情報をボットで分析するなど、複数の手法を組み合わせてアクセス権を入手したとみられる。この不正利用が、企業セキュリティの防御策として提供されるはずのMythosの信頼性に深刻な影響を与える可能性が指摘されている。

背景

AnthropicのMythosは、AIによるサイバー攻撃の脅威が高まる中、防御的な目的（脆弱性発見）に特化して開発された先進的なAIモデルである。本来、その強力な性能ゆえに悪用リスクが懸念され、一般公開を避け、一部の企業に限定提供されている。

重要用語解説

Claude Mythos Preview: Anthropicが開発した、サイバーセキュリティの脆弱性発見に特化した高性能AIモデル。防御的用途に限定公開されている。
Project Glasswing: Anthropicが実施する、ソフトウェアの安全性強化を目的とした取り組み。Mythosの限定公開の枠組みとなっている。
防御的サイバーセキュリティ: サイバー攻撃を実際に受けるのではなく、システムやネットワークの脆弱性を事前に発見し、防御を固めるためのセキュリティ対策。

今後の影響

本件が事実であれば、Anthropicのセキュリティ管理体制に大きな疑問符がつく。Mythosの限定公開の目的が「悪用防止」であるため、不正利用が広がることで、AIセキュリティツールの信頼性全体に影響を及ぼし、今後のAIモデルの規制強化を促す可能性がある。Anthropicは迅速な対応が求められる。

Information Sources: