限定公開のAIモデル「Mythos」に不正アクセスか:非セキュリティ目的での利用が懸念
米Bloombergが4月21日(現地時間)、「Anthropic」が開発した新しいAIモデル「Claude Mythos Preview」(Mythos)に対し、少数の不正ユーザーがアクセスしていたと報じた。Mythosは、サイバーセキュリティの脆弱性発見という防御的用途に限定し、一部の企業にのみ限定公開されている。Anthropicは、このモデルを「Project Glasswing」の一環として、AIによるサイバー攻撃への対策を進めるために提供している。
報道によると、Mythosが発表された4月7日当日に、プライベートなオンラインフォーラムに所属するユーザーグループが、不正にアクセス権を獲得した。このグループはその後もMythosを日常的に利用しているが、その用途はサイバーセキュリティの目的ではないと報じられている。Anthropicの広報担当者は「サードパーティベンダー環境を経由した不正アクセス」について現在調査中であるとコメントしている。
Mythosは、脆弱性を自律的に発見し、攻撃エクスプロイトを作成できるなど、極めて高いサイバー攻撃性能を持つため、規制当局から懸念が示されている。不正アクセスを行ったグループは、「未公開のAIモデルに関する情報探索に特化した非公開のDiscordサーバー」に参加しており、Anthropicが公開した情報をボットで分析するなど、複数の手法を組み合わせてアクセス権を入手したとみられる。この不正利用が、企業セキュリティの防御策として提供されるはずのMythosの信頼性に深刻な影響を与える可能性が指摘されている。
背景
AnthropicのMythosは、AIによるサイバー攻撃の脅威が高まる中、防御的な目的(脆弱性発見)に特化して開発された先進的なAIモデルである。本来、その強力な性能ゆえに悪用リスクが懸念され、一般公開を避け、一部の企業に限定提供されている。
重要用語解説
- Claude Mythos Preview: Anthropicが開発した、サイバーセキュリティの脆弱性発見に特化した高性能AIモデル。防御的用途に限定公開されている。
- Project Glasswing: Anthropicが実施する、ソフトウェアの安全性強化を目的とした取り組み。Mythosの限定公開の枠組みとなっている。
- 防御的サイバーセキュリティ: サイバー攻撃を実際に受けるのではなく、システムやネットワークの脆弱性を事前に発見し、防御を固めるためのセキュリティ対策。
今後の影響
本件が事実であれば、Anthropicのセキュリティ管理体制に大きな疑問符がつく。Mythosの限定公開の目的が「悪用防止」であるため、不正利用が広がることで、AIセキュリティツールの信頼性全体に影響を及ぼし、今後のAIモデルの規制強化を促す可能性がある。Anthropicは迅速な対応が求められる。
- https://www.itmedia.co.jp/aiplus/articles/2604/22/news141.html
- https://www.itmedia.co.jp/news/articles/2604/22/news138.html
- https://gigazine.net/news/20260422-claude-mythos-preview-unauthorized-users/
- https://techcrunch.com/2026/04/21/unauthorized-group-has-gained-access-to-anthropics-exclusive-cyber-tool-mythos-report-claims/