AnthropicのAI「Claude Fable 5」に性能制限と過剰なセキュリティ対策が判明、開発者から不満噴出
高性能AIモデルを提供するAnthropic社は、2026年6月9日に「Claude Mythos 5」および一般公開版の「Claude Fable 5」をリリースした。Mythos 5は一部組織限定のアップデート版であり、Fable 5はセキュリティ対策を施した製品版として誰でも利用可能となった。
しかし、このFable 5には過剰なセキュリティ制限がかけられていることが開発者コミュニティから指摘されている。Anthropic社は「迅速なモデル展開のため」と明言し、セッション全体の5%を「危険な質問」と判断する厳しい対策を実施した結果、実際の利用において誤検知の報告が相次いでいる。
具体例として、生物医学専門家のDerya Unutmaz氏は、「Cancer(がん)」という単語を入力しただけで応答が終了し、別のモデルに切り替わってしまった事例や、「Hello」と入力するだけで危険と判断される事態を報告している。さらに深刻なのは、AI研究者に対する利用制限の厳しさである。Anthropicは「フロンティアLLMの開発者」を対象とした新たなセーフガードを導入し、事前トレーニングパイプライン構築などの用途への利用が制限される一方、通常の危険判定時にはユーザー通知や他モデルへの切り替えが行われないため、「Claude Fable 5の効果を制限する」という極めて厳しい処置が取られることが判明した。
この「フロンティアLLM開発者」の定義基準は不明確であり、Aratako氏などからは一般的なML系研究・開発にも悪影響を及ぼす可能性への懸念が示されている。また、AI企業創業者からは、Anthropicの制限措置が過剰な監視体制につながり、将来的にOSやメールなどの日常的なデジタルサービス全般にまで適用されるのではないかという強い皮肉と批判が寄せられている。
背景
AIモデルの安全性確保は喫緊の課題であり、Anthropic社を含む主要開発企業は、サイバー攻撃や誤用を防ぐため、厳格なセキュリティ対策(セーフガード)を導入している。しかし、その過剰な制限が利用者の利便性や研究活動に支障をきたすケースが増えており、技術的な制約と倫理的配慮のバランスが問われている。
重要用語解説
- Claude Fable 5: Anthropic社が提供する一般公開版AIモデル。高性能な「Mythos 5」からセキュリティ対策を施した製品版であり、誰でも利用可能だが、過剰な制限がかかっている点が問題視されている。
- フロンティアLLMの開発者: Anthropic社が新たに導入したセーフガードの対象となる開発者層。事前トレーニングパイプライン構築など高度な研究用途への利用を制限する基準は不明確で、批判の的となっている専門用語。
- 誤検知(False Positive): AIモデルが実際には危険ではない入力や単語(例:「Cancer」や「Hello」)を、セキュリティ上のリスクと誤って判断し、応答を拒否してしまう現象。
今後の影響
Anthropic社の過剰な制限は、研究者コミュニティにおける信頼性を低下させ、開発の自由度を大きく制約する可能性がある。今後は、安全性確保と利用者の実用性のバランスを取るための透明性の高いガイドライン策定が求められ、AI業界全体の規制議論に影響を与えると考えられる。