MetaがプロプライエタリLLM「Muse Spark」を発表:医療・高難度推論で業界トップを主張
メタ社は、Superintelligence Labs(MSL)から初のプロプライエタリモデルとして「Muse Spark」を発表しました。これは、従来のオープンソース路線であったLlamaシリーズからの戦略的な転換点を示すものです。
本モデルの最大の特徴は、医療・ヘルスケア分野に特化したベンチマークである「HealthBench Hard」でフロンティアモデル群から42.8というスコアを叩き出し、トップクラスの実力を示した点です。また、「Contemplating mode」(マルチエージェント並列推論)を使用することで、高難度な知識・推論問題(HLE)においてもGPT-5.4やGemini 3.1 Proといった競合モデルを上回る性能を発揮しています。
一方で、総合的な知能指数(Intelligence Index)では52点となり、GPT-5.4(57点)やClaude Opus 4.6(53点)には及びません。特に抽象的推論能力を示すARC-AGI-2など、新しいパターンへの汎化能力においては差が目立ちます。
実用的なタスク遂行能力を測るコーディング(Terminal-Bench 2.0)やエージェント業務タスク(GDPval-AA)では、GPT-5.4やClaude Opus 4.6といった先行モデルに優位性を認められています。しかし、Muse Sparkは全評価を通じて高いトークン効率(58M)を維持しており、APIが一般公開された際のコスト競争力に期待が寄せられています。
現時点ではMeta AIアプリから無料でアクセス可能ですが、本格的な利用には限定プレビューAPIの提供段階であり、今後のオープンソース化の動向や一般公開時期が注目されています。
背景
本ニュースは、AI業界における主要プレイヤー(Meta、OpenAI、Googleなど)による大規模言語モデル(LLM)開発競争の激化を示すものです。特にMetaがオープンソースからプロプライエタリモデルへの戦略転換を図った点が重要であり、今後のAI市場の構造変化を予感させます。
重要用語解説
- Muse Spark: Meta Superintelligence Labs(MSL)が開発した初のプロプライエタリLLM。医療分野や高難度推論に強みを持つ次世代AIモデルです。
- Contemplating mode: 複数の思考プロセスを並列で実行し、最終的な回答を統合する独自機能。複雑な問題解決能力を高めるマルチエージェント推論モードです。
- HealthBench Hard: 医療・ヘルスケア分野の知識や安全性を評価するための専門ベンチマーク。このスコアはモデルの実用的な信頼性を示す指標となります。
今後の影響
Muse SparkがAPIを通じて一般公開されれば、特に医療・研究用途において新たな標準となる可能性があります。また、Metaがクローズドなプロプライエタリ戦略を強化することで、AI市場におけるオープンソースとクローズドモデルの競争軸がより明確化されるでしょう。