Appleの新Core AI、iPhone 17 ProでLLMを実機ベンチマーク:MLX比で2回目以降は大幅高速化
本記事は、WWDC 2026で発表されたAppleの新しいフレームワーク「Core AI」(Core MLの後継)を用いて、大規模言語モデル(LLM)をiPhone 17 Pro実機上でベンチマークした結果を詳細に報告している。比較対象は、MLXや従来のCoreMLである。
実験では、Qwen3-0.6Bという同一モデルを使用し、「Appleが想定する使い方」に忠実に公式のexportプロセスを経て実行された。その結果、Core AI GPUエンジンを用いた場合、定常状態(warm)でのデコード速度は181 tok/sを記録した。一方、MLXは安定して約112 tok/sで推移している。
注目すべき点は、Core AIのパイプライン処理において「初回コスト」が非常に大きいことである。pipelinedエンジンを使用した場合、最初の実行ではカーネルコンパイルと3段パイプライン充填のコストにより71 tok/sに低下するものの、これは一度きりの現象であり、アプリを再起動せずに2回目以降の実行からは再び約181 tok/sという高い速度が維持されることが判明した。つまり、「初回だけCore AIが遅く、それ以降はMLXより大幅に高速」であると結論付けられている。
また、技術的な詳細として、iOS環境ではJIT(Just-In-Time)コンパイルができないため、事前にAOT(Ahead-Of-Time)コンパイルによるデバイス向け最適化が必須であり、さらに演算ユニット(ANE/GPU)の選択は実行時フラグではなくモデルのエクスポート形状によって自動判定されるという技術的な課題も指摘されている。最後に、メモリ効率を重視した自作のCoreML-LLM変換手法は、デコード速度は遅いが、従来のCore AI ANEと比較して圧倒的に省メモリ(約1/6)であると報告している。
背景
本ニュースは、Appleが次世代のオンデバイスAI処理を担う新フレームワーク「Core AI」を発表したことに端を発する。LLMの性能比較は、単なる速度だけでなく、実機での安定性やメモリ効率など多角的な視点が必要であり、専門エンジニアによる詳細なベンチマーク結果が公開された。
重要用語解説
- Core AI: iOS/macOS 27から導入される、従来のCore MLの後継となるAppleのAIフレームワーク。オンデバイスでLLMを動かすためのパイプラインを提供する。
- MLX: Appleが開発した機械学習ライブラリ。Metal Performance Shadersを利用し、Apple Silicon上で高い計算効率を実現する目的で設計されている。
- AOTコンパイル: Ahead-Of-Time Compilationの略。実行前にコードやモデルをデバイス固有の形式に完全に最適化・変換すること。iOSなどJITが困難な環境で必須となる。
今後の影響
Core AIは、初回起動時のオーバーヘッドがあるものの、定常利用時にはMLXを超える高速処理能力を提供し、オンデバイスAI体験を大きく向上させる可能性がある。開発者は、この「初回コスト」と「安定した高速度」のトレードオフを理解し、アプリ設計に組み込む必要がある。