概要
Ministral 3B は Mistral AI の Ministral 3 ファミリーで最小のメンバー、2025 年 12 月公開。Ministral 3 ライン全体は dense モデル 3 サイズ(3B / 8B / 14B)で構成 —— すべて Apache 2.0、すべてオプションで画像理解搭載。より大きい Mistral Small 4(サーバー向け 119B MoE)とは異なり、Ministral は最初から edge デプロイを前提に設計された:スマートフォン、軽量ノート PC、IoT ハードウェア。3B バリアントは生の能力を多少犠牲にする代わりに、4GB RAM の CPU マシンならほぼどこでも動作する展開ハードルの低さを獲得した。
主要スペック
(上記スペックカードを参照。構造化データから自動描画。)
動作デバイス
3B 版を Q4 量子化すると約 2GB のストレージ + 2-4GB の RAM 余裕が必要。これにより Pixel 8 以降、iPhone 15 Pro 以降、2023 年以降に公開された 4GB+ RAM の Android スマホの大半、そして任意の消費者向けノート PC(古い Intel/AMD CPU と Apple silicon を含む)が対象。Mistral は CPU のみの推論に特化最適化を施しており、専用 NPU を持たないデバイスでも実用的なトークンスループット(モダンなノート PC CPU で 10-20 トークン/秒)を実現する。
強みと制約
強み。 CPU のみの性能が突出 —— 多くの端末同類は NPU オフロードを前提としているが、Ministral は古いハードウェアでも十分動作する。Apache 2.0 ライセンスは Gemma 4 や Qwen 3.5 と同等の契約上のシンプルさ。「不要なトークンを生成しない」よう訓練されており —— 実際のメリットは応答が高速・低コストになること。画像理解は Llama 3.2 Mobile や DeepSeek-R1 Distill のようなテキスト専用同類に対する無料の機能アップグレード。
制約。 音声モダリティを持たない(Gemma 4 と Phi-4-multimodal は両方とも対応)。32K コンテキストは Gemma 4 の 128K の半分、Qwen 3.5 の 262K と比べると桁違いに少ない —— 長文処理ワークロードは別モデルを選ぶべき。ビジョン能力は堅実だが、MiniCPM-V 4.0 のような専用設計ほどではない。
どんな場面で選ぶか / 選ばないか
Ministral 3B を選ぶ場面: バランスの取れたテキスト+ビジョンモデルが必要で、CPU のみのノート PC を含む幅広いハードウェアで動作させたい;Apache 2.0 ライセンスのシンプルさを重視する;ワークロードが短く焦点を絞った出力(分類、ルーティング、要約、音声メモ)を好む;レイテンシ予算がタイト。
選ばない場面: 長文コンテキスト対応が必要(Gemma 4 の 128K か Qwen 3.5 の 262K のほうが向く);音声が必要(Gemma 4 や Phi-4-multimodal);最先端のビジョンベンチマークが必要(純粋なビジョンタスクでは MiniCPM-V 4.0 が上回る)。
類似モデルとの比較
最も近い 2 つ:Microsoft Phi-4-multimodal(より大型・強力、MIT、音声も追加)と Gemma 4 E2B(より小型、同じく Apache 2.0、コンテキストが長い、音声もあり)。Ministral 3B の差別化ポイントは優れた CPU のみの性能と、簡潔で効率的な出力への注力 —— Phi と Gemma はどちらも暗黙的に NPU 搭載のフラッグシップを対象としている。完全な横並び比較は leaderboard を参照。
実際の Cove アプリで
Cove Voice は Gemma 4 を使って音声メモを要約している。Ministral 3B はまさにこのニッチで強力な代替候補 —— 簡潔な出力に向けて調整されており、より多様なハードウェア(Cove は古いノート PC 向けにデスクトップビルドも提供)で動作し、Apache 2.0 でライセンスがシンプル。最終的に Gemma 4 を選んだのは、Cove Photo の画像理解にも同一モデルが必要だったため。将来 Cove が音声専用アプリをリリースするなら、Ministral 3B はショートリストに入る。