它是什么?
Ministral 3B 是 Mistral AI 的 Ministral 3 家族里最小的成员,2025 年 12 月发布。Ministral 3 产品线包含 3B、8B、14B 三个 dense 模型 —— 全部 Apache 2.0、全部带可选图像理解。和更大的 Mistral Small 4(119B MoE 服务器版)不同,Ministral 从设计起就是冲着 edge 部署去的:手机、轻量笔记本、IoT 硬件。3B 版本牺牲一点原始能力,换取「在 4GB RAM 的 CPU 上几乎到处都能跑」的部署门槛。
核心规格一览
(请参考上方规格卡,数据来自结构化数据层。)
什么设备能跑?
3B 版本 Q4 量化下大约占 2GB 存储 + 2-4GB RAM 余量。覆盖范围包括 Pixel 8 及以上、iPhone 15 Pro 及以上、2023 年以来发布的大多数 4GB+ RAM 安卓手机,以及任何消费级笔记本(包括较老的 Intel/AMD CPU 和 Apple silicon)。Mistral 专门为纯 CPU 推理做了优化,没有专用 NPU 的设备也能跑出可用速度(现代笔记本 CPU 上 10-20 token/秒)。
优势与局限
优势。 纯 CPU 性能突出 —— 很多端侧同行假设有 NPU 卸载,Ministral 在老硬件上也跑得动。Apache 2.0 许可证与 Gemma 4 和 Qwen 同档,合同简洁。训练时刻意「减少不必要 token 输出」 —— 实际收益是更快更省。图像理解是相对 Llama 3.2 Mobile、DeepSeek-R1 Distill 这些纯文本同行的免费升级。
局限。 无音频模态(Gemma 4 和 Phi-4-multimodal 都有)。32K 上下文是 Gemma 4 128K 的一半、Qwen 3.5 262K 的零头 —— 长文档任务要选别的模型。视觉能力扎实但不像 MiniCPM-V 4.0 那样专精。
适合什么场景?不适合什么场景?
选 Ministral 3B 当: 你需要均衡的文本+视觉模型,要在广泛硬件(包括纯 CPU 笔记本)上跑;你看重 Apache 2.0 许可证简洁性;你的工作流偏好简短聚焦的输出(分类、路由、摘要、语音笔记);你的延迟预算紧。
别选它当: 你需要长上下文支持(Gemma 4 128K 或 Qwen 3.5 262K 更好);你需要音频(Gemma 4 或 Phi-4-multimodal);你需要 SOTA 视觉 benchmark(纯视觉任务 MiniCPM-V 4.0 表现更强)。
与相似端侧模型对比
最相近的两位:Microsoft Phi-4-multimodal(更大、更强、MIT、还加了音频)与 Gemma 4 E2B(更小、同样 Apache 2.0、上下文更长、也有音频)。Ministral 3B 的差异化点是出色的纯 CPU 性能和对简短高效输出的关注 —— Phi 和 Gemma 都隐含针对带 NPU 的旗舰机。完整横评见 leaderboard。
在 Cove App 里的真实落地
Cove Voice 用 Gemma 4 整理语音笔记。Ministral 3B 在这一精确场景里是有力替代 —— 它训练时刻意输出简短,能在更多样的硬件上跑(Cove 桌面版也面向不少老旧笔记本),Apache 2.0 让授权更简单。我们最终选 Gemma 4 是因为 Cove Photo 也要图像理解,需要同模型。如果未来 Cove 推出纯语音类 App,Ministral 3B 会进入候选短名单。