Ministral 3B:Mistral 最小 dense 端侧模型

3B 参数、32K 上下文、原生图像理解、Apache 2.0 —— Ministral 3B 是 Mistral AI 最小的 dense 模型,从设计起就为手机、IoT 和 edge 硬件而生。

最后校验: 2026 年 5 月
参数量3 B
量化后大小2 GB
上下文长度32,768 tokens
模态text+vision
许可证apache-2.0
最低 RAM4 GB
版本Ministral 3B
发布2025-12

它是什么?

Ministral 3B 是 Mistral AI 的 Ministral 3 家族里最小的成员,2025 年 12 月发布。Ministral 3 产品线包含 3B、8B、14B 三个 dense 模型 —— 全部 Apache 2.0、全部带可选图像理解。和更大的 Mistral Small 4(119B MoE 服务器版)不同,Ministral 从设计起就是冲着 edge 部署去的:手机、轻量笔记本、IoT 硬件。3B 版本牺牲一点原始能力,换取「在 4GB RAM 的 CPU 上几乎到处都能跑」的部署门槛。

核心规格一览

(请参考上方规格卡,数据来自结构化数据层。)

什么设备能跑?

3B 版本 Q4 量化下大约占 2GB 存储 + 2-4GB RAM 余量。覆盖范围包括 Pixel 8 及以上、iPhone 15 Pro 及以上、2023 年以来发布的大多数 4GB+ RAM 安卓手机,以及任何消费级笔记本(包括较老的 Intel/AMD CPU 和 Apple silicon)。Mistral 专门为纯 CPU 推理做了优化,没有专用 NPU 的设备也能跑出可用速度(现代笔记本 CPU 上 10-20 token/秒)。

优势与局限

优势。 纯 CPU 性能突出 —— 很多端侧同行假设有 NPU 卸载,Ministral 在老硬件上也跑得动。Apache 2.0 许可证与 Gemma 4 和 Qwen 同档,合同简洁。训练时刻意「减少不必要 token 输出」 —— 实际收益是更快更省。图像理解是相对 Llama 3.2 Mobile、DeepSeek-R1 Distill 这些纯文本同行的免费升级。

局限。 无音频模态(Gemma 4 和 Phi-4-multimodal 都有)。32K 上下文是 Gemma 4 128K 的一半、Qwen 3.5 262K 的零头 —— 长文档任务要选别的模型。视觉能力扎实但不像 MiniCPM-V 4.0 那样专精。

适合什么场景?不适合什么场景?

选 Ministral 3B 当: 你需要均衡的文本+视觉模型,要在广泛硬件(包括纯 CPU 笔记本)上跑;你看重 Apache 2.0 许可证简洁性;你的工作流偏好简短聚焦的输出(分类、路由、摘要、语音笔记);你的延迟预算紧。

别选它当: 你需要长上下文支持(Gemma 4 128K 或 Qwen 3.5 262K 更好);你需要音频(Gemma 4 或 Phi-4-multimodal);你需要 SOTA 视觉 benchmark(纯视觉任务 MiniCPM-V 4.0 表现更强)。

与相似端侧模型对比

最相近的两位:Microsoft Phi-4-multimodal(更大、更强、MIT、还加了音频)与 Gemma 4 E2B(更小、同样 Apache 2.0、上下文更长、也有音频)。Ministral 3B 的差异化点是出色的纯 CPU 性能和对简短高效输出的关注 —— Phi 和 Gemma 都隐含针对带 NPU 的旗舰机。完整横评见 leaderboard

在 Cove App 里的真实落地

Cove Voice 用 Gemma 4 整理语音笔记。Ministral 3B 在这一精确场景里是有力替代 —— 它训练时刻意输出简短,能在更多样的硬件上跑(Cove 桌面版也面向不少老旧笔记本),Apache 2.0 让授权更简单。我们最终选 Gemma 4 是因为 Cove Photo 也要图像理解,需要同模型。如果未来 Cove 推出纯语音类 App,Ministral 3B 会进入候选短名单。

在 Cove App 里看真实落地

常见问题

Ministral 3B 和 Mistral Small 是同一个吗?

不是。Mistral Small 4(2026-03 发布)是 119B 参数 MoE 模型,定位服务器和大型工作站。Ministral 3B 是完全独立的更小的 dense 模型,面向手机、edge、IoT。命名容易混淆是因为 Mistral 把 "Small" 挪给了服务器层。

Ministral 3B 在什么设备上能跑?

Pixel 8 及以上、iPhone 15 Pro 及以上、大多数 4GB+ RAM 的现代安卓手机、消费级笔记本(包括 Apple silicon)。3B 版本在很多场景下纯 CPU 也能流畅运行 —— 尤其适合启动速度优先的轻量分类和路由任务。

Ministral 3B 支持图像吗?

支持。Ministral 3 家族(3B / 8B / 14B)全部带图像理解能力。3B 版本在图像精度上略有妥协换取更小体积,但它是真正的多模态 —— 不像 Llama 3.2 Mobile 或 DeepSeek-R1 Distill 那样仅文本。

Ministral 3B 用什么开源许可证?商用可以吗?

Apache 2.0 —— Mistral 在 Ministral 3 整个家族(base / instruct / reasoning 全变体)一致采用 Apache 2.0 开源权重。是合同最友好的 mobile LLM 之一,与 Gemma 4 和 Qwen 3.5 同档。

和 Phi-4-multimodal 或 Gemma 4 比怎么样?

Ministral 3B 更小(3B vs Phi-4 multimodal 的 5.6B;与 Gemma 4 的 2.3B 有效参数相当)。比 Phi 跑在更普通的硬件上,但缺 Gemma 的音频模态。需要均衡的文本+视觉 dense 模型且看重延迟可预测性的场景选 Ministral。

引用源