Ministral 3B：Mistral 端侧 LLM 移动版完整评测

参数量	3 B
量化后大小	2 GB
上下文长度	32,768 tokens
模态	text+vision
许可证	apache-2.0
最低 RAM	4 GB
版本	Ministral 3B
发布	2025-12

参数量

3 B

量化后大小

2 GB

上下文长度

32,768 tokens

模态

text+vision

许可证

apache-2.0

最低 RAM

4 GB

版本

Ministral 3B

发布

2025-12

它是什么？

Ministral 3B 是 Mistral AI 的 Ministral 3 家族里最小的成员，2025 年 12 月发布。Ministral 3 产品线包含 3B、8B、14B 三个 dense 模型 —— 全部 Apache 2.0、全部带可选图像理解。和更大的 Mistral Small 4（119B MoE 服务器版）不同，Ministral 从设计起就是冲着 edge 部署去的：手机、轻量笔记本、IoT 硬件。3B 版本牺牲一点原始能力，换取「在 4GB RAM 的 CPU 上几乎到处都能跑」的部署门槛。

核心规格一览

（请参考上方规格卡，数据来自结构化数据层。）

什么设备能跑？

3B 版本 Q4 量化下大约占 2GB 存储 + 2-4GB RAM 余量。覆盖范围包括 Pixel 8 及以上、iPhone 15 Pro 及以上、2023 年以来发布的大多数 4GB+ RAM 安卓手机，以及任何消费级笔记本（包括较老的 Intel/AMD CPU 和 Apple silicon）。Mistral 专门为纯 CPU 推理做了优化，没有专用 NPU 的设备也能跑出可用速度（现代笔记本 CPU 上 10-20 token/秒）。

优势与局限

优势。 纯 CPU 性能突出 —— 很多端侧同行假设有 NPU 卸载，Ministral 在老硬件上也跑得动。Apache 2.0 许可证与 Gemma 4 和 Qwen 同档，合同简洁。训练时刻意「减少不必要 token 输出」 —— 实际收益是更快更省。图像理解是相对 Llama 3.2 Mobile、DeepSeek-R1 Distill 这些纯文本同行的免费升级。

局限。 无音频模态（Gemma 4 和 Phi-4-multimodal 都有）。32K 上下文是 Gemma 4 128K 的一半、Qwen 3.5 262K 的零头 —— 长文档任务要选别的模型。视觉能力扎实但不像 MiniCPM-V 4.0 那样专精。

适合什么场景？不适合什么场景？

选 Ministral 3B 当： 你需要均衡的文本+视觉模型，要在广泛硬件（包括纯 CPU 笔记本）上跑；你看重 Apache 2.0 许可证简洁性；你的工作流偏好简短聚焦的输出（分类、路由、摘要、语音笔记）；你的延迟预算紧。

别选它当： 你需要长上下文支持（Gemma 4 128K 或 Qwen 3.5 262K 更好）；你需要音频（Gemma 4 或 Phi-4-multimodal）；你需要 SOTA 视觉 benchmark（纯视觉任务 MiniCPM-V 4.0 表现更强）。

与相似端侧模型对比

最相近的两位：Microsoft Phi-4-multimodal（更大、更强、MIT、还加了音频）与 Gemma 4 E2B（更小、同样 Apache 2.0、上下文更长、也有音频）。Ministral 3B 的差异化点是出色的纯 CPU 性能和对简短高效输出的关注 —— Phi 和 Gemma 都隐含针对带 NPU 的旗舰机。完整横评见 leaderboard。

在 Cove App 里的真实落地

Cove Voice 用 Gemma 4 整理语音笔记。Ministral 3B 在这一精确场景里是有力替代 —— 它训练时刻意输出简短，能在更多样的硬件上跑（Cove 桌面版也面向不少老旧笔记本），Apache 2.0 让授权更简单。我们最终选 Gemma 4 是因为 Cove Photo 也要图像理解，需要同模型。如果未来 Cove 推出纯语音类 App，Ministral 3B 会进入候选短名单。

常见问题

Ministral 3B 和 Mistral Small 是同一个吗？

不是。Mistral Small 4（2026-03 发布）是 119B 参数 MoE 模型，定位服务器和大型工作站。Ministral 3B 是完全独立的更小的 dense 模型，面向手机、edge、IoT。命名容易混淆是因为 Mistral 把 "Small" 挪给了服务器层。

Ministral 3B 在什么设备上能跑？

Pixel 8 及以上、iPhone 15 Pro 及以上、大多数 4GB+ RAM 的现代安卓手机、消费级笔记本（包括 Apple silicon）。3B 版本在很多场景下纯 CPU 也能流畅运行 —— 尤其适合启动速度优先的轻量分类和路由任务。

Ministral 3B 支持图像吗？

支持。Ministral 3 家族（3B / 8B / 14B）全部带图像理解能力。3B 版本在图像精度上略有妥协换取更小体积，但它是真正的多模态 —— 不像 Llama 3.2 Mobile 或 DeepSeek-R1 Distill 那样仅文本。

Ministral 3B 用什么开源许可证？商用可以吗？

Apache 2.0 —— Mistral 在 Ministral 3 整个家族（base / instruct / reasoning 全变体）一致采用 Apache 2.0 开源权重。是合同最友好的 mobile LLM 之一，与 Gemma 4 和 Qwen 3.5 同档。

和 Phi-4-multimodal 或 Gemma 4 比怎么样？

Ministral 3B 更小（3B vs Phi-4 multimodal 的 5.6B；与 Gemma 4 的 2.3B 有效参数相当）。比 Phi 跑在更普通的硬件上，但缺 Gemma 的音频模态。需要均衡的文本+视觉 dense 模型且看重延迟可预测性的场景选 Ministral。

应用

适用场景

了解

获取 Cove

信任

Ministral 3B：Mistral 最小 dense 端侧模型

它是什么？

核心规格一览

什么设备能跑？

优势与局限

适合什么场景？不适合什么场景？

与相似端侧模型对比

在 Cove App 里的真实落地

在 Cove App 里看真实落地

常见问题

引用源

它是什么？

核心规格一览

什么设备能跑？

优势与局限

适合什么场景？不适合什么场景？

与相似端侧模型对比

在 Cove App 里的真实落地

相关模型

在 Cove App 里看真实落地

常见问题

引用源