端侧 AI 模型 Leaderboard 2026:8 主流大模型横评

最后校验: 2026 年 5 月
模型厂商参数量化大小上下文模态许可证最低 RAMCove 用了吗详情
Gemma 4 E2B Google DeepMind 2.3B 1.5 GB 128,000 text+vision+audio apache-2.0 4 GB 查看 →
Microsoft Phi-4 multimodal Microsoft Research 5.6B 3.5 GB 128,000 text+vision+audio mit 6 GB 查看 →
Apple Foundation Models Apple 3B 未公开 未公开 text+vision apple-proprietary 8 GB 查看 →
Llama 3.2 Mobile Meta AI 3B 2 GB 128,000 text llama-community 6 GB 查看 →
Qwen 3.5 2B Alibaba Cloud 2B 1.5 GB 262,000 text+vision apache-2.0 4 GB 查看 →
Ministral 3B Mistral AI 3B 2 GB 32,768 text+vision apache-2.0 4 GB 查看 →
DeepSeek R1 Distill (Qwen 1.5B) DeepSeek 1.5B 1 GB 32,768 text apache-2.0 4 GB 查看 →
MiniCPM-V 4.0 ModelBest / OpenBMB 4.1B 2.5 GB 32,768 text+vision modelbest-terms 4 GB 查看 →

方法论

这份对比表怎么做出来的。 8 款模型按相同维度对比 —— 参数量、量化后大小、上下文窗口、模态、许可证、最低设备 RAM —— 数据来源是各厂商官方模型卡(Hugging Face、厂商博客、官方文档),截止日期见上方「最后校验」徽章。我们不跑自己的 benchmark,而是对每个数据点交叉验证 2-3 个权威源,遇到矛盾时优先采纳厂商自身声明。实际表现可能与本表偏差 ±10-20%,取决于量化方案(Q4_K_M / AWQ / GPTQ 各有差异)、推理 runtime(LiteRT / MediaPipe / ExecuTorch / llama.cpp / Core ML)、以及设备热降频。每个模型卡都有自己的 `lastReviewed` 字段,本页每季度刷新一次。冲突与歧义在我们的 GitHub 公开 repo 里追踪。

按用途选模型

翻译

按设备选模型