它是什么?
Apple Foundation Models (AFM) 是驱动 Apple Intelligence 的大语言模型家族。Apple 提供两个版本:30 亿参数的端侧模型完全跑在用户设备上,更大的服务器版本通过 Private Cloud Compute 处理复杂查询。从 iOS 26 / iPadOS 26 / macOS 26 起,Apple 通过 Foundation Models 框架向第三方开发者开放了端侧版本 —— 可直接 Swift 调用,免费,无单次请求成本。
核心规格一览
(请参考上方规格卡,数据来自结构化数据层。Apple 未公开量化后大小和上下文窗口,对应字段显示「未公开」。)
什么设备能跑?
AFM-on-device 需要支持 Apple Intelligence 的设备:手机端 iPhone 15 Pro / 15 Pro Max / 16 系列,iPad M1 芯片及以上,Mac 搭载 Apple silicon。运行时由 Apple Neural Engine 加 Metal 加速,由系统透明管理。老旧设备没有 Apple Intelligence 功能,没有降级到更小模型的回退方案 —— 要么有要么没有。
优势与局限
优势。 零下载 —— 所有支持设备都已自带模型。开发者通过 FoundationModels 框架免费使用。Swift 深度集成,支持 guided generation、结构化输出、tool calling。隐私故事完整:推理本地完成,复杂查询走 Private Cloud Compute 且带加密验证。
局限。 仅限苹果设备。闭源权重 —— 无法检视、微调或自托管。许多规格细节(量化、上下文长度)Apple 一直未公开。跨平台 App 需要给非苹果设备另外配一个模型,QA 与内容工作量翻倍。
适合什么场景?不适合什么场景?
选 AFM-on-device 当: 你的 App 仅服务苹果生态;你想要零下载 AI;你看重 Apple 全栈控制带来的隐私保障;你要最简单的开发者体验来做内容打标、摘要、结构化生成等任务。
别选它当: 你需要面向苹果以外平台(Android、Windows、Linux)发布;你需要开源权重做微调、蒸馏或合规审计;你需要明确的规格数据(Gemma 4 把 Apple 隐藏的所有信息都公开了)。
与相似端侧模型对比
最相近的两位:Gemma 4 E2B(2.3B 有效参数、Apache 2.0 开源、跨平台)与 Microsoft Phi-4-multimodal(5.6B、MIT 许可证、还支持音频模态)。Apple 的强项是集成体验;开源对手胜在便携性和可检视性。完整横评见 leaderboard。
在 Cove App 里的真实落地
Cove Travel 和 Cove Voice 在 iOS 与 Android 上都使用 Gemma 4 —— 我们需要同一个模型同时跑在两个平台。AFM-on-device 是我们如果 Cove 仅服务苹果时会选的模型 —— 当受众 100% 是 iPhone / iPad 用户时,集成体验无可匹敌。Cove 的隐私承诺核心思想(“推理永不离开你的设备,靠架构而非政策保证”)与 Apple Foundation Models 倡导的理念高度一致。