这件事我一年里被问了二十几次
先讲一个真事。
朋友从京都坐车出来,给我发 WhatsApp。流量包当天早上刚被限速,下一站站 名是汉字她又看不懂,Google 翻译的日语离线包她从来没下过。原话是:“我完 全不知道该在哪一站下车。”
我看到消息已经晚了三分钟。她那时候已经凭直觉换过两班车——结果当然是越 换越偏。
像这样的事——不是「翻译不准」,是翻译根本不响应——是我做 Cove Travel 最初的动机,也是这一年里反复被人问到的同一种困境。所以本文不打算重新论 证”离线翻译有没有用”,那个答案是肯定的。我想说清楚的是:
- “离线 AI 翻译”和大部分 app 标榜的”离线模式”,根本不是一回事
- 2026 年到底发生了什么,让这个品类从 demo 变成可上架的产品
- 旅行中真正决定体验差距的三个场景
- 选品时我个人会过的五道筛子
- 以及它做不到什么——这条没人愿意写,但你买之前应该知道
「离线 AI 翻译」到底指什么
这个词最近被滥用了。一堆应用市场上挂着”支持离线”的产品,里面装的其实是 十年前那种统计翻译模型——按词查表、没有上下文理解,能塞进手机但翻不出 人话。
真正的离线 AI 翻译指的是另一回事:你的手机里真的在跑一个生成式 语言模型。Cove Travel 用的是 Google Gemma 4 E2B, 四十亿参数,针对指令遵循和多语言生成做过 fine-tune。说白了——让 ChatGPT 能听懂你阴阳怪气的那套架构,现在被压进了你裤兜里那台手机,而且不需 要联网。
具体能做到三件事:
| 传统离线包 | 离线 AI 翻译 | |
|---|---|---|
| 句法处理 | 逐词翻 | 整句 + 语法 |
| 习语处理 | 字面 | 上下文(多数情况) |
| 语气控制 | 没有 | ”再客气一些”管用 |
| 占用空间 | 每语种 100-500MB | 全语种共享 2-3GB |
| 延迟 | <100ms | Pixel 9 实测 <500ms |
注意”占用空间”这一行:老式离线包按语言收费,下三个语言就是 1GB 起跳。 现代 AI 翻译用一个模型搞定所有支持语言。两种语言以上,AI 路线在存储上 占优。
2026 年发生了什么
过去一年里有三件事让”在手机上跑 AI 翻译”从有趣的 demo 变成真的能上 架:
- 模型变小变准了。 Gemma 4 E2B 用 4-bit 量化能压到大约 2.5GB, 在中端 Android 上跑一句翻译耗时低于 500ms。这个数字在 2024 年初 是不可想象的。
- NPU 主流化了。 Pixel、三星、几乎所有 2025+ 的 Android 都自带神经 处理单元。Cove Travel 通过 LiteRT-LM 走 NPU 路径,单次翻译的电池消耗 比 CPU 路线降了大约 4 倍。
- 模型许可证不再卡门。 Gemma 的条款允许在应用内打包重分发,包括 fine-tuned 版本。这给了独立开发者一个机会窗口,不用再为”上云推理”的 服务器账单忧虑。
三者叠加,意味着 2026 年一个独立小团队可以发布真的离线的 AI 翻译, 不需要服务器预算,也不需要订阅模式来反哺成本。
三个旅行场景,差距就在这里
1. 看不懂的菜单
站在一家不会英语的日本拉面店门口,菜单板上全是手写字。手机相机一对, 两秒后你不只看到菜名,还看到汤底类型、辣度(如果标了)、有没有猪肉。 云端翻译也能做到——只是你常常正好待在没信号的地下室里。
云端方案在地下餐馆、列车隧道、需要 captive portal 登录的咖啡馆里都会 “正好不响应”。本机方案没有这个变数。
2. 来回的对话
向车站柜台问一句话、听对方答、再回一句。如果网络不稳,云端翻译往返一次 8 秒延迟,对话变成一连串尴尬的暂停。本机推理是亚秒级响应,对话节奏接近 正常——足够让对方不会因为太慢而放弃你。
这是延迟差距最关键的场景。等菜单翻译人们能接受,等对话翻译没人能接受。
3. 用混合语言写日记
一个人旅行时我习惯用混合语言写日记——一半中文,一半正在学的当地语。一 个好用的翻译工具帮我在睡前把它们捋顺。我不想让我私人的观察上传任何 服务器。本机优先意味着我的日记默认是私人的,这对日记类内容来说是唯一 能接受的答案。
我会用的五个评估维度
如果你要在 2026 年挑一个离线 AI 翻译,按这个优先级看。
隐私:它真的脱网能跑吗?
最直接的测试是飞行模式。打开飞行模式,开应用,试翻译。任何一步崩溃—— 哪怕是”订阅状态校验”或者远程广告加载——你买的就不是离线产品,是个 带网关的云产品。Cove Travel 主推理完全脱网,仅有可关掉的可选模型更新检 查走网络。
准确度:习语处理得怎么样?
挑一个你两个语言都熟的习语试。“露一手”不应译成”暴露一只手”。“打瞌睡”不 应译成”敲打小睡”。如果一个翻译能合理处理习语,背后是真的生成式模型。如 果不能,背后还是 2014 年的短语表。
模型尺寸:共享还是按语种?
老式离线包每语种约 300MB。现代 AI 翻译一个模型管所有语言,通常 2-3GB。 三种语言以上 AI 路线就赢了。
语种覆盖:愿不愿意承认能力上限?
任何宣称”100+ 语言离线翻译水平一致”的应用都值得怀疑。本机模型的水平很 不均匀:高资源语言(西/法/中/日/阿)非常好,低资源语言(斯瓦希里、缅甸 语、普什图)明显弱。Cove Travel 给每个语种标了置信度,而不是假装都一样 好。这种诚实比标题数字更重要。
价格:订阅还是一次买断?
每年只用四周的旅行翻译,不应该和每天用的生产力工具收一样的钱。iTranslate $5.99/月——一年 $72——哪怕你只出去两次也得交。Cove Travel $3.99 一次买 断。
它做不到的事
我不假装离线 AI 翻译已经在每个维度追平了云端:
- 长篇专业文档还得交给云端。DeepL 翻一份 10 页合同的水平,目前任何 本机模型都比不过。
- 极冷门的语言真的有差距。如果你需要 Tagalog ↔ Wolof,Gemma 和其他 本机模型都还称不上够用。
- 专业医学/法律词汇对大模型更友好。Cove Travel 处理消费级口语没问 题,但我不会用它做医学诊断的翻译。
这些限制就是 Cove Travel 把自己定位成”旅行陪伴”而不是”专业翻译替代品” 的原因。
FAQ
Cove Travel 飞行模式下能跑吗?
能——这就是设计本意。开飞行模式,Cove 仍能翻译、录音、识图。唯一会失败 的是可选的模型更新检查。
下载多大?
首次模型下载约 2.5GB,包含所有支持的语言。后续仅可选的更新会用流量。
和 Google Translate 比有多准?
对高资源语言对、旅行口语句子(25 词以内、对话风格),Cove Travel 与 Google Translate 在线 API 在 FLORES-200 基准 上差距在 5% 以内。Cove 的优势在延迟和隐私;Google 的优势在长篇专业文档。
我需要 Pro 订阅吗?
不需要。Cove Travel 单价 $3.99 一次买断,本机 AI 不限次数使用。Pro 档存 在是为四款应用合卖的全家桶(Travel + Voice + Photo + Health $12.96 一 次买断);它不卡基础翻译。
万一 Google 把 Gemma 下架了,还能用吗?
能。模型文件已经在你设备上。即便 Google 明天把 Gemma 公开版下架,你已 装的那一份依旧能跑。这就是”本机优先”的本质好处之一。
如果你对这种架构选择感兴趣,我写了一篇更长的姊妹文:为什么本机 AI 在 旅行场景胜过云端翻译, 聊延迟、隐私、可靠性三轴。
也可以读 /why-offline 长页,那里把同样的论点扩展到 Voice、Photo、Health 三款兄弟产品。
想试用:去下载 Cove Travel。