小さなビストロでの「実地ストレステスト」
具体的な場面から始めたい。
リヨン郊外、火曜の夜 9 時、小さなフレンチビストロ。Wi-Fi は「complimentary」 と書かれているが、キャプティブポータルのログインページが開かない。ローミ ングは 200 MB を超えて 2G まで落ち、ファイバーが藁一本まで細くなったような あの遅さになっている。
ウェイターはテーブルの脇で、礼儀正しく待っている。あなたはメニューの 「andouillette」を指でつついて、スマホのクラウド翻訳に問いかける。
8 秒、ぐるぐるしている。返ってきた答えは「andouillette」だった。
ウェイターはまだ待っている。仕方なく、勘で注文する。二口食べたところで、 andouillette が何かを身をもって理解する——独特な匂いの強いフランスの 内臓ソーセージだ。初めて食べると、たいてい一瞬ひるむやつ。
私はこの状況を**「旅行型ストレステスト」**と呼ぶことにしている。エッジ ケースではない。旅行中に毎日のように繰り返し直面する、ごくありふれた 状態——ネットが弱い、人がいる、急かされる、判断コストが極端に低い決定。 この記事の主張はシンプルで、こうした圧の下では オンデバイス AI は単 なるプライバシー強化ではなく、唯一その場で崩れない形のプロダクトである。
論拠は「3 つの軸」が同方向に揃うこと
私自身、最初はオンデバイス AI をプライバシーの話として捉えていた。 だが何度か旅をしてから気づいた——これは実は 互いに独立した 3 つの論拠 が、たまたま同じ方向を指している 話だ。「3 つのうち 1 つでも成立する」 のではなく「3 つすべてが成立する」プロダクト判断は珍しい。だから 1 つ ずつ分けて見る価値がある。
ネットワーク信頼性
旅行はネットワーク敵対的環境です。地下、電車、キャプティブ Wi-Fi ポータル、eSIM が「使える」が実質的に 2 kbps の細い流れである国。 クラウド翻訳はソーステキストを送るための 安定した上り帯域 と、訳文を 受け取るための 安定した下り帯域 に依存します。どちらが不安定でも ループが壊れます。
オンデバイス翻訳はこの変数を完全に取り除きます。リビングでもヒマラヤの 尾根でも同じように動きます。
プライバシー
クラウド翻訳サービスはリクエストをログします。プライバシーポリシーを 読めばわかります — ほとんどが「サービス改善のために翻訳リクエストを 保存・処理することがあります」と書いてあります。これに含まれるのは、 外国の薬局での医療質問、「整理」したいプライベートなジャーナル、 バーテンダーと訳そうとした気まずい会話です。
オンデバイスはそれらのテキストが端末を出ないという意味です。信頼モデルは データが信頼境界に到達すらしない。
レイテンシ
これが人々が過小評価する点。良い接続でのクラウド翻訳ラウンドトリップは 約 300–500 ms。不安定な接続では 2–8 秒。Pixel 9 のオンデバイスはネット ワーク変動なしで 500 ms 未満。
500 ms と 5 秒の差は「5× 遅い」ではありません — それは 会話が普通に 感じる と 会話が放棄される の差です。
横並びテスト
同じ 4 つの文を Google 翻訳(クラウド)と Cove Travel(Gemma model card の Gemma 4 E2B オンデバイス)で Pixel 9 上で走らせました。
| 原文 | Google 翻訳(クラウド) | Cove Travel(オンデバイス) |
|---|---|---|
| “Could I have the bill, please?” (EN→FR) | “Puis-je avoir l’addition, s’il vous plaît?" | "L’addition, s’il vous plaît?" |
| "Is this dish spicy?” (EN→JA) | “この料理は辛いですか?" | "この料理、辛いですか?" |
| "Where is the nearest pharmacy?” (EN→ES) | “¿Dónde está la farmacia más cercana?" | "¿Dónde está la farmacia más cercana?" |
| "I have an allergy to peanuts.” (EN→ZH) | “我对花生过敏。" | "我对花生过敏。” |
クラウドとオンデバイス版はほぼ同等。違いは精度のギャップというより スタイル(“l’addition” 単独 vs “Could I have” 付き)。旅行スタイルの文 (25 単語以下、会話トーン)であれば、両方が同じ実用的な出力を生みます。
表に 出ていない もの:クラウド版は強い接続で 400–800 ms かかり、 不安定な接続では 2 度タイムアウトしました。オンデバイス版は毎回 280–410 ms でした。
クラウドが今でも勝つ場面
オンデバイスがすべてに勝つと主張すれば、省略による嘘になります。今日 クラウドが正直にオンデバイスに勝つケースが 3 つあります:
- 長文の業務文書。 10 ページの契約書、研究論文、技術仕様 — DeepL や Google Cloud の商用 API が、スマホハードウェアの 4B モデルが扱える どれよりも上手く処理します。別カテゴリです。
- 非常に稀少な言語。 タガログ語 ↔ ウォロフ語のような低リソース ペアが必要なら、Gemma 4 E2B も他のオンデバイスモデルもまだ十分に有能と 感じない。はるかに大きなデータセットで学習されたクラウドモデルが ここでは前に出ます。
- 翻訳メモリとチームワークフロー。 チーム間で協業するプロ翻訳者は 訳文のクラウドベースバージョン管理が必要。オンデバイスは定義上それを 提供しません。
これが Cove Travel をプロ翻訳の代替ではなく 旅行コンパニオン として 位置付けている理由です。仕事に応じて適切な道具を使ってください。
オンデバイスが解放しクラウドができないもの
逆向きのリストはより短く、より興味深い。オンデバイスにはできて、 クラウドが正直にできないことがあります:
- 機内モードで動作する。 自明の 1 つ。クラウドは文字通りネットワーク なしで動作できません。
- 真にプライベートなジャーナリング。 クラウドサービスで翻訳した ものは定義上、誰かのログ内にあります。オンデバイスは信頼境界が あなたのスマホの中に留まることを保証します。
- 予測可能なレイテンシ。 クラウドのレイテンシはネットワークの最悪 経路で上限が決まります。オンデバイスのレイテンシは CPU/NPU で上限が 決まり、それはどの国でも同じです。
- サブスクリプション依存なし。 買い切りオンデバイスアプリは、それを 作った会社が明日閉じても動き続けます。サブスクリプション型クラウド アプリはサブスクが切れた瞬間に止まります。
最後の項目は過小評価されています。モデルファイルはあなたの端末にあります。 Cove という会社が消えても、あなたのインストール済み Cove Travel はまだ 翻訳します。
FAQ
オンデバイス翻訳はクラウドと同じ精度ですか?
高リソース言語ペアの旅行スタイル文であれば、はい — 標準ベンチマークで 約 5% 以内。長文の業務文書はどの言語でも今でもクラウドが勝ちます。
翻訳中にスマホが温かく感じるのはなぜ?
4B パラメータのモデルは実際の計算負荷です。NPU 加速のある Pixel 9 では 温かさは穏やかで、翻訳あたりのバッテリーコストは YouTube 動画を 10 秒 再生するのとほぼ同じです。
アクセント記号や特殊文字の入力は?
それは OS レベルのキーボードの問題で、翻訳の問題ではありません。 オンデバイス翻訳はキーボードが生成するものを何でも扱います。
アップロードされていないと信頼できますか?
Cove Travel は /ja/why-offline にネットワーク監査を 公開し、アプリが行うすべてのネットワーク呼び出しをリストしています。 要約:あなたの Wi-Fi 越しのオプションのモデル更新、オプトインした場合の オプションのクラッシュレポート、それ以外は何もなし。
姉妹読み物: