← ブログ

なぜオンデバイス AI は旅行でクラウド翻訳に勝つのか

観光客でいる時、レイテンシ・プライバシー・信頼性はすべてオンデバイス AI へ向かいます。その論証、横並びテスト、そしてクラウドが今でも勝つ正直な例外を、Pixel 9 + Gemma 4 E2B の実機データと共に解説します。

小さなビストロでの「実地ストレステスト」

具体的な場面から始めたい。

リヨン郊外、火曜の夜 9 時、小さなフレンチビストロ。Wi-Fi は「complimentary」 と書かれているが、キャプティブポータルのログインページが開かない。ローミ ングは 200 MB を超えて 2G まで落ち、ファイバーが藁一本まで細くなったような あの遅さになっている。

ウェイターはテーブルの脇で、礼儀正しく待っている。あなたはメニューの 「andouillette」を指でつついて、スマホのクラウド翻訳に問いかける。

8 秒、ぐるぐるしている。返ってきた答えは「andouillette」だった。

ウェイターはまだ待っている。仕方なく、勘で注文する。二口食べたところで、 andouillette が何かを身をもって理解する——独特な匂いの強いフランスの 内臓ソーセージだ。初めて食べると、たいてい一瞬ひるむやつ。

私はこの状況を**「旅行型ストレステスト」**と呼ぶことにしている。エッジ ケースではない。旅行中に毎日のように繰り返し直面する、ごくありふれた 状態——ネットが弱い、人がいる、急かされる、判断コストが極端に低い決定。 この記事の主張はシンプルで、こうした圧の下では オンデバイス AI は単 なるプライバシー強化ではなく、唯一その場で崩れない形のプロダクトである

論拠は「3 つの軸」が同方向に揃うこと

私自身、最初はオンデバイス AI をプライバシーの話として捉えていた。 だが何度か旅をしてから気づいた——これは実は 互いに独立した 3 つの論拠 が、たまたま同じ方向を指している 話だ。「3 つのうち 1 つでも成立する」 のではなく「3 つすべてが成立する」プロダクト判断は珍しい。だから 1 つ ずつ分けて見る価値がある。

ネットワーク信頼性

旅行はネットワーク敵対的環境です。地下、電車、キャプティブ Wi-Fi ポータル、eSIM が「使える」が実質的に 2 kbps の細い流れである国。 クラウド翻訳はソーステキストを送るための 安定した上り帯域 と、訳文を 受け取るための 安定した下り帯域 に依存します。どちらが不安定でも ループが壊れます。

オンデバイス翻訳はこの変数を完全に取り除きます。リビングでもヒマラヤの 尾根でも同じように動きます。

プライバシー

クラウド翻訳サービスはリクエストをログします。プライバシーポリシーを 読めばわかります — ほとんどが「サービス改善のために翻訳リクエストを 保存・処理することがあります」と書いてあります。これに含まれるのは、 外国の薬局での医療質問、「整理」したいプライベートなジャーナル、 バーテンダーと訳そうとした気まずい会話です。

オンデバイスはそれらのテキストが端末を出ないという意味です。信頼モデルは データが信頼境界に到達すらしない

レイテンシ

これが人々が過小評価する点。良い接続でのクラウド翻訳ラウンドトリップは 約 300–500 ms。不安定な接続では 2–8 秒。Pixel 9 のオンデバイスはネット ワーク変動なしで 500 ms 未満。

500 ms と 5 秒の差は「5× 遅い」ではありません — それは 会話が普通に 感じる会話が放棄される の差です。

横並びテスト

同じ 4 つの文を Google 翻訳(クラウド)と Cove Travel(Gemma model card の Gemma 4 E2B オンデバイス)で Pixel 9 上で走らせました。

原文Google 翻訳(クラウド)Cove Travel(オンデバイス)
“Could I have the bill, please?” (EN→FR)“Puis-je avoir l’addition, s’il vous plaît?""L’addition, s’il vous plaît?"
"Is this dish spicy?” (EN→JA)“この料理は辛いですか?""この料理、辛いですか?"
"Where is the nearest pharmacy?” (EN→ES)“¿Dónde está la farmacia más cercana?""¿Dónde está la farmacia más cercana?"
"I have an allergy to peanuts.” (EN→ZH)“我对花生过敏。""我对花生过敏。”

クラウドとオンデバイス版はほぼ同等。違いは精度のギャップというより スタイル(“l’addition” 単独 vs “Could I have” 付き)。旅行スタイルの文 (25 単語以下、会話トーン)であれば、両方が同じ実用的な出力を生みます。

表に 出ていない もの:クラウド版は強い接続で 400–800 ms かかり、 不安定な接続では 2 度タイムアウトしました。オンデバイス版は毎回 280–410 ms でした。

クラウドが今でも勝つ場面

オンデバイスがすべてに勝つと主張すれば、省略による嘘になります。今日 クラウドが正直にオンデバイスに勝つケースが 3 つあります:

  1. 長文の業務文書。 10 ページの契約書、研究論文、技術仕様 — DeepL や Google Cloud の商用 API が、スマホハードウェアの 4B モデルが扱える どれよりも上手く処理します。別カテゴリです。
  2. 非常に稀少な言語。 タガログ語 ↔ ウォロフ語のような低リソース ペアが必要なら、Gemma 4 E2B も他のオンデバイスモデルもまだ十分に有能と 感じない。はるかに大きなデータセットで学習されたクラウドモデルが ここでは前に出ます。
  3. 翻訳メモリとチームワークフロー。 チーム間で協業するプロ翻訳者は 訳文のクラウドベースバージョン管理が必要。オンデバイスは定義上それを 提供しません。

これが Cove Travel をプロ翻訳の代替ではなく 旅行コンパニオン として 位置付けている理由です。仕事に応じて適切な道具を使ってください。

オンデバイスが解放しクラウドができないもの

逆向きのリストはより短く、より興味深い。オンデバイスにはできて、 クラウドが正直にできないことがあります:

  • 機内モードで動作する。 自明の 1 つ。クラウドは文字通りネットワーク なしで動作できません。
  • 真にプライベートなジャーナリング。 クラウドサービスで翻訳した ものは定義上、誰かのログ内にあります。オンデバイスは信頼境界が あなたのスマホの中に留まることを保証します。
  • 予測可能なレイテンシ。 クラウドのレイテンシはネットワークの最悪 経路で上限が決まります。オンデバイスのレイテンシは CPU/NPU で上限が 決まり、それはどの国でも同じです。
  • サブスクリプション依存なし。 買い切りオンデバイスアプリは、それを 作った会社が明日閉じても動き続けます。サブスクリプション型クラウド アプリはサブスクが切れた瞬間に止まります。

最後の項目は過小評価されています。モデルファイルはあなたの端末にあります。 Cove という会社が消えても、あなたのインストール済み Cove Travel はまだ 翻訳します。

FAQ

オンデバイス翻訳はクラウドと同じ精度ですか?

高リソース言語ペアの旅行スタイル文であれば、はい — 標準ベンチマークで 約 5% 以内。長文の業務文書はどの言語でも今でもクラウドが勝ちます。

翻訳中にスマホが温かく感じるのはなぜ?

4B パラメータのモデルは実際の計算負荷です。NPU 加速のある Pixel 9 では 温かさは穏やかで、翻訳あたりのバッテリーコストは YouTube 動画を 10 秒 再生するのとほぼ同じです。

アクセント記号や特殊文字の入力は?

それは OS レベルのキーボードの問題で、翻訳の問題ではありません。 オンデバイス翻訳はキーボードが生成するものを何でも扱います。

アップロードされていないと信頼できますか?

Cove Travel は /ja/why-offline にネットワーク監査を 公開し、アプリが行うすべてのネットワーク呼び出しをリストしています。 要約:あなたの Wi-Fi 越しのオプションのモデル更新、オプトインした場合の オプションのクラッシュレポート、それ以外は何もなし。


姉妹読み物: