概要
Qwen 3.5 2B は Alibaba Cloud の Qwen 3.5 Small Series で、モバイル向けに最適化されたメンバー。2026 年 3 月 1 日に公開された。シリーズは 4 サイズ(0.8B、2B、4B、9B)で構成され、多くの「フラッグシップを縮小した」モデルファミリーと異なり、Qwen 3.5 Small はゼロから端末展開を前提に設計されている。2B 版はスマートフォンの最適バランスポイント —— RAM 4GB のミドルレンジ機で動作し、推論能力と多言語カバレッジで価値を発揮できる規模。
主要スペック
(上記スペックカードを参照。構造化データから自動描画。)
動作デバイス
2B 版を Q4 量子化すると約 1.5GB のストレージ + 2-3GB の RAM 余裕(コンテキスト用)が必要。これにより 4GB+ RAM の主要 Android スマートフォンほぼ全てと、iPhone 15 Pro 世代以降全てが対象となる。フラッグシップ機(Pixel 8 Pro、iPhone 17 Pro、Galaxy S24 Ultra)で 30-50 トークン/秒、ミドルレンジ機で 15-25 トークン/秒 —— チャット用途には十分実用的。
強みと制約
強み。 端末モデルとして業界最長の 262K コンテキストウィンドウ —— Gemma 4 E2B の 128K の 2 倍。200+ 言語をネイティブサポートし、中・日・韓・英で特に強い。Gated Delta + 疎 MoE のハイブリッドアーキテクチャによりアクティブパラメータあたりの性能が突出。Apache 2.0 ライセンスで企業契約が単純化される。
制約。 ネイティブ音声モダリティを持たない(Gemma 4 と Phi-4-multimodal は音声に対応)。純英語ベンチマークで Gemma 4 にわずかに劣る。ビジョン能力は堅実だが、専用に訓練された MiniCPM-V 4.0 に及ばない。MoE アーキテクチャは各トークンでルーティングされる expert によりレイテンシにばらつきが出るため、リアルタイムアプリには不向き。
どんな場面で選ぶか / 選ばないか
Qwen 3.5 2B を選ぶ場面: 中国語・日本語・韓国語ユーザーが多い;超長コンテキストが必要(法務文書、コードベース、完全なチャット履歴);4GB RAM スマホを含む幅広いデバイスをカバーしたい;Apache 2.0 ライセンスの単純さを重視する。
選ばない場面: 端末上の音声処理が必要(Gemma 4 や Phi-4-multimodal が向く);ワークロードがビジョン中心でベンチマーク精度が最重要(MiniCPM-V 4.0 がビジョン特化);リアルタイム用途で予測可能なレイテンシが必要(Llama 3.2 3B のような dense モデルはトークンあたりコストが均一)。
類似モデルとの比較
最も近い 2 つ:Gemma 4 E2B(より小型、テキスト+ビジョン+音声マルチモーダル、Apache 2.0、128K コンテキスト)と MiniCPM-V 4.0(ビジョン特化、4B パラメータ、より大型だがビジョン強力)。Qwen はコンテキスト長と多言語対応で勝り、Gemma は音声で、MiniCPM はビジョンタスクで勝る。完全な横並び比較は leaderboard を参照。
実際の Cove アプリで
Cove Travel は数十の言語ペアで Gemma 4 を使ってオフライン翻訳を提供している。ただし普通話・広東語・日本語・韓国語の翻訳タスクに関しては、Qwen 3.5 2B のほうが強力な基盤となる —— 現在のオープンウェイト端末モデルの中で、東アジア言語の訓練データウェイトでは並ぶものがない。将来 Cove が国内市場向けの「Cove China」バリアントをリリースするなら、Qwen 3.5 2B が出発点となる。