Qwen 3.5 2B:Alibaba の端末特化型多言語 LLM

1.5GB の量子化サイズ、262K コンテキスト、200+ 言語、Apache 2.0 —— Qwen 3.5 2B は Alibaba Cloud がマスマーケット層スマートフォン向けに特化した端末専用モデル。

最終校閲: 2026年5月
パラメータ数2 B
量子化後サイズ1.5 GB
コンテキスト長262,000 tokens
モダリティtext+vision
ライセンスapache-2.0
最低 RAM4 GB
バージョンQwen3.5-2B
リリース2026-03

概要

Qwen 3.5 2B は Alibaba Cloud の Qwen 3.5 Small Series で、モバイル向けに最適化されたメンバー。2026 年 3 月 1 日に公開された。シリーズは 4 サイズ(0.8B、2B、4B、9B)で構成され、多くの「フラッグシップを縮小した」モデルファミリーと異なり、Qwen 3.5 Small はゼロから端末展開を前提に設計されている。2B 版はスマートフォンの最適バランスポイント —— RAM 4GB のミドルレンジ機で動作し、推論能力と多言語カバレッジで価値を発揮できる規模。

主要スペック

(上記スペックカードを参照。構造化データから自動描画。)

動作デバイス

2B 版を Q4 量子化すると約 1.5GB のストレージ + 2-3GB の RAM 余裕(コンテキスト用)が必要。これにより 4GB+ RAM の主要 Android スマートフォンほぼ全てと、iPhone 15 Pro 世代以降全てが対象となる。フラッグシップ機(Pixel 8 Pro、iPhone 17 Pro、Galaxy S24 Ultra)で 30-50 トークン/秒、ミドルレンジ機で 15-25 トークン/秒 —— チャット用途には十分実用的。

強みと制約

強み。 端末モデルとして業界最長の 262K コンテキストウィンドウ —— Gemma 4 E2B の 128K の 2 倍。200+ 言語をネイティブサポートし、中・日・韓・英で特に強い。Gated Delta + 疎 MoE のハイブリッドアーキテクチャによりアクティブパラメータあたりの性能が突出。Apache 2.0 ライセンスで企業契約が単純化される。

制約。 ネイティブ音声モダリティを持たない(Gemma 4 と Phi-4-multimodal は音声に対応)。純英語ベンチマークで Gemma 4 にわずかに劣る。ビジョン能力は堅実だが、専用に訓練された MiniCPM-V 4.0 に及ばない。MoE アーキテクチャは各トークンでルーティングされる expert によりレイテンシにばらつきが出るため、リアルタイムアプリには不向き。

どんな場面で選ぶか / 選ばないか

Qwen 3.5 2B を選ぶ場面: 中国語・日本語・韓国語ユーザーが多い;超長コンテキストが必要(法務文書、コードベース、完全なチャット履歴);4GB RAM スマホを含む幅広いデバイスをカバーしたい;Apache 2.0 ライセンスの単純さを重視する。

選ばない場面: 端末上の音声処理が必要(Gemma 4 や Phi-4-multimodal が向く);ワークロードがビジョン中心でベンチマーク精度が最重要(MiniCPM-V 4.0 がビジョン特化);リアルタイム用途で予測可能なレイテンシが必要(Llama 3.2 3B のような dense モデルはトークンあたりコストが均一)。

類似モデルとの比較

最も近い 2 つ:Gemma 4 E2B(より小型、テキスト+ビジョン+音声マルチモーダル、Apache 2.0、128K コンテキスト)と MiniCPM-V 4.0(ビジョン特化、4B パラメータ、より大型だがビジョン強力)。Qwen はコンテキスト長と多言語対応で勝り、Gemma は音声で、MiniCPM はビジョンタスクで勝る。完全な横並び比較は leaderboard を参照。

実際の Cove アプリで

Cove Travel は数十の言語ペアで Gemma 4 を使ってオフライン翻訳を提供している。ただし普通話・広東語・日本語・韓国語の翻訳タスクに関しては、Qwen 3.5 2B のほうが強力な基盤となる —— 現在のオープンウェイト端末モデルの中で、東アジア言語の訓練データウェイトでは並ぶものがない。将来 Cove が国内市場向けの「Cove China」バリアントをリリースするなら、Qwen 3.5 2B が出発点となる。

実際のCoveアプリで体験する

よくある質問

Qwen 3.5 はモバイル向け最新版?

はい。Alibaba Cloud は 2026 年 3 月 1 日に Qwen 3.5 Small Series(0.8B / 2B / 4B / 9B)を公開した。設計段階から端末展開を前提とし、大型モデルの蒸留版ではない。2026 年 4 月公開の Qwen 3.6 はサーバー・デスクトップ向けでスマホは対象外。

どのデバイスで Qwen 3.5 2B が動作する?

Pixel 8 以降、iPhone 15 Pro 以降(MLX 最適化対応の iPhone 17 Pro 含む)、Galaxy S24+、4GB+ RAM のミドルレンジ Android。2B 版はフラッグシップ機で 30-50 トークン/秒、ミドルレンジ機で 15-25 トークン/秒、会話用途には十分実用的。

Qwen 3.5 のアーキテクチャは?

Qwen 3.5 は Gated Delta Networks と疎 Mixture-of-Experts を組み合わせたハイブリッドアーキテクチャを採用。MoE 設計により各トークンで一部のパラメータのみアクティブとなり、2B モデルでもスマートフォンで低メモリ・低レイテンシを保ちつつ、サイズを超える性能を発揮できる。

Qwen 3.5 2B は本当に Apache 2.0?

はい。Qwen 3.5 世代から従来の Qwen 独自ライセンスを廃止し、Apache 2.0 へ移行した。重みは完全公開され、Apache の標準クレジット表記要件のみで商用展開が可能。

Gemma 4 E2B との比較は?

Qwen 3.5 2B はコンテキストが大幅に長く(262K vs Gemma の 128K)、多言語対応が強い(特に中・日・韓・英)、同じく Apache 2.0。Gemma 4 はネイティブ音声モダリティを追加、純英語ベンチマークがやや有利。長文や東アジア言語なら Qwen、音声なら Gemma を選ぶ。

出典