Qwen 3.5 2B：Alibaba の 262K コンテキスト端末 LLM 完全レビュー

パラメータ数	2 B
量子化後サイズ	1.5 GB
コンテキスト長	262,000 tokens
モダリティ	text+vision
ライセンス	apache-2.0
最低 RAM	4 GB
バージョン	Qwen3.5-2B
リリース	2026-03

パラメータ数

2 B

量子化後サイズ

1.5 GB

コンテキスト長

262,000 tokens

モダリティ

text+vision

ライセンス

apache-2.0

最低 RAM

4 GB

バージョン

Qwen3.5-2B

リリース

2026-03

概要

Qwen 3.5 2B は Alibaba Cloud の Qwen 3.5 Small Series で、モバイル向けに最適化されたメンバー。2026 年 3 月 1 日に公開された。シリーズは 4 サイズ（0.8B、2B、4B、9B）で構成され、多くの「フラッグシップを縮小した」モデルファミリーと異なり、Qwen 3.5 Small はゼロから端末展開を前提に設計されている。2B 版はスマートフォンの最適バランスポイント —— RAM 4GB のミドルレンジ機で動作し、推論能力と多言語カバレッジで価値を発揮できる規模。

主要スペック

（上記スペックカードを参照。構造化データから自動描画。）

動作デバイス

2B 版を Q4 量子化すると約 1.5GB のストレージ + 2-3GB の RAM 余裕（コンテキスト用）が必要。これにより 4GB+ RAM の主要 Android スマートフォンほぼ全てと、iPhone 15 Pro 世代以降全てが対象となる。フラッグシップ機（Pixel 8 Pro、iPhone 17 Pro、Galaxy S24 Ultra）で 30-50 トークン/秒、ミドルレンジ機で 15-25 トークン/秒 —— チャット用途には十分実用的。

強みと制約

強み。 端末モデルとして業界最長の 262K コンテキストウィンドウ —— Gemma 4 E2B の 128K の 2 倍。200+ 言語をネイティブサポートし、中・日・韓・英で特に強い。Gated Delta + 疎 MoE のハイブリッドアーキテクチャによりアクティブパラメータあたりの性能が突出。Apache 2.0 ライセンスで企業契約が単純化される。

制約。 ネイティブ音声モダリティを持たない（Gemma 4 と Phi-4-multimodal は音声に対応）。純英語ベンチマークで Gemma 4 にわずかに劣る。ビジョン能力は堅実だが、専用に訓練された MiniCPM-V 4.0 に及ばない。MoE アーキテクチャは各トークンでルーティングされる expert によりレイテンシにばらつきが出るため、リアルタイムアプリには不向き。

どんな場面で選ぶか / 選ばないか

Qwen 3.5 2B を選ぶ場面： 中国語・日本語・韓国語ユーザーが多い；超長コンテキストが必要（法務文書、コードベース、完全なチャット履歴）；4GB RAM スマホを含む幅広いデバイスをカバーしたい；Apache 2.0 ライセンスの単純さを重視する。

選ばない場面： 端末上の音声処理が必要（Gemma 4 や Phi-4-multimodal が向く）；ワークロードがビジョン中心でベンチマーク精度が最重要（MiniCPM-V 4.0 がビジョン特化）；リアルタイム用途で予測可能なレイテンシが必要（Llama 3.2 3B のような dense モデルはトークンあたりコストが均一）。

類似モデルとの比較

最も近い 2 つ：Gemma 4 E2B（より小型、テキスト+ビジョン+音声マルチモーダル、Apache 2.0、128K コンテキスト）と MiniCPM-V 4.0（ビジョン特化、4B パラメータ、より大型だがビジョン強力）。Qwen はコンテキスト長と多言語対応で勝り、Gemma は音声で、MiniCPM はビジョンタスクで勝る。完全な横並び比較は leaderboard を参照。

実際の Cove アプリで

Cove Travel は数十の言語ペアで Gemma 4 を使ってオフライン翻訳を提供している。ただし普通話・広東語・日本語・韓国語の翻訳タスクに関しては、Qwen 3.5 2B のほうが強力な基盤となる —— 現在のオープンウェイト端末モデルの中で、東アジア言語の訓練データウェイトでは並ぶものがない。将来 Cove が国内市場向けの「Cove China」バリアントをリリースするなら、Qwen 3.5 2B が出発点となる。

よくある質問

Qwen 3.5 はモバイル向け最新版？

はい。Alibaba Cloud は 2026 年 3 月 1 日に Qwen 3.5 Small Series（0.8B / 2B / 4B / 9B）を公開した。設計段階から端末展開を前提とし、大型モデルの蒸留版ではない。2026 年 4 月公開の Qwen 3.6 はサーバー・デスクトップ向けでスマホは対象外。

どのデバイスで Qwen 3.5 2B が動作する？

Pixel 8 以降、iPhone 15 Pro 以降（MLX 最適化対応の iPhone 17 Pro 含む）、Galaxy S24+、4GB+ RAM のミドルレンジ Android。2B 版はフラッグシップ機で 30-50 トークン/秒、ミドルレンジ機で 15-25 トークン/秒、会話用途には十分実用的。

Qwen 3.5 のアーキテクチャは？

Qwen 3.5 は Gated Delta Networks と疎 Mixture-of-Experts を組み合わせたハイブリッドアーキテクチャを採用。MoE 設計により各トークンで一部のパラメータのみアクティブとなり、2B モデルでもスマートフォンで低メモリ・低レイテンシを保ちつつ、サイズを超える性能を発揮できる。

Qwen 3.5 2B は本当に Apache 2.0？

はい。Qwen 3.5 世代から従来の Qwen 独自ライセンスを廃止し、Apache 2.0 へ移行した。重みは完全公開され、Apache の標準クレジット表記要件のみで商用展開が可能。

Gemma 4 E2B との比較は？

Qwen 3.5 2B はコンテキストが大幅に長く（262K vs Gemma の 128K）、多言語対応が強い（特に中・日・韓・英）、同じく Apache 2.0。Gemma 4 はネイティブ音声モダリティを追加、純英語ベンチマークがやや有利。長文や東アジア言語なら Qwen、音声なら Gemma を選ぶ。

アプリ

ユースケース

学ぶ

Cove を入手

信頼

Qwen 3.5 2B：Alibaba の端末特化型多言語 LLM

概要

主要スペック

動作デバイス

強みと制約

どんな場面で選ぶか / 選ばないか

類似モデルとの比較

実際の Cove アプリで

実際のCoveアプリで体験する

よくある質問

出典

概要

主要スペック

動作デバイス

強みと制約

どんな場面で選ぶか / 選ばないか

類似モデルとの比較

実際の Cove アプリで

関連モデル

実際のCoveアプリで体験する

よくある質問

出典