Llama 3.2 Mobile (1B/3B)：Meta の端末テキスト LLM

パラメータ数	3 B
量子化後サイズ	2 GB
コンテキスト長	128,000 tokens
モダリティ	text
ライセンス	llama-community
最低 RAM	6 GB
バージョン	Llama 3.2 1B / 3B
リリース	2024-09

パラメータ数

3 B

量子化後サイズ

2 GB

コンテキスト長

128,000 tokens

モダリティ

text

ライセンス

llama-community

最低 RAM

6 GB

バージョン

Llama 3.2 1B / 3B

リリース

2024-09

概要

Llama 3.2 Mobile は Meta が 2024 年 9 月に公開した、端末向けに特化した小型言語モデルファミリー。Meta は 1B と 3B の両バリアントをテキスト専用モデルとしてリリースした —— 同世代の 11B と 90B のビジョンモデルとは異なり、これらはより大型のデバイスを対象としている。Mobile ペアは Llama 3.1 大モデルの構造的プルーニングと知識蒸留を組み合わせて作られ、事前学習段階で Llama 3.1 8B と 70B モデルの logits をトークンレベルの教師信号として用いた結果、サイズに対して驚くほどの推論能力を保持している。2026 年中時点で、これらは依然として Meta の主要モバイル提供製品 —— Llama 4 世代に同サイズクラスの直接後継機は存在しない。

主要スペック

（上記スペックカードを参照。構造化データから自動描画。）

動作デバイス

3B バリアントは Pixel 8 以降、iPhone 15 Pro 以降、Snapdragon 8 Gen 3+ Android スマートフォンで快適に動作する。Meta は Qualcomm と MediaTek と提携し、公開日レベルの SoC 最適化を完了。Grouped-Query Attention で ARM CPU 向けに深く調整されている。1B バリアントは要件が大幅に緩和され、2022 年以降の RAM 4GB 以上のスマートフォンで動作する。両バージョンとも llama.cpp、MLC、PyTorch ExecuTorch でデプロイ可能。

強みと制約

強み。 巨大な 128K コンテキスト —— Gemma 4 E2B と同等、他の端末同類より先行。Llama 3.1 8B と 70B 教師モデルからの蒸留により、パラメータ数に対する推論能力が突出。成熟したエコシステム：llama.cpp、LM Studio、Ollama、MLC、そして数十のファインチューン。公開日レベルのモバイルチップ最適化。オープンウェイトでファインチューンが容易。

制約。 テキストのみ —— 画像なし、音声なし。Llama Community License の 7 億 MAU 条項により、超大規模サービスとの契約が複雑化する。Llama 4 世代に明確な後継機が存在しない。多言語品質はばらつきがあり、英語と主要欧州言語が最強。

どんな場面で選ぶか / 選ばないか

Llama 3.2 Mobile を選ぶ場面： ワークロードがテキストのみ（チャット、要約、分類、RAG）；最も広いオープンソースエコシステムとツール群が欲しい；128K コンテキストの完全オープンなモバイルモデルが必要；ターゲットデバイスの RAM が最低 6GB（3B）または 4GB（1B）。

選ばない場面： ワークロードに画像や音声を含む（Gemma 4、Phi-4-multimodal、MiniCPM-V のほうが向く）；7 億 MAU 超のサービスを運営し、交渉なしの寛容ライセンスが必要（Apache 2.0 系の Gemma 4、Qwen 3.5、Mistral がより適合）；最小サイズのテキストモデルが欲しい（DeepSeek-R1 Distill 1.5B のほうが粒度が細かい）。

類似モデルとの比較

最も近い 2 つ：Gemma 4 E2B（より小型、マルチモーダル、Apache 2.0）と Ministral 3B（同サイズ、マルチモーダル対応、Apache 2.0）。Llama 3.2 はエコシステム成熟度と 128K コンテキストで勝るが、モダリティとライセンスのシンプルさで遅れる。完全な横並び比較は leaderboard を参照。

実際の Cove アプリで

Cove Voice は現在 Gemma 4 を使用して音声メモを AI 要約している —— これは Llama 3.2 のテキスト専用プロファイルにも同等にフィットするワークロードだ。Gemma 4 を選んだ理由は、同一モデルで Cove Photo の写真 Q&A もカバーする必要があり、Llama 3.2 Mobile は画像が見えないからだ。将来 Cove がテキスト専用アプリ（例：日記アシスタント）を出すなら、Llama 3.2 3B は有力な代替候補になる —— 特に完全なエコシステムツールと Hugging Face のファインチューンを活用したいユーザーにとって。

よくある質問

なぜ Llama 3.2 Mobile はテキスト専用？

Meta は Llama 3.2 を 2 系統に分けた：mobile/edge 向け 1B と 3B はテキスト専用、ビジョン処理は 11B と 90B が担当。Mobile 版はマルチモーダルを諦める代わりに、より小さなフットプリントとスマートフォンに適した 128K コンテキストを獲得した —— ビジョンはメモリ消費が大きく、edge では不利と判断したため。

Llama 3.2 はどのデバイスで動作するか？

Pixel 8 以降、iPhone 15 Pro 以降、Snapdragon 8 Gen 3+ Android スマートフォン。Meta は Qualcomm と MediaTek と連携し公開日に SoC 最適化を完了、ARM CPU 向けに Grouped-Query Attention で深く調整済み。3B 版は Q4 量子化で約 2GB ストレージ + 4-6GB RAM。

Llama 3.2 は商用利用無料か？

ほぼ無料。Llama Community License は商用利用を許可するが、月間アクティブユーザー 7 億超のサービスは Meta に別途ライセンス申請が必要。スタートアップやインディーアプリにとっては Apache 2.0 から消費者向け超大規模サービスを差し引いたものに近い。

Llama 4 にモバイル版はある？

2026 年中時点では存在しない。2025-04 公開の Llama 4 ファミリー（Scout、Maverick）はデータセンター向け MoE ワークロードを対象。Llama 3.2 1B / 3B が Meta の主要端末向け選択肢として継続している。Llama 5 で画面認識エージェント機能を備えた新モバイル層モデルが噂されている。

Gemma 4 や Qwen 3.5 との比較は？

Llama 3.2 3B はテキスト専用、一方 Gemma 4 E2B と Qwen 3.5 2B はテキスト+ビジョンのマルチモーダル対応。長文処理は Llama が有利（128K で Gemma と同等、Qwen が 262K で先行）。Meta エコシステム（LangChain、llama.cpp）を活用するなら Llama、ビジョンが必要なら Gemma または Qwen。

アプリ

ユースケース

学ぶ

Cove を入手

信頼

Llama 3.2 Mobile：Meta の 128K コンテキスト端末テキストモデル

概要

主要スペック

動作デバイス

強みと制約

どんな場面で選ぶか / 選ばないか

類似モデルとの比較

実際の Cove アプリで

実際のCoveアプリで体験する

よくある質問

出典

概要

主要スペック

動作デバイス

強みと制約

どんな場面で選ぶか / 選ばないか

類似モデルとの比較

実際の Cove アプリで

関連モデル

実際のCoveアプリで体験する

よくある質問

出典