概要
Llama 3.2 Mobile は Meta が 2024 年 9 月に公開した、端末向けに特化した小型言語モデルファミリー。Meta は 1B と 3B の両バリアントをテキスト専用モデルとしてリリースした —— 同世代の 11B と 90B のビジョンモデルとは異なり、これらはより大型のデバイスを対象としている。Mobile ペアは Llama 3.1 大モデルの構造的プルーニングと知識蒸留を組み合わせて作られ、事前学習段階で Llama 3.1 8B と 70B モデルの logits をトークンレベルの教師信号として用いた結果、サイズに対して驚くほどの推論能力を保持している。2026 年中時点で、これらは依然として Meta の主要モバイル提供製品 —— Llama 4 世代に同サイズクラスの直接後継機は存在しない。
主要スペック
(上記スペックカードを参照。構造化データから自動描画。)
動作デバイス
3B バリアントは Pixel 8 以降、iPhone 15 Pro 以降、Snapdragon 8 Gen 3+ Android スマートフォンで快適に動作する。Meta は Qualcomm と MediaTek と提携し、公開日レベルの SoC 最適化を完了。Grouped-Query Attention で ARM CPU 向けに深く調整されている。1B バリアントは要件が大幅に緩和され、2022 年以降の RAM 4GB 以上のスマートフォンで動作する。両バージョンとも llama.cpp、MLC、PyTorch ExecuTorch でデプロイ可能。
強みと制約
強み。 巨大な 128K コンテキスト —— Gemma 4 E2B と同等、他の端末同類より先行。Llama 3.1 8B と 70B 教師モデルからの蒸留により、パラメータ数に対する推論能力が突出。成熟したエコシステム:llama.cpp、LM Studio、Ollama、MLC、そして数十のファインチューン。公開日レベルのモバイルチップ最適化。オープンウェイトでファインチューンが容易。
制約。 テキストのみ —— 画像なし、音声なし。Llama Community License の 7 億 MAU 条項により、超大規模サービスとの契約が複雑化する。Llama 4 世代に明確な後継機が存在しない。多言語品質はばらつきがあり、英語と主要欧州言語が最強。
どんな場面で選ぶか / 選ばないか
Llama 3.2 Mobile を選ぶ場面: ワークロードがテキストのみ(チャット、要約、分類、RAG);最も広いオープンソースエコシステムとツール群が欲しい;128K コンテキストの完全オープンなモバイルモデルが必要;ターゲットデバイスの RAM が最低 6GB(3B)または 4GB(1B)。
選ばない場面: ワークロードに画像や音声を含む(Gemma 4、Phi-4-multimodal、MiniCPM-V のほうが向く);7 億 MAU 超のサービスを運営し、交渉なしの寛容ライセンスが必要(Apache 2.0 系の Gemma 4、Qwen 3.5、Mistral がより適合);最小サイズのテキストモデルが欲しい(DeepSeek-R1 Distill 1.5B のほうが粒度が細かい)。
類似モデルとの比較
最も近い 2 つ:Gemma 4 E2B(より小型、マルチモーダル、Apache 2.0)と Ministral 3B(同サイズ、マルチモーダル対応、Apache 2.0)。Llama 3.2 はエコシステム成熟度と 128K コンテキストで勝るが、モダリティとライセンスのシンプルさで遅れる。完全な横並び比較は leaderboard を参照。
実際の Cove アプリで
Cove Voice は現在 Gemma 4 を使用して音声メモを AI 要約している —— これは Llama 3.2 のテキスト専用プロファイルにも同等にフィットするワークロードだ。Gemma 4 を選んだ理由は、同一モデルで Cove Photo の写真 Q&A もカバーする必要があり、Llama 3.2 Mobile は画像が見えないからだ。将来 Cove がテキスト専用アプリ(例:日記アシスタント)を出すなら、Llama 3.2 3B は有力な代替候補になる —— 特に完全なエコシステムツールと Hugging Face のファインチューンを活用したいユーザーにとって。