概要
DeepSeek-R1-Distill-Qwen-1.5B は DeepSeek R1 蒸留ファミリーで最小のメンバー、2025 年 1 月に完全版 DeepSeek-R1 と同時リリース。蒸留版は Qwen-2.5-Math-1.5B を base アーキテクチャとして、671B パラメータの教師 R1 が生成した 80 万件の連鎖推論サンプルで微調整されている。結果として、数学・コード・論理タスクに対して明示的に段階的推論を行う 1.5B パラメータのモデルが得られる —— R1 のコストの一部、はるかに手軽なハードウェアで。
主要スペック
(上記スペックカードを参照。構造化データから自動描画。)
動作デバイス
1.5B 版を Q4 量子化すると約 1GB のダウンロードで、ほぼあらゆる端末で動作する:Pixel 7 以降、iPhone 14 以降、Snapdragon Copilot+ PC、任意の現代 Intel/AMD ノート PC(CPU のみ)、Apple silicon Mac。CPU のみで 5-10 トークン/秒は遅いが実用的、Apple silicon ノート PC や軽量 GPU で 50-60 トークン/秒。Snapdragon NPU + ONNX 最適化により、短プロンプトの初回トークンまで 70ms 未満を実現。
強みと制約
強み。 1.5B のフットプリントで本物の連鎖推論を実現 —— 端末同類では他に類を見ない。Qwen-2.5 base から継承した Apache 2.0 ライセンス。小さいので同一デバイス上で他モデルと共存可能。数学・コードに特に強く、推論拡張エージェントへ自然にルーティングされる(プロンプトテクニックが不要)。
制約。 品質はパラメータ数に縛られる。AIME 2024 pass@1 28.9% 対完全版 R1 約 80% pass@1 は意味のある差 —— フロンティアレベルを期待しないこと。テキストのみ、ビジョン・音声なし。同サイズの汎用チャットモデルと比較してオープンエンドタスクでの流暢性は劣る。推論深度が深いほどレイテンシが増加 —— 連鎖推論は設計上冗長。
どんな場面で選ぶか / 選ばないか
R1 Distill 1.5B を選ぶ場面: ワークロードが推論支配(数学宿題ヘルパー、コードアシスタント、論理エージェント);ローエンドハードウェア(4GB RAM ノート PC、ミドルレンジスマホ)に展開する必要;透明性のために明示的な連鎖推論出力が欲しい;Apache 2.0 ライセンスが重要。
選ばない場面: オープンエンドチャットがメイン(Gemma 4 や Qwen 3.5 のほうが汎用性が高い);マルチモダリティが必要(Gemma 4、Phi-4-multimodal、MiniCPM-V);フロンティアレベルの推論品質が必要(クラウド版完全 DeepSeek-R1、または次世代蒸留を待つ)。
類似モデルとの比較
最も近い 2 つ:Qwen 3.5 2B(汎用、多言語、マルチモーダル、262K コンテキスト)と Ministral 3B(汎用、同じく Apache 2.0、画像対応)。R1 Distill の差別化は、より小さいサイズで明示的に推論調整されている点。完全な横並び比較は leaderboard を参照。
実際の Cove アプリで
Cove Voice は Gemma 4 を使って音声メモを要約している —— これは汎用チャット風の要約で、Gemma の広い流暢性が勝つ。R1 Distill 1.5B は推論重視のアドオン用途に向く:明示的論理によるアクションアイテム抽出、構造化タスク分解、数学関連の転写。すでに将来の Cove Voice モードとしてプロトタイプ化済み —— bullet list ではなく連鎖推論による要約を求めるパワーユーザー向け。