
| 模型名称 | API model 参数 | 介绍 |
|---|---|---|
| DeepSeek-R1 | deepseek-r1 | MoE 混合模型 |
| DeepSeek-V3 | deepseek-v3 | 基础模型 |
| Qwen2.5-Max | qwen-max-2025-01-25 | MoE 混合模型 |
| Qwen2.5-72B-instruct | qwen2.5-72b-instruct | 基础模型 |
| Qwen2-72B-instruct | qwen2-72b-instruct | 基础模型 |
| Qwen2-VL-72b-instruct | qwen2-vl-72b-instruct | 视觉模型 |
| 模型名称 | 模型大小 | 显存推荐 | GPU推荐 | 主机型号推荐 | 适用场景 |
|---|---|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-7B | 5GB | 8GB+ | P4 8GB | GPU计算型 gn5i | 本地开发测试(中小型企业) |
| 中等复杂度 NLP 任务(文本摘要、翻译) | |||||
| 轻量级多轮对话系统 | |||||
| DeepSeek-R1-Distill-Llama-8B | 5GB | 8GB+ | P4 8GB | GPU计算型 gn5i | 本地开发测试(中小型企业) |
| 中等复杂度 NLP 任务(文本摘要、翻译) | |||||
| 轻量级多轮对话系统 | |||||
| DeepSeek-R1-Distill-Qwen-14B | 9GB | 16GB+ | P100 16GB | ||
| T4 16GB | GPU计算型 gn5 | ||||
| GPU计算型 gn6i | 企业级复杂任务(合同分析、报告生成) | ||||
| 长文本理解与生成(书籍/论文辅助写作) | |||||
| DeepSeek-R1-Distill-Qwen-32B | 20GB | 24GB+ | P100 16GB *2 | ||
| T4 16GB *2 | GPU计算型 gn5 | ||||
| GPU计算型 gn6i | 高精度专业领域任务(医疗/法律咨询) | ||||
| 多模态任务预处理(需结合其他框架) | |||||
| DeepSeek-R1-Distill-Llama-70B | 43GB | 48GB+ | P100 16GB * 4 | ||
| A10 24GB * 2 | GPU计算型 gn5 | ||||
| GPU计算型 gn7i | 科研机构/大型企业(金融预测、大规模数据分析) | ||||
| 高复杂度生成任务(创意写作、算法设计) | |||||
| DeepSeek-R1-671B | |||||
| (全参1.73bit量化) | 158GB | 200GB+ | V100 32GB * 8 | ||
| H20 96GB * 8 | |||||
| H20 48GB * 8 | |||||
| A100 80GB * 8 | GPU计算型 gn6e | ||||
| GPU计算型 gn8v | |||||
| GPU计算型 gn8i | |||||
| GPU计算型 A100 | 全参数 | ||||
| 全能力 | |||||
| 全场景 |
专属GPU主机限时优惠: https://marketing.qiniu.com/activity/2024-1111-act