17391790837257.png

七牛云Token API支持模型列表

模型名称 API model 参数 介绍
DeepSeek-R1 deepseek-r1 MoE 混合模型
DeepSeek-V3 deepseek-v3 基础模型
Qwen2.5-Max qwen-max-2025-01-25 MoE 混合模型
Qwen2.5-72B-instruct qwen2.5-72b-instruct 基础模型
Qwen2-72B-instruct qwen2-72b-instruct 基础模型
Qwen2-VL-72b-instruct qwen2-vl-72b-instruct 视觉模型

七牛云大模型专属GPU主机配置推荐

模型名称 模型大小 显存推荐 GPU推荐 主机型号推荐 适用场景
DeepSeek-R1-Distill-Qwen-7B 5GB 8GB+ P4 8GB GPU计算型 gn5i 本地开发测试(中小型企业)
中等复杂度 NLP 任务(文本摘要、翻译)
轻量级多轮对话系统
DeepSeek-R1-Distill-Llama-8B 5GB 8GB+ P4 8GB GPU计算型 gn5i 本地开发测试(中小型企业)
中等复杂度 NLP 任务(文本摘要、翻译)
轻量级多轮对话系统
DeepSeek-R1-Distill-Qwen-14B 9GB 16GB+ P100 16GB
T4 16GB GPU计算型 gn5
GPU计算型 gn6i 企业级复杂任务(合同分析、报告生成)
长文本理解与生成(书籍/论文辅助写作)
DeepSeek-R1-Distill-Qwen-32B 20GB 24GB+ P100 16GB *2
T4 16GB *2 GPU计算型 gn5
GPU计算型 gn6i 高精度专业领域任务(医疗/法律咨询)
多模态任务预处理(需结合其他框架)
DeepSeek-R1-Distill-Llama-70B 43GB 48GB+ P100 16GB * 4
A10 24GB * 2 GPU计算型 gn5
GPU计算型 gn7i 科研机构/大型企业(金融预测、大规模数据分析)
高复杂度生成任务(创意写作、算法设计)
DeepSeek-R1-671B
(全参1.73bit量化) 158GB 200GB+ V100 32GB * 8
H20 96GB * 8
H20 48GB * 8
A100 80GB * 8 GPU计算型 gn6e
GPU计算型 gn8v
GPU计算型 gn8i
GPU计算型 A100 全参数
全能力
全场景

专属GPU主机限时优惠: https://marketing.qiniu.com/activity/2024-1111-act