七牛云Token API支持模型列表

模型名称	API model 参数	介绍
DeepSeek-R1	deepseek-r1	MoE 混合模型
DeepSeek-V3	deepseek-v3	基础模型
Qwen2.5-Max	qwen-max-2025-01-25	MoE 混合模型
Qwen2.5-72B-instruct	qwen2.5-72b-instruct	基础模型
Qwen2-72B-instruct	qwen2-72b-instruct	基础模型
Qwen2-VL-72b-instruct	qwen2-vl-72b-instruct	视觉模型

七牛云大模型专属GPU主机配置推荐

模型名称	模型大小	显存推荐	GPU推荐	主机型号推荐	适用场景
DeepSeek-R1-Distill-Qwen-7B	5GB	8GB+	P4 8GB	GPU计算型 gn5i	本地开发测试（中小型企业）
中等复杂度 NLP 任务（文本摘要、翻译）
轻量级多轮对话系统
DeepSeek-R1-Distill-Llama-8B	5GB	8GB+	P4 8GB	GPU计算型 gn5i	本地开发测试（中小型企业）
中等复杂度 NLP 任务（文本摘要、翻译）
轻量级多轮对话系统
DeepSeek-R1-Distill-Qwen-14B	9GB	16GB+	P100 16GB
T4 16GB	GPU计算型 gn5
GPU计算型 gn6i	企业级复杂任务（合同分析、报告生成）
长文本理解与生成（书籍/论文辅助写作）
DeepSeek-R1-Distill-Qwen-32B	20GB	24GB+	P100 16GB *2
T4 16GB *2	GPU计算型 gn5
GPU计算型 gn6i	高精度专业领域任务（医疗/法律咨询）
多模态任务预处理（需结合其他框架）
DeepSeek-R1-Distill-Llama-70B	43GB	48GB+	P100 16GB * 4
A10 24GB * 2	GPU计算型 gn5
GPU计算型 gn7i	科研机构/大型企业（金融预测、大规模数据分析）
高复杂度生成任务（创意写作、算法设计）
DeepSeek-R1-671B
(全参1.73bit量化)	158GB	200GB+	V100 32GB * 8
H20 96GB * 8
H20 48GB * 8
A100 80GB * 8	GPU计算型 gn6e
GPU计算型 gn8v
GPU计算型 gn8i
GPU计算型 A100	全参数
全能力
全场景

专属GPU主机限时优惠： https://marketing.qiniu.com/activity/2024-1111-act