deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

DeepSeek推出的开源语言模型级轻量级产品,基于知识蒸馏技术,通过优化Qwen-7B实现推理效率与成本的双重突破
2025-02-04
语言大模型
Model capability: function_call
输入:
免费
输出:
免费
大额采购联系客户经理享专属优惠

API介绍

DeepSeek-R1-Distill-Qwen-7B 是深度求索(DeepSeek)推出的开源语言模型级轻量级产品,核心定位为 基于知识蒸馏技术的高性能轻量化模型,通过优化Qwen-7B实现推理效率与成本的双重突破。

  • 技术原理:采用知识蒸馏(Knowledge Distillation)技术,将复杂教师模型(Qwen-7B)的能力迁移至轻量化学生模型,推理速度提升40%。
  • 性能优势:在MT-Bench、AlpacaEval 2.0等评测中超越原生Qwen-7B,数学推理(GSM8K)任务得分达82.5分(Qwen-7B为78.3)。
  • 开源协议:采用Apache 2.0协议,兼容Hugging Face Transformers框架,提供完整训练代码与微调指南。
  • 适用场景:适配边缘计算、实时翻译、轻量级代码生成等资源受限场景,显存占用减少50%。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 极致轻量化:独家蒸馏架构压缩模型体积至原生1/3,消费级显卡(如3090)即可流畅运行。

📊 高性能推理:MT-Bench评测得分5.78(Qwen-7B为5.21),响应延迟<80ms。

🔑 低成本部署:显存占用降低50%,单卡A100可支持4并发请求,运维成本节省40%。

🌍 多框架兼容:原生支持Hugging Face、vLLM推理框架,3行代码完成API服务部署。

🛠️ 开箱即用:提供预训练权重与领域适配微调方案,覆盖医疗、金融等垂直场景。

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(硅基流动)
POST
稳定
查看详情

API价格表

$
模型说明上下文302.AI价格

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

-
64000

输入免费
输出免费
原价