企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

DeepSeek推出的开源语言模型级轻量级产品，基于知识蒸馏技术，通过优化Qwen-7B实现推理效率与成本的双重突破

2025-02-04

语言大模型

输入:

免费

输出:

免费

大额采购联系客户经理享专属优惠

API介绍

DeepSeek-R1-Distill-Qwen-7B 是深度求索（DeepSeek）推出的开源语言模型级轻量级产品，核心定位为 基于知识蒸馏技术的高性能轻量化模型，通过优化Qwen-7B实现推理效率与成本的双重突破。

技术原理：采用知识蒸馏（Knowledge Distillation）技术，将复杂教师模型（Qwen-7B）的能力迁移至轻量化学生模型，推理速度提升40%。
性能优势：在MT-Bench、AlpacaEval 2.0等评测中超越原生Qwen-7B，数学推理（GSM8K）任务得分达82.5分（Qwen-7B为78.3）。
开源协议：采用Apache 2.0协议，兼容Hugging Face Transformers框架，提供完整训练代码与微调指南。
适用场景：适配边缘计算、实时翻译、轻量级代码生成等资源受限场景，显存占用减少50%。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 极致轻量化：独家蒸馏架构压缩模型体积至原生1/3，消费级显卡（如3090）即可流畅运行。

📊 高性能推理：MT-Bench评测得分5.78（Qwen-7B为5.21），响应延迟＜80ms。

🔑 低成本部署：显存占用降低50%，单卡A100可支持4并发请求，运维成本节省40%。

🌍 多框架兼容：原生支持Hugging Face、vLLM推理框架，3行代码完成API服务部署。

🛠️ 开箱即用：提供预训练权重与领域适配微调方案，覆盖医疗、金融等垂直场景。

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（硅基流动）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	302.AI价格