
deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
基于Qwen3-8B Base模型,通过蒸馏 DeepSeek-R1-0528的思维链微调而成
2025-05-28
价格:
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
DeepSeek-R1-0528-Qwen3-8B 是 DeepSeek 联合通义实验室推出的轻量级多模态推理模型,核心定位为“高效图文理解+低门槛部署”的边缘端智能视觉语言助手。
- 融合 Qwen3 架构优势:基于通义千问 Qwen3 系列的 8B 高效语言主干,继承其强大的中文理解与逻辑推理能力
- 原生多模态支持:可直接处理图像与文本混合输入,适用于截图问答、图表解析、商品识别等常见场景
- 超长上下文兼容:支持高达 128K token 上下文,轻松应对图文长文档、多轮交互等复杂任务
- 本地部署友好:模型体积小、推理快,可在 RTX 3060/4060 等消费级 GPU 或高端笔记本上流畅运行
───────────────────────────────────────────────────────────────────
核心能力
👁️ 精准图文对齐:能识别图像中的关键对象、文字与布局,并结合自然语言指令生成结构化回答
🧠 轻量高能推理:在 8B 规模下实现接近更大模型的思维链能力,擅长分步解答数学、逻辑与代码问题
🌍 中文场景深度优化:针对中文界面、表格、广告图等本土内容进行专项训练,输出更贴合用户习惯
🧩 智能体快速集成:支持 Function Calling 与 JSON 输出,可轻松嵌入自动化办公、客服或教育类 AI 工作流
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽