
qwq-32b
QwQ-32B 是阿里巴巴推出的强化学习驱动型推理模型,适配电商客服、金融风控等高频交互场景
2025-03-06
输入:
$0.29/1M tokens
输出:
$0.86/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
QwQ-32B 是阿里巴巴推出的强化学习驱动型推理模型,主打「320亿参数媲美6710亿参数模型」与「批判性思考+工具调用双能力融合」,为复杂推理任务提供高性价比的企业级解决方案。
- 性能对标顶级模型:在编程(LiveCodeBench 83.9)、数学(AIME24 79.8)、通用能力(MMLU-Pro 71.6)等基准测试中媲美 DeepSeek-R1,性能超越 o1-mini 等竞品。
- 强化学习突破:通过冷启动数据+多阶段训练,结合答案正确性校验与代码执行反馈,实现数学与编程能力持续提升。
- 双模式推理:支持批判性思考(复杂问题分步拆解)与工具调用(环境反馈调整),动态平衡深度推理与实时响应。
- 开源开放:采用 Apache 2.0 协议在 Hugging Face、ModelScope 开源,提供 API 调用与本地部署方案。
- 企业级适配:支持消费级显卡(如 RTX 3090)部署,推理成本比千亿级模型降低 70%。
───────────────────────────────────────────────────────────────────
核心能力
🧠 强化学习引擎:基于答案校验与代码执行反馈,实现数学与编程能力持续进化,突破传统训练瓶颈。
🚀 双轨推理模式:动态切换批判性思考(复杂问题分步拆解)与工具调用(环境反馈调整),兼顾深度与效率。
⚡ 超高性价比:320亿参数实现“小体积大能量”,消费级设备流畅运行,企业AI应用门槛降低60%。
🌐 全场景覆盖:在编程、数学、通用问答等任务中媲美顶级竞品,适配电商客服、金融风控等高频交互场景。
───────────────────────────────────────────────────────────────────
基准测试

Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽