qwq-32b

qwq-32b

QwQ-32B 是阿里巴巴推出的强化学习驱动型推理模型,适配电商客服、金融风控等高频交互场景
2025-03-06
语言大模型
Model capability: function_call
输入:
$0.29/1M tokens
输出:
$0.86/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

QwQ-32B 是阿里巴巴推出的强化学习驱动型推理模型,主打「320亿参数媲美6710亿参数模型」与「批判性思考+工具调用双能力融合」,为复杂推理任务提供高性价比的企业级解决方案。

  • 性能对标顶级模型:在编程(LiveCodeBench 83.9)、数学(AIME24 79.8)、通用能力(MMLU-Pro 71.6)等基准测试中媲美 DeepSeek-R1,性能超越 o1-mini 等竞品。
  • 强化学习突破:通过冷启动数据+多阶段训练,结合答案正确性校验与代码执行反馈,实现数学与编程能力持续提升。
  • 双模式推理:支持批判性思考(复杂问题分步拆解)与工具调用(环境反馈调整),动态平衡深度推理与实时响应。
  • 开源开放:采用 Apache 2.0 协议在 Hugging Face、ModelScope 开源,提供 API 调用与本地部署方案。
  • 企业级适配:支持消费级显卡(如 RTX 3090)部署,推理成本比千亿级模型降低 70%。

───────────────────────────────────────────────────────────────────

核心能力

🧠 强化学习引擎:基于答案校验与代码执行反馈,实现数学与编程能力持续进化,突破传统训练瓶颈。

🚀 双轨推理模式:动态切换批判性思考(复杂问题分步拆解)与工具调用(环境反馈调整),兼顾深度与效率。

超高性价比:320亿参数实现“小体积大能量”,消费级设备流畅运行,企业AI应用门槛降低60%。

🌐 全场景覆盖:在编程、数学、通用问答等任务中媲美顶级竞品,适配电商客服、金融风控等高频交互场景。

───────────────────────────────────────────────────────────────────

基准测试

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
QwQ-32B
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

qwq-32b

-
32000

输入$0.29 / 1M tokens
输出$0.86 / 1M tokens

输入$0.29/ 1M tokens
输出$0.86/ 1M tokens
原价