
qwen3-max-2026-01-23
阿里巴巴推出的Qwen3 Max系列模型,具备自适应工具调用与测试时扩展能力
2026-01-27
输入:
$0.36/1M tokens起
输出:
$1.43/1M tokens起
大额采购联系客户经理享专属优惠
API介绍
qwen3-max-2026-01-23 阿里云推出的旗舰级语言模型,相较2025年9月23日快照版,此版本实现思考模式和非思考模式的有效融合,模型整体效果得到全方位的大幅度提升。在思考模式下,同时支持Web搜索、Web信息提取和代码解释器工具能力,使得模型在慢思考的同时,能够通过引入外部工具,以更高的准确性解决更有难度的问题,核心定位为“具备自适应工具调用与测试时扩展能力的高阶推理引擎”,专为复杂任务与智能体场景打造。
- 性能对标:在19项权威基准中媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro,Arena-Hard v2胜率达90.2,显著领先。
- 核心创新:独家支持自适应工具调用(搜索/记忆/代码解释器)与测试时扩展技术,推理效率与准确性双提升。
- 适用场景:适配智能编程、科研问答、多跳搜索、自动化规划等高阶AI智能体应用。
- 开发友好:API 兼容 OpenAI 与 Anthropic 协议,一行配置即可切换模型,快速集成到现有工作流。
- 实测提升:启用测试时扩展后,GPQA得分从90.3升至92.8,HLE(带工具)达58.3,超越Gemini 3 Pro。
───────────────────────────────────────────────────────────────────
核心能力
⚡ 极致推理引擎:
- 支持多轮迭代式自我反思,避免冗余计算,token利用效率更高。
- 在HMMT Feb 25数学竞赛基准上达98.0分,逼近人类顶尖水平。
🔍 自适应工具调用:
- 无需手动干预,自动判断何时调用搜索引擎、代码解释器或长期记忆。
- 有效缓解幻觉,提供实时信息与个性化响应,提升对话可信度。
🧩 智能体就绪架构:
- Agentic Search(HLE w/ tools)得分49.8,显著优于竞品。
- 内置Deep Planning智能体基准支持,专为复杂任务链设计。
🔌 无缝开发体验:
- API兼容OpenAI与Anthropic协议,Python/Node.js等生态即插即用。
───────────────────────────────────────────────────────────────────
测试数据
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽