
MiniMax-M2.5-highspeed
API介绍
MiniMax M2.5 是 MiniMax 推出的 大语言模型级 旗舰产品,核心定位为“为真实世界生产力而生的前沿 Agentic 模型”,在编程、工具调用、搜索与办公等复杂任务场景中达到或刷新行业 SOTA,同时实现极低成本与高推理效率。
- 性能突破:在 SWE-Bench Verified 达 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%,全面领先开源及主流闭源模型;任务完成速度比 M2.1 快 37%。
- 架构优化:通过数十万真实环境强化学习,优化复杂任务拆解能力与思考过程中的 token 消耗,支持高效 Agentic 执行。
- 成本革命:每秒输出 100 token 连续工作一小时成本极低,50 TPS 版本输出价格仅为 Opus/Gemini 3 Pro/GPT-5 的 1/10–1/20,实现“经济上几乎无限制地构建和运营 Agent”。
- 推理速度:提供 100 TPS 高速推理,近两倍于主流模型,并支持并行工具调用,端到端任务耗时显著降低。
- 真实生产力集成:已深度集成于 MiniMax Agent,覆盖研发、产品、销售、HR、财务等职能,30% 整体任务由 M2.5 自主完成,新提交代码中 80% 由其生成。
───────────────────────────────────────────────────────────────────
核心能力
💻 像架构师一样思考和构建
在编码前主动拆解功能、结构与 UI 设计,具备原生 Spec 行为;支持超 10 种语言(Python/Java/Go/Rust/TS 等)及 Web/Android/iOS/Windows/Mac 全栈开发,覆盖从 0-1 系统设计到 90-100 Code Review 全流程。
🔍 专家级搜索与工具调用
在 BrowseComp、Wide Search 及自建 RISE(真实专业搜索评测)中表现卓越;相比 M2.1 节省约 20% 搜索轮次,以更精简路径逼近结果。
📑 高阶办公交付能力
联合金融、法律、社科等领域专家共建训练数据,在 Word 排版、PPT 编辑、Excel 金融建模等场景显著提升可交付产物质量;在内部 GDPval-MM 评测中平均胜率达 59.0%。
⚡ 极致效率与成本优势
SWE-Bench Verified 平均耗时从 31.3 分钟降至 22.8 分钟,token 消耗从 3.72M 降至 3.52M,速度与 Claude Opus 4.6 基本持平。
🛠️ 原生 Agentic 框架支持
基于自研 Forge Agent RL 框架,通过 CISPO 算法与过程奖励机制,在数十万个真实 Agent 脚手架上训练,实现对环境与工具的强泛化能力。
───────────────────────────────────────────────────────────────────
部分测试数据
───────────────────────────────────────────────────────────────────
相关测评
《实测 MiniMax M2.5:开源掀桌,性价比封神?先看看它交的作业》
Playground
登录后,探索更多精彩功能! 点击登录