
grok-3
xAI推出的最先进AI模型系列,融合卓越推理能力与海量预训练知识的 “推理智能体”
2025-02-21
输入:
$3/1M tokens
输出:
$15/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
Grok 3 是 xAI 推出的AI模型系列,核心定位为融合卓越推理能力与海量预训练知识的 “推理智能体”,专注于在数学、编码、科学推理、长文档处理等任务中提供高精度、可追溯的输出。
- 超强训练基础:基于 xAI 的 Colossus 超级集群训练,计算量是此前Grok最先进模型的 10 倍;Grok 3 mini 则代表高效推理新方向,适配无需大量世界知识的 STEM 任务。
- 顶尖推理性能:Grok 3 (Think) 经大规模强化学习(RL)优化,可思考数秒至数分钟,支持回溯纠错、多方案探索;Grok 3 mini (Think) 在 2024 年 AIME 达 95.8%、LiveCodeBench 达 80.4%。
- 全面学术领先:非推理模式下,在多类学术基准测试中表现突出,且 Grok 3 mini 在对应基准中也保持高竞争力(如 MMLU-pro 78.9%、LOFT (128k) 83.1%)。
- 上下文处理:在 LOFT (128k) 长文本 RAG 基准测试中,12 项任务平均准确率达行业领先,支持复杂文档处理与精准信息检索。
- 智能体与工具融合:支持代码解释器与互联网访问,可主动查询缺失上下文、动态调整策略;推出首个 AI 智能体 “DeepSearch”,能跨人类知识 corpus 深度检索,合成关键信息、梳理矛盾观点,输出简洁全面的报告,适配实时新闻、社交问题咨询、深度科研等场景。
- 实用功能特性:用户可通过 “Think” 按钮启用推理功能,查看完整推理过程;具备提升的事实准确性与 stylistic 控制能力,减少 “幻觉” 输出。───────────────────────────────────────────────────────────────────
核心能力
⚡ 多版本适配多元需求
- Grok 3:主攻高复杂度任务,强化推理、数学、编码、世界知识与指令遵循能力,适配深度学术研究、复杂代码开发等场景。
- Grok 3 mini:平衡效率与成本,侧重无需大量世界知识的 STEM 任务,适配轻量推理、快速响应需求。
- Grok 3 (Think)/Grok 3 mini (Think):beta 版推理模型,经 RL 优化链 - of-thought(CoT)过程,支持长时思考与多方案验证,适配高难度数学、逻辑推理任务。
🛠️ 关键场景性能突破
- 数学与科学推理:覆盖竞赛级数学(AIME)、研究生级科学问题(GPQA),能拆解复杂问题、回溯纠错,验证解决方案准确性,支持科研辅助与高阶教育场景。
- 编码能力:可生成完整功能代码,例如基于 pygame 开发 “Break-Pong” 混合游戏(融合 Pong 与 Breakout 元素),包含平滑动画、粒子效果、完整游戏逻辑与交互控制,代码结构清晰且注释详尽。
- 多模态理解:在 MMMU(多模态理解)测试中达 78%,支持图像、视频相关任务理解,适配多模态信息处理场景。
- 智能检索与合成:通过 “DeepSearch” 智能体,可跨海量知识源检索信息,梳理复杂信息、解决矛盾观点,输出结构化报告,远超传统浏览器搜索的信息整合能力。
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (5)
API价格表
$¥ 円 ₽