Grok 4.1

从文本助手到生产力智能体——2025大模型年度测评：多模态、强推理与真交付 | 302.AI 基准实验室

导读：2025年，大语言模型完成从“文本助手”到“生产力智能体”的关键跃迁。本报告深度实测Gemini 3 Pro、Claude Opus 4.5、GPT-5.2、Grok 4.1、GLM-4.7、DeepSeek-V3.2六大旗舰模型，覆盖模型幻觉控制、复杂逻辑推理、多模态融合理解、创意生成与人类直觉、编程与工程化交付五大高难度真实场景。评测结果显示：G…

2026 年 1 月 14 日 • 基准实验室
3.2K00
卷完参数卷“人格”？Grok 4.1 实测：情商满点，编程大幅提升丨302.AI 基准实验室

上周当整个 AI 圈的目光聚焦在 Google、OpenAI 两巨头的版本迭代时，xAI 再次以它标志性的突袭方式于 11 月 18 日凌晨向所有用户免费开放了 Grok 4.1 系列模型。这代表着在短短四个月内，Grok 4 系列完成了一次关键升级，并且这一升级，向外界清晰地传递出 xAI 独特的竞争策略：大模型的下一个前沿，或许不再是冰冷的算力与参数，而…

2025 年 11 月 26 日 • 基准实验室
4.7K00