Gemini 3 Pro
-
从文本助手到生产力智能体——2025大模型年度测评:多模态、强推理与真交付 | 302.AI 基准实验室
导读:2025年,大语言模型完成从“文本助手”到“生产力智能体”的关键跃迁。本报告深度实测Gemini 3 Pro、Claude Opus 4.5、GPT-5.2、Grok 4.1、GLM-4.7、DeepSeek-V3.2六大旗舰模型,覆盖模型幻觉控制、复杂逻辑推理、多模态融合理解、创意生成与人类直觉、编程与工程化交付五大高难度真实场景。 评测结果显示:G…
-
谷歌的“普惠核弹”:Gemini 3 Flash 实测——更快、更强、更省可以兼得丨302.AI 基准实验室
12 月 18 日深夜,谷歌闪击式抛出一枚“重磅炸弹”——Gemini 3 Flash 发布。这次发布没有过多的预热,但其展现出的性能与成本组合,足以让整个 AI 领域重新审视现有的竞争格局。 简而言之,Gemini 3 Flash 做了一件看似矛盾的事:它以一个“轻量版”模型的定位和极低的成本,提供了接近甚至部分超越旗舰模型的顶尖性能。 性能:打破“轻量即…
-
价格直降 66%,性能仍是天花板?Claude Opus 4.5 这一波“降价打击”让谁慌了?丨302.AI 基准实验室
11月25日,当大模型竞赛的聚光灯还在 GPT-5.1 与 Gemini 3 Pro 之间流转时,Anthropic 携其王炸产品 Claude Opus 4.5 强势回归,并宣称这是目前全球范围内在编程、agents 和计算机使用方面最强大的模型,编程能力超越人类专家。 Claude 系列最引人瞩目的王牌,始终是它在编程领域的统治级表现。在权威的真实世界软…