
claude-sonnet-4-5-20250929
API介绍
基本信息
Claude Sonnet 4.5是Anthropic于2025年9月29日正式发布的最新一代AI模型,基于Anthropic自研技术架构打造。它是Claude系列的重要升级版本,模型API ID为claude-sonnet-4-5-20250929,代表了Anthropic在AI编程与复杂智能体构建领域的重大技术突破。普通用户可通过网页端、iOS及安卓端的Claude.ai使用,开发者可通过Claude开发者平台、Amazon Bedrock和Google Cloud的Vertex AI调用,知识截断日期为2025年1月,训练数据截断日期为2025年7月。
核心特性
顶尖编程能力:作为官方定位的“用于复杂代理和编码的最聪明的模型”,在衡量真实软件工程能力的SWE-bench Verified测试中表现优异,单模型配置准确率达77.2%,启用并行推理优化后更是提升至82.0%,远超同类竞品。支持连续自主工作超30小时,能一次性生成约1.1万行代码,覆盖项目开发、bug调试、代码重构等全流程,适配企业级软件开发需求。
复杂智能体构建优势:是“构建复杂智能体的最强工具”,具备强大的计划协调、记忆管理和子代理调度能力。搭配Anthropic开放的Claude Agent SDK,开发者可轻松搭建拥有权限系统和任务拆分功能的复杂AI代理,大幅降低高端智能体应用的开发门槛,适配企业级智能体构建场景。
高效计算机操作能力:在OSWorld真实计算机任务测试中以61.4%的得分领先同类模型,较前代版本的42.2%实现大幅提升。可自主完成浏览器导航、电子表格处理、文件管理、数据录入等操作系统级任务,能与各类办公及专业软件工具无缝交互,适配自动化办公、运维等场景。
卓越推理与知识处理能力:在专业领域测试中表现突出,GPQA Diamond研究生级推理测试取得83.4%的成绩,AIME 2025数学竞赛测试中获满分,多语言问答(MMMLU)准确率达89.1%。在金融分析、法律文书处理、医学研究、STEM领域等专业场景中,逻辑推理和知识应用能力优异,可作为专业领域的高效辅助工具。
多模态与参数优势:支持文本和图像输入,具备完善的多语言处理能力。单次最大输出为64K令牌,标准上下文窗口为200K令牌,测试版可通过特定标头支持1M令牌上下文,能满足长篇内容生成、多文档整合综述、大规模代码开发等大型任务需求。
技术亮点
开发者工具升级:搭载Claude Code v2,新增“检查点”功能,支持进度保存与回滚,避免因操作失误导致的进度丢失。提供原生VS Code扩展和全新终端界面,可在对话场景中直接执行代码、创建文件,大幅简化开发流程,提升开发效率。
安全框架进阶:采用AI Safety Level 3(ASL-3)发布框架,内置高精度分类器过滤器,能主动拦截化学、生物、放射性等高危内容。抵御提示注入攻击的能力显著提升,误报率较前代降低十倍以上,同时首次引入机制可解释性技术,强化安全性评估与管控。
成本与部署优化:支持多平台灵活部署,输入定价为每百万令牌3美元,输出定价为每百万令牌15美元。创新推出提示缓存功能可节省最高90%成本,批量处理场景可节省50%成本,在高性能基础上实现了成本与效率的平衡,适配不同规模企业的使用需求。
市场影响
Claude Sonnet 4.5的发布被业界视为AI编程与复杂智能体领域的重要里程碑,其“顶尖编程+复杂智能体构建+高效计算机操作”的三维核心能力,标志着AI在生产级场景的应用进入深化阶段。凭借在专业测试中的领先表现,它已成为企业级软件开发、复杂智能体构建、高端自动化办公、专业领域研究等场景的优选模型,有望推动相关行业的效率革新,尤其受到金融、高端软件研发、生物医药等对性能和安全性有高要求的行业青睐。
相关测评:《Claude Sonnet 4.5 对阵 GLM-4.6:中外大模型编程巅峰对决,胜负已分? 》
Playground
登录后,探索更多精彩功能! 点击登录