
gpt-4.1-nano
GPT-4.1 最快速、最具成本效益的版本
2025-04-14
输入:
$0.1/1M tokens
输出:
$0.4/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
GPT‑4.1 nano 是 GPT‑4.1 系列中主打“极致轻量与极低成本”的型号,相比旗舰版 GPT‑4.1,它牺牲一部分顶级推理与编码上限,换来大幅降低的价格和延迟,更适合作为高并发、实时场景的默认模型。两者都支持最高 100 万 token 的长上下文,并共享 2024 年 6 月的知识截止时间,但 GPT‑4.1 聚焦“最强综合能力”和复杂代理任务,而 GPT‑4.1 nano 则定位为“最快、最便宜的生产级模型”。
在学术评测上,GPT‑4.1 nano 在 MMLU 80.1%、GPQA 50.3%,显著领先 GPT‑4o mini,同时在 Aider polyglot coding 上也优于 GPT‑4o mini,说明它在小模型体积下仍具备不俗的通识理解与代码能力。不过与 GPT‑4.1 相比,它在 SWE‑bench、复杂多步推理、函数调用等高难度任务上的上限明显更低,更适合作为分类、自动补全、轻量对话、规则执行等“快而准够用”的工作马,而将真正困难的任务交给 GPT‑4.1 或更强的推理模型。
在价格与性能上,差异更为明显:GPT‑4.1 的输入/输出为 $2 / $8 /M tokens,而 GPT‑4.1 nano 仅 $0.10 / $0.40,成本大约是 GPT‑4.1 的二十分之一;配合 75% 折扣的缓存输入,长上下文调用也无需额外溢价。加上推理栈优化后亚秒级的首 token 延迟(在 128K 上多数请求 <5 秒),GPT‑4.1 nano 非常适合嵌入式智能、海量请求的后台服务、低价值高频任务以及对响应时间高度敏感的前端产品中,与 GPT‑4.1 形成“旗舰 + nano”分层部署。
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (15)
API价格表
$¥ 円 ₽