gpt-4.1-nano

gpt-4.1-nano

GPT-4.1 最快速、最具成本效益的版本
2025-04-14
语言大模型
Model capability: imageModel capability: function_call
输入:
$0.1/1M tokens
输出:
$0.4/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

GPT‑4.1 nano 是 GPT‑4.1 系列中主打“极致轻量与极低成本”的型号,相比旗舰版 GPT‑4.1,它牺牲一部分顶级推理与编码上限,换来大幅降低的价格和延迟,更适合作为高并发、实时场景的默认模型。两者都支持最高 100 万 token 的长上下文,并共享 2024 年 6 月的知识截止时间,但 GPT‑4.1 聚焦“最强综合能力”和复杂代理任务,而 GPT‑4.1 nano 则定位为“最快、最便宜的生产级模型”。

在学术评测上,GPT‑4.1 nano 在 MMLU 80.1%、GPQA 50.3%,显著领先 GPT‑4o mini,同时在 Aider polyglot coding 上也优于 GPT‑4o mini,说明它在小模型体积下仍具备不俗的通识理解与代码能力。不过与 GPT‑4.1 相比,它在 SWE‑bench、复杂多步推理、函数调用等高难度任务上的上限明显更低,更适合作为分类、自动补全、轻量对话、规则执行等“快而准够用”的工作马,而将真正困难的任务交给 GPT‑4.1 或更强的推理模型。

在价格与性能上,差异更为明显:GPT‑4.1 的输入/输出为 $2 / $8 /M tokens,而 GPT‑4.1 nano 仅 $0.10 / $0.40,成本大约是 GPT‑4.1 的二十分之一;配合 75% 折扣的缓存输入,长上下文调用也无需额外溢价。加上推理栈优化后亚秒级的首 token 延迟(在 128K 上多数请求 <5 秒),GPT‑4.1 nano 非常适合嵌入式智能、海量请求的后台服务、低价值高频任务以及对响应时间高度敏感的前端产品中,与 GPT‑4.1 形成“旗舰 + nano”分层部署。

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (15)

API描述接口地址请求方法稳定性参数说明
Chat(聊天)
POST
稳定
查看详情
Chat(gpt-4o 分析图片)
POST
稳定
查看详情
Chat(gpt-4o 结构化输出)
POST
稳定
查看详情
Chat(gpt-4o 函数调用)
POST
稳定
查看详情
Chat(gpt-4-plus 分析图片)
POST
不稳定
查看详情
Chat(gpt-4-plus 生成图片)
POST
不稳定
查看详情
Chat(gpts模型)
POST
不稳定
查看详情
Chat(chatgpt-4o-latest)
POST
稳定
查看详情
Chat(o1系列)
POST
不稳定
查看详情
Chat(o3系列)
POST
不稳定
查看详情
Chat(gpt-4o 语音模型)
POST
稳定
查看详情
Chat(gpt-4o-image-generation 修改图片)
POST
稳定
查看详情
o4
POST
稳定
查看详情
Responses(聊天)
POST
稳定
查看详情
Responses(Deep-Research)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gpt-4.1-nano

-
1000000

输入$0.1 / 1M tokens
输出$0.4 / 1M tokens

输入$0.1/ 1M tokens
输出$0.4/ 1M tokens
原价