gpt-4o-transcribe

gpt-4o-transcribe

来自OpenAI的语音转文字模型
2025-10-31
音视频处理
Model capability: audio
输入:
$6/1M tokens
输出:
$10/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

GPT-4o-Transcribe 是 OpenAI 推出的高精度语音转文本模型,基于 GPT-4o 架构,专为语音识别任务优化。该模型在多语言、多口音和嘈杂环境下表现优异,显著降低了单词错误率(WER),尤其在英语和其他主要语言中。适用于会议记录、客户服务、媒体字幕等场景。


相关测评:《当准确率不再是唯一标准:三款主流STT语音转文字模型实测横评

API调试台

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Transcriptions(语音转文字)
POST
稳定
查看详情

API价格表

$
模型说明官网原价302.AI价格

gpt-4o-transcribe

-

输入$6 / 1M tokens
输出$10 / 1M tokens

输入$6/ 1M tokens
输出$10/ 1M tokens
原价