企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

speech-2.8-turbo

MiniMax 推出的文本转语音级高性能模型

2026-02-06

音视频处理

价格:

$30 /百万字符起

大额采购联系客户经理享专属优惠

API介绍

MiniMax Speech 2.8 Turbo 是 MiniMax 推出的文本转语音级高性能产品，核心定位为“支持情感与拟声表达的广播级语音合成 API”，以自然度、控制力与低成本满足多场景语音生成需求。

升级点：支持 17+ 预设人声及自定义克隆音色，新增情感控制与拟声词（如 (laughs)、(sighs)）原生解析能力。
适用场景：有声书制作、视频配音、播客生成、教育课件、游戏 NPC 语音及无障碍内容播报。
产品价值：提供细粒度音频控制（速度/音高/音量/采样率/比特率），输出即用型生产级音频。
成本优势：每千字符仅 0.03 PTC，性价比优于多数高保真 TTS 服务。
技术特色：支持英文数字标准化（english_normalization）与发音词典（pronunciation_dict），确保品牌名与术语准确发音。

───────────────────────────────────────────────────────────────────

核心能力

🎙️ 丰富音色库

17+ 预设声音覆盖不同性别、年龄与风格（如 Deep_Voice_Man、Lively_Girl、Abbess），亦可接入自定义克隆音色。

💬 拟声表达支持

原生识别 (laughs)、(coughs)、(gasps)、(sighs) 等 22 种拟声词，让语音更富人性。

😊 情感调控

可指定 happy、calm 等情绪模式，匹配内容情感基调。

🎛️ 全参数可控

自由调节 speed、pitch、volume 及 audio format（如 MP3/WAV）、sample_rate、bitrate、channel。

🔤 精准发音定制

通过 pronunciation_dict 定义专有名词读音，启用 english_normalization 优化英文数字/日期朗读。

API调试台

登录后，探索更多精彩功能！点击登录

API统计

API列表 (4)

API描述	接口地址	请求方法	稳定性	参数说明
T2A（语音生成-同步）	https://api.302.ai/minimaxi/v1/t2a_v2	POST	稳定	查看详情
文档详情来自Minimax的语音生成模型官方文档：https://platform.minimaxi.com/docs/api-reference/speech-t2a-http 音色列表: https://platform.minimaxi.com/docs/faq/system-voice-id 价格：Turbo版本 30 PTC / 百万字价格：HD版本 52.5 PTC / 百万字请求参数 Header参数 Authorizationstring 可选示例值:`Bearer {{YOUR_API_KEY}}` Content-Typestring 可选示例值:`application/json` Body参数 application/json modelenum<string> 必需请求的模型版本，可选范围：speech-2.8-turbo，speech-2.8-hd，speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo 枚举值: `speech-2.6-hdspeech-2.6-turbospeech-02-hdspeech-02-turbospeech-01-hdspeech-01-turbospeech-2.8-turbospeech-2.8-hd` textstring 必需需要合成语音的文本，长度限制小于 10000 字符，若文本长度大于 3000 字符，推荐使用流式输出 streamboolean 可选控制是否流式输出。默认 false，即不开启流式 stream_optionsobject 可选 exclude_aggregated_audioboolean 可选设置最后一个 chunk 是否包含拼接后的语音 hex 数据。默认值为 False voice_settingobject 可选 voice_idstring 可选合成音频的音色编号，支持系统音色、复刻音色以及文生音色 speednumber 可选合成音频的语速，取值范围 [0.5,2]，默认值为1.0 volnumber 可选合成音频的音量，取值范围 (0,10]，默认值为1.0 pitchinteger 可选合成音频的语调，取值范围 [-12,12]，默认值为0 emotionenum<string> 可选控制合成语音的情绪，模型会根据输入文本自动匹配情绪枚举值: `happysadangryfearfuldisgustedsurprisedcalmfluent` text_normalizationboolean 可选是否启用中文、英语文本规范化，开启后可提升数字阅读场景的性能 latex_readboolean 可选控制是否朗读 latex 公式，默认为 false audio_settingobject 可选 sample_rateenum<integer> 可选生成音频的采样率，默认为 32000 枚举值: `80001600022050240003200044100` bitrateenum<integer> 可选生成音频的比特率，默认值为 128000，仅对 mp3 格式有效枚举值: `3200064000128000256000` formatenum<string> 可选生成音频的格式，默认为 mp3 枚举值: `mp3pcmflacwav` channelenum<integer> 可选生成音频的声道数，1 为单声道，2 为双声道枚举值: `12` force_cbrboolean 可选是否使用恒定比特率编码，仅对流式输出且格式为 mp3 时生效 pronunciation_dictobject 可选 tonearray[string] 可选替换需要特殊标注的文字或符号对应的注音或发音替换规则 timber_weightsarray[object] 可选 voice_idstring 可选合成音频的音色编号 weightinteger 可选音色的权重，取值范围 [1, 100] language_boostenum<string> 可选是否增强对指定的小语种和方言的识别能力，默认值为 null 枚举值: `ChineseChinese,YueEnglishArabicRussianSpanishFrenchPortugueseGermanTurkishDutchUkrainianVietnameseIndonesianJapaneseItalianKoreanThaiPolishRomanianGreekCzechFinnishHindiBulgarianDanishHebrewMalayPersianSlovakSwedishCroatianFilipinoHungarianNorwegianSlovenianCatalanNynorskTamilAfrikaansauto` voice_modifyobject 可选 pitchenum<integer> 可选音高调整（低沉/明亮），范围 [-100,100] 枚举值: `-100100` intensityenum<integer> 可选强度调整（力量感/柔和），范围 [-100,100] 枚举值: `-100100` timbreenum<integer> 可选音色调整（磁性/清脆），范围 [-100,100] 枚举值: `-100100` sound_effectsenum<string> 可选音效设置枚举值: `spacious_echoauditorium_echolofi_telephonerobotic` subtitle_enableboolean 可选控制是否开启字幕服务，仅在非流式输出时有效 output_formatenum<string> 可选控制输出结果的形式，流式场景仅支持返回 hex 形式枚举值: `urlhex` aigc_watermarkboolean 可选控制是否在合成音频的末尾添加音频节奏标识，默认值为 False
T2A（语音生成-异步）	https://api.302.ai/minimaxi/v1/t2a_async_v2	POST	稳定	查看详情
暂无数据
T2A（语音生成-状态查询）	https://api.302.ai/minimaxi/v1/query/t2a_async_query_v2	GET	稳定	查看详情
暂无数据
Files（音频文件下载）	https://api.302.ai/minimaxi/v1/files/retrieve	GET	稳定	查看详情
文档详情接口说明来自Minimax的文生音色频官方文档：https://platform.minimaxi.com/document/VoiceGeneration?key=669f5af198ff2c57eeb9a0f0 价格：0 PTC / 次请求参数 Header参数 Authorizationstring 可选示例值:`Bearer {{YOUR_API_KEY}}` Query参数 file_idstring 可选

API价格表

$￥円 ₽

模型	说明	302.AI价格

speech-2.8-turbo	T2A（语音生成-同步）	$30 / 百万字符
speech-2.8-turbo	异步超长文本语音生成	$30 / 百万字符
T2A	语音生成-状态查询	免费
Files（音频文件下载）	-	免费

speech-2.8-turbo

API介绍

核心能力

API调试台

API统计

API列表 (4)

Header参数

Body参数 application/json

Header参数

Query参数

API价格表

speech-2.8-turbo

$30 / 百万字符

speech-2.8-turbo

$30 / 百万字符

T2A

免费

Files（音频文件下载）

免费

猜你喜欢

快捷访问

帮助与支持

法律声明