
IndexTTS-2
B站最新开源的TTS模型
2025-09-15
价格:
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
IndexTTS2 在情感表达和持续时间控制的自动回归零样本文本转语音领域实现突破,提出新颖通用的模型友好方法。该方法支持两种生成模式:指定标记数量以精确控语音时长,或自回归自由生成且忠实再现输入提示韵律。其实现情感表达与说话者身份解开,零样本下能精准重建目标音色、完美再现指定情感音调。同时,结合 GPT 潜在表示并设计三阶段训练范式提升高情感语音清晰度与稳定性,通过微调 Qwen3 设文本描述软指令机制降低情绪控制门槛。多数据集实验显示,其在单词错误率、说话人相似性、情感保真度上优于现有零样本 TTS 模型。
API调试台
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (2)
API价格表
$¥ 円 ₽