
可灵对口型
实现视频人物口型和音频完美同步
2025-11-27
价格:
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
可灵推出的对口型功能,支持通过上传视频和音频,实现视频人物口型和音频完美同步,仿佛真人在说话/唱歌,视频瞬间栩栩如生!
在多种场景的对比测试中,可灵所生成的唇形不仅在时序和形态上与音频高度一致,面部表情也随着语音的起伏变化而更显自然。即使在发音难度较高的音节(如 “truth”,其标准发音为 [truːθ],[u:] 要求双唇前突、口型小而紧)或高频语音中的短暂静音段落,可灵对口型均能够准确还原相应的口型状态。
视频要求:
支持传入时长不超过60秒的视频id/视频URL,或:
上传格式为.mp4/.mov、文件大小不超过100MB、视频时长不超过60s且不短于2s、清晰度720p和1080p、长宽的边长均位于512px~2160px之间的视频文件
音频要求:
支持传入音频Base64编码或音频URL、格式为.mp3/.wav/.m4a、时长不短于2秒且不长于60秒的音频文件
使用流程:
- 调用“/v1/videos/identify-face”上传视频进行人脸识别,获得“session_id”
- 调用“/v1/videos/advanced-lip-sync”上传音频创建对口型任务,获得“task_id”
- 调用“/v1/videos/advanced-lip-sync/{id}”传入“task_id”查询单个任务,从“task_result”获得最终结果“url”
API调试台
登录后,探索更多精彩功能! 点击登录
API列表 (3)
API价格表
$¥ 円 ₽