Kling O3 视频生成

Kling O3 视频生成

Kuaishou 推出的 AI 视频生成级旗舰模型,覆盖文生视频、图生视频、参考视频生成与智能视频编辑四大核心场景
2026-02-09
视频生成
价格:
$0.084/秒

大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

支持同步生成音频(enable_audio=True),仅图片参考、首尾帧场景使用


Kling O3 是 Kuaishou(快手)推出的 AI 视频生成级 旗舰产品,基于统一多模态视觉语言(MVL)架构,全面超越 V3.0,在物理仿真、主体一致性、运动自然度与语义理解上实现显著突破。该系列采用 Standard(标准版)与 Pro(专业版)双模策略,覆盖文生视频、图生视频、参考视频生成与智能视频编辑四大核心场景,为创作者提供从轻量测试到影视级交付的全链路解决方案。

  • 架构升级:O3 系列采用全新统一 MVL 架构,在动态真实感、时序连贯性与复杂指令遵循能力上全面领先,杜绝闪烁、形变或逻辑断裂。
  • 双版本策略:Standard 版主打高性价比(价格约为 Pro 版的 1/3–2/3),适合高频迭代与社交内容;Pro 版专注影视级质量,支持 4K、复杂运镜、多图引导与身份绑定,面向专业成品交付。
  • 核心能力:全系支持 3–15 秒任意整秒时长、多画幅(16:9 / 9:16 / 1:1)、原生音画同步(环境音效或对白)、内置 Prompt Enhancer 智能优化,并可选保留原始音轨(keep_original_sound)。
  • 适用场景:社交媒体短视频、营销广告、AI 数字人、产品动画、影视预演、电商素材修改、创意概念测试及带身份一致性的角色视频生产。
  • 灵活控制:支持负向提示(negative_prompt)、起止帧引导(end_image)、多参考图(最多 7 张图像或 4 张+参考视频)及自然语言编辑指令(如“移除行人”“换成雨天”),实现精准可控创作。

───────────────────────────────────────────────────────────────────

核心能力

🎬 O3 影视级动态真实感

Pro 版实现电影级光影、物理模拟与流畅运镜;Std 版在保持主体稳定与动作合理性的前提下优化推理效率。

🖼️→🎥 多模态输入驱动

支持纯文本(Text-to-Video)、单图起始(Image-to-Video)、多视角身份绑定(Reference-to-Video)及现有视频编辑(Video Edit),满足全类型创作需求。

🔊 智能音画协同

可自动生成匹配画面的环境音效(如雨声、城市喧嚣);Pro 版在文生视频中支持叠加自定义语音实现角色对白。

⏱️ 平台级时长适配

3–15 秒任意长度,完美适配 TikTok、Reels、YouTube Shorts 等主流短视频平台节奏。

📱 一键多画幅输出

16:9(横屏)、9:16(竖屏)、1:1(方形)无需后期裁剪,直接用于多端分发。

Prompt Enhancer 智能增强

自动补全“慢镜头”“环绕运镜”“黄昏光照”等专业描述,降低创作门槛,提升生成质量。

✂️ 自然语言视频编辑

用口语化指令直接修改视频内容,Pro 版支持最多 4 张参考图引导细节,Std 版提供高效基础编辑。

👤 高保真身份一致性

通过多角度参考图精准锁定角色/物体外观,确保长视频中身份高度一致,适用于数字人与品牌角色复用。

端到端云端 API

无需本地渲染或预处理,提交提示即返回可商用高清视频,无缝集成至自动化工作流与创意工具链。

───────────────────────────────────────────────────────────────────

效果展示

───────────────────────────────────────────────────────────────────

相关测评

Kling O3实测:能够实现人人皆可成为导演的愿景么?

API调试台

登录后,探索更多精彩功能! 点击登录

API列表 (3)

API描述接口地址请求方法稳定性参数说明
Image2Video(omni 3)
POST
稳定
查看详情
omni3主体数据
GET
稳定
查看详情
Fetch(获取任务结果)
GET
稳定
查看详情

API价格表

$
模型说明302.AI价格

baseVideo指令变换

std

$0.252/秒

baseVideo指令变换

pro

$0.336/秒

referVideo视频参考

std

$0.252/秒

referVideo视频参考

pro

$0.336/秒

referImage图片参考

std-audio off

$0.084/秒

referImage图片参考

std-audio on

$0.112/秒

referImage图片参考

pro-audio off

$0.224/秒

referImage图片参考

pro-audio on

$0.228/秒

firstTail首尾帧

std-audio off

$0.168/秒

firstTail首尾帧

std-audio on

$0.252/秒

firstTail首尾帧

pro-audio off

$0.224/秒

firstTail首尾帧

pro-audio on

$0.336/秒

omni 3 主体数据

-

$0/次