企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

happyhorse-1.0-i2v

阿里巴巴集团推出的下一代尖端 AI 视频生成模型

2026-04-27

视频生成

价格:

$0.156/秒

起

大额采购联系客户经理享专属优惠

API介绍

HappyHorse-1.0（又称“欢乐马”）是阿里巴巴集团 ATH 创新事业部推出的下一代尖端 AI 视频生成模型，作为全球首个从零实现文本、视频、音频三种模态“原生联合建模”的开源模型，HappyHorse-1.0 在 2026 年 4 月初一经发布便以 1333 Elo 分强势登顶 Artificial Analysis 权威 AI Video Arena 排行榜，一举超越 Seedance 2.0、Kling 3.0、Veo 3 及 Sora 2 Pro，成为全球性能最强的开源视频生成模型。

───────────────────────────────────────────────────────────────────

核心能力

真正的原生音视频联合建模：突破了传统 AI 视频模型“先视频后配音”的拼接限制。HappyHorse-1.0 采用 150 亿参数、40 层单流 Self-Attention Transformer 架构，将文本、视频及音频 token 置于同一序列中进行联合预训练。这种架构设计确保了画面动态与声音节奏的极致同步，真正实现了视听语言的一体化生成。

卓越的物理一致性与叙事能力：模型在处理复杂商业拍摄需求时，表现出极强的物理规律模拟能力。无论是短片电影级的转场，还是多镜头联动拍摄，它都能在保持严苛物理一致性的前提下，精准遵循复杂的文本指令。该模型在多镜头控制及长指令遵循方面的深度表现，使其成为了专业创作者手中的“生产力利器”。

极致的生成效率：得益于 DMD-2 蒸馏技术，HappyHorse-1.0 仅需 8 步去噪即可完成高质量图像生成，大幅降低了推理成本。其约 38 秒即可生成 1080p 高清动态影像的响应速度，结合其在开源界的通用性，使其不仅能胜任严谨的商业叙事，也能满足创作者高频的创意迭代需求。

引领开源的标杆实力：凭借完全开源且可商业使用的 Apache 2.0 协议，HappyHorse-1.0 彻底打破了闭源模型对高性能视频生成的垄断。它不仅已在阿里百炼平台内部上架，更为全球开发者提供了通向顶尖 AI 影像创作的钥匙，被誉为视频生成领域里程碑式的开源突破。

API调试台

登录后，探索更多精彩功能！点击登录

API统计

API列表 (2)

API描述	接口地址	请求方法	稳定性	参数说明
I2V（图生成视频）	https://api.302.ai/aliyun/api/v1/services/aigc/video-generation/video-synthesis	POST	稳定	查看详情
文档详情 I2V（图片生成视频）API是阿里云通义万相提供的图生视频服务，支持将静态图片转换为动态视频内容。该API提供多个模型版本，满足不同的生成速度、画质和功能需求。支持模型 wanx2.1-i2v-turbo 生成速度更快，表现均衡。 wanx2.1-i2v-plus 生成细节更丰富，画面更具质感。 wan2.2-i2v-plus 万相2.2专业版，当前最新模型,在画面细节表现、运动稳定性方面均有显著提升 wan2.2-i2v-flash 万相2.2极速版，极致生成速度，指令理解与运镜控制更准，画面元素保持一致，稳定性与成功率全面提升 wan2.5-i2v-preview 万相2.5预览版支持自动配音，或传入自定义音频文件 wan2.6-i2v 支持生成包含多个镜头的视频，在镜头切换时保持主体一致性。 happyhorse-1.0-i2v 欢乐马主要功能特点多分辨率支持：提供480P、720P、1080P多种分辨率选项灵活时长控制：支持3-15秒不同时长的视频生成智能提示词优化：自动改写和扩展用户输入的提示词音频支持：部分模型支持自动配音或自定义音频导入视频特效：提供魔法悬浮、气球膨胀等多种特效模板多镜头支持：wan2.6-i2v支持多镜头视频，保持主体一致性异步处理本接口采用异步处理模式：调用接口后立即返回 task_id 使用 task_id 轮询查询任务状态任务完成后获取视频结果任务通常需要1-5分钟完成，具体时间取决于队列情况和服务负载。价格：wanx2.1-i2v-turbo 0.05 PTC/秒价格：wanx2.1-i2v-plus 0.15 PTC/秒价格：wan2.2-i2v-plus 480p 0.03 PTC/秒，1080p 0.15 PTC/秒价格：wan2.2-i2v-flash 480p 0.02 PTC/秒，720p 0.04 PTC/秒价格：wan2.5-i2v-preview 480p 0.05 PTC/秒，720p 0.1 PTC/秒，1080p 0.16 PTC/秒价格：wan2.6-i2v 720P 0.1ptc/秒 1080p 0.15ptc/秒价格：wan2.7-i2v 720P 0.1ptc/秒 1080p 0.15ptc/秒价格：happyhorse-1.0-i2v 720P 0.156ptc/秒 1080p 0.276 ptc/秒请求参数 Header参数 Authorizationstring 可选示例值:`Bearer {{YOUR_API_KEY}}` Content-Typestring 可选示例值:`application/json` Body参数 application/json modelenum<string> 必需模型名称，用于指定使用哪个图生视频模型。不同模型具有不同的特性、价格和支持的功能。枚举值: `wanx2.1-i2v-turbowanx2.1-i2v-pluswan2.2-i2v-pluswan2.2-i2v-flashwan2.5-i2v-previewwan2.6-i2vwan2.7-i2vhappyhorse-1.0-i2v` 示例值:`wan2.2-i2v-plus` inputobject 必需输入的基本信息，包括提示词、图像、音频等 promptstring 可选文本提示词，用于描述生成视频中期望包含的元素和视觉特点。支持语言：中英文长度限制： wan2.6-i2v：不超过1500个字符 wan2.5-i2v-preview：不超过1500个字符 wan2.2及以下版本：不超过800个字符字符计算：每个汉字/字母占一个字符，超过部分会自动截断特殊说明：当使用视频特效参数（template不为空）时，prompt参数无效，无需填写示例值:`一只猫在草地上奔跑` negative_promptstring 可选反向提示词，用于描述不希望在视频画面中看到的内容，可以对视频画面进行限制。支持语言：中英文长度限制：不超过500个字符，超过部分会自动截断示例值:`低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良` img_urlstring 必需首帧图像的URL或Base64编码数据（必填）。图像格式：JPEG、JPG、PNG（不支持透明通道）、BMP、WEBP 图像分辨率：宽度和高度范围为[360, 2000]像素文件大小：不超过10MB 输入方式：使用公网可访问URL（支持HTTP或HTTPS协议）传入Base64编码图像字符串，格式：data:{MIME_type};base64,{base64_data} 本地文件：可通过上传文件获取临时URL 示例值:`https://file.302.ai/gpt/imgs/20250610/5da3c994668c42908e45d74227f21e17.jpg` audio_urlstring 可选音频文件的URL，模型将使用该音频生成视频。支持模型：wan2.6-i2v、wan2.5-i2v-preview 音频格式：wav、mp3 音频时长：3～30秒文件大小：不超过15MB 协议支持：HTTP或HTTPS协议，本地文件可通过上传文件获取临时URL 超限处理：若音频长度超过duration值（5秒或10秒），自动截取前5秒或10秒，其余部分丢弃若音频长度不足视频时长，超出音频长度部分为无声视频例如：音频为3秒，视频时长为5秒，输出视频前3秒有声，后2秒无声示例值:`https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250923/fttrns/%E9%94%A6%E7%91%9F.mp3` reference_video_urlsarray[string] 可选参考视频URL列表。支持模型：wan2.6-r2v 示例值:`[ "https://cdn.wanx.aliyuncs.com/static/demo-wan26/vace.mp4" ]` templatestring 可选视频特效模板的名称。若未填写，表示不使用任何视频特效。注意事项：不同模型支持不同的特效模板调用前请查阅视频特效列表，以免调用失败使用特效时，prompt参数无效可用特效示例： flying：魔法悬浮 balloon：气球膨胀示例值:`flying` mediaarray[object] 可选 typeenum<string> 必需枚举值: `first_framelast_framedriving_audiofirst_clip` urlstring 必需 parametersobject 可选视频生成参数设置，用于控制视频的分辨率、时长、音频等 resolutionenum<string> 可选指定生成的视频分辨率档位，用于调整视频的清晰度（总像素）。重要提示：resolution直接影响费用，同一模型：1080P > 720P > 480P 分辨率说明：模型根据选择的分辨率档位，自动缩放至相近总像素视频宽高比将尽量与输入图像img_url的宽高比保持一致各模型支持的分辨率： wan2.6-i2v：720P、1080P（默认1080P） wan2.5-i2v-preview：480P、720P、1080P（默认1080P） wan2.2-i2v-flash：480P、720P、1080P（默认720P） wan2.2-i2v-plus：480P、1080P（默认1080P） wanx2.1-i2v-turbo：480P、720P（默认720P） wanx2.1-i2v-plus：720P（默认720P）枚举值: `480P720P1080P` 示例值:`1080P` prompt_extendboolean 可选是否开启提示词智能改写功能。功能说明：系统会自动优化和扩展用户输入的提示词，以获得更好的生成效果默认值：true（默认开启）示例值:`true` audioboolean 可选是否自动添加音频。支持模型：wan2.5-i2v-preview、wan2.6-i2v 生效条件：仅当audio_url为空时生效功能说明：设置为true时，系统会根据视频内容自动生成配音设置为false时，生成无声视频默认值：true（默认开启）示例值:`true` durationenum<integer> 可选视频时长设置（单位：秒）。各模型支持的时长： wan2.6-i2v：5、10、15秒 wan2.5-i2v-preview：5、10秒（默认5秒） wan2.2-i2v-plus：固定5秒，不支持修改 wan2.2-i2v-flash：固定5秒，不支持修改 wanx2.1-i2v-plus：固定5秒，不支持修改 wanx2.1-i2v-turbo：3、4、5秒枚举值: `3451015` shot_typeenum<string> 可选镜头类型设置。支持模型：wan2.6-i2v 可选值： single：单镜头 multi：多镜头（支持镜头切换时保持主体一致性）枚举值: `singlemulti` 示例值:`multi` seedinteger 可选随机数种子。取值范围为[0, 2147483647]。未指定时，系统自动生成随机种子。若需提升生成结果的可复现性，建议固定seed值。请注意，由于模型生成具有概率性，即使使用相同seed，也不能保证每次生成结果完全一致。取值范围：[0, 2147483647] watermarkboolean 可选是否添加水印标识，水印位于视频右下角，文案固定为”AI 生成”。 false：默认值，不添加水印； true：添加水印。
Tasks（获取任务结果）	https://api.302.ai/aliyun/api/v1/tasks/{task_id}	GET	稳定	查看详情
文档详情获取任务结果价格：0 PTC/次请求参数 Path参数 task_idstring 必需 Header参数 Authorizationstring 可选示例值:`Bearer {{YOUR_API_KEY}}`

API价格表

$￥円 ₽

模型	说明	302.AI价格

wan2.7-i2v（图生成视频）	720p	$0.156/秒
wan2.7-i2v（图生成视频）	1080p	$0.276/秒
Tasks	获取任务结果	免费

happyhorse-1.0-i2v

API介绍

核心能力

相关测评

API调试台

API统计

API列表 (2)

支持模型

主要功能特点

异步处理

Header参数

Body参数 application/json

Path参数

Header参数

API价格表

wan2.7-i2v（图生成视频）

$0.156/秒

wan2.7-i2v（图生成视频）

$0.276/秒

Tasks

免费

猜你喜欢

快捷访问

帮助与支持

法律声明