Wan 2.5 480p 测试成本更低。去试试 Wan 2.5 如果你想节省积分。

模型

上传图片

支持PNG、JPG、JPEG格式

上传音频

Formats: WAV, MP3 • Length: 3–30s • ≤ 15MB

0/2000 字符
所需积分: 75
剩余: 0

Wan 2.6

支持音画同步的 1080p 顶级视频生成

体验 Wan 2.6
Wan 2.6 提供顶尖 1080p 画质并支持音画同步,是专业级高品质创作的首选。
分辨率: 720p / 1080p时长: 5s / 10s / 15s

Wan 2.6 AI 视频生成器

阿里出品:支持多镜头叙事的顶级 AI 视频大模型

Wan 2.6 于 2025 年 12 月发布,是阿里最先进的视频生成模型。相比 Wan 2.5,它将时长延长至 15 秒,引入了智能多镜头转场,并显著提升了音画同步与对口型质量。

15秒时长多镜头场景1080p 质量增强型对口型未审查

第一次使用 Wan AI? Wan 2.5 提供 480p 选项,成本降低 50% —— 非常适合在升级到 Wan 2.6 高清画质前测试提示词效果。

Wan 2.6 对比 Wan 2.5 有哪些升级?

Wan 2.6 不只是小版本更新,更是能力的跨越。以下是它能为您的项目带来的核心价值。

15s

更长视频

Wan 2.5 最长支持 10 秒。而 Wan 2.6 多出的 5 秒是质的飞跃,足以完成从“产品展示”到“完整叙事”的跨越:全景铺垫 → 动作细节 → 结果呈现。

多镜头

电影感故事表达

Wan 2.6 能智能拆解提示词,在保持角色一致的前提下切换多镜头。例如:“角色走进咖啡馆点餐”会生成:全景 → 特写 → 中景。而 Wan 2.5 仅支持单镜头。

对口型

增强音画同步

Wan 2.6 的音画同步表现大幅提升。人物口型与对白自然匹配,非常适合对话类、解说类及数字人视频。

Wan 2.6 参数规格

两种模式,同样顶尖画质。根据您是否有参考图灵活选择。

图片转视频

精准控制动作,让你的图片动起来

输入:图片 + 提示
分辨率:720p • 1080p
时长:5s • 10s • 15s
音频:可选 WAV/MP3

适用场景:产品展示、人像动画、基于现有图片的连贯角色动作。

文本转视频

纯文生视频

输入:仅提示词生成
尺寸:16:9 • 9:16 (720p/1080p)
时长:5s • 10s • 15s
音频:可选 WAV/MP3

适用场景:概念短片、广告片、社媒爆款、无需参考图的电影感叙事。

丝滑动态

真实的物理特性与丝滑的角色动作

角色一致性

多镜头场景角色一致

深度提示词理解

精准还原复杂的创意描述

未审查

创作自由度高,无内容限制

Wan 2.6 价格详情

积分消耗随时长线性增加。同等时长下,720p 比 1080p 节省 25% 积分。

720p HD

适合社媒分享与初稿预览

5 75 积分
10 150 积分
15 225 积分

1080p Full HD

专业出片首选

5 100 积分
10 200 积分
15 300 积分

高手技巧:先测试提示词,使用 Wan 2.5 480p 在使用 Wan 2.6 生成最终成品前,建议先用(5秒/30积分)进行预览。

何时使用 Wan 2.6

Wan 2.6 贵有贵的道理。以下是它超越 Wan 2.5 的核心优势。

商业广告

15秒规格完美适配小红书、抖音及视频号。多镜头剪辑节奏感强,轻松打造专业级广告。

对话类内容

增强的对口型技术,让 Wan 2.6 成为数字人播报、角色对话及配音解说视频的神器。

电影级叙事

多镜头叙事打造电影级转场。人物入场 → 特写 → 反应镜头,只需一段提示词即可搞定。

产品视频

1080p 超清画质,媲美专业商业摄影。让产品图动起来,动作丝滑且精准可控。

角色动画

跨场景保持角色一致。非常适合动画系列剧、IP 形象及品牌角色创作。

最终成品

当提示词已调优完毕,需要最终成片时。建议用 Wan 2.5 打草稿,用 Wan 2.6 出正片。

常见问题解答

我该选 Wan 2.5 还是 Wan 2.6?

Wan 2.5 适用于:测试提示词、快速迭代、10秒内短片、高性价比创作。Wan 2.6 适用于:成片导出、11-15秒长视频、对口型/对白内容、多镜头叙事、追求极致画质。

什么是多镜头叙事?

多镜头模式会自动将提示词拆解为多个运镜角度,并保持角色一致。例如输入“女人走进咖啡馆,点餐,坐下”,将生成三个连贯镜头而非单一视角。注意:多镜头模式受内容合规限制。

音画同步如何工作?

上传 WAV 或 MP3 音频(3-30秒,15MB以内),Wan 2.6 即可实现音画同步。包括人物对口型、音乐节奏卡点及音效对齐。若音频长于视频,将仅截取开头段落。

Wan 2.6 是否有内容审查?

是的,Wan 2.6 单镜头模式无内容限制。多镜头模式开启了内容审核。如需生成无限制的多场景内容,请分别生成单个镜头。

生成需要多长时间?

通常需要 2-7 分钟,具体取决于时长和分辨率。1080p 15秒视频比 720p 5秒视频耗时更长。您可以离开页面,生成结果会自动保存到作品历史中。

准备好用 Wan 2.6 创作了吗?

生成长达15秒的电影级 AI 视频,支持多镜头切换与增强对口型。

先用 Wan 2.5 测速