支持音画同步的 1080p 顶级视频生成
Wan 2.6 提供顶尖 1080p 画质并支持音画同步,是专业级高品质创作的首选。
阿里出品:支持多镜头叙事的顶级 AI 视频大模型
Wan 2.6 于 2025 年 12 月发布,是阿里最先进的视频生成模型。相比 Wan 2.5,它将时长延长至 15 秒,引入了智能多镜头转场,并显著提升了音画同步与对口型质量。
第一次使用 Wan AI? Wan 2.5 提供 480p 选项,成本降低 50% —— 非常适合在升级到 Wan 2.6 高清画质前测试提示词效果。
Wan 2.6 不只是小版本更新,更是能力的跨越。以下是它能为您的项目带来的核心价值。
Wan 2.5 最长支持 10 秒。而 Wan 2.6 多出的 5 秒是质的飞跃,足以完成从“产品展示”到“完整叙事”的跨越:全景铺垫 → 动作细节 → 结果呈现。
Wan 2.6 能智能拆解提示词,在保持角色一致的前提下切换多镜头。例如:“角色走进咖啡馆点餐”会生成:全景 → 特写 → 中景。而 Wan 2.5 仅支持单镜头。
Wan 2.6 的音画同步表现大幅提升。人物口型与对白自然匹配,非常适合对话类、解说类及数字人视频。
两种模式,同样顶尖画质。根据您是否有参考图灵活选择。
精准控制动作,让你的图片动起来
适用场景:产品展示、人像动画、基于现有图片的连贯角色动作。
纯文生视频
适用场景:概念短片、广告片、社媒爆款、无需参考图的电影感叙事。
真实的物理特性与丝滑的角色动作
多镜头场景角色一致
精准还原复杂的创意描述
创作自由度高,无内容限制
积分消耗随时长线性增加。同等时长下,720p 比 1080p 节省 25% 积分。
适合社媒分享与初稿预览
专业出片首选
高手技巧:先测试提示词,使用 Wan 2.5 480p 在使用 Wan 2.6 生成最终成品前,建议先用(5秒/30积分)进行预览。
Wan 2.6 贵有贵的道理。以下是它超越 Wan 2.5 的核心优势。
15秒规格完美适配小红书、抖音及视频号。多镜头剪辑节奏感强,轻松打造专业级广告。
增强的对口型技术,让 Wan 2.6 成为数字人播报、角色对话及配音解说视频的神器。
多镜头叙事打造电影级转场。人物入场 → 特写 → 反应镜头,只需一段提示词即可搞定。
1080p 超清画质,媲美专业商业摄影。让产品图动起来,动作丝滑且精准可控。
跨场景保持角色一致。非常适合动画系列剧、IP 形象及品牌角色创作。
当提示词已调优完毕,需要最终成片时。建议用 Wan 2.5 打草稿,用 Wan 2.6 出正片。
Wan 2.5 适用于:测试提示词、快速迭代、10秒内短片、高性价比创作。Wan 2.6 适用于:成片导出、11-15秒长视频、对口型/对白内容、多镜头叙事、追求极致画质。
多镜头模式会自动将提示词拆解为多个运镜角度,并保持角色一致。例如输入“女人走进咖啡馆,点餐,坐下”,将生成三个连贯镜头而非单一视角。注意:多镜头模式受内容合规限制。
上传 WAV 或 MP3 音频(3-30秒,15MB以内),Wan 2.6 即可实现音画同步。包括人物对口型、音乐节奏卡点及音效对齐。若音频长于视频,将仅截取开头段落。
是的,Wan 2.6 单镜头模式无内容限制。多镜头模式开启了内容审核。如需生成无限制的多场景内容,请分别生成单个镜头。
通常需要 2-7 分钟,具体取决于时长和分辨率。1080p 15秒视频比 720p 5秒视频耗时更长。您可以离开页面,生成结果会自动保存到作品历史中。