Flux Context

模型

参考图片 *

点击上传或拖放文件

支持PNG、JPG、JPEG格式

结束帧（可选）

点击上传或拖放文件

支持PNG、JPG、JPEG格式

结束帧必须与第一张图片具有相同的尺寸。

视频提示 *

0/2000 字符

所需积分： 50

演示提示

A young woman with shoulder-length dark brown hair and soft bangs, wearing a fitted white tank top and braided black shoulder strap backpack, standing on a subway platform. She is holding a phone with white wired earphones, looking at the camera with a neutral expression. The background shows tiled station walls with green and white tiles, yellow tactile paving, metal train tracks, and overhead fluorescent lights. Natural, candid street photography style, realistic lighting, shallow depth of field.

模型:Wan 2.2•时长: 8s

Wan 2.2 AI Video Generator

世界首个开源 MoE 视频生成模型

Wan 2.2 AI 是阿里巴巴通义万象团队的最新突破。通过文本提示创建高达720p的惊艳高保真视频，或使用革命性的专家混合（MoE）架构为静态图像添加动画。在 Apache 2.0 许可证下完全免费用于商业用途。

文本转视频图片转视频最高可达720p和1280pMoE 架构

Wan 2.2 视频生成展示

体验 Wan 2.2 AI 视频生成的强大功能。这些示例展示了高保真视频输出、出色的运动一致性和强大的提示遵循性，这是全球首个开源 MoE 视频模型。

文本转视频

文本到视频生成

使用 Wan 2.2 AI 从详细文本描述生成视频

图片转视频

图片到视频动画

使用 Wan AI 技术为静态图片添加自然运动

720p 质量

高保真输出

专业级720p视频质量，细节丰富，运动流畅

运动

出色的运动一致性

复杂的摄像机运动和角色一致性，伪影极少

创意

创意故事讲述

将创意想法转化为引人入胜的视频叙事

商业

商业应用

用于营销和广告的专业级内容

Wan 2.2 AI 技术规格

根据您的硬件配置和创意需求选择合适的 Wan 2.2 模型。两个模型都采用创新的 MoE 架构以实现最佳性能。

Wan 2.2 AI - 5B Model

消费者友好版本

参数：5 Billion

所需 VRAM：~10GB

分辨率：720p, 1280p

Wan 2.2 AI - 14B Model

专业质量版本

参数：14 Billion

所需 VRAM：~60GB

分辨率：720p, 1280p+

MoE 架构

世界首个用于高效处理的 MoE 视频模型

双模型系统

HNoise + LNoise 提供卓越质量

高保真输出

丰富的细节和流畅的运动，最高可达1280p

Apache 2.0 许可证

个人和商业用途免费

如何使用 Wan 2.2 AI 视频生成

使用 ComfyUI 或云服务开始使用 Wan 2.2 AI 视频生成。选择最适合您硬件和工作流程需求的方法。

使用 ComfyUI（本地设置）

更新 ComfyUI

确保您安装了最新版本的 ComfyUI，以获得对 Wan 2.2 AI 工作流程的全面支持。

下载模型文件

从 Hugging Face 下载 Wan 2.2 模型文件。5B 模型需要约10GB VRAM，而14B模型需要约60GB。

加载工作流

在 ComfyUI 中，使用为 Wan 2.2 AI 设计的预构建工作流，包含文本到视频或图片到视频生成所需的节点。

配置与生成

输入提示，调整分辨率和帧数等参数，然后点击“队列提示”开始生成。

最佳适用对象：拥有强大本地硬件并希望完全控制生成过程的用户。

云服务（无需设置）

思维扩散

通过 Think Diffusion 的云平台按使用量付费并即时设置，访问 Wan 2.2 AI。

开放艺术

使用 Open Art 的集成 Wan 2.2 AI 服务，轻松生成视频，无需硬件要求。

简单界面

使用直观的网页界面输入提示、上传图片并生成视频，无需技术设置。

即时结果

快速获取生成的视频，无需等待本地处理或管理硬件资源。

最佳适用对象：希望无需硬件投资或技术设置即可即时访问的用户。

Wan 2.2 AI 用例

了解 Wan 2.2 AI 视频生成器如何在各个行业和应用中改变您的创意工作流程。

短片和广告

快速将创意简报转换为高质量的视频剪辑，用于社交媒体营销或产品展示。

数字艺术与动画

通过添加动态运动，使静态图片、数字画作或照片栩栩如生。

电影预可视化

在电影制作早期阶段使用，以快速生成场景和镜头的概念视觉效果。

个人创意项目

将任何疯狂想法变成有趣、可分享的视频剪辑——从“水下弹吉他的猫”到未来概念。

用户对 Wan 2.2 AI 的评价

社区反馈突出了 Wan 2.2 AI 视频生成的令人印象深刻的能力和当前的局限性。

社区赞誉

“免费革命性产品”

作为一个免费开源模型，其质量常被认为与付费闭源模型相媲美，有时甚至更好。

“惊艳的质量”

用户对生成视频的逼真度、流畅性和细节印象深刻，尤其是人类动作的自然性。

“降低入门门槛”

5B 模型让高级 AI 视频生成对拥有消费级 GPU（例如8GB显存）的用户可用。

“繁荣的生态系统”

开源促进了一个活跃的开发者社区，创造了教程、优化的工作流程和插件。

改进空间

高显存需求

14B 模型要求极高，使得大多数用户无法在没有专业级硬件的情况下使用。

生成时间较长

渲染可能很慢，尤其是高分辨率剪辑，有时几秒钟的视频可能需要一个多小时。

视频长度限制

生成的视频目前较短，通常约为5秒。

物理与伪影

它有时在处理复杂物理效果时会遇到困难，或在高度动态的场景中产生意外的伪影。

关于 Wan 2.2 AI 的常见问题解答

关于 Wan 2.2 AI 视频生成模型的一切，从技术要求到商业用途。

Wan 2.2 的最大优势是什么？

它的主要优势是开源（可免费用于商业用途）并提供极高质量的结果。这使得没有预算购买昂贵专有工具的创作者受益。

我需要什么样的电脑来运行 Wan 2.2 AI？

这取决于模型。对于 5B 模型，建议使用至少 8GB 显存的 NVIDIA GPU。要运行 14B 模型，您需要专业或数据中心级别的 GPU，显存至少为 24GB。如果您的硬件不足，云服务是一个很好的替代方案。

5B 和 14B 模型之间有什么区别？

关键区别在于质量与资源成本。14B 模型生成更详细和连贯的视频，但需要显著更多的显存和更长的渲染时间。5B 模型是一个轻量版本，速度更快，可在性能较低的硬件上运行，但质量略有折扣。

我可以将 Wan 2.2 用于我的业务吗？

是的。它在 Apache 2.0 许可证下发布，允许商业用途。

我能生成的视频有多长？

目前，通过 ComfyUI 等工具生成的视频通常约为5秒长（例如，24帧每秒时为121帧）。社区正在积极探索创建更长视频的方法。

Wan 2.2 是目前最好的 AI 视频模型吗？

它被广泛认为是目前最好的开源视频模型之一。虽然它与 Google 的 Veo 或 Kling 等顶级闭源模型竞争激烈，但各有独特优势。Wan 2.2 是一个非常强大且易于访问的选项，特别是对于开源社区。

立即开始使用 Wan 2.2 AI 创作

加入开源视频生成革命。体验 Wan AI 技术的力量，从您的想象中创造出令人惊叹的视频。