MuseV

MuseV 是基于扩散模型的虚拟人视频生成框架，支持无限长度生成和高保真输出，兼容 Stable Diffusion 生态系统。

腾

腾讯音乐娱乐集团 (Tencent Music Entertainment) 中国

模型等级 B-Tier

分类

视频与音频数字人

MuseV 产品介绍

项目概述

MuseV 是由腾讯音乐娱乐 Lyra 实验室开发的虚拟人视频生成框架，采用基于视觉条件并行去噪的创新技术。

核心特性

无限长度生成：采用新颖的视觉条件并行去噪方案
多种生成模式：支持 Image2Video、Text2Image2Video、Video2Video
Stable Diffusion 生态兼容：完全兼容 Stable Diffusion 生态系统
多参考图像技术：支持 IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID 等
高质量输出：训练于约 60K 人体文本 - 视频对数据集