MuseV

MuseV

MuseV 是基于扩散模型的虚拟人视频生成框架,支持无限长度生成和高保真输出,兼容 Stable Diffusion 生态系统。

腾讯音乐娱乐集团 (Tencent Music Entertainment) 中国
模型等级 B-Tier
分类
视频与音频 数字人
访问官网

MuseV 产品介绍

项目概述

MuseV 是由腾讯音乐娱乐 Lyra 实验室开发的虚拟人视频生成框架,采用基于视觉条件并行去噪的创新技术。

核心特性

  • 无限长度生成:采用新颖的视觉条件并行去噪方案
  • 多种生成模式:支持 Image2Video、Text2Image2Video、Video2Video
  • Stable Diffusion 生态兼容:完全兼容 Stable Diffusion 生态系统
  • 多参考图像技术:支持 IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID 等
  • 高质量输出:训练于约 60K 人体文本 - 视频对数据集
产品 UID: 10695000
数字人 视频生成 人像生成