≡ AI工具

HunyuanVideo-Foley – 腾讯混元开源的视频音效生成模型

分类:AI工具
HunyuanVideo-Foley – 腾讯混元开源的视频音效生成模型

HunyuanVideo-Foley是什么

HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型。模型能根据输入的视频和文字描述,生成与视频画面精准匹配的高质量音效,解决现有AI视频生成中音效缺失的问题。模型通过大规模高质量的文本-视频-音频数据集训练,用创新的多模态扩散变换器架构和表征对齐损失函数,实现强大的泛化能力、多模态语义均衡响应及专业级音频保真度,在多个评测基准上性能领先,广泛应用在短视频创作、电影制作等领域。

HunyuanVideo-Foley