≡ AI工具

AudioFly – 科大讯飞开源的文生音效模型

分类:AI工具
AudioFly – 科大讯飞开源的文生音效模型

AudioFly是什么

AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构,拥有10亿参数,通过大量开放数据集(如AudioSet、AudioCaps、TUT)及内部专有数据训练而成。AudioFly 能根据文本描述生成高质量音频,采样率高达44.1kHz,生成的音效与文本描述高度匹配。模型在单事件和多事件场景下均表现出色,在AudioCaps数据集上性能卓越,超越以往的音频生成模型。AudioFly 适用短视频配音、有声故事生成等领域,为声音创作带来无限可能。

AudioFly