AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
AniTalker – 上海交大开源的对口型说话视频生成框架
混元DiT – 腾讯混元开源的文生图扩散模型Hunyuan-DiT
Veo – 谷歌推出的可生成1分钟1080P的视频模型
CogVLM2 – 智谱AI推出的新一代多模态大模型
Universal-1 – AssemblyAI推出的多语种语音识别和转换模型
Codestral – Mistral AI推出的代码生成模型,支持80+编程语言
ChatTTS – 开源的用于对话的生成式语音合成模型
Seed-TTS – 字节跳动推出的高质量文本到语音生成模型
Qwen2 – 阿里云开源的新一代通义千问大模型