AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
DeepCode – 港大实验室推出的多Agent代码生成平台
VibeVoice – 微软推出的开源文本转语音模型
EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架
SpatialGen – 群核科技开源的3D场景生成模型
SpatialLM 1.5 – 群核科技推出的空间语言模型
WhisperLiveKit – 开源AI语音识别工具,支持说话人识别
Wan2.2-S2V – 阿里通义开源的多模态视频生成模型
Gemini 2.5 Flash Image – 谷歌推出的图像生成和编辑模型
Youtu-agent – 腾讯优图推出的开源智能体框架