AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
FlashVideo – 字节联合港大推出的高分辨率视频生成框架
ACE++ – 阿里通义推出的升级版图像生成与编辑模型
LLaVA-Rad – 微软推出的小型多模态模型,专注于临床放射学报告生成
Satori – 开源的大语言推理模型,具备自回归搜索和自我纠错能力
Goku – 港大和字节联合推出的最新视频生成模型
AnythingLLM – 开源的全栈 AI 客户端,支持本地部署和API集成
VideoCaptioner – AI视频字幕处理工具,支持字幕样式调整和多格式导出
Zonos – ZyphraAI 开源的多语言 TTS 模型
InspireMusic – 阿里通义实验室开源的音乐生成技术