AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
SAM 2.1 – Meta 开源的视觉分割模型
Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式
ShowUI – 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型
NVLM – 英伟达推出的多模态大型语言模型
Promptriever – 信息检索模型,支持自然语言提示响应用户搜索需求
LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型
Devika – 开源的AI编程工具,理解和执行复杂的人类指令
iDP3 – 斯坦福大学联合多所高校推出的改进型3D视觉运动策略
Proactive Agent – 清华联合面壁智能开源的新一代主动Agent交互范式