AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
INFP – 音频驱动的生成逼真面部表情和头部姿态的AI框架
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token
AgentScope – 阿里开源的多智能体开发平台
LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术
3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目
ERA-42 – 星动纪元推出的端到端原生机器人大模型
Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型
VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集