AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
Whisper Input – 开源AI语音输入工具,支持多语言实时转录和翻译
Fast3R – Meta 联合密歇根大学推出的多视图3D重建方法
Tarsier2 – 字节跳动推出的视觉理解大模型
VideoLLaMA3 – 阿里达摩院推出的多模态基础模型
Baichuan-Omni-1.5 – 百川智能开源的全模态理解模型
TeleAI-t1-preview – 中国电信推出的复杂推理大模型
Qwen2.5-1M – 阿里通义千问开源的语言模型,支持100万Tokens上下文
DiffuEraser – 阿里通义实验室推出的视频修复模型
Janus-Pro – DeepSeek 开源的统一多模态模型