AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
HunyuanOCR – 腾讯混元推出的端到端OCR视觉语言模型
FLUX.2 – Black Forest Labs开源的AI图像生成与编辑模型
ViMax – 港大开源的多智能体视频生成框架
Z-Image – 阿里通义推出的图像生成模型
Depth Anything 3 – 字节跳动推出的视觉空间重建模型
DeepSeek-Math-V2 – DeepSeek开源的数学推理模型
StepAudio R1 – 阶跃星辰开源的原生音频推理模型
Ito – 开源的AI语音听写工具,口语意图可转为文本
GELab-Zero – 阶跃星辰开源的 GUI Agent 模型