AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
M2UGen – 腾讯联合国立大学推出多模态音乐理解和生成框架
Nemotron-Mini-4B-Instruct – 英伟达推出的开源小型语言模型
PoseTalk – 文本和音频驱动的生成会说话的头部动画开源项目
Follow-Your-Canvas – 腾讯与清华合作推出的高分辨率视频扩展技术
Filmfotos – 模拟和还原胶片质感效果的LoRA模型
Faster Whisper – 一款高效语音识别工具,实现高速转写和快速推理
SwiftBrush V2 – 文本到图像的单步扩散模型,性能与多步模型相媲美
Jina-embeddings-v3 – 专为多语言和长文本上下文检索设计的文本嵌入模型
Click2Mask – AI图像编辑技术,通过简单点击和内容描述实现智能编辑