AI项目和框架
本栏目介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
video-subtitle-master – 开源AI字幕生成工具,支持批量为视频或音频生成字幕
DualPipe – DeepSeek 开源的双向流水线并行技术
EPLB – DeepSeek 开源的专家并行负载均衡器
Profiling Data – DeepSeek开源训练和推理框架的性能分析数据
Phi-4-Multimodal – 微软最新推出的多模态语言模型
R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调
Phi-4-Mini – 微软推出专注于文本任务的小型语言模型
IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音
Scribe – ElevenLabs 推出的高精度语音转文本模型