≡ AI工具
DeepSeek-OCR – DeepSeek团队开源的视觉语言模型
DeepSeek-OCR是什么
DeepSeek-OCR 是 DeepSeek 团队推出的视觉语言模型,专注于通过光学压缩技术高效处理长文本内容。模型由 DeepEncoder 编码器和 DeepSeek3B-MoE 解码器组成,能在保持高分辨率输入的同时,显著降低激活内存和视觉标记数量。模型在 10 倍压缩比下 OCR 精度可达 97%,在 20 倍压缩比下仍能保持 60% 的准确率。DeepSeek-OCR 支持多种分辨率模式,适用多语言文档处理,能解析图表、化学公式等复杂内容,为大规模文档处理提供高效解决方案。