≡ AI百科

什么是光学字符识别（Optical Character Recognition, OCR） – AI百科知识

分类：AI百科

光学字符识别（Optical Character Recognition, OCR）是一种将文本图像转换为机器可读格式的技术。通过自动数据提取，快速将图像中的文本转换为机器可读的格式。它有时也被称为文本识别，能够从扫描的文档、相机图像和纯图像PDF中提取和重新利用数据。OCR的概念最早由德国科学家Tausheck在1929年提出。1974年，Ray Kurzweil创立了Kurzweil Computer Products, Inc.，推出了全字体OCR产品，能够识别几乎任何字体打印的文本。包括简单OCR、光学标记识别（OMR）、智能字符识别（ICR）和智能单词识别。采用OCR技术可以减少或消除冗余的手动输入，简化工作流程，实现文档路由、内容处理和文本挖掘准备工作的自动化，节省存储成本，并提供最新、最准确的信息以改善服务。