≡ AI百科

什么是光学字符识别(Optical Character Recognition, OCR) – AI百科知识

分类:AI百科
什么是光学字符识别(Optical Character Recognition, OCR) – AI百科知识

光学字符识别(Optical Character Recognition, OCR)是一种将文本图像转换为机器可读格式的技术。通过自动数据提取,快速将图像中的文本转换为机器可读的格式。它有时也被称为文本识别,能够从扫描的文档、相机图像和纯图像PDF中提取和重新利用数据。OCR的概念最早由德国科学家Tausheck在1929年提出。1974年,Ray Kurzweil创立了Kurzweil Computer Products, Inc.,推出了全字体OCR产品,能够识别几乎任何字体打印的文本。包括简单OCR、光学标记识别(OMR)、智能字符识别(ICR)和智能单词识别。采用OCR技术可以减少或消除冗余的手动输入,简化工作流程,实现文档路由、内容处理和文本挖掘准备工作的自动化,节省存储成本,并提供最新、最准确的信息以改善服务。