光学符号识别 - 知识百科

光学符号识别

更新时间：2023-08-16 09:59

OCR技术是光学字符识别的缩写(Optical Character Recognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的文本的计算机输入技术。可应用于银行票据、大量文字资料等、档案卷宗、文案的录入和处理领域。

技术简介

OCR通过扫描和摄像等光学输入方式获取图像上的文字信息，利用各种模式识别算法分析文字形态特征，判断出文字的标准码，并按通用格式存储在文本文件中。所以OCR是一种非常快捷、省力的文字输入方式，也是在文字数据量大的今天被人们广泛采用的输入方法。

OCR技术并非一项新的技术，远在计算机之前就有了。早在1929年，德国的科学家Tausheck首先提出了OCR的概念。几年后，美国科学家Handel也提出了利用光学技术对文字进行识别的想法。在20世纪60、70年代，世界各国就开始有OGR的研究，在研究的初期，多以文字的识别方法研究为主，且识别的文字仅为0—9的数字。以同样拥有方块文字的日本为例，1960年左右开始研究OCR的基本识别理论，初期以数字为对象，直至1965—1970年之间开始有一些简单的产品，如印刷文字的邮政编码识别系统，用来识别邮件上的邮政编码，帮助邮局做区域分信的作业。也因此至今邮政编码一直是各国所倡导的地址书写方式。

OCR技术主要是研究计算机自动识别文字的技术。OCR系统涉及图像处理、模式识别、人工智能、认知心理学等许多领域。

系统构成

一个OCR系统可分为3个部分。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}