下载此文档

OCR识别系统设计与研究.pdf


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/ 7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 7 下载此文档
文档列表 文档介绍
邱锡良:OCR 识别系统设计与研究·1·

OCR 识别系统设计与研究

(工程技术学院光电工程系电子科学与技术邱锡良)
(学号:2001301075)

内容摘要:光学字符识别技术(简称 OCR)是计算机自动、高速地辨别图片上的文字,并
将其转化为可编辑文本的一项实用技术。它是新一代计算机智能接口的一个重要组成部分,也是
模式识别领域的一个重要分支。它涉及到图像处理、人工智能、形式语言、自动化及统计决策理
论等学科。本文阐述了当今 OCR 识别的状况以及介绍一种较为简单且又与常用模版匹配不同的
识别方法,并将其应用于一个实例:数字与字母的识别。文中将详细介绍其过程以及具体的实现、
方案的改进。程序采用 VC++ 编写,具有友好的 GUI 界面。
关键字:光学字符识别技术、模版匹配、数字识别、字母识别、VC++
教师点评:邱锡良同学研究了各种 OCR 技术在号码识别中的优缺点,并结合各种方法的优
点提出了采用基于区域特征的模板匹配方法进行识别,这种方法不仅实现相对简单,而且对于特
定的号码识别应用中效果很好。他还用 VC++设计和实现了整个 OCR 识别系统,系统最后达到
了很好的识别率,具有较高的实用性。(点评教师:刘承香,副教授)

一、绪论
OCR 识别的由来
随着计算机技术的推广应用,人类越来越多地依赖计算机获得各种信息,大量的信息处理
工作也都转移到计算机上进行。现代社会绝大部分的信息是以图书形式进行保存和传播的,这使
得要以计算机处理大量的信息就需要更长的时间,影响着计算机处理的效率。因此,需要有一种
能够将信息高速、自动的输入到计算机的方法。目前出现的文字输入的方法,如五笔输入法等,
其输入速度还是不高。所以,能够实现文字信息高速、自动输入的只能使计算机自动识别技术,
即光学字符识别技术。
模式识别研究方法简介
图像识别是对处理后的图像进行分类,确定类别名称。它可在分割的基础上选择需要提取
的特征,并对某些参数进行测量,再提取这些特征,最后根据测量结果作分类。对图像识别环节
来说,输入的是图像,输出的是类别和图像的结构分析,而结构分析的结果则是对图像的描述,
也是对图像重要信息的理解和解释。这里要注意的是,图像分割不一定完全在图像处理时进行,
对有些问题,要一面进行分割,一面进行识别。所以说,图像处理和图像识别是相互交叉的。对
于 OCR 识别来说,它大致可以分为结构模式识别和统计模式识别。
(1)结构模式识别——结构模式识别方法一般需要先抽取基本的笔画作为基元,由这些基
元构成部件,再由部件的组合来描述字符,最后利用形式语言及自动机理理论进行文法推断。其
优点在于对于字符形状的稍变适应性强,区分相似字能力强;但是抗干扰能力差,这些因素直接
影响到结构上的提取难度。而且结构模式识别的描述是十分复杂的,需要经过大量的计算。
(2)统计模式识别——统计模式识别方法是先提取待识别模式的一组统计特征,然后按照
一定准则所确定的决策函数进行分类判别。这样的识别方法具有良好的鲁棒性和较好的抗干扰能
力,但是,可以用来区分“敏感部位”的差异也随之消失,因此区分相似字的能力较差。
结构模式识别和统计模式识

OCR识别系统设计与研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 7
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 中国课件站
  • 文件大小 0 KB
  • 时间2011-10-18
最近更新