关于字符相关论文范文参考文献,与基于形状的字符识别算法相关毕业论文提纲

本论文是一篇关于字符相关毕业论文提纲,关于基于形状的字符识别算法相关本科论文范文。免费优秀的关于字符及凹凸及区域方面论文范文资料,适合字符论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘要：现有基于字符形状的识别算法依赖其他辅助方法识别字符,对此提出改进.采用背景赋值描述字符的凹凸性特征,提出凹凸对称性和凹凸区域夹角的计算方法作为补充,充分利用字符的凹凸性特征设计多级分类器,完全采用凹凸性特征进行多级分类识别,正确识别25个大写英文字符和10个阿拉伯数字,不受字符大小与倾斜影响.实验结果表明,在此提出的改进算法克服了现有算法缺陷,扩展了凹凸性特征的可区分范围,突出了基于形状的算法的优越性.

关键词：字符识别；形状特征；凹凸性特征；凹凸对称性；凹凸区域夹角

中图分类号：TN91934；TP391文献标识码：A文章编号：1004373X（2013）16007704

0引言

字符特征的提取是字符识别中的关键技术.目前应用较为广泛的是提取字符轮廓特征为主的方法,如采用链码描述字符线条、平面曲线及区域边界等[13].此类方法可以较好地提取景物的轮廓,但对于字符大小、倾斜等因素较为敏感,因此需要经过归一化、倾斜校正和细化等预处理.这些处理过程较为繁琐,特别是细化过程,无论是并行算法[4]或是模板匹配算法[5],最终获取理想的单像素图像非常困难,对于字符的准确识别造成不利影响.文献[67]所提基于字符形状的识别算法,根据字符的整体形状特征,如字符的凹凸性,提取字符特征,不受字符大小、倾斜的影响,省去归一化、倾斜校正和细化处理,提高字符识别的速度,是一类较为简单、实用的方法.

采用以字符凹凸性特征提取为主的方法识别字符,简单易行.但在分类识别时,需用辅助方法,如文献[6]使用弯曲度计算提取直线特征,文献[7]使用链码描述提取直线和角点等.这些辅助方法除了需要额外的处理时间之外,实际上仍受到字符大小、倾斜等因素的影响.文献[6]所提算法在字符笔画弯曲度计算中,会受到字符倾斜的影响；文献[7]提出的算法,链码描述直线特征需将字符细化.

对此,本文提出采用新的字符凹凸性特征分析与提取方法,针对25个大写英文字符（不包含“I”）及10个阿拉伯数字（0～9）,探讨该种方法的可行性及优势.

1字符形状的凹凸性描述

字符形状的凹凸性特征指字符呈现于人眼的凹凸曲直性.字符的凹凸性特征描述有多种方法[810],本文采用背景赋值法.首先逐像素扫描图像并选择背景点（像素值为1）,从该像素向其8邻域方向作射线,判断射线是否与图像前景点（像素值为0）相交,将有交点的射线数作为背景值赋值给当前背景点.图1（a）所示的图案进行背景赋值后得到图1（b）所示的赋值背景图像.根据背景赋值,可实现对字符的凹凸性特征描述.

图1（b）中,背景值为8的区域表示该区域的点向8个方向所做射线均与前景点相交,即该点被字符的笔划包围,为圈区域,如图1（a）中的L1、L2.背景值为5～7的点则处于字符笔划的凹陷区,为凹区域,如图1（a）中的LC、RC、UC、DC.显然,不同字符呈现的凹凸性特征具有明显的区别,且抗变性强.

本文采用圈区域数量、凹区域数量及方向、圈区域的大小、凹凸对称性、凹凸区域夹角、凹凸区域位置和宽高比共7个特征识别字符.

2凹凸性特征提取

（1）圈区域L

如上所述,背景赋值为8即认为是圈区域.但在实践中发现如Arial等部分字体,由于笔划包裹性较强,字符中存在凹陷较深的区域,简单地按照背景赋值法赋值则会将其凹区域的边缘赋值为8,导致圈区域的误判.如图2（a）所示字符“6”.

为避免该问题出现,增加了二次赋值步骤,即对于赋值为8的像素,还要检测其8邻域是否在圈内,将不在圈内的像素赋值为9,认定其为凹区域,如图2（b）所示.

（2）凹区域C

图1（a）中存在4个特征不同的凹区域,为加以区别,做如下定义：

基于形状的字符识别算法参考属性评定
有关论文范文主题研究:	字符类论文范文	大学生适用:	研究生毕业论文、自考毕业论文
相关参考文献下载数量:	11	写作解决问题:	写作参考
毕业论文开题报告:	标准论文格式、论文选题	职称论文适用:	职称评定、高级职称
所属大学生专业类别:	写作参考	论文题目推荐度:	最新题目

左凹LC：左侧无字符笔划的凹区域；

右凹RC：右侧无字符笔划的凹区域；

上凹UC：上方无字符笔划的凹区域；

下凹DC：下方无字符笔划的凹区域.

（3）圈的大小LV

有圈的字符较多,显然圈的大小可作为重要特征区别不同字符.如D、O为大圈,4、R为小圈.定义LV为圈区域面积与字符面积之比,若LV>0.7为大圈,而LV<0.7则为小圈.

（4）凹凸对称性CS

对于凹凸性特征相似的字符,如5和S,识别难度较大.文献[6]采用计算水平交点数的方法区别.此种方法具有一定局限性,如5和S下部都有2个交点,而上部虽然交点数有差异,但较难精确测算,同时受到字符倾斜等因素影响会出现误判.

研究中发现如5和S、2和Z,虽然特征相近,但大多数常见字体中S和Z的上下凹区域均对称,而5和2则不对称,如图3所示.

因此定义凹凸对称性CS,计算字符两个不同凹区域的相似程度以区别这些字符.简单起见,定义字符上下凹区域的面积之比为对称性CS,若CS等于1则表示对称.也可根据具体情况设置CS门限以体现字符凹凸对称程度.

（5）凹凸区域夹角CA

字符U和V、H和N特征相近.但“V”、“N”中存在锐角凹区域,即左右两侧笔划夹角成锐角,而“H”中存在直角凹区域,如图4所示.

怎样撰写字符本科论文
播放:28610次评论:3519人

图5所示为8邻域示意图.

定义[CA等于i等于29pi].

若p1在赋值背景的凹凸区域中,其8邻域中某像素是笔划的则给对应邻域赋值为1,是凹区域的则给对应邻域赋值为0.那么在锐角凹区域中总会找到一点满足CA>5；而直角凹区域中总会找到一点满足CA等于5；在不含锐角/直角的凹区域则找不到这样的像素.

（6）凹凸区域位置CP

定义CP<0.5表示凹凸区域在字符图像上半部分,CP>0.5则表示凹凸区域在图像的下半部分.（7）宽高比CR

本文出处:http://www.sxsky.net/benkelunwen/060184482.html

字符0和O可用宽高比区别,设若CR<0.75对应0,CR>0.75对应O.

3实验结果与分析

通过对35个字符的凹凸性特征提取和分析,设计多级分类器,每级使用一项或几项特征条件,将字符逐级分类识别.在VC6.0环境中,针对大量包含常见字体的32×32字符图像进行识别的实验.

3.1一级分类

以无圈、有圈（1圈/2圈）作为分类特征,将字符分为3类,如表1所示.

表1一级分类结果

3.2二级分类

二级分类结果如表2所示.二级分类根据一级分类结果中的字符凹凸性特征,灵活选用分类特征进行逐级分类,将一级分类中的3类字符分别分为多个子类,如表2所示.

对于类1,先筛选出含有左凹区域的字符得到子类11；在剩余字符中分别依据含有1个和2个右凹区域得到子类12、13；含有上凹或下凹区域的字符分为子类14；不含凹区域的只有字符“1”,作为子类15.对于类2则选用含有大或小圈区域作为分类特征,得到子

关于字符相关论文范文参考文献,与基于形状的字符识别算法相关毕业论文提纲

相关推荐

农田有关论文例文,与强化农田水利建设服务现代农业生产相关电大毕业论文范文