-
中英文资料对照外文翻译文献综述
一种在线图像编码识别系统的设计
摘要
:本文介绍了在线图像编码字符识别系统的设计与实现过程
,对其中
重点环节进行了分析与研究,给出了主要环节问题的解决方法,在识
别算法上,结合模板匹配与特征识别,提出了基于特征加权的模板匹
配算法
,该算法对提高字符识别率提到了较好的作用。
关键词
:图像处理
;
模式识别
;
特征加权
;
软件设计
0
引言
图像
编码字符识别的研究目前仍是国内外一个重点研究课题,它具有
广泛的应用背景,比如车
牌号码自动识别、邮政编码的自动识别、试卷自
动阅读、报表自动处理等,由于这种在线
图像编码字符的识别都具有一些
共性,本文结合在线轮胎编码字符识别系统的设计,对一
般图像编码字符
识别系统进行了阐述,对关键环节进行了研究与分析,该方法对其它在线
图像编码字符系统的开发具有一定指导意义。
1
在线图像编码识别系统流程
在线图像编码字符识别系统主要包括数字图像的采集、存储、图像预
处
理、编码图像提取、编码特征提取、编码识别和后续处理等一些环节,
其流程图如图
p>
1
所示。
编码图像的采集与存储
编码特征提取与识别
后续处理
图像预处理
图
1
在线图像编码字符识别系统流程图
在
线轮胎图像编码字符识别系统要求对通过生产流水线上每一个轮胎
采集含有轮胎编码的图
像,
然后通过对图像的处理,
提取出轮胎编码特征,
采用合适的识别算法将每一位编码字符进行识别。由于轮胎编码字符在轮
胎
上有一定变形,且摄像角度不同,得到的编码图像差异也很大,规律性
差,所以编码图像
的预处理和识别算法的选取显得尤为重要。
2
图像采集与存储
< br>在线编码图像通常使用数码摄像机、数码照相机、数码摄像头等设备
采集并输入计
算机进行处理,
本系统采用
QuickCamPro4000<
/p>
数码摄像头采
集轮胎编码图像
,
直接按
JPG
格式存储。
编码图像一般都要先转成
BMP
图
像格式,因为
BMP
格式己经成为
PC
领域事实上的标准——几乎所有为
Windows
操作系统设计的图像处理
软件都支持这种格式的图像。
BMP
是
Windows
的原始位图
格式,它可以
用于保存任意类型的位图数据,
可以支持所有的屏
幕分辨率和
Windows
所
支持的颜
色组合。一般情况下,为了保证显示的高效率,它对图像数据没
有任何的压缩,所以一幅
很小的位图就可能占据相当大的空间。
1
BMP
位图文件包括位图文件头、
位图信息头、
调色板、位图数据区四
个
部分,位图文件头由
14
个字节构成,位图信息头由
40
个字节构成,调
色板的大小取决于色彩数,单
色图像调色
板占
8
< br>个字节,
16
色图像调色板占
6
4
个字节,
256
色图像调色板占
p>
1024
个字节,
2
24
色图像没有调色板,位图数据区内数据按行顺序自下而上、自
左而右排列。
3
图像预处理
图像预处理主要包括有:图像灰度化、图像降噪与增强、编码区边缘
检测、图像几何校
正、编码区图像提取、编码图像二值化、字符分割、字
符归一化等。下面介绍几个关键环
节的处理过程。
3.1
图像灰度化处理
编码图像通常是彩色
的,实际识别用的图像是灰度图,所在需要先将
彩色编码图像转换为灰度图像。在
RGB
颜色模型中,如果
R=G=B
,则颜色
(
R
,
G
,
B
)表示一种黒
白颜色,其中
R=G=B
的值叫灰度值,灰度化处理
就是使彩色的
R
、
G
p>
、
B
分量值相等的过程。常用灰度化处理方
法是加权平
均值法,即
R=G=B=
(W
R
R+W
G
G+W
B
B)/3
其中,
W
R
、
W
G
、
W
B
< br>分别是
R
、
G
< br>、
B
的权值,
实验和理论证明,
当
W
R
=0.
3,
W
G
=0.59,
W
B
=0.11
时,
p>
即当
R=G=B=0.30R+0.59G+0.11B
时,
能得到最合理的灰度图像。
3.2
图像增强处理
3.2.1
直接灰度变换
①线性灰度变换:假设图像灰度是线性变化的,如原图像
f(x,y)<
/p>
灰度范
围为
[a,b]
< br>,要求变换后图像灰度范围达到
[c,d]
,根据线性规
律,则变换后
图像
g(x,y)
为:<
/p>
g
(
x
,
y
)
?
d
?
c
f
(
x
,
y
)
?
c
(
1
)
p>
b
?
a
②非线性变
换——对数变换和指数变换。当需要扩展低灰度区、压缩
高灰度区时使用对数变换,当需
要扩展高灰度区时使用指数变换。
3.2.2
平滑滤波
—
降噪
由于噪声对应图像中的区域边缘等灰度值具有较大较快变
化的部分,
属高频分量,所以使用低通滤波器(即平滑滤波器)降噪。同时平滑还可
p>
以使图像模糊,有利于在提取较大的目标前去除较小的细节或将目标内的
小间断连接起来。
平滑降噪的方法是使用模板对图像进行
卷积运算,线性平滑滤波器最
常用的模板是如图
2
所示的
3
×
3
模板,
将此模板与图像中像素按如下方法进
行卷积运
算,可得到平滑降噪的图像。
①将模板在图中漫游,并将模板中心与图中每个像素位置重合;
②将模板上系数与模板下对应像素相乘;
③将所有乘积相加;
④将和赋给图中对应模板中心位置的像素。
< br>非线性平滑滤波器最常用的是中值滤波器,它将区域中所有的值按大
小进行排序,
将排序后位于中间的像素值赋予中心像素。中值滤波可有效
2
地去除随机噪声,能得到较好的视觉效果。
3.3
编码区边缘检测
边缘是灰度值不连续的结果,
可利用求一阶和二阶导数的方法检测到。
p>
因为在边缘地带导数值大,而非边缘的地方导数值小。由于数字图像是离
散的,不能求导数,可以通过卷积的方法用差分近似代替微分。
< br>效果较好的边缘检测算法是
Sobel
算子。
Sobel
算子是一种梯度幅值
,
分别利用垂直算子
Sx
、
水平
算子
Sy
来获取编码区垂直边缘
和水平
边缘,即在水平和垂直方向上使用如图
3
所示的两个不同的卷积
模
板,得到如图
4
所示的边缘检测结果
。
1
2
1
0
0
0
-1
-2
-1
-1
0
1
-2
0
2
-1
0
1
M
?
2<
/p>
2
s
x
?
s
y
图
2
平滑滤波器模板
图
3
Sobel
边缘检测模板
图
4
So
bel
算子边缘
检测结果
3.4
图像几何校正
Hough
变换可以检测出编码区图像倾斜角度,根据此角度进行旋转变
p>
换可使编码区图像得到校正。
Hough
变换可以将图像空间
XY
中的直线(<
/p>
y=px+q
)检测问题转换到
参数空间
PQ
中点的检测问题,在参数空间
PQ
里,建立一个累加数组
Sum(p,q)
,对每一个图像空间中给定边缘点,让
p
取遍所有可能值,根
据
直线方程
q=-xp+y
计算出对应
的
q
,对
Sum(p,q)
进行累加,得到
Sum(p,q)
的值就是在
p>
(p,q)
处共线的点的个数,
(p,q)
的值就是图像空间中直线的斜率
和截距,由斜率得到图像编码区
水平边缘角度。
3.5
字符切割
通过对编码字符区直接进行
水平扫描,由字符间距一般可以将字符区
域分割出来。也可以通过对编码字符区做垂直方
向投影运算,根据字符大
致宽度与字符总数,对字符进行切割。如图
5
所示是编码字符区及对应垂
直投影图。
< br>
图
5
编码字符及对应垂直投影
图
6
线性插值示意图
3.6
字符归一化处理
对分割出的字符从四个方向扫描,确定字符边界,然后采用线性插值
方法对
每个字符作归一化处理,
使每个字符归一为
32
×
16
点阵。
图
6
为线性
插值示意图,根据线性原理,
f(x
1
)
可由公式(
p>
2
)计算:
3
f
(
x<
/p>
1
)
?
(
f
(
x
2
)
?
f
(
x
0
))(
x
1
?
x
0
)
?
f
(
x
0
)
(
2
)
p>
x
2
?
x
0
4
识别算法设计
<
/p>
字符识别一般采取特征判别或模板匹配的方法,特征判别是根据特征
抽取的程度分阶段的、用结构分析的办法完成字符的识别。模板匹配即是
根据字符的知
识采取按形匹配的方法,模板匹配一般分为两类:一类是直
接利用输入的二维平面图像与
字典中记忆的图形进行匹配;另一类是抽出
部分特征与字典进行匹配。
< br>
轮胎编码图像中字符仅涉及部分英文字符和
10
个阿拉伯数字,字符较
少,结构相对简单,因此具体识别时,既可以采
用图形匹配的方法,也可
以采用结构分析的方法。但由于轮胎上编码字符有一定变形,且
有断裂现
象,所以直接模板匹配与直接特征抽取方法识别率都不理想,本系统使用
了模板匹配与特征识别相结合的基于特征加权的模板匹配识别算法,其字
符识别率比简单模板匹配算法和特征识别算法识别率都有不同程度的提
高。
基于特征加权的模板匹配识别算法基本思路是:给模板中有字符笔画
p>
的点分配不同的权重,位于笔画中心的点权重最高,位于笔画边缘的点权
重最低,
然后将样本模板与标准模板逐点模糊匹配,
按模糊
识别规则识别。
5
结论
本文
结合轮胎编码识别系统的实现对在线图像字符编码识别系统的设
计进行了阐述,提出了一
种模板匹配与特征匹配相结合的识别算法,该方
法对传统的模板匹配算法进行了改进,<
/p>
提高了变形、
断裂等字符的识别率。
这种
方法在试验中得到了验证,取得了令人满意的效果。
The Development of A Kind
of Online Image Code
Recognition System
4