小波变换的特定图像识别的应用研究
申恩庆整容-联欢会策划
华南师范大学
硕士学位论文
基于小波变换的特定图像识别的应用研究
姓
名:李观海
申请学位级别:硕士
专业:电路与系统
指导教师:李榕
20090
501
基于小波变换的特定图像识别的应用研究
基于小波变换的特定图像识别的
应用研究
摘要
随着图像识别技术的发展,图像识别技术在实际应用当中的作用越来越受关
注。特别是金融业产品的广泛应用就是图像识别技术的发展的背景。然而从现有
的产品来看,存在着速
度慢、不稳定、能识别的图像种类少等种种问题,因此,
为了支持我国经济的发展,有必要对其功能等作
进一步的开发研究,本论文从软
件算法方面对特殊图像识别进行研究,利用小波变换的多分辨率功能,对
特殊图
像进行基于小波系数的特征提取。
在特征提取之前,必须对图像进行预处理,针对实际应
用考虑,本论文只对
图像进行倾斜校正和选感兴趣区域两种通用处理。图像倾斜校正处理是利用最小二乘直线拟合原理进行确定倾斜角的,再在有倾斜角的基础上通过旋转方法对原
图进行校正,大量的
实验显示,其校正结果非常理想。
在特征提取部分,本论文主要利用了小波变换后的高频部分信息的系数
作为
特征值。一幅图经小波变换后分为低频信息和高频信息,其中低频信息占原图像
90%左右
的信息,而高频信息却保留了原图像的水平、垂直和对角线的信息,这
三部分信息对图像特征提取作用很
大,所以本论文选用这三部分的系数作为图像
的特征值。在识别分类方法中,本论文选用了欧式最小距离
法进行分类,这种算
法运行速度很快,效果也不错。
图像识别的算法能不能成功的运用到实际中
去,主要考虑识别率和算法的速
度,经过大量的对特定图像的实验,小波系数特征的提取和选区域的完美
结合,
最终的识别率达到99.8%左右的效果,有较好的实用价值。
关键字:小波变换;特征
提取;模式识别;倾斜校正
摹于小波变换的特定图像识别的应用研究
Based
On
Wavelet
Transform
Of
A
Particula
r
Application
Of
ImageRecognition
Abst
ract
With
the
development
of
image<
br>recognition
technolo—gles.image
recogniti
on
teehnology
inwhichtheroleofthe
practic
alapplication
of
increasing
concern.In
particular
thefinancial
sector
iSthe
product
of
the
widely
used
imagerec
ognition
technology
background.However,judgi
ng
a
fromthe
existingproducts,there
is
a
slow,
unstableand
the
image
t
o
identi【fy
small
numberofsuch
problem
s,therefore,in
order
to
support
China’
S
economic
development.it
iS
necessary
forits
function,such
as
the
develo
pment
offurther
research,in
thisthesissof
tware
algorithms
from
image
ona
rec
ognitionspecialstudy
ofthe
use
ofmultires
olutionwavelet
function,a
special
thefeat
ureextraction.
image
of
the
waveletcoe
fficientsbased
practicalapplications.this
th
esis
only
addresstwo
common
least.squa
resfitting
inclination
based
on
a
a
reas
on
Beforethefeature
extraction.image
pre.processing
must
be
done,considered
for
uses
to
image
correctionandtiltth
eelection
to
use
of
interest.Image
tiltcorrectioniS
to
the
principle
ofstraight
line
to
determine
thetiltangle.and
theninthe
angle
of
the
method
of
image
rotation
for
correc
tion.a
large
numberof
experiments
show
edthatthecorrectionwas
very
satisfactory
results.
In
the
featureextraction
part
,the
main
advantage
of
this
thesis,
after
thewavelet
transfoI'ITIcoef矗cientsofhighfrequency
infornlation
as
part
o
f
eigenvalues.A
drawingby
following
th
e
wavelet
tranSform
into
low.frequency
information
and
hig}1.frequency
infor
mation,which
accounts
for
low.frequencyinformation
about
90%of
the
original
image
information.and
high.frequency
information
butretains
the
original
im
age
ofthe
horizontal,vertical
and
diag
onal
information,these
three
some
info
rillation
on
therole
of
image
featu
reextraction
iS
why
this
Paper
the<
br>three—part
selectionof
coe踊cient
value
s
as
image
features.Intheidentificationof
classifica.tion
methods,this
paper
se
lected
a
minimum
runs
distance
betw
een
a
European.style
classification
me
thod,thisalgorithmvery
fast,the
effectis
not
bad.
Image
recognition
algorithmCan
be
successfullyapplied
to
the
practice,and
the
main
considerations
and
algorithms
to
identify
the
rate
of
speed,after
a
large
number
o
f
images
coefficients
rate
of
onaspecific
experiment.extraction
ofthe
ch
aracteristics
ofwavelet
and
the
perfec
t
combination
of
regional
elections.th
efinal
recognition
99.8%of
theresults.abe
tter
practical
value.
KEY
WORDS:wavele
t
transform;feature
extraction;pattern
re
cognition;tilt
correction
华南师范大学学位论文原
创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独
立进行研究工作所取得
的成果。除文中已经注明引用的内容外,本论
文不包含任何其他个人或集体已经发表或撰写过的研究成果
。对本文
的研究做出重要贡献的个人和集体,均已在文中以明确的方式标明。
本人完全意识到此
声明的法律结果由本人承担。
学位论文使用授权声明
本人完全了解华南师范大学有关收集、保留
和使用学位论文的规
定,即:研究生在校攻读学位期间论文工作的知识产权单位属华南师
范大学
。学校有权保留并向国家主管部门或其指定机构送交论文的电
子版和纸质版,允许学位论文被检索、查阅
和借阅。学校可以公布学
位论文的全部或部分内容,可以允许采用影印、缩印、数字化或其他
复
制手段保存、汇编学位论文。
(保密的论文在解密后遵守此规定)
年后解密适用保密论文注释:
本学位论文属于保密范围,在
本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。
论文作者签名:考、玩询.
日期:
导师签名:
听年D扩月矽日
日期:夕々年汐扩月乙.7日
基于小波变换的特定图像识别的应用研究
第一章
绪论
1.1论文背景及意义
随着图像识别近20年的发展,图像识别在各个领域的应用越发突显
其重要
性,特别是在金融业的作用更为明显。银行业的信息化、自动化发展已成必然趋
势,自动
取存款机(ATM)的应用,这正是银行业务自动化的体现。然而从目前现
有的国内产品来看,就拿自动
存款机来说,存在着速度慢、不稳定、能识别的币
值种类少等种种问题,因此,为了加快银行业的全面自
动化的步伐,有必要对其
功能等作进一步的开发研究,以更好地为银行业服务:为我国的金融业走向国际
化打下坚定的科技基础。
同样近些年兴起的小波变换已经成为图像分析的重要工具,小波变换的
多尺
度分解特性更加符合人类的视觉机制,与计算机视觉中的由粗到细的认识过程十
分相似,更
加适合图像的信息处理。小波变换能给出信号完全而稳定的表示,能
够得到不同尺度下信号的形式。从特
征提取的角度来分析,其变换后的信号正包
含了信号的主要特征,如大致形状、变化位置及幅度等。二维
小波变换分量具有
方向选择性,可将原始图像分解成平滑子图、水平子图、垂直子图和斜向子图。
所以,对特定图像(如卢布纸币)不同的图案结构进行认真的观察和分析,可以
很好很有效的从纸币图
像中提取有用的特征分量。因此,采用小波变换能够实现
结构和统计特征相结合的识别方法提取纸币图像
特征。
1.2图像模式识别的发展
图像模式识别的发展来源于模式识别的发展,图像识别只是模
式识别的一个
分支;模式识另lJ(Pattem
Recognition)是人类的一项基本
智能,在日常生活中,人
们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代
人
工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
模式识别在2
0世纪60年代初迅速发展并成为一门新学科。
模式识要JIJ(Pattem
Recogni
tion)是指对表征事物或现象的各种形式的(数值的、
文字的和逻辑关系的)信息进行处理和分析,
以对事物或现象进行描述、辨认、
基于小波变换的特定图像识别的应用研究
分类
和解释的过程、是信息科学和人工智能的重要组成部分。
模式还可分成抽象的和具体的两种形式。前者如
意识、思想、议论等,属于
概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要
是
对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物的传感
器等对象进行
测量的具体模式进行分类和辨识。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感
知对象
的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的
理论和方
法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,
后者通过数学家、信息学专家和
计算机科学工作者近几十年来的努力,已经取得
了系统的研究成果。
应用计算机对一组事件或过
程进行鉴别和分类。所识别的事件或过程可以是
文字、声音、图像等具体对象,也可以是状态、程度等抽
象对象。这些对象与数
字形式的信息相区别,称为模式信息。
模式识别所分类的类别数目由特定
的识别问题决定。有时,开始时无法得知
实际的类别数,需要识别系统反复观测被识别对象以后确定。<
br>模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有
关系。它与人工智能、
图像处理的研究有交叉关系。例如自适应或自组织的模式
识别系统包含了人工智能的学习机制;人工智能
研究的景物理解、自然语言理解
也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像
处理的
技术;图像处理中的图像分析也应用模式识别的技术。
图像识别近些年是发展最快的几年
。目前图像识别主要运用在工业生产、军
事国防、医学医疗等多个方面,在我们日常生活中,图像识别的
产品几乎无处不
在。尽管这样,相对于图像识别理论的蓬勃发展,图像识别的应用和实践则显的
相对落后,究其原因,主要是算法的可实现性、通用性和有效性的底下引起的。
特别是算法的有效性,因
为图像识别的应用产品大多数是嵌入式系统的方式出现
的,嵌入式系统的特点是系统资源有限,而较好的
识别算法,一般都非常耗资源
的,因此,即使已经理论上实现的算法也未必能够真正而有效的应用到实际
系统
中去,所以我们在考虑一个具体应用的识别算法时,一定要考虑其算法的有效性
和可移植性
等实际因素。
4
基于小波变换的特定图像识别的应用研究
1.3本论文
主要研究的内容
本论文主要是针对特定图像(如纸币图像)识别算法进行研究,并对此识别
算法
的有效性和可移植性进行评定。
本论文的主要工作如下:
1.第一章绪论,阐述了本论文的背景
及意义和图像识别技术的发展状况。
2.第二章对图像识别系统的组成,图像识别的各种方法做了一些理
论阐述;
并对图像倾斜校正和图像特征提取的原理分别作了详细的分析。
3.第三章小波系数的
特征提取,从小波变换的基础理论开始讲解;分析和
研究现在运算速度最快的两种小波变换算法:Mal
lat算法和提升算法;最后对基
于小波变换的特征提取的方法进行了阐述和归纳。
4.第四章
是基于小波变换系数的纸币识别的实现,从系统设计到系统实现
详细的阐述了各步骤的主要算法实现;最
后是对运行结果进行了分析和总结。
5.第五章是总结和展望,总结本论文的主要完成工作和计划下一步
怎么完
善本算法系统。
基于小波变换的特定图像识别的应用研究
第二章
图像识别的概述
图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。
据统
计,在人类接受的信息中,视觉信息占了70%以上,也就是常说的“百闻不
如一见”。在许多场合,图
像所传递的信息比其他任何形式的信息更加丰富和真
切。随着数字图像技术的发展和实际应用的需要,出
现了另一类问题,就是不要
求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割
和
描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的-N新
兴技术科学—
—图像识别。它以研究某些对象或过程的分类与描述为主要内容,
以研制能够自动处理某些信息的机器视
觉系统,代替传统的人工完成分类和辨识
的任务为目的。例如金融业的自动取款机、点钞机等应用;从遥
感图像中分割出
各种农作物、森林资源和矿产资源等;根据医学图片分析发生病变的细胞形状和
颜色判断是否发生癌变;从气象观测数据或气象卫星照片准确预报天气;交通管
理系统中应用车牌自动识
别技术管理车辆等。因此,在当今社会,图像识别技术
已经在各个领域发挥着极其重要的作用。虽然图像
模式识别的研究取得了很大的
进步,但由于实际系统中涉及到很多的复杂的问题,面对这些问题,现有的
理论
和方法就显的有些不足。如何将这些方法结合实际问题加以应用,是绝大多数涉
足这一领域
所必须考虑的问题。
2.1图像识别系统
图像识别,简单地说,就是要把一种研究对象,根据其
某些特征进行识别并
分类。例如要识别写在卡片上的数字,判断它是0,l,2,…,9中的哪个数字,
就是将数字图像分成10类的问题,因此可以认为,对数字图像进行区别分类其
实质就是对图像
进行模式识别。这种识别早已存在人们的生活实践中。然而,随
着实践活动的扩大、深入和社会化的需要
,人们不仅需要识别分类数很多的事物,
而且被识别的对象内容也越来越复杂。特别是由于科学技术水平
的提高,使得各
种不同的研究对象“图像化’’或“数字化”,可采用某种技术把考察的对象转换
成图片、波形图以及若干数据,这些数据就可以代表所研究的对象。但是对于模
式识别来说,无论是数
据、信号还是平面图像或立体景物都是除掉它们的物理内
6
基于小波变换的特定
图像识别的应用研究
容而找出它们的共性,把具有同一共性的归为一类,而具有另一种共性者归为一类。图像模式识别的目的就是研制采用某种仪器或设备,自动处理某些信息,代
替人完成分类和辨识
的任务,并且能够快速而准确地进行图形识别。
一般来说,一个图像识别系统由以下几个部分组成。第一部分是图像信息的获取。它相当于对被研究对象的调查和了解,从中得
到数据和材料,对图像识
别来说就是把图片、底片和文字图形等用光电扫描设备
转换为电信号以备后续处理。
第二部分是
图像的预处理。这个处理过程的工作包括采用数字图像处理的各
种方法来消除原始图像的噪声和畸变,消
减无关特征而加强图像的系统感兴趣的
特征,如果图像包含多个目标的,还要对图像进行分割,将其分为
多个每个只包
含一个目标的区域。
第三部分特征提取。通常能描述对象的元素很多,为了节约资
源,节省计算
机存储空间、机时、特征提取费用,在满足分类识别正确率要求的条件下,按某
种
准则尽量选用对正确分类识别作用大得特征,使得用较少的特征就能完成分类
识别任务。这项工作的表现
为减少特征矢量的维数、符号、串字符数或简化图的
结构。
第四部分是判决或分类。即依据所提
取的特征,将前一部分的特征向量空间
映射到类型空间,把相应原图归属已知的一类模式,相当于人们从
感性认识升到
理性认识而做出结论的过程。
第四部分与特征提取的方式密切相关,它的复杂程度
也依赖于特征提取的方
式,例如,类似度、相关性、最小距离等等。其中前三部分是属于图像处理范畴,
第四部分为模式识别范畴。我们也把预处理和特征提取部分称为低级处理,而判
决和分类部分称
为高级处理。其中,每一阶段都会对识别结果产生严重影响,所
以每一阶段都应争取尽可能完美的结果。
2.2图像预处理
预处理的目的是加强有用的信息,并对输入测量仪器或其他因素所造成的退<
br>化现象进行复原。
不管用什么预处理方法,仅仅只是为了特征提取打基础,使识别率变的更高。<
br>7
基于小波变换的特定图像识别的应用研究
本论文从实际出发,只做两种
处理:一是倾斜校正;二是选取感兴趣区域。我这
里重点介绍一下倾斜校正的方法。倾斜校正可分为两部
分来实现;先确定图像倾
斜的倾斜角,再在此上的基础上完成图像的校正旋转。
2.2.1倾斜
角的确定
纸币图像倾角获取的步骤如下:
(1)边缘点的一次获取
从灰度图像2.1可
以看出,虽然背景和图像并没有完全彻底的分开,但是己
经可以很清楚的看到背景与图像的区别效果,为
此设计了一个寻找上边缘的算
法:
a.为了防止获得如图21所示的边缘点x,图像扫描由中间
往两边进行,间
距为40个像素点,左右各扫描相同的点数。
b.每一列都从上边缘的第3个点
算起,在选定的一阈值t,找到第一次小于
t的点就假定这个点为边缘点。并用此方法找到所有的上边缘
点。本文通过对点
数的选取比较,最终选取了lO个边缘点。
(2)用一元线性回归方程,采用
最小二乘法对获得的边缘点进行线性拟合,
获得直线方程原理图如图2.2所示:
图21边缘点
的获取
图2
2:最小二乘法的线性拟合
基于小波变换的特定图像识别的
应用研究
(3)求得各个边缘点到直线的距离d,将口与给定的阂值d进行比较用以排
除离直线
较远的边缘点,然后用这些余下的边缘点进行二次拟合获得新的拟合直
线,这样就能有效地降低偏差,提
高精度。
(4)根据拟合所得直线的斜率利用反三角正切函数求得倾角0。
在这里,需要一提的
是,哈夫变换也可以提取直线的方程,不过哈夫变换要
遍历整幅图像,速度较慢,不能满足实时处理的要
求。
2.2.2图像的旋转校正
图像的旋转变换,就是将一个像素(x,y)映射到一个新位置
(X’,Y’)。
P
2驰∽(2-1)
lY’=弓(x,Y)
其中(X,Y)
表示倾斜图像中的点,(x’,y’)表示校正后图像中的点。利用以上
映射会导致校J下图中的某些点
(x’,y’)不在值域中,虽然可以默认为0,但这样做
会破坏原图像的平滑性,产生不必要的毛刺。
为了解决可以采用f的逆函数。即
从校正图像到原图像的映射,这样得到的图像的质量好于上一种情况。
利用此式
进行图像旋转,每计算一个像素的值需要四次浮点数乘法和两次浮点数加法,是
很费时
的运算。为了提高速度,下面介绍一种快速算法。
(1)确定校正前后的坐标对应关系,坐标轴XOY为
校正前的坐标系,X’O’Y’
为校正后的坐标系。图像的中心为0点,校正前后点的位置不会改变。校
正前,
图像中任何一点P的坐标为(X,Y)。由于一般只要对水平方向的倾斜进行校正,
所以
校正前后水平坐标位置不变,假定图像的倾斜角度为o,校正后P’的纵坐
标为Yl=y—xtanO。
由此可以得到校正前后的坐标对应关系:
五一
月=y-xtanO
(2.2)
(2)根据上述的校正(2.2)公式,经常需要求整数位置的图像灰度,这个
过程中必须进行插值运算
,最简单的插值方法是最近邻插值,即令非整数位置的
灰度值等于离它最近的象素灰度值。最近邻插值法
方法简单,但是,当图像中包
含象素之间灰度级有变化的细微结构时,最近邻插值法会在图像中产生人工
的痕
迹。
9
基于小渡变挠的特定目霉tI{刷的应用研究
可以
考虑采用下面的双线性插值法。令f(x,y)为两个变量的函数,其正方形
顶点的值已知。如果希望通
过插值得到正方形内任意点f(x,y)值,可由取线性方
程:
f(x’y产缸+by+cry
+d
(2—3)
来定义的一个双曲线抛物面与四个已知点拟合。从到这四个系数需由已知的四个
顶点的f(x,y)值来选定。有一个简单的算法可以产生一个双线性插值函数,并使
之与四个
顶点的f(x,y)值拟合。首先,本文对上端的两个项点进行线性插值可得:
f(x,0芦(o,0H
If(1,0}媳o)]
类似地.对于底端两个顶点进行线性插值有
f(x,1)_-f(o,
1)+x【f(1,1)一f(o,1)】.
(3)做垂直方向线性插值阻确定
f(x,YPx
[fO,0)一f(o,0)】+y【f(O,1)-f(O,O)】+q1,1)(2-5)
图像倾斜
校正后的效果如图2.3:
(2-4)
l二罄l
图2.3倾斜校正后的纸币
■
■■——■——一
2.3图像的特征提取
图像的特征提取也可称为图像的特征选择。由图像所获
得的数据量是相当
丈的。实际当中常常不可能对整幅图去傲识别,必须进行一定变换,特征提取再
进行识别,这样才有实际的可行性。为了有效的实现分类识别,就要对原始数据
进行变换,得到最能反
映分类本质的特征,这就是特征提取。
图像识别是根据一定的图像特征进行的,特征就是一个图像区别与
其他图像
所具有的某方面性质的抽象。在模式识别中不可能直接采用包含图片所有信息的
原始信
息来进行模式分类,因为原始信息不但过于庞大,而且包含的图片各方面
的信息相互交织无法进行有效的
区分。与原始信息相比,特征信息不但在信息量
方面大大减少,并且一种特征信息一般只含有图像的一个
方面的信息,所以对图
像的分类都是采用单个或多个包含目标的某个方面信息的特征信息来进行的,特<
br>征的选取及提取对模式识别具有关键性的意义。
基于小波变换的特定图像识别的应
用研究
通过对图像的原始信息采用不同处理方式,可以提取出各种各样的特征信
息,并不是所有
的特征都能用于模式识别,用于模式识别的特征必须具备以下三
个条件:
1.唯一性:对于模式
识别的所有对象群体,该特征能唯一的代表一个对象类
别。
2.可分性:不同类别对象的特征应
具有明显的可测差异,以便通过特征将不
同类别对象区分开来。
3.鲁棒性:当图像所处环境或
者是图像与类别无关状态发生改变时,当图像
的信息受到噪声污染或发生畸变时,特征应尽量保持不变。
实际应用中一般很难采用一种特征来完全满足上述三个条件,所以一般采用
多个特征的组合来进
行模式识别。经过大量的研究,人们在理论上已经找到了具
有旋转不变性的一些变换,如傅立叶变换、梅
林变换、矩变换和小波变换。
2.4图像模式识别的方法
2.4.1统计模式识别法
本
论文采用的就是统计模式识别法,其基本原理是:有相似性的样本在模式
空间中互相接近,并形成“集团
”,即“物以类聚”。其分析方法是根据模式所测
得的特征向量置=(五,恐,…,h)(i=1,2,
…,N),将一个给定的模式归入C个类
w,w2…,M中,然后根据模式之间的距离函数来判别分类。
统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决策系
统进行模式识别的技
术,又称为决策理论识别方法。
统计模式识别的主要方法有:距离分类法,判别函数法,k近邻分类法,
非
’线性映射法,特征分析法,主因子分析法等。
在统计模式识别中,贝叶斯决策规则从理论上
解决了最优分类器的设计问
题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接
从
观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它
是一种启发
式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取
基于小波变换的特定
图像识别的应用研究
得的突破性成果导致现代统计学习理论叫C理论的建立,该理论不仅在严格
的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新
的学习方法——支撑向量
机。
统计方法是以数学上决策理论为基础,根据这种理论建立了统计学识别模
型。其基本模型是
在对研究的图像进行了大量统计分析,找出规律性认识,抽出
反映图像本质特点的特征进行识别。在这种
方法中,大量工作在于如何抽取图像
的特征或决定统计参数,即所谓参数法。另外,还有非参数决策法,
如近邻法则,
它是一种绕过概率的估计而直接进行决策的方法。对于特征抽取,必须把图像的
大
量原始信息缩减为少数的特征,例如采用方差分布、特征向量法等。对文字、
符号等可只抽取几何形状特
征,对声波信号可抽取频谱特征。为了抽取特征,有
时要对原始图像信息进行各种变换,如空问投影,把
多维的图像点简化到几个坐
标分量上。例如:在高空用多波段遥感仪得到的遥感图片,具有大量的图像数
据,
为了进行识别,可先将其划分为若干小的集群,将性质相近的数据点划为一个集
群,进行聚
合分析。如利用梯度法反复迭代计算,可把数据点的距离小于某一数
值的点合并在一起。从而大大减少信
息量,只需研究这些集群的性质就够了,这
就是集群分析。
统计决策理论的基本思想就是在不同
的模式类中建立一个决策边界,利用
决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基
本模型如图
2.4,该模型主要包括两种操作模型:训练和分类,其中训练主要利用已有样本
完
成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优
的;而分类主要对输入的模
式利用其特征和训练得来的决策函数而把模式划分到
相应模式类中。
I图像输入r叫分类
叫预处理卜_叫特征提取r
I粱教L
I本输入卜一
一训练H分析结呆
图2.
4:统计模式识别的过程
12
基于小波变换的特定图像识别的应用研究
2.4.2句法模式识别法
利用模式与子模式分层结构的树状信息所完成的模式识别工作,就是结构模<
br>式识别或句法模式识别。其基本思想是把一个模式描述为较简单的子模式的组
合,子模式又可描述
为更简单的子模式的组合,最终得到一个树形的结构描述,
在底层的最简单的子模式称为模式基元。在句
法方法中选取基元的问题相当于在
决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一
个紧凑的
反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应
该含有
重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描
述语句,这相当于在语言中,句
子和短语用词组合,词用字符组合一样。基元组
合成模式的规则,由所谓语法来指定。一旦基元被鉴别,
识别过程可通过句法分
析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入<
br>该类。
2.4.3模糊模式识别法
模糊模式识别其实就是在模式识别问题中引进模糊逻辑
的方法或者思想。模
糊模式识别在统计模式识别中己经取得了较好的应用,模糊理论在图像识别系统的应用,主要是利用模糊理论对图像特征模糊化和模糊分类。
模糊特征其实就是根据一定的模糊化规
则将图像的一个特征或者一组特征
分成多个模糊变量,使每个模糊变量能表达原特征的一部分特性,然后
用这些新
的模糊特征代替原来的特征进行模式识别,虽然模糊特征相对原来的特征数量变
多了,
但是可能使分类结果和特征值间的关系线性化,从而简化了分类器的设计,
提高了分类器的性能。
模糊分类其实就是把样本空间分成若干个子集,而这些子集用模糊子集的概
念来代替,从而得到模糊分
类结果,也即分类结果的模糊化。模糊分类中的一个
样本将不再属于某个特定的类别,而是以不同的可信
程度属于某个类别,这样的
优点是:(1)分类结果中可以反映出分类过程中的不确定性,利用用户根据
可信
程度决策;(2)如果采用多级分类,这能为下级分类提供分类信息。分类结果模
糊化通常
没有固定的方法,一般结合实际情况和分类器的特性来设计。
基于小波变换的特定图像识
别的应用研究
2.4.4人工神经网络模式识别法
一般神经网络模式识别系统由预处理、特征提
取和神经网络分类器组成。神
经网络图像识别系统中的特征提取部分不一定存在,这样就分为两大类:(
1)有
特征提取部分的:这一类系统实际上是传统方法与神经网络方法技术的结合,这
种方法可
以充分利用人的经验来获取模式特征以及神经网络分类能力来识别图
像。特征提取必须能反映整个图像的
特征。(2)无特征提取部分的:省去特征抽
取,整幅图像直接作为神经网络的输入。这种方式下,系统
的神经网络结构的复
杂度大大增加了,输入模式维数的增加导致了网络规模的庞大。此外,神经网络结构需要完全自己消除模式变形的影响。但是网络的抗干扰性能好,识别率高。
构造神经网络分类器
首先要选择适当的网络结构:神经网络分类器的输入就
是图像的特征向量:神经网络分类器的输出节点应
该是类别数;隐层数要选好,
每层神经元数要合适,目前有很多采用一层隐层的网络结构;然后要选择适
当的
学习算法,这样才会有很好的识别效果。在学习阶段应该用大量的样本进行训练
学习,通过
样本的大量学习对神经网络的各层网络的连接权值进行修正,使其对
样本有正确的识别结果。神经网络在
样本学习中就像人记数字一样,学习样本时
的网络权值调整就相当于人记住各个数字的形象,网络权值就
是网络记住的内
容,网络学习阶段就像人由不认识数字到认识数字反复学习过程是一样的。神经
网络是按整个特征向量的整体来记忆图像的,只要大多数特征符合曾学习过的样
本就可识别为同一类别,
所以当样本存在较大噪声时神经网络分类器仍可正确识
别。在图像识别阶段,只要将图像的特征向量作为
神经网络分类器的输入,经过
。
网络的计算,分类器的输出就是识别结果。
模式识别的
方法主要是以上的四种,四种方法特点各异:
统计模式识别法:比较成熟,能考虑干扰、噪声等影响,识
别模式基元能力
强。
句法模式识别法:识别方便,可以从简单的基元开始,由简至繁。
模糊模式识别法:由于用隶属函数作为样本与模板间相似程度的度量,故往
往能反映它们整体的与主要的
特性,从而允许样本有相当程度的干扰与畸变。
人工神经网络模式识别法:可处理一些环境信息十分复杂
,背景知识不清楚,
推理规则不明确的问题。允许样品有较大的缺损、畸变。
14
基于小波变换的特定图像识别的应用研究
本论文理论结合实际,引用比较成熟的统计模式识别
法。在对任何图像做识
别前,必须对图像的本身进行认真的观察,考虑同类图像间存在的差别,本质的<
br>差别就是最好的特征值,用什么预处理方法也只能针对这种差别来选用,目的也
只是更加凸显这种
差别。分类的方法在上面已经提到过,本论文选用的是欧式距
离分类法,分类的方法考虑的重要影响因素
同样是提取的特征值。无疑特征的提
取是统计模式识别的重中之重,本论文也不例外。特征提取算法有很
多种,各种
算法的理论也比较成熟。本论文提出用小波变换系数作为特征提取,利用对图像
进行
小波变换后的高频部分的系数作为特征值。这里我们不详细讲,下面将对小
波变换系数作为特征值做详细
的分析和阐述。
基于小波变换的特定图像识别的应用研究
第三章小波变换系数的
特征提取
3.1小波变换的理论基础
小波分析是目前数学中一个迅速发展的新领网域,它同时具
有理论深刻和应
用十分广泛的双重意义。
小波变换的概念是由法国从事石油信号处理的工程师J
.Morlet在1974年首
先提出的,通过物理的直观和信号处理的实际需要经验的建立了反演公式
,当时
未能得到数学家的认可。正如1807年法国的热学工程师Fourier提出任一函数都
能展开成三角函数的无穷级数的创新概念未能得到著名数学家J.L.Lagrange,
P.S.L
aplace以及A.M.Legendre的认可一样。幸运的是,早在七十年代,A.Calderon表示定理的发现、Hardy空间的原子分解和无条件基的深入研究为小波变换的诞
生做了理论上的
准备,而且J.O.Stromberg还构造了历史上非常类似於现在的小
波基;1986年著名数学
家Y.Meyer偶然构造出一个真正的小波基,并与S.Mallat
合作建立了构造小波基的同意方
法??多尺度分析之后,小波分析才开始蓬勃发展
起来,其中比利时女数学家I.Daubechies
撰写的《小波十讲(Ten
Lectures
On
Wavelets)》对小波的普及
起了重要的推动作用。它与Fourier变换、视窗Fourier
变换(Gabor变换)相比,这
是一个时间和频率的局网域变换,因而能有效的从
信号中提取资讯,通过伸缩和平移等运算功能对函数或
信号进行多尺度细化分析
(MultiscaleAnalysis),解决了Fourier变换不能
解决的许多困难问题,从而小波
变化被誉为“数学显微镜”,它是调和分析发展史上里程碑式的进展。<
br>3.1.1连续小波变换
小波变换继承和发展了窗13Fourier变换时频局部化的思想,同
时又克服了
窗口太小不随频率变化,没有离散正交基的缺点。一个小波基函数的作用相当于
一个
窗函数,小波基的平移相当于窗口的平移,它既有随频率变化的自适应窗,
而且具有离散化的规范正交基
,因此,小波变换是比较理想的时频分析工具。
连续小波变换的定义:引入窗口函数甄必)2才责缈(了
t-b),并定义变换
16
基于小波变换的特定图像识别的应用研究
w
j(啪)2南e几旷(学灿
率相关的伸缩,b为时间平移因子。
(3.1)
其中,aE
R且口≠O。式(3.1)定义了连续小波变换,a为尺度因子,表示与频
很显然,并非所有函数都能保
证式(3.1)中表示的变换对于所有f∈三2俾)
均有意义;另外,在实际应用尤其是信号处理以及图
像处理的应用中,变换只是
一种简化问题、处理问题的有效手段,最终目的需要回到原问题的求解,因此
,
还要保证连续小波变换存在逆变换。同时,作为窗ISl函数,为了保证时间窗口与
频率窗1
21具有快速衰减特性,经常要求函数吣)具有如下性质:
I沙(工)15c(1+1xI)一~,I痧
(刃)I-<C(1+I彩I)一’。。
其中,C为与工,刃无关的常数,e>0。
由小波变换
的定义式(3.1)可以得出小波变换的运算过程如下:
(3.2)
吩(口,6)=(厂(f)
,%。。(f))=If(t),此6(t)dt
=£巾)击∥‘(了t-b)df(口>0以17(删
其中,哪,=忑1
y(字]
并设f(t)=f(kzl哆,f∈(屯斛1),则
%(口,6)=军J:『”厂(圳口[-I/2Ip'"(譬户
=;n㈣l口m+(等卜
-l
口1邮莓m)I
fk+l*(学)山一p(学)出).
.
根据连续小波变换的定义可以
知道小波分析能够提供一个随频率改变的时
间一频率窗口。由定义式(3.1)可知野(口,6)给出了
fi[t)在时间窗
[6+讲*-a△∥,6+斫’+n△∥]内的局部化信息。其中f’、∥,△妒、
△矿分别是小
波基虬。(f)和其傅立叶变换杪’(w)的中心与半径。
3.1.2连续小波变
换的性质
为了研究小波的时频局部化性质,首先讨论如下一个基本性质。
17
<
br>现在讨论由定义式(3.1)定义的窗口函数的时频局部化性质。从时域角度
来看,当%,6(f
)作为窗口函数时,其中心fo与窗口宽‰6分别为
%,2击{po)2渺洲12蚴j
铲志}帆
删df
I
口
I
㈦5,
式(3.1)可以表示成卷积厂・缈0二鱼)的
形式。而从频率的角度来看,利用Parseval
等式,又有%厂(口,6)=击j:夕(万)眈曲(
万)d巧,因此利用眈^2I
d产e砌8矿(口功,得到
频率窗口的中心万。与宽度%^分别为
‰2志"酬d万
V志{』(m-too)2]帅枷乒I
●
(3.6)
记以=1,b=O,此时%jO)=妙(f),而相应的时、频窗口参数分别记为f。・,~以
及‰・,
%。于是,可以建立下面等式:
fto=ato幸+6,盯%.6=口仃1|f,
1‰=譬‰=
詈
只证明式(3.7)中第一行的等式。事实上,直接计算有
@7,
下面讨论式(3.
7)的证明。由于两个等式的证明相似,因此,为节省篇幅,
岛=帮ft[1
t-b
1
2=
『(饿+6)I∥(圳2
dx
R——
』llf,(x)12
dx
R
类似得到%.。=口~。
由式(3.7)建立时.频窗口满足:
[to一仃
∥础,%+盯妒。.6】×【万。一盯∥。.6,刃o+盯妒。.6】
.【口一6--120"W,a—
m啪【半,半】
此时,窗口的时间宽度为2
a6。,,频率宽度为2屯/a,因此其面积为4q
×唧,
与口和b的选取无关。
基于小波变换的特定图像识别的应用研究
窗口的特点:当需要检测高频分量时,减少a的值,此时时间窗口自动变窄,
而频率窗口自动变宽,此时
为一时宽窄而频宽大的高频窗;而在检测低频分量时,
增加a值,时间窗口自动变宽,频率窗口自动变窄
,此时为一时宽大而频宽窄的
低频窗。
作为窗口函数,吣)应该具有快速衰减性质,谓之为“小
”,同时其振幅为
正负相间的震荡形式,谓之为“波”,特别地,将式(3.1)所定义的变换称之为<
br>小波变换,而相应的函数妒(力称之为小波函数。
下面从系统响应的角度讨论小波变换的物理意义
。
设输入信号为他),而系统的单位冲激响应设为ha(f)=1与h(-L),于是系
41<
br>a
I
a
统的输出满足
厂(.)眺(.)2赤,∽叭孚)dx=哪口,6
)
应为ho(t)={彳办(一三)的系统输出,另外我们知道:
、/I口I
a
(3.8).
式(3.8)表明,信号厂O)的连续小波变换等价于信号m)通过一单位冲激响
Ⅳ。(万)=h。(万)=√J
a
I痧(一口万)
因此,也可以将Ax)的连续小波
变换视为传递函数为亿(6[))的系统的输出。另外,
通过前面的窗口函数的时频特性分析可知,以f
)本质上是一个带通系统,而随着
伸缩因子a的改变,‰.6(力对应着一系列带宽和中心频率各异的带
通系统。根据
式(3.8)可以总结出小波变换的下列物理特性:
(1)信号f(D的连续小波
变换是一系列带通滤波器对At)滤波后的输出,
Wd'(a,b)dP的参数a反映了带通滤波器的带
宽和中心频率,而参数b反映了滤波
后输出的时间参数。
(2)设Q为滤波器的中心频率与带宽
之比,即为品质因数,则伸缩因子a
的变化形成的带通滤波器都是恒Q滤波器。
(3)当伸缩因
子a变化时,带通滤波器的带宽和中心频率也变化。当a较
小时,中心频率较大,带宽变宽;当a变大时
,中心频率变小,带宽变窄。小波
变换的这一特性对于信号八力的局部特性分析具有重要应用价值。例如
,对于信
号变化缓慢的地方,主要为低频成分,频率范围比较窄,此时小波变换的带通滤
19<
/p>
基于小波变换的特定图像识别的应用研究
波器相当于a较大的情况;反之,信号发
生突变的地方,主要为高频成分,频率
范围比较宽,小波的带通滤波器相当于a较小的情形。总之,当伸
缩因子从小到
大变化时,滤波的范围从高频到低频变化,因此,小波变换具有变焦特性。
(4)
线性变换。小波变换是线性变换,具有线性变换具有的性质:叠加性。
(5)时移特性。如果厂(x)—
Q马町(口,6),那么f(x一‰)—Q马町(口,b—Xo)。
(6)尺度转换。如果厂(x)—Q
马吩(口,6),那么厂(车)—Q_√万渺r(导,6)。
^
^
(7)重建核(re
productionkemel)与重建核方程。重建核说明了小波变换的
冗余性。即在(口,6)半
平面内各点小波变换的值是相关的。点(口o,bo)处的小
波变换值可以由(口,6)半平面内各点小
波变换的值来表示。
W/(ao,bo)=r詈e巧(%bo)K。,(ao,bo,ao,bo)df
在式(3.9)中,
(3.9)
K∥(ao,bo,a0,60)=÷儿“x)昵“x
)dx=士(%“x),lf/oo,bo(x))
(3.10)
巧是%≯(工)与‰如(z)
的内积,反映了两者的相关程度,称为重建核;式(3.9)
称为重建核方程。当a=ao,6=bo时
,‰有最大值。当(口,6)偏离了(口o,bo)时,
杨的值快速衰减,两者的相关区域就愈小。如果
岛=60-ao,b-bo),此时(口,6)平
面内的小波变换值是互不相关的,小波变换所含的信息
才没有冗余,这就要求不
同尺度及不同平移的小波互相正交。不过,当(口,6)是连续变量时很难达到
这
样的要求。
(8)小波谱图交叉项的性质。小波变换具有线性性质,不存在交叉项。但
是由小波变换引伸出来的能量分布函数1w/(口,b)12在多信号情况下具有交叉项。
设
则
f(t)=fl(t)+f2(t)
l肜(a,功I2=I虼(a,6)I2+I%(a,功
I2+2|%(a,6)I・l%(a,功I・COS(0。一0。)
小波变换的交叉项只出现在%,既
同时不为零的(口,6)处。这一点跟维格
纳分布不同。两个信号在时频平面内不重叠,但是由两个信号
线性组合而成的信
号显然存在交叉项。
基于小波变换的特定图像识别的应用研究
3.1.3离散小波变换
1.~维离散小波变换
在每个可能的缩放因子和平移参数下计
算小波系数,起计算量相当大,将产
生惊人的数据量,而且有许多数据是无用的。如果缩放因子和平移参
数都选择为
2‘的倍数,即只选择部分缩放因子和平移参数来进行计算,就会使分析的数据量
大
大减少。使用这样的缩放因子和平移参数的小波变换称为双尺度小波变换,它
是离散小波变换的一种形式
。通常离散小波变换就是指双尺度小波变换。
同傅立叶变换和沃尔仕变换等正交变换类似,在实际应用尤
其是在计算机
是实现时,连续的小波必须进行离散化处理。这里所说的离散化并非针对时间变
量
x,而是针对尺度参数a和连续平移参数b而言的。由下式可通过对尺度因子
a和平移因子b的取样离散
化:
a=以om
b=咒%口om
其中,ao>l,bo∈R,聊,,z∈Z2。
连续小波和连续小波变换的离散化形式为:
‰小)=击文半]=aom/Z6p(aomt-nbo)
CM=<厂,缈M>=口∥e厂(f)缈(臼一一刀b。)dt
矽,,七(x)=2∥2(2x
—k)/,k∈Z
J
离散小波变换式是一种时频分析,它从集中在某个区间上的基本函数开始,
以规
定步长向左或者右移动基本波形,并用尺度因子ao来扩张或者缩一构造起函数
系。一系列
小波由此而生,这就是“小波”一词的由来。这里m和n分别成为
频率范围指数和时间步长变化指数。<
br>如果尺度以二进方式离散变化,可得到响应能够的二进小波变换:
整数J决定伸缩,而k确定平移
幅度。其中变换系数再次由内积给出。
cm=</(x),纺,七(x)>=2肌£厂(x切(2/x-
k)dx
2l
基于小波变换的特定图像识别的应用研究
一褂波‰㈨,音
睁,孚)。
缈1(x,Y)=qk(x)r.p(y)
缈2(x,Y)=矽(x)伊(Y)缈3(x,Y)=矽(x)缈(少)
假定存在可分离的二维尺度函数①(x,Y)=①(x)①(y
),①(z)是一个一维的尺
度函数,①(y)为相应的小波函数。则可以得到三个二维基本小波变换函
数:
一幅N枣N的图像fi(x,y),其中下标指示尺度并且N是2的冥。对于J=0,
原图
像的尺度为2J=20=1。j值的每一次增大都使尺度加倍,分辨率减半。每一次
这4个子频带区域的
每一个都是由原图与一个小波基内积后,再经过X和Y方向
都进行2被的间隔抽样而产生的。对于第一个
层次(j=1),可写成:
片(,竹,刀)=<石(x,y),矽(x一2m,Y一2n)>
爿
(m,托)=<六(x,y),伊1(x一2m,Y一2n)>
‘
露(,刀,刀)=<Z(x,
y),缈2(x一’2m,Y一2n)>
刀(朋,以)=<六(x,y),缈3(x一2m,Y一2n)
>
而对于后继的层次(j>1),刀b力都以完全相同的方式分解而构成4个尺度上
基于小波变换的特定图像识别的应用研究
将内积写成卷积的形式,可有:
e+。(M)={
[e(w)木矽(毡一y)](2m,2”))
乃卅m,,z)={[e(训)木缈1(%一y)](2
历,2刀))
名¨m,门)={[e(w)木缈2(一一y)](2聊,2即))
名+。m,,
z)={[e(训)宰缈3(飞一Y)I(2m,2门))
并且在每一层进行4个相同的间隔抽样滤波操
作。
u“L飒n
.LH2{H心
HLI*'
Urll—I'IHI。
图3.1二维离散小波变换
因为尺度函数和小波函数都是可分离的,所以每个卷积都可以分解成在
刀b力的行和列上的一维卷积,DWT图像分解步骤如下图3.2所示。
如t南,’
F:fx
,,j
吩l醛’
&札y,t
Pf沁,}
图3.2
DWT图像分解步骤
在第一层,首先用ho(一x)和hl(一x)分别与图像fl(X,y)的每行做积分并丢弃奇(或<
br>偶)数列(以最左列为第0列)。接着N/2奎N阵列的每列再和110(.x)与hl(.X)
相卷积,丢弃奇(或偶)数行(以最上行为第0行)。其结果就是该层变换所要
基于小波
变换的特定图像识别的应用研究
求的四个(N/2)・(N/2)的数组。
3.1.4二进小波
变换
显然,我们不能用计算机实现连续小波变换,因此,在实际应用中,需要将
连续小波变换离
散化,最直观的一种方法是对时间频率平面进行重采样。
我们先讨论根据频率值口离散化时原信号的精确
重构问题,首先考虑前面
讨论过的频率窗口:【!丢垒,!丢垒),显然,当口取所有大于。的实数值时
,频
率轴[O,+∞]将会被完全覆盖,同时也不难发现,这种覆盖存在严重的交叉覆盖因
而产
生覆盖的冗余。为了在完全覆盖的前提下避免冗余现象的出现,下面讨论取
特殊离散值的覆盖问题,使得
按照小波函数以力所对应的窗口半径4口构成如下划
分:
【o,+∞)=U【274p,2’“
A口)
事实上,只要取频率参数吩为二进制整数旷2一,频率窗口就为
【等一鲁,荨+争_【2
协宰刁办2蛔宰物枷
(3.…
其中EO'・为认巧)所确定的窗口中心。为方便计,还可以假定
矿=勿函,否则取
口=勿谚一万宰,构造函数|;c,op)=eh缈(f),则当∥(f)为小波函数
时,矿(f)也构成仅改
变原有小波的相位的小波函数,且汐。(万)=汐(万一口),4扩=彳驴。此
时缈。(巧)所对
应的窗口中心铲=勿口。=勿眵,于是式(3.11)所描述的频率窗可简化为
【2—0驴,27+砀矿),当/取遍整数集Z中所有元素时,[0,+∞)上所对应的傅里叶变换
将
完全被上述窗口所覆盖。
’
为了在傅里叶离散化的情形下能够精确重建原信号,需要对基小波做
进一
步的限制。
若存在常数O<A\<B<oo,使
删s∑I汐(2一’万)12卯<
br>(3.12)
几乎处处成立,则称∥∈L2(R)是一个二进小波,式(3.12)称为稳定性条
件。
基于小波变换的特定图像识别的应用研究
现在说明二进小波首先是基小波,
即有如下定理。
二进小波妒(r)是基小波,且有
Aln2<f一噬d万,r”l里!二!堑d
万sBln2
Jo
(3.13)
万
Jo
万
进一步地,当A=
B时,式(3.13)简化为
。=f譬船2胁2
的(频率)信息,就可以重构^为此定义
(3.…
下面说明∥(r)在二进小波的前提下,只需知道其小波变换WPf(a,6)在口,=2一
,处
町厂(6)=%厂(口,,6),虮,,6(f)=2j∥(27t-276)
并引入另一
二进小波痧(f)(称为二进对偶),满足
(3.15)
参(万):i旦堕一
∑1矿(
2以w)12
★;1
于是有
(3.16)
』=o
∑驴(2一』刃)参
(2一。万)=l
并且可以建立下面的式子。
设∥(f)为二进小波,则当/∈L2(R)时,
厂可以通过{哗厂(6),‰^(f):j
并且
e
Z}重构,
厂(工)=∑4
,oo
J'WTf(b){27痧(2J。X--2’b}db
』=ⅧR
从某种意义上
讲,连续小波变换,二进小波变换与离散小波变换的关系是密不
可分的。当尺度及位移均作连续变化时,
可以理解必将产生一大堆数据,作实际
应用时并不需要这么多的数据,因此就产生了离散的思想.将尺度
作二进离散就
得到二进小波变换,同时也将信号的频带作了二进离散.当觉得二进离散数据量
仍
显大时,同时将位移也作离散就得到了离散小波变换。
基于小波变换的特定图像识别的应
用研究
3.1.5小波变换与DFT的比较
信号分析的主要目的是寻找一种简单有效的信号变换
方法,以便突出信号中
的重要特性,简化运算的复杂度。大家熟知的Fourier变换就是一种刻画函
数空
间,求解微分方程,进行数值计算的主要方法和有效的数学工具。它可把许多常
见的微分、
积分和卷积运算简化为代数运算。从物理意义上理解,一个周期振动
信号可看成是具有简单频率的简谐振
动的叠加。Fourier展开正是这一物理过程
的数学描述。
Fourier变换的特点是域
变换,它把时域和频域联系起来,把时域内难以显
现的特征在频域中十分清楚地显现出来。频谱分析的本
质就是对F(60)的加工和
处理。基于这一基本原理,现代谱分析已研究与发展了多种行之有效的高效
、多
分辨率的分析算法。
与Fourier变换相比,小波变换是时间(空间)频率的局部化分
析,它通过
伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低
频
处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,
解决了Fourier变
换的困难问题,成为继Fourier变换以来在科学方法上的重大突
破。在实际过程中,时变信号是常
见的,如语音信号、地震信号、雷达回波等。
在这些信号的分析中,希望知道信号在突变时刻的频率成份
,显然利用Fourier
变换处理这些信号,这些非平稳的突变成份往往被Fourier变换的积分
作用平滑
掉了。由于,因此,频谱F(60)的任一频率成份的值是由时域过程f【t)在(.∞,+<
br>oo)上的贡献决定的,而过程fj[t)在任一时刻的状态也是由F(∞)在整个频域(.∞,
+∞)的贡献决定的。该性质可由6(t)函数来理解,即时域上的一个冲激脉冲在频
域中具有无限伸展
的均匀频谱。f【t)与F(∞)间的彼此的整体刻画,不能反映各自
在局部区域上的特征。因此,不能
用于局部分析。在实际应用中,也不乏不同的
时间过程却对应着相同的频谱的例子。
以上我们从
各个方面论述了Fourier变换与小波变换的异同。虽然小波变换
在某些方面优于Fourier变
换,但小波函数的存在性的证明依赖于Fourier分析,
其思想也来源于Fourier分析。更进
一步的研究还表明:在处理渐变信号时,
Fourier分析或加窗Fourier分析更为有效。因此
小波分析不能取代Fourier分析,
它只是Fourier分析的新发展,与Fourier分析相
辅相成。
基于小波变换的特定图像识别的应用研究
3.2小波变换的的算法研究
3.2.1
Mallat算法
Mallat于1987年把多分辨翠思想引入到小波分
析中,提出了多分辨分析理论,
并给出了完美的数学描述和一种子带滤波器机构的离散小波变换与重构算
法
Mallat算法,运用该算法可使信号每次分解时的长度减半,使得在实际应用中减
少了小
波变换的复杂度,因而它是一种快速算法。其分解式子可表示为:
1.一维信号的Mallat算法设巧是分辨率为2一’的信号空间,e是信号厂(x)在巧的投影,%为巧的正
交空间,q为厂(x
)在%上投影。矽和y分别是相应的尺度函数和小波函数。
其中:
咖,。(x)=2T-1矽(
2一’x-n)
%,。(工)=2子少(2一’x-n)
e可以表示为:
Pjf(x)
:艺(m),岘,。(甜)>风,。(x)
离散信号Pjf(x)=(厂(“),办,。@))称为厂(
x)在分辨率2。的离散逼近。
哆可表示为:
DiS(x):艺(m),西,,,,(“))风
一(x)
离散信号掣厂(工)=(厂@),%,。@))称为厂(工)在分辨率2—7的离散细节信号。
由
于岘,。@)和风,。@)的正交性,e厂和彰厂可直接由毕,/导出:
Pff(n)=∑h
(k-2n)1ff_。厂(忌)
k=--∞
(3.17)
彰厂(玎)=∑g(k-2
n)P'/_。厂(尼)
k=--∞
(3.18)
基于小波变换的特定
图像识别的应用研究
其中:
Jil(疗)=<破.。(力),矽(“-n))
g(n)
=(∥。,。(n),矽(“一玎))=(一1)”h0一n)
几n
假设h(n)和g(n)分
别对应的离散滤波器为H和G,H和G分别为H和G的镜像
口口
滤波器,其冲激响应分别为h=
h(-n)和g=g(-n)。
口几
从式(3.17)和(3.18)可以看到,砭。厂经过离
散线性滤波H和G,再由
抽样得到e厂和D;厂。由此可知,数据的小波变换可以由数据通过高、低通滤
波
器H和G来现实,如下图3.3所示:
践}
Pj{
分解过程
重构过
程
图3.3小波分解和重构过程
2.二维信号的Mallat算法
小波变换的概念可以
从一维推广到二维,用于图像的小波分解与重建。一个
简单而有用的特例是二维可分离模型,此时二维尺
度函数矽(工,Y)∈r(R2)可表示
为两个一维尺度函数的乘积:
≯(工,y)=≯(石)
≯(y)
令沙(x)、y(少)分别为与≯(工)、≯(y)相对应的一维小波,则在分辨率k层,二维的二进小波可表示为以下3个可分离的正交基函数:
缈1(x,y)=矽(工)沙(y)
沙2(x,Y)=y(x)矽(y)
y3(x,y)=沙(x)杪(J,)
相应的二维Mal
lat小波分解算法如下图3.4所示,其中弓相对应e一,的低频部
分,为e一,的逼近图像;q相对
应在水平方向上的细节图像;巧相对应于垂直
28
基于小波变换的特定图像识别
的应用研究
水平方向上的细节图像;巧相对应于45。、135。对角方向上的细节图像。
◇昌
罢二
图3.4:二维小波变换的Mallat算法
3.2.2提升算法
1.提升小波变
换的基本原理
-<Z>-◆一二
第一代小波的研究工具主要是傅立叶分析,即从频域来分析问题
。在实际应
用中,传统小波变换的实现是通过卷积完成的,它计算复杂,运算速度慢,对内
存的
需求量较大,不适于实时实现。信号经过传统小波变换后产生的是浮点数,
由于计算机有限字长的影响,
往往不能精确的重构原始信号。而且传统小波对原
始图像的尺寸有严格的要求,一般要求图像的长和宽都
必须是2的整数次幂的倍
数。而提升小波则直接在时(空)域分析问题,使问题变得更加简单,并且可以
将
所有传统小波都通过提升方法构造出来。基于提升方法的小波变换既保持了传统
小波的时频局
部化等特性,又克服了它的局限性。提升算法给出了双正交小波简
单而有效的构造方法,它使用了基本的
多项式插补来获取信号的高频分量(y系
数),之后通过构建尺度函数来获取信号的低频分量(旯系数)
。提升算法的基本思
想在于通过一个基本小波,逐步构建出一个更具有良好性质的新小波,这就是提升的基本含义。一个标准的提升算法包含3个步骤:切分、预测、修正。它的实
现步骤如下图3.5
所示:
基于小波变换的特定图像识别的应用研究
图3.5:提升算法的实现步骤
由于数据之间有某种相关,可以将它用更为紧凑的格式来表示,也就是说,寻找
原数据列的一个
子集,使它能够表示原始信号所包含的信息。按照上图提升算法
的实现步骤,这里重点讲一下提升小波的
分解。
(1)切分:(又称惰性小波变换)它是将数据列‰分解成为两个互不相交的子
集。假定
相邻的数据间有最大的相关性,按照数据的奇偶序号对数据进行间隔采
样,即
友l,★=凡m<
br>丘l。I=厶m+t
k∈z;
k∈z;
(2)预测:利用数据间的相关性,用允
。预测丘。,即采用一个与厶无关的预
测算子使得:儿。=P(允。)。
由于可以用疋。预测丘
。,那么,就可以用允,来表示原始的数据,称丘。为
小波系数。可以用丘。和它的预测值之间的差值来
代替丘。。如果预测是合理的,
那么差值数据所包含的信息比原来丘。包含的信息要少得多。预测过程的
表达式
记为:丘。=丘。一尸(允,)。则此时的小波系数丘。表明了由预测算子P引入的误差。
此时,已经可以用较小的数据序列友。和小波系数丘。来代替原始的数据。如果有
一个好的预测,那么
两个子集{疋。,丘。)将产生比原来的序列厶更为紧凑的表示。
可以对这个算法进行周期重复。例如,
将丑。抽取成两个序列如和丘:,然后用h
和P(丑:)之间的差值来代替h,这样经过n步,就可以用
小波表示
{丑。,丘。,…,丘。)来取代原来的数据序列。假设小波系数是由基于某种相关性的预
p>
基于小波变换的特定图像识别的应用研究
测模型得到的,那么,{以。,丘。,…,
丘。)将给出一个比原序列更为紧凑的表示。
(3)修正:经过分裂步骤产生的子集的某些整体性质(如
均值)并不和原始数据
的一致。因此需要采用一个更新过程,更新的思想是通过寻找五.,从而使得对<
br>于某一个度量标准QO,例如平均值,允。和厶具有相同的值:Q(卫。)=Q(20)。
考虑使
用已计算出的小波丘。来更新允。,从而使丑。保持上述性质。构造一
个操作U并进行如下的更新:丸。
=丑。+U(丑。)。
重复这个算法,对低频分量递归的进行提升小波分解,创建了多分辨分解的
多级变换。
由此,得到了提升算法的有效的实现步骤,即任何有限长的滤波器都可以从
基本小
波开始,通过有限数目的预测和更新步骤得到。实现提升算法的关键是寻
找合理的预测函数和更新函数。
2.小波提升算法的特点
小波提升除了具有第1代小波的多分辨率特性、不依赖傅罩叶变换的优
点外,
还具有以下特性:
a)原位计算。提升样式中一个很大的特点就是进行小波变换时在原位
计算
各个系数。可以看到,在计算某个特定偶数位置的系数时,使用到的数据仅仅是
若干个奇数
位置的数据和该位置的原有数据,而未使用该系数相邻偶数位置上的
系数,因此,所得结果可以直接将原
有数据覆盖而不影响后续偶数位置系数的计
算。同理,奇数位置和反变换时,也可以实现原位计算。原位
计算只是占用了与
.输入大小相同的空间,不需要其他辅助空间。
.
b)整数提升。在
传统的小波变换算法(即Mallat算法)中,采取了输入信号与
高通滤波器和低通滤波器相卷积的方
法来实现高频和低频信息的分离。但是,小
波滤波器的系数都是小数,中间结果中有一些是小数,如果对
小数进行取整,会
丢失很多信息,使得重构和分解是不可逆的,从而无法实现精确重构。但是,在
提升方案中,可以进行整数变换,并且整数变换不影响精确重构。
c)分解结果交织排列。以一维信号
为例,当对x进行第l级分解后,低频信
息在奇数位置,高频信息在偶数位置。当进行第2级分解时,是
对第1级的低频信
息(奇数序列)进行分解,而分解的结果则是奇数序列数据中的奇数位置为第2级
p>
基于小波变换的特定图像识别的应用研究
分解的低频信息,奇数序列数据中的偶数位
置是高频信息。也就是说,总是将上
一级分解结果中的奇数位置系数进行分解,所得结果又分成奇、偶序
列来存储低
频和高频信息。
本论文用到的提升算法将在下一章详细介绍,这里不再累述。
3.3小波变换在特征提取中的应用
小波变换应用在图像识别中的研究在近几年取得很大的进步,但这
远远不
够,还需要大量的科学研究,这样才能促使小波不管是在理论和还是实际应用当
中都能发
挥它的最大价值。常用的基于小波变换的特征提取方法有:基于小波变
换的模极大值特征、基于小波分解
的能量特征、基于小波包分解的嫡特征、基于
适应性小波网络的特征提取方法和基于小波系数的特征提取
方法等。本论文偏重
的实际应用,考虑小波变换的理论在实际图像识别中能达到什么样的实际效果才是本论文提出方法的最终目的。本论文提出的基于小波系数的特征提取就是通过
针对纸币图像的认真
观察和对小波理论深入理解提出来的。在某种程度上促使了
小波在图像识别中的价值。下面我们分别介绍
一下几种提取方法。
3.3.1基于小波变换系数的特征提取
1)小波变换系数
小波变
换的实质是对原始信号的滤波过程。小波函数选取的不同,分解结果
也不同。但无论小波函数如何选取,
每一分解尺度所用的滤波器中心频率和带宽
成固定的比例,即具有所谓的“恒Q”特性。因此,各尺度空
间内的平滑信号和
细节信号能提供原始信号的时频局部信息,特别是能提供不同频段上信号的构成
信息。我们可以直接将小波分解系数作为特征。
2)能量分布特征
若把不同分解尺度上信号的
能量求解出来,则可以将这些能量值按尺度顺序
排列形成特征向量供识别用。这就是基于小波变换提取多
尺度空间能量特征的基
本原理。
理论上讲,可以使用任何形式的小波函数对目标信号进行分解。
为了计算方
便并减少特征维数,这里利用二进小波变换来提取尺度空间上的能量分布特征。
32
基于小波变换的特定图像识别的应用研究
其中二进小波分解的过程可以用MaU
at快速算法实现。体多尺度空间能量分布特
征的提取及目标识别过程的流程如下图3.6。
图
像样本
上
预处理
毒
小波变换
毒
各尺度空间能量
毒<
br>选做特征向量
善
分类识别
图3.6基于能量特征提取的识别流程图
选择
部分尺度空间能量组成特征向量,主要是指选择那些能量相对集中的尺
度空间。这样既能充分利用先验信
息,使目标的主要能量特征得以增强,又能减
小特征维数,加快分类速度。但如果先验信息不明确或因减
小特征维数导致分类
能力降低,那么仍应将所有尺度空间能量组成最终的特征向量。
3)小波变
换系数聚类
考虑到上面最后所说的直接用能量值作为特征的缺点,不同于上述直接采用
能量作为
特征,对各尺度上的小波系数都分别进行聚类分析,将各尺度上的小波
系数划分为多个聚类,在各个聚类
里求所有的小波系数的能量和,将这一系列能
量和作为用来分类的特征。
3.3.2基于小波包
变换的特征提取
1)基本原理
统计热力学认为熵是物理系统状态概率的测度,用来反映系统状态
的无组织
(或紊乱)程度。在信息论中,这种无组织情况可具体理解为随机信号序列的不
定性表
现。因此,信息论中将熵衍生为随机信号序列的概率密度的泛函。熵越小,
基于小波变换
的特定图像识别的应用研究
随机信号序列的不定性程度越低,从而该序列代表的信息量状态也就越稳定。
目标采样后得到时域内的随机信号序列。利用小波包分解,可将该时域随机
信号序列映射为时间
尺度域各子空间内的随机系数序列。此即表明,按小波包分
解得到的最佳子空间内随机系数序列的不定性
程度最低,在小波包变换域内的目
标信息状态最为稳定。这种小波包分解结果中所包含的最稳定的信息状
态可视为
目标包含的特征状态。而不同种类目标对应的特征状态,一方面可由各自对应最
佳子空
间的熵值及熵值总和来衡量;另一方面则可通过按最佳小波包基分解后呈
现的二叉树拓扑结构来反映。因
此,将最佳子空间的熵值及最佳子空间在完整二
叉树中的位置参数作为特征量,可以用于目标识别。2)最佳子空间熵特征的提取方法
小波包库包含了多种小波包基,而每一组小波包基都构成r俾)的
一组正交
基,因此只需按其中某组小波包基进行分解即可。Coifman和Wickerhauser
已在
他们的文章中提出了利用信息代价函数选取最佳小波包基并进行分解的算法。实
际特征提取
时,各个目标的最佳小波包基选取不可预见,对应的二叉树结构各异,
即便是同一类目标,其二叉树的结
构也略有不同。因此,为了能得到统一的特征
向量形式,同时充分利用不同二叉树的结构信息及所有最佳
子空间对应熵值,可
以以尺度为基准,将每一尺度下属于最佳子空间的熵值求和,以和值作为该尺度下的特征量,并将所有尺度下的特征量依尺度分解顺序组合在一起,形成最终的
特征向量。
3.3.3基于适应性小波神经网络的特征提取
按以前的方法,信号的自适应小波特征是通过对信号进行
适应性小波表示实
现的。其原理如下:任意信号s(t)可以用母小波h(t)及其子小波的加权求和近
似
表示,即
衲;争wkh(盟)
m)=∑k=l
寻)
(3.19)<
br>。.1”
“量
式(3.19)中,wk、a。和反是每一子小波的权系数、平移因子和伸
缩因子。
信号的这一近似表示可以用下图3.7所示。
基-T-,'I,波变换
的特定图像识别的应用研究
网络参数M,包和吼可通过求一能量函数E=三喜[s(f)一:(纠2的极
小值而
优化得到。用梯度下降法求得函数E的最小值后,即可得到网络参数%,仇和q。
将这些
参数按序排列可得到信号的特征向量:
矿={M,v2,…,%)={Ⅵ,6I,al,w2,62,口
2,…,wt,‰,a女)
.
图3.7:小波神经网络结构图
3.3.4方法分析上述各种方法都有其适用的地方,在实际当中方法是没有好坏的,只有合适
不合适。理论上讲基于适
应性小波网络的特征提取方法具有非常优异的特点,因
为它可以把信号通过超级小波拟合表示出来,特征
提取效果应该很好。但是具体
计算过程复杂,运算量大,计算速度慢,且对信号的初始状态或者预处理依
赖较
大,这是该方法最大的不足。为了尽量保证纸币识别的实时性要求,我们在后面
的试验中没
有采用这种方法。后面我们结合实际的纸币图像特征选用了基于小波
系数的特征提取方法。在后面章节我
们将重点提到。
基于小波变换的特定图像识别的应用研究
第四章基于小波变换系
数的纸币识别的实现
纸币的识别在金融业的作用越来越重要,自动取存款机(ATM)的广泛应用,一些银行专用设备像一些小型的点钞机或是验钞机的出现,是纸币识别的地位越
来越同常化。然而从
目前现有的国内产品来看,就拿自动存款机来说,存在着速
度慢、不稳定、能识别的币值种类少等种种问
题,因此,为了加快银行业的全面
自动化的步伐,有必要对其功能等作进一步的开发研究,以更好地为银
行业服务。
本论文采用比较成熟的统计模式识别法,基于统计模式识别方法的系统由以下几
个部
分组成:图像数据的获取、预处理、特征提取和分类识别。下面将从识别系
统的设计、系统算法的实现和
实验结果分析三大块来详细的阐述基于小波变换系
数的纸币识别的实现。
4.1基于小波变换系
数的纸币识别系统的设计
统计模式识别法常分为三步来实现:预处理、特征提取和分类识别。本系统的设计也是按这三大步来做的,下图4.1是本系统的具体算法实现流程图:
基于小
波变换的特定图像识别的应用研究
图4.1:基于小波变换系数的纸币识别系统实现流程图
上述
流程图详细的显示出了系统具体算法的各个步骤。从上图4.1可看出,
系统分为左右两大块:左为训练
部分,右为识别部分。但不管是那部分,都要经
过预处理、特征提取和分类识别这三大步。下面分别讲讲
三大步的具体算法设计。
在预处理中包括了选区域和倾斜校正两个功能函数。算法实现时,选区域是在倾斜校正的前面的,而不是先校正后选区域。这样做是考虑实际的算法的可操
作性,选区域算法的
作用是把选取的区域的坐标保存在PC机上。以便供训练和
识别调用。
在特征提取中,训练和识
别都是要调用它的,不同的是:训练时的小波特征
值是要保存下来的;而识别时是不要保存的,识别时提
取的特征值直接和训练出
来的所有特征值做比较。这就到了下一步了,分类识别。
理论的分类识
别的算法非常多,选用欧式距离法分类主要是考虑实际的应
用。我们知道系统设计好坏考虑的三大主要因
素:识别率、运算速度和移植性。
在基于具体硬件系统实现此算法时,如果仿真时识别率很高,具体实现
也应不存
在问题;而移植性也不存在问题,因为本系统的关键算法都是用c语言实现的;
37<
/p>
基于小波变换的特定图像识别的应用研究
本系统实现好坏影响的因素是运算速度:
训练的时候因为是在PC机上仿真的,
这时运算速度是看不出来的,但在设计系统算法的时候,必须要有
意识的考虑运
算速度的问题,本系统考虑到小波变换的提升算法时间虽然很快,但为了不影响
整
体算法的运算速度,在分类识别的时候本论文只选用耗时最少的欧式距离法进
行分类识别。
系统
的实现是在Visual
C++2005软件平台来仿真的,主要所用语言是C++,
系统的实
现只是仿真,并没有放在任何具体硬件平台上实现。所以本论文的系统
设计要考虑的主要问题就是算法在
具体应用的有效性。
4.2基于小波变换系数的纸币识别系统的实现
4.2.1基于卢布纸币的
预处理
1.卢布纸币的倾斜校正
本论文从实际出发,只做两种处理:一是倾斜校正;二是选取感
兴趣区域。
我这里重点介绍一下倾斜校正的方法。倾斜校正可分为两部分来实现:先确定图
像倾
斜的倾斜角,再在此上的基础上完成图像的校正旋转。
1)倾斜角的确定
算法原理:通过最小二
乘法直线拟合确定纸币的四条边缘,以四条边缘确定
四个顶点的位置,以此最终确定纸币的倾斜角。具体算法如下:
因为实际当中采集的纸币图像往往有残缺性,即这些点可能落入残缺区,使
拟合线不再准确,所以本论文提出使用两次直线拟合的方法,第一次直线粗拟合
可以寻找到落入残缺区的
点,并加以抛弃,用剩下的特征点再次拟合就可以得到
纸币图像的边缘直线方程。
a.拟合特征
点的检测
纸币边缘的检测首先需要检测边缘上的有限特征点。纸币有四个边缘,从水
平方向搜索
可以确定纸币图像的左右边缘上的有限点,从垂直方向搜索可以确定
纸币图像的上下边缘上的有限点。这
里以确定上边缘线为例来说明边缘线有限点
的检测,算法从图像的垂直方向由上边缘向下搜索。
基于小波变换的特定图像识别的应用研究
确定上边缘需要若干个上边缘上的特征点,针对
卢布纸币的特征,本文确定
上下边缘都搜索16个特征点。搜索时首先从纸币背景上边界的中点开始向左
右
等距离分开这16个点的搜索位置,然后从上向下搜索。在等距离分开这16个点
时,要考虑
到分开的距离要合适,要求这16个点都包含在采集到的图像中的纸
币图像内,避免落在了背景区。一般知道扫描的图像背景区域为黑色,纸币图像边缘与背景的分界线较为明
显,只要在实际的系统环
境中对所有纸币做试验就可以估计出此阈值。对于每一
个搜索点,将此搜索点与阈值比较,从而确定此搜
索点是否为边界线的特征点。
其他边缘线上的特征点的确定与上边缘特征点确定的方法一致。这里就不再
一一赘述。
b.两次直线拟合边界检测
所谓最小二乘直线拟合就是使用一元线性回归方
程来处理两个变量之间关
系,并使用最小二乘法来估计参数。假设一元线性回归方程为:
Y=口
+px+善
(4.1)
式中Q,∥为回归系数,X为自变量,Y为因变量,£表示随机误差,常
常
假定£遵从正态分布N(0,仃2),这表示误差为正和负的机会一样多,盯2表示误
差的大
小。式中Q,∥,仃2通常是未知的,它们要通过数据的信息来估计。设
{(鼍,Z),i=1,2,…
,刀)为一组数据,若用回归方程来拟合,则当X=置时I的估计
值为:
线性回归方程为:^
Yi=仅+pXt
^
(4.2)
自然,我们希望口和∥使誓与I很接近
,也就是说,我们要决定一条直线,
使其与所有的点都比较接近,最流行求口,∥估计值的办法是用最小
二乘法,令
Q:窆(影一t)z:窆(1一口一∥五):
f_l
(4.3)
扭
l
最d"Z乘法是求口和∥使Q达极小,使Q达极小的历和∥记为a和b。利用微积
39
基于小波变换的特定图像识别的应用研究
分中求极值的办法
筹一2喜(即啦)
-o
器=之置喜盱州耻。
求得a和b,最终最小二乘法的直线拟合方程为:
Y=a+b
X
(4.4)
(4.5)
(4.6)
其中a和b分别为:
口:歹一6
牙
(4.7)
6:三盟
L)口(
(4.8)
式中:
叉=去喜
鼍
F=吉喜z
k=∑(墨一-y)2
b=∑(墨一叉)(髟一F)
(4.9)
㈤10)
(4.11)
(4.12)
对于纸币识别系统,纸币图像的四个边缘
线在图像中呈现四条直线,因此就
可以使用最小二乘直线拟合来拟合纸币边缘线。对于每一个边缘线而言
,搜索特
征点个数可以由实际情况确定,在这里对每一边缘线令搜索到的有限点集合为:
{(五
,M),(恐,儿),…(‘,以))
n为某一边缘线有限点个数
本文根据拟合特征点的检测方
法选取n的值为16,并由这16个有限点作第
一次最小二乘线性回归方程拟合上边缘线:Y=AX+B
,其中:
么:妻!兰:三主:!萼二三姜兰!
善(薯一去善∥
。4.。3,
基于小波变换的特定图像识别的应用研究
B=-磊1”y,-A×去嘉薯
(4.1 4)
从最小二乘线性回归的思想可知拟合线满足所有的样本点。但是,实际情况
中,纸币的边缘 可能存在残缺,如果有限点中存在边缘残缺区的点,也即局外点,
就可能导致拟合线偏离边缘线。为此, 需要使用某种方法从有限特征点中将局外
点寻找出来,用剩下的不包含局外点的有限特征点再次拟合边缘 线。
实际情况下,拟合特征点的检测法检测到的有限点中只有个别点落在了残缺
区,成为局外点 ,剩下的有限点皆为局内点,也就是说局外点个数的概率远小于
50%。根据最小二乘直线拟合的方法需 要保证Q=∑(I一霉)2=∑(I-a-p&)2
i=li=l
的Q值最小,那么个别局外点 距离拟合线必定较大,大多数局内点距离拟合线
必定较小,才可保证Q值最小。因此,本文根据这一点来 寻找有线点中残缺区
边缘点:
局外点={l"-(Ax,+B)l较大的点}
i=1, 2,…,刀
然后从有限点集合中将局外点抛弃,剩下的有限特征点构成新的集合。我们
以新的有 限点集合再次作最d,-乘线性回归方程拟合上边缘线。此时拟合线去除
了局外点的破坏,将更接近于实 际的上边缘线。
其他三个边缘线方程都使用同样的方法来完成,最终确定了纸币图像四个边
缘线 的方程。纸币的上下边缘线和左右边缘线相互之间的四个交点为卢布纸币图
像的四个顶点,从而确定出人 民币图像在采集到的图像中的位置,进而可确定纸
币倾斜的角度口。
2)旋转校正
倾斜 角度的确定,接下来就是图像的旋转,旋转算法的重点是旋转的中心的
选定和旋转算子的计算。
倾斜校正的一般原理是:所有图像点先转换到新坐标系中,然后在新坐标系
中完成旋转,最后再转换到初 始坐标系中。
在本文中,对于所有的图像都是以整幅图像的中心点为旋转中心的。图4.2
显示 了旋转变换中各坐标系间的相互关系,其中坐标系xoy为初始坐标系,坐标
系X]O㈠Y为以图像中心 为原点的新坐标系。
41
基于小波变换的特定图像识别的应用研究
图4
.2:两种坐标系间的转换及图像旋转示意图
由上图4.2可知,映射前的图像是以纸币左上角为原点o
(O,O)的坐标系xoy,
新坐标系XlO¨Y的原点为旧坐标系的0t(a,b)坐标点。设图像上
的一点P在坐标系
xoy上的坐标为P(x,y),在坐标系XlO¨Y的坐标为P(Xl,Y1),<
br>则
100
cx
y・,=c.而乃t,[壹丢;][墨三
们√副
=(焉
咒
D
000
(4.15)
口
6l
设在坐标系
X101Y1上,P沿顺时针旋转角度9后的位置为A(而,Y:),P。在坐标系
xoy上的坐标为p
1(Xo,Y。),
C
..sinO
ol
I
(而
耽
1)=(而
M
、,
S
秒秒cos00
1
(4.16)
∞洫O
01
J
l
l0
(%Yo1)=(X2
Y2
●I
、J
0
o(4.17)
口
6
到
-I
由
上面的三个式子(4.15)、
(
t6
入
r7
,
可
孙
:
一
O
C
.署
.U
(%Yo
1)=(X
Y
D
●0
.
o
S
秒p
,.c旧秒
一一
哪6
㈧叽刊
∞.口O
潞。
略0
㈦;](4.㈦
又由上式(4.18)可的方程组:
ll
XCO
一
y
S
m<
br>+
6
一
{宝
十
(4.19)
‰%
=
XS.Ⅱ
p秒
+
y
C
∞
秒9
一以
咖咖口p
一
口6
哪
秒9
+
口6
42
摹于小波变换的特定圈像识别的应用研究
由上式可计算出坐标系工即上每一点绕口,旋转变换后
的新位置。下图4.3是旋
转校正前后的卢布灰度图像。
匿圄
图4.3卢布圈像的倾斜
校正前后的比较
2.选取感兴趣区域
选取感兴趣区域的作用是一种辅助工具,它的用处是对纸币
图像经观察后选
取对特征提取有用的区域出来,同时她也能减少一定计算量。但它和倾斜校正有
一点不一样,它的算法往往不需要移植到具体的系统里去,这点就为其算法的实
现摘单化很多了。程序运
行产生的坐标才是选区域程序所有用的结果,具体的算
法不是主要.所以本论文在这里不对此算法做过多
的分析。算法主要利用了
OPENCV里的一些函数。
4.2.2对卢布纸币小波变换算法的实
现
1.小波系数在卢布图像中的应用
前面一章已经对小波变换的理论做了充分的分析,这里不再
赘述。本节主要
是对小波系数对卢布纸币识别的物理意义做一定的分析。
图像经小波变换后其能
量还是守恒的,只是把能量进行了再一次的分配而
已,主要分为低频和高频两部分。低频部分的占了原图
的90%以上的能量,所以
以前大部分的小波研究都是集中在低频部分的研究;而往往把高频部分的信息
丢
弃不要。本论文以前人的研究反道而行,只对小波变换后的高频信息傲研究,低
频信息只做再
次小波分层的用处。
我们知道高频部分的信息一般保存是图像的边缘细节信息,这点对纸币图像
的边缘特征的提取打下理论基础,也为小波变换后高频信息有实际应用价值打下
基础。
假设一幅
N}N的图像』(z,y),其中下标指示尺度并且N是2的幂。对于
j=0,原图像的尺度为2’=2
。=l。j值的每一次增大都使尺度加倍。分辨率减半。
每一次通过隔行隔列采样,图像被分解为4个大
小为原来尺寸四分之一的于频带
43
基于小波变换的特定图像识别的应用研究<
br>区域,这4个子频带区域的每一个都是由原图与一个小波基内积后,再经过x和
Y方向都进行2被
的间隔抽样而产生的。对于第一个层次(j--1),可写成:
/?(,”,,z)=<石(x,y),
矽(x一2
m,Y一2
n)>
爿(m,以)=<六(x,y),p1(x一2m,Y一
2n)>
疗(m,刀)=<Z(x,y),缈2(x一2m,Y一2n)>
刀(聊,以)=<f
l(x,少),缈3(x一2m,Y一2n)>
而对于后继的层次(j>1),E(x,y)都以完全相
同的方式分解而构成4个尺度上
的更小的图像,如下图所示。我们对图像数据进行三层小波分解,得到塔
式数据
结构如下图所示。其中L表示低通滤波器,H表示高通滤波器,则LL、HL、LH
和H
H构成了4个具有不同频率特性和方向特性的滤波器。LL用于检测图像中
的低频成分;LH用于检测水
平方向的边缘和细节分量;HL用于检测垂直方向
的边缘和细节分量;HH用于检测主对角线和副对角线
方向分量。
将内积写成卷积的形式,可有:
e+。(朋,门)={[e(w)宰矽(噶一y)]
(2聊,2刀)}
乞+。(聊,刀)={[e(训)木缈1--X9--y)](2聊,2咒))
名“m,门)={[e(w)木驴2(飞一y)](2历,2刀))
名+.m,刀)={[e(训)木
缈3(一x:一y)](2聊,2刀))
并且在每一层进行4个相同的问隔抽样滤波操作。
基于小波变换的特定图像识别的应用研究
跳l棚幺
LH2HH2
HL-一<
br>LHlo
HHI,J
图4.4:小波变换分解图
由小波变换的算法可知,只要我
们在程序中有意识的把高频和低频的信息分
开来保存,那么这将很容易得到高频的信息。再根据图像的大
小分出每块对应的
是哪部分信息。小波变换应用于卢布纸币的物理意义关键是把变换后的高频信息
提取起来。下面是具体小波算法的提出,实际当中算法的速度是关键,如果一个
算法耗时比较多,那这
个算法是没有什么利用价值的。小波变换的经典算法是
Mallat算法,但它不是最快的算法,现阶段
最快的小波变换算法当之无愧为小波
的提升算法。
2.提升算法的提出
上一章已经对小
波提升算法的原理做了详细的阐述,通过原理可知一个标准
的提升算法包含3个步骤:切分、预测、修正
。小波提升算法的核心是更新算子
和预测算子,通过预测算子可以分离出高频信息,通过更新算子可以得
到正确的
低频信息。
现在比较实用的两种提升算法:W5/3d、波提升算法和D9/7d、波
提升算法,
本论文采用W5/3d、波提升算法,W5/3小波提升算法仅需一次预测和更新就可完成变换,算法可对图像进行无损处理,这点D9/7不如它;而且在实际硬件实现的
时候,相对于其
它提升算法,其基本不增加硬件数量,可以节约变换的时间,减
少器件空闲时间。下图4.5为W5/3
小波提升变换算法的结构:
“”)
d(”)
45
基于小波变换
的特定图像识别的应用研究
图4.5-W5/3小波提升变换
算法的设计:对于二维离散小波变
换,采用提升算法进行实现,可以采用两
级一维提升算法级联进行,即把NXN矩阵先看作N行数组,采
用提升算法,先进
行行变换,输出的结果仍为N×N矩阵,将其看作NYU数组,再进行列变换,完成二维变换。这种方法原理简单,易于实现。
~
对于采用W5/3抽头滤波器,其低通滤波
器系数为(6/8,2/8,.1/8),高通
滤波器系数为(1,.1/2),整个小波变换系统函数
为:
皇一!z一!z一-
三+三z
一一一Z一一Z。一十一Z
p(z)=888
z一-
8
1
8
一!一一1
一…Z。
22
(4.20)
m,=护枷01
o]
¨∥+。=一j1(置,2j"1"Xi纠
+:)+
z,:』=i1(r,2j-I-I-Y/,:/+。)+z,:/
同样可以得到再进
行列变换后的数据乙,,也满足:
㈧2・,
假设图像数据为五,J,o≤f,歹≤N一1,于是
有行变换后得到的数据X√满足:
(4.22)
Z2M,,:一委(艺u+K件:,,)+匕Ⅲ
,,
二
.
(4.23)
Z2i,j=1(Z2i-l,j
dl-Z2
M,』)+影,:,
由上面的式(4.23)可以看出采用提升算法进行变换,可以直接通过原始数据x计算奇序数的变换后数据K,而如果要计算偶序数变换值艺,需要首先得到
与之相邻奇序数数据
的变换值虼。
基于小波变换的特定图像识别的应用研究
4.2.3统计分类识别
方法
本论文采用的是统计模式识别法。统计模式识别的基本原理是:有相似性的
样本在模式空间
中互相接近,并形成“集团”,即“物以类聚’’。其分析方法是
根据模式所测得的特征向量置=(%,
蕾:,…,勃)r(i一1,2,…,N),将一个给定的模
式归入C个类Ⅵ,w2.…,wc中,然后
根据模式之间的距离函数来判别分类。其中,
T表示转置;N为样本点数;d为样本特征数。
统
计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法,
特征分析法,主因子分析法等。
统计分类法又可分为监督分类法和非监督分类法。
监督分类法中,类别名已知的训练样本是预先
给定的。而非监督分类法是根
据模式之间的相似度进行分类的,将相似度强的模式归为同一类,所以非监
督分
类法又称为聚类分析。这种方法是很有用的,但本论文不采用这种方法。本论文
还是选用监
督分类法中的欧式距离法进行分类。
所谓监督分类法就是根据预先已知类别名的训练样本,求出各类在特
征空间
的分布,然后利用它对未知数据进行分类。分类方法如下:
(1)根据类别名选定训练样
本,求各类特征矢量分布的判别函数g。~&(c
为类别数)。这一过程称为学习。
(2)对于
待分类的特征矢量(或称模式)X=(五,x2,…,%),计算各判别函数
的值蜀(x)~晶(工)。
(3)在蜀(石)~&(工)中选择最大者,把模式X分到这一类中。
换句话说,监督分类法就
是根据训练样本把特征空间分割成对应于各类的区
域。其分类中关键是判别函数的选用,常有的判别函数
很多。
常用的判别函数有:最小距离法、线性判别法、贝叶斯分类器等方法。
线性判别法是应用
较广的一种方法,它是图像所有特征量的线性组合。即
g(X)=aX+b。
47
基于小波变换的特定图像识另II的心用研究
采用线性判别法进行分类时,一般将m类问题分
解成(m-1)个2类识别问题。
方法是先把特征空间分为1类和其它类,如此进行下去即可。而2类线
性分类是
最简单、最基本的。其中线性判别函数的系数a可通过样本训练来确定的。
贝叶斯分类
是统计学分类方法之一,它是一类利用概率统计知识进行分类
的算法。在许多场合,贝叶斯(Naive
Bayes,NB)分类算法可以与决策树和神经
网络分类算法相媲美,该算法能运用到大型数
据库中,且方法简单、分类准确率
高、速度快。由于贝叶斯定理假设一个属性值对给定类的影响独立于其
它属性的
值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为
此,就
出现了许多降低独立性假设的贝叶斯分类算法,如TAN(tree
Bayes
augment
ed
network)算法。
实际上,设计贝叶斯分类器时,其实已经采用了准则函数,所用的
准则是
错误率或风险。贝叶斯分类器的错误率或风险最小的,所以通常称之为最优分类
器,而其
他准则函数下得到的分类器则称之是次优的。在本论文中不采用贝叶斯
分类器主要是考虑到算法的运算时
间。
欧式距离是最小距离分类法的一种,欧氏距离(Euclideandistance)是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。
在二维和三维空间中的欧式距离的
就是两点之间的距离,二维的公式是
厂————————_=—’‘‘‘’—————●
d=√
(五一X2)2+(Yl一.耽)2
三维的公式是
d=√(而-x02+(M一儿)2+(zl
—z2)2
欧氏距离看作信号的相似程度。距离越近就越相似,所以两模式的距离越远
越好,在
实际钱币识别的特征提取时,各种样本的相似程度就越差越好,这也决
定了纸币识别率的高低。
欧式距离只是最小距离判别法里的一种,最小距离分类法还包括L距离、相
似度等分类法。这里就不再赘
述。
4.2.4基于小波变换系数的纸币识别系统的仿真实现
整个系统的实现只是在Visua
lC++2005软件平台仿真,通过在Visual