基于纸币透射图像的新旧检测
摘 要: 纸币新旧检测是纸币清分机中的一个重要功能,与传统的基于纸币反射图像检测纸币新旧等级不同,采用了纸币的透射图像进行纸币新旧检测。根据纸币的新旧程度人工划分为3个等级,分别使用了基于灰度图像整体亮度的新旧检测法和传统的模式识别的方法,采用纸币透射图像直方图分布作为纸币新旧特征,分别使用了KNN、SVM分类器进行分类,并且提出一种简单的级联分类器。实验结果表明级联分类器比KNN和SVM的单独使用有更好的表现。
关键词: 透射图像; 模式识别; SVM; 级联分类器
New and old banknotes′ classification based on transmission images
QI Lei, REN Ming?wu
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
Abstract: Classification of new or old banknotes is a important function in the banknote sorter. The transmission image is adopted in this paper to detect new or old banknotes. It is different from the traditional new or old banknote detection based on reflection images. According to the new or old degree of banknotes, all banknote samples are divided into three grades. The new or old banknote detection method based on gray level image brightness and pattern recognition method are used respectively. The histogram distribute of transmission image is used as feature of new or old banknotes. The KNN and SVM classifier are employed to carry out classification. A new ッ cascade clasฒsifier which combines SVM and KNN is put forward. Test proves the new cascade classifier is more effective than SVM and KNN in detection of new or old banknotes.
Keywords: transmission image; pattern recognition; SVM; cascade classifier
0 引 言
纸币清分机是一种集光机电磁于一体的高端金融现金处理设备,其主要功能是对纸币进行面值、面向、新旧程度及纸币序列号的识别。纸币清分机挑选适合在市场中流通的纸币、高效地代替了人工选择可流通纸币的工作。当纸币流通时间过长时,表面会出现粗糙、模糊、磨损等现象。过旧的纸币影响了纸币的真伪鉴别、冠字号识别等,导致货币在市场中的流通带来了不便。根据中国人民银行发布的《不宜流通人民币挑剔标准》,过旧的纸币不宜流通,因此纸币清分机中需要具有检测纸币新旧的功能来满足这样的需求。
本文将纸币的新旧程度划分为3个等级,使用纸币的透射图像对纸币进行新旧判断,分别采用了纸币透射图像平均亮度划分图像等级和传统的模式识别的方法,提取了纸币透射图像的灰度直方图分布作为纸币新旧检测特征,并分别采用了KNN(k近邻),SVN(Support Vector Machine支持向量机)分类器,并提出了一种简单的级联分类器。
1 图像数据说明
图1 原始采样数据分割
2 基于图像亮度的纸币新旧检测
目前,针对于纸币的新旧检测提出的大多数方法都与纸币的亮度有关,因为新旧纸币在图像采集的时候反光的强弱不同,所得图像的明暗有差异,因此可以根据纸币图像的亮度判定纸币的新旧等级。常用的方法有使用纸币空白区域的平均亮度,纸币反射图像某固定区域的平均灰度值。使用反射图像进行新旧检测时,必须先确定纸币图像的面向,还要定位到纸币的固定的区域。对于纸币透射图像,无论采集到的图像是纸币的正面或反面,所得的透射图像都一样,所以采用纸币的透射图像就不需要检测纸币的面向。采用图像的部分区域进行检测时,当此区域存在涂污时,对纸币的新旧检测结果产生影响。本文采用完整的纸币透射图像亮度的平均值检测纸币的新旧,具有更好的鲁棒性。
在所有训练样本和测试样本中,已经准确标记了纸币的4个顶ห点的坐标。这样就可以得到纸币边缘具体位置,可以利用行扫描,来统计每张纸币的所有点的灰度值的和,然后求得其平均值,根据平均值与自己设定的标准进行比较就可以得到纸币的新旧等级。但由于纸币在流通的过程中会出现磨损,完整的纸币图像经常存在一些噪声,例如对于过旧的纸币中往往存在细小的孔洞区域和图像边缘检测并非很精确(会残留一些白色背景区域),这就导致了所统计的透射图像的像素点中存在白色的噪声区域如图2所示,因此首先统计纸币透射图像的灰色直方图,然后将根据纸币图像的直方图去除亮度前%α的点和后%α的点,最后计算所有剩余像素点的平均灰度值。
图2 原始图像
基于纸币透射图像平均亮度检测新旧,具体步骤如下:
(1) 统计训练样本中新旧程度最新的样本(本文为等级1)纸币透射图像的灰度直方图,并去除最亮的前%α和最暗的前%α,计算每张纸币的平均亮度,最后计算所有样本平均亮度设为[vmax]。同理计算得到训练样本中新旧程度最旧样本(本文为等级3)的平均亮度设为[vmin]。
(2) 统计待检测的样本的灰度平均值,方法同(1),得到纸币透射图像的亮度为[v]。
step3判定新旧等级,根据以下公式:
3 基于模式识别方法的纸币新旧检测
纸币的新旧检测除了采用图像的整体平均亮度值,近年来也出现了将纸币的新旧检测转换为模式识别的问题,例如文献[9]基于BP?LVQ神经网络的纸币新旧识别算法研究,首先提取纸币图像的新旧特征,然后将特征送给分类器识别,得到识别结果,具体过程如图3所示。
3.1 特征提取
纸币图像的新旧特征一般采用灰度直方图的分布统计,新旧纸币的差异不仅反映在纸币灰度图像的平均值上,在灰度直方图的分布中也有所差异。越新的纸币图像灰度直方图波峰靠后,越旧的纸币图像直方图波峰靠前。对于纸币透射图像也存在同样的表现如图4所示,分别为新旧等级一、二、三纸币透射图像直方图统计分布。统计每张纸币透射图像的直方图,得到256维的特征向量。所得到的特征向量中与基于亮度检测新旧具有同样的问题,图像中的最亮和最暗区域存在一定的噪声,使用上述相同的方法去除亮度前%α的点和后%α的点后统计直方图,得到256维纸币新旧特征,并归一化特征向量。
E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T3.tif
图3 模式识别方法的流程
E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T4.tif
图4 不同新旧程度的直方图
3.2 KNN
K近邻法(K?nearest neighbor,KNN)是由Cover和Hart在1968年提出的[10],它是最近邻法的推广形式,其主要的决策方法也是类似的,当k=1时就是最近邻法。K?近邻法是通过找到与待识别样本点最近的k个样本点,根据这k个训练样本的类别,通过多数表决等方式进行预测。因此k近邻法不具有显示的学习过程。k近邻法实际上利用训练数据集对特征向量空间进行划分,并作其分类的“模型”[11],K近邻法中的距离度量一般选用欧式距离。
判别决策规则:如果
则待识别样本[x∈wj]。
3.3 支持向量机
式中:[xi]为第i个特征向量,[yi]为[xi]的类标记,当[yi=+1]时,[xi]为正实例,当[yi=-1]时,[xi]为负实例,[(✯xi,yi)]称为样本点。假定训练样本集是线性可分的,学习的目标是找到最佳决策超平面,能将实例分为不同的两类。分离超平面方程为:
[w?x+b=0]
分类超平面将特征空间划分为两部分,一部分是负类,一部分是正类,法向量[w]垂直于超平面并指向正类部分。
一般情况下,当可知训练样本可以线性分开的时候,则几何空间中存在了无穷多个分类超平面可以将训练样本分开。但是支持向量机利两个平行向量之间距离最大化求得了最优的分类超平面,这时的解是惟一的,图5为样本在线性可分情况下的支持向量示意图。
E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T5.tif
图5 SVM线性可分
从图5可以看出,相同的样本训练机可以有不同的划分,(b)图代表着线性可分支持向量机,其中虚线代表最优的分类超平面,与分类超平面最近的样本点称为支持向量。从图5中可以看出,此时两条实线之间的间隔最大。对于线性不可分的样本,可引入松弛变量加以解决。对于SVM分类器进行训练就是求解[w]和[b]的过程,具体过程参考文献[13]。
有时分类问题不是线性可分的,这时就不能用线性可分支持向量机来解决问题,如图6所示。
E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T6.tif
图6 SVM线性不可分
非线性问题的实质就是把能够将其转化成线性问题。所用的方法,就是构造一个非线性变换,将样本点的特征从一个低维线性不可分空间映射到一个高维线性可分空间。这里,就引入了核函数的概念。
设[χ]是输入空间,H为特征空间,如果存在一个[χ]到H的映射[φ(x):χ→H]对所有的[x,z∈χ]都成立,函数[K(x,z)]满足条件
[K(x,z)=φ(x)?φ(z)]
则称[K(x,z)]为核函数,[φ(x)]为映射函数,[φ(x)?φ(z)]为[φ(x)]和[φ(z)]的内积。
若直接将输入数据映射到高维空间可能出现维度爆炸现象,可采用核函数在低维空间进行计算,不需要显示的写出映射后的结果,其处理后的结果与高维映射等效。
3.4 级联分类器
为得到更高的纸币新旧检测的准确率,本文设计了一种级联分类器SVM?KNN来判定纸币新旧等级如图7所示,第一级分类器采用SVM,第二级分类器采用KNN,首先使用训练样本对SVM分类器进行训练,得到SVN分类器的模型参数。
E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T7.tif
图7 级联分类器
4 实验结果与分析
表1 实验结果
实验结果表明在检测纸币的新旧等级实验中使用模式识别的方法明显优于使用图像亮度特征的方法,将SVM分类器和KNN线性级联使用的效果要优于它们单独使用,由于人工选择纸币新旧程度还存在一定偏差,在一定程度上也影响了新旧检测的整体结果。经试验分析误识别结果一般为相邻的两类新旧等级之间。
5 结 语
与传统使用纸币反射图像检测新旧等级不同,本文使用了纸币的透射图像对纸币的新旧等级进行检测,分别采用了基于图像整体平均亮度的方法和传统的模式识别方法,选用纸币透射图像灰度直方图的分布作为纸币新旧判别特征,分别使用了KNN,SVM和SVM?KNN线性级联的分类器。由于人工划分纸币新旧等级存在一定的误差,对于具体的新旧等级判别的界定比较模糊,如何解决这些问题并提高分类等级的准确性是本文后续研究的重点。
参考文献
[2] 李朝。.纸币清分机图像处理系统研究[D]. 湘潭:湘潭大学,2012.
[3] 谭家国.纸币图像高速采集系统设计[D].鞍山:辽宁科技大学,2012.
[5] 郭玉佳.纸币图像处理技术研究[D].哈尔滨:哈尔滨工业大学,2009.
[6] 许万征.纸币多光谱图像分析方法[D].哈尔滨:哈尔滨工业大学,2010.
[7] 李庆峰.基于图像处理的纸币清分系统关键算法研究[D].北京:中国科学院,2006.
[8] 魏军.纸币动态检测识别算法研究[D].哈尔滨:哈尔滨理工大学,2009.
[9] 王洪,陈丽,肖思宁.基于BP?LVQ神经网络的纸币识别算法研究[J].光学与光电技术,2010,8(4):64?67.