旋转角可变的人体检测算法

时间:2024-11-10 17:25:32 来源:作文网 作者:管理员

摘要:常用的人体检测算法多应用于无旋转角的情况,而在旋转角可变的情况下检测性能有限,为此提出了一种适用于有旋转角的人体检测算法。首先,通过径向梯度转换(RGT)获得具有旋转不变性的梯度;其次,使用类似于梯度方向直方图(HOG)特征中相互重叠块的组合方式,获取多个带有旋转角信息的特征描述子,按旋转角大小将它们一维线性连接成具有旋转不变性的特征描述子组;最后,利用基于支持向量机(SVM)的二级级联分类器实现了带旋转角的人体检测。基于INRIA行人数据库的144个不同旋转角的人体测试集检测率都不低于86%,144个不同旋转角的非人体样本误检率均低于10%。实验证明了该算法可用于在任意旋转角图像上进行人体检测。

关键词:旋转不变;梯度方向直方图;径向梯度变换;级联分类器;支持向量机;人体检测

中图分类号: TP391.41 文献标志码:A

英文摘要

Abstract:Prevalent human detection methods are usually applied in cases without rotation angle, and their detection rates are poor when rotation angle varies. In order to solve the issue, an algorithm which could identify human with variable rotation angle was proposed. Firstly, Radial Gradient Transform (RGT) method was adopted to obtain the rotationinvariance gradient. Then, adopting the method similar to the way that blocks were overlapped in the Histogram of Oriented Gradient(HOG) feature, a plurality of descriptors with rotation angle information were obtainปed and connected linearly into a descriptor group with rotation invariance feature, according to the descriptors rotation angle. Finally, the human detection algorithm was conducted with the support of a twolevel cascaded classifier based on Support Vector Machine (SVM). The recognition rate of the proposed algorithm achieves more than 86% for a human test set with 144 different rotation angles based on the INRIA pedestrian database. In the meantime, the false detection rate is less than 10% for a nonhuman test set with 144 different rotation angles. The experiments indicate that the proposed aღlgorithm can be used for human detection in an image with arbitrary rotation angle.

英文关键词

Key words:rotationinvariance; Histogram of Oriented Gradient (HOG); Radial Gradient Transform (RGT); cascaded classifier; Support Vector Machine (SVM); human detection

0 引言

Takacs等[13]提出一种低维度并具有旋转不变性的快速旋转不变特征(RotationInvariant Fast Feature,RIFF),该特征使用径向梯度转换(Radial Gradient Transform,RGT)算法和压缩梯度方向直方图(Compressed Histogram of Gradients,CHoG)特征[14]。RIFF特征的检测窗是一个直径为40个像素的圆形,将检测窗等分成4个同心圆环,对每个圆环提取CHoG特征。虽然RIFF特征拥有高速、旋转不变性等优点,但由于其特征维度少,许多人体的特征细节难以得到很好的体现,不适用于人体的检测。

为了克服拍摄视角给人体检测的应用带来的局限性,本文使用具有旋转不变性的梯度方向直方图,结合Dalal提出的HOG特征中可相互重叠块的方法,提出径向梯度转换梯度方向直方图(Radial Gradient TransformHistogram of Oriented Gradient,RGTHOG)特征描述子组,该特征描述子组具有多角度旋转不变性。相互重叠块的方法对旋转角有较好的鲁棒性,在旋转角度小于两个相邻的旋转不变角差值的情况下依然能较好地刻画出人体的特征。配合以线性核支持向量机(Support Vector Machine,SVM)为基础设计的二级级联分类器,实现了适用于旋转角可变场景的RGTHOG人体检测算法,RGTHOG检测算法流程如图1所示。由于行人具有一般人体检测中服饰变化、姿态变化等特点,因此本文将行人作为人体检测对象,利用INRIA行人数据库验证本文提出的人体检测算法。

1 RGTHOG特征描述子组

1.1 概述

1)得到圆形待检测图像;

2)使用Gamma校正对图像归一化,减弱环境光照对人体目标识别的影响;

3)计算图像梯度;

4)使用RGT算法对图像梯度进行变换,得到具有旋转不变性的RGT梯度;

5)将图像分成若干个单元格(Cell),每个单元格中所有像素⌚的RGT梯度向直方图通道(Bin)做加权投影;

6)将相邻的单元格组合成块(Block),一维线性链接块内单元格的加权投影结果,并对加权投影结果进行归一化,归一化结果作为Block的特征向量;

7)位置旋转角相同的Block组合成扇区(Sector),每个扇区中所有Block的特征向量一维线性链接得到Sector的特征向量;

8)选择任一个位置旋转角的扇区作为起点,按位置旋转角大小以升序的方式依次链接所有扇区,得到带有位置旋转角信息的RGTHOG特征描述子;

9)将所有带有不同位置旋转角信息的RGTHOG特征描述子无序组合,得到RGTHOG特征描述子组。

1.3 单元格

Dalal等[6]在提出HOG时通过实验证明使用线性核SVM和高斯核SVM可有效地对人体与非人体进行分类,在检测效果上高斯核SVM要比线性核SVM好,但也带来了大量的运算时间。考虑到高斯核SVM运算量太大,本文将采用两个线性核SVM级联的方式对人体目标进行分类,其中第一级分类器用于粗略判断检测窗中是否有人体,并确定人体在图片中的旋转角度;第二级分类器用于精确判断第一级分类器的结果。

2.1 第一级分类器

其中I1对应的人体旋转角σ1为检测窗中的人体旋转角。

这个4类分类器可看作为3个两类分类器的叠加,这种叠加会使得负类的误检率增加,因此需要一个两类分类器作精确判断。

2.2 第二级分类器

基于两类的线性核SVM作为第二级分类器,通过σ =0°正训练样本和无人体负训练样本进行训练,得到一个高精度的两类分类器。通过第一级分类器判断出检测窗中存在人体并获得人体旋转角σ1,不通顺,未完?与下一句矛盾“特征描述子D1”后多了“,”,把“,”删除即可

将σ1所对应的特征描述子D1通过式(8)计算得到人体旋转角为0°的特征描述子D′,将D′ 送入第二级分类器中作精确分类,得到检测窗中人体检测的最终结果。

3 仿真实验

本文的实验平台:Intel Core i7 2.4GHz,8GB内存,Matlab R2012a。

3.1 实验参数

由1.3节可知,同心圆环数N越大,每个圆环M等分的Cell越多,具有旋转不变性的角度越多,但每个Cell中人体细节越少,影响人体的检测率;而M、N过少,每个Cell包含的人体特征过多,细节将难以体现。

级联分类器使用Lin等[16]开发的LIBSVM软件包中的SVM算法,两个级联分类器均采用线性核函数。

3.2 实验结果

在实验过程中,将正测试£集和负测试集在[0°,360°)的区间内以2.5°的步长旋转,共得到144个不同人体旋转角的测试集和144个不同旋转视角的非人体测试集。第一级分类器和第二级分类器在正负测试集上的检测率和误检率分别如图6、图7所示。

图8将第一级分类器与分类结果进行了对比,分类结果与第一级分类器的曲线相似。加入了第二级分类器虽然降低了平均2%的人体检测率,但却有效降低平均8%的非人体误检率。 本文对提出的检测算法中特征提取和分类所消耗的时间如表1所示,其中分类时间是特征提取时间的5到6倍。由于第一类分类器在进行人体和角度判断时,使用了线性核SVM进行了M次预测,加上第二级分类器的精确判断,本算法共使用了M+1次线性核SVM进行预测,因此大幅度地增加了分类时间。

3.3 与HOG检测算法的比较

HOG是目前行人检测中使用最广泛的算法,而本文的测试样本使用的是INRIA行人数据库,因此将HOG检测算法与本文提出的RGTHOG检测算法进行比较。

由图9(a)的比较结果得,HOG检测算法在旋转角为(-10°,10°)区间内拥有高检测率,但随着旋转角的增大,检测率则不断下降,而RGTHOG检测算法则在测试旋转角范围内保持这良好的识别率。图9(b)中HOG检测算法误检率在[-45°,45°]范围低于本文提出的检测算法。

4 结语

RGTHOG检测算法的可行性。使用线性核SVM作为级联分类器的处理时间较长,对实时应用带来一定影响,如何提高级联分类器的处理速度仍有待研究。

参考文献:

[2]DOLLAR P, WOJEK C, SCHIELE B, et al. Pedestrian detection: an evaluation of the state of the art [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761.

[5]ANDRILUKA M, SCHNITZSPAN P, MEYER J, et al. Vision based victim detection from unmanned aerial vehicles [C]// Proceedings of the 2000 IEEE/RSJ International Conference on Intelligent Robots and Systems. Piscataway: IEEE, 2010: 1740-ฑ1747.

[6]DALAL N, TRIGGS B. Histograms of oriented gradients for human detection [C] // CVPR 2005: Proceedings of the 2005 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2005, 1: 886-893.

[7]MU Y, YAN S, LIU Y, et al. Discriminative local binary patterns for human detection in personal album [C] // CVPR 2008: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2008: 1-8.


热门排行: 教你如何写建议书