基于多特征降维和迁移学习的红外人体目标识别方法
2019-01-06王鑫张鑫宁晨
王鑫 张鑫 宁晨
摘 要:針对红外成像条件下人体目标受干扰严重时目标的识别准确性和鲁棒性较差的问题,提出了一种基于多特征降维和迁移学习的红外人体目标识别方法。首先,针对传统的红外人体目标特征提取方法提取某单一特征时存在信息涵盖不全面的问题,提取目标不同种类的异构特征,从而充分挖掘出红外人体目标的特点。其次,为了向后续识别分析提供有效且紧凑的特征描述,采用主成分分析方法对融合后的异构特征进行降维。最后,针对带标签的红外人体目标样本数据匮乏、训练样本和测试样本之间的分布及语义偏差导致的泛化性能差等问题,提出了一种有效的基于迁移学习的红外人体目标分类器,可较大程度地提高泛化性能和目标识别准确度。实验结果表明,所提的方法在红外人体目标数据集上的识别准确率达到了94%以上,与使用方向梯度直方图(HOG)特征、亮度自相似(ISS)特征等单一特征进行特征表示的方法以及使用传统的非迁移分类器如支持向量机(SVM)、K-近邻算法(KNN)等进行学习的方法相比均有所提升,且更加稳定,可以在实际的复杂红外场景中提升人体目标识别的性能。
关键词:红外;人体目标识别;多特征;降维;迁移学习
中图分类号: TP391.413文献标志码:A
Infrared human target recognition method based on multi-feature dimensionality
reduction and transfer learning
WANG Xin1*, ZHANG Xin1, NING Chen2
(1. College of Computer and Information, Hohai University, Nanjing Jiangsu 211100, China;
2. School of Physics and Technology, Nanjing Normal University, Nanjing Jiangsu 210000, China)
Abstract: Aiming at the poor recognition accuracy and robustness of the human targets caused by the serious interference on the targets under infrared imaging conditions, an infrared human target recognition method based on multi-feature dimensionality reduction and transfer learning was proposed. Firstly, in order to solve the problem of incomplete information during the extraction of a single feature by the traditional infrared human target feature extraction method, different kinds of heterogeneous features were extracted to fully exploit the characteristics of infrared human targets. Secondly, to provide the efficient and compact feature description for subsequent recognition, a principal component analysis method was utilized to reduce the dimensionality of the fused heterogeneous features. Finally, to solve the problems such as poor generalization performance, caused by the lack of tagged human target samples in infrared images as well as the distributional and semantic deviations between the training samples and testing samples, an effective infrared human target classifier based on transfer learning was presented, which was able to greatly improve the generalization performance and the target recognition accuracy. The experimental results show that the recognition accuracy of the method on infrared human target data set reaches more than 94%, which is better and more stable than that of the methods with a single feature such as Histogram of Oriented Gradients (HOG), Intensity Self Similarity (ISS) for feature representation or the methods learned with traditional non-transfer classifiers such as Support Vector Machine (SVM), K-Nearest Neighbors (KNN). Therefore, the performance of infrared human target recognition is improved in real complex scenes by the method.
Key words: infrared; human target recognition; multi-feature; dimensionality reduction; transfer learning
0 引言
红外人体目标识别是红外图像处理和模式识别领域中一个重要的研究分支。由于在红外图像中,人体目标受成像噪声的干扰,对比度一般较低;其次,目标所处的背景一般较为复杂,目标容易被背景所干扰;最后,人体目标姿态多变,且容易被其他物体遮挡,因此,红外人体目标的有效和稳健识别目前仍是一项富有挑战性的课题,对其深入研究有着重要的理论意义和实用价值[1]。
为了有效地在红外图像中识别出人体目标,首先需要对红外人体目标图像进行特征提取。为此,研究学者们提出了众多的红外图像目标特征提取方法。例如:文献[2-3]提出采用方向梯度直方图(Histogram of Oriented Gradients, HOG)对红外人体目标形状进行特征提取;文献[4]在分析了红外人体目标特性的基础上,提出了一种基于局部强度差异直方图(Histograms of Local Intensity Differences, HLID)的红外人体目标亮度特征提取方法;文献[5-6]采用局部二进制模型(Local Binary Pattern, LBP)对红外目标进行纹理特征提取;文献[7]针对红外人体目标识别,提出了一种梯度位置方向直方图(Gradient Location-Orientation Histogram, GLOH)对目标进行形状特征提取。以上研究均通过提取红外人体目标的某单一特征对目标进行表示,虽然取得了一定的效果,但是特征描述不全面,导致识别精度不够高。为此,又有学者提出对红外人体目标图像进行多特征提取和融合,改善了识别的性能。比如:文献[8]提出针对红外图像分别采用HOG和Haar-like提取形状和纹理特征进行融合,提高了红外人体目标识别的精度;文献[9]采用HOG提取红外人体目标的形状特征,然后采用边界片段模型(Boundary-Fragment-Model, BFM)提取轮廓特征,一定程度上提升了识别的性能;文献[10]采用了HOG和LBP描述子分别提取形状和纹理等特征,较单一特征而言,有利于目标的识别。从上述分析可以得出如下几点结论:首先,多特征融合确实能提高红外人体目标识别的精度;其次,针对红外人体目标而言,HOG特征已被证明是一种有效的特征提取方式;最后,虽然目前有很多方法提出提取红外人体目标的多种特征,但是有些方法提取的特征是同类的(即非异构特征),如形状、纹理、轮廓特征反映的实际都是目标的结构信息,因此,它们实际上未能从多个角度提取目标不同类型的特征,识别性能也就无法得到更满意的提升。
红外人体目标识别的第二个关键环节是分类器的设计。目前,针对红外人体目标的识别,常见的分类器有基于支持向量机(Support Vector Machine, SVM)的分类器[11-12]、基于AdaBoost的分类器[13]、基于稀疏表示(Sparse Representation, SR)的分类器[14]等。这些分类器虽然都取得了一定的效果,但是为了保证分类模型准确可靠,在进行训练时它们都依赖于两个基本的假设:1)训练样本与新的测试样本需要满足独立同分布的条件;2)必须有足够多的有效样本才能训练出一个性能较好的分类模型。然而,在红外人体目标识别的实际应用中可以发现,这两个条件很难满足。首先,原先可利用的带标签的样本可能变得不可用:由于红外图像特殊的成像原理,即使是同一目标,不同外部环境仍然可能会造成成像结果的巨大差异,导致训练样本与新的测试样本的分布及语义产生较大的偏差。此外,可利用的带标签的红外图像样本数据比较匮乏。因此,如何利用有限的带标签训练样本或源领域数据,建立出一个可靠的模型对目标领域数据进行预测(源领域数据和目标领域数据可以不服从相同的数据分布)变得非常有意义。
近年来,迁移学习[15-16]在计算机科学等领域引起了广泛的关注和研究。迁移学习通过迁移已经学习到的知识来解决目标领域中仅含有微量带标签样本的学习问题。现阶段,迁移学习在目标识别与分类问题上已经有了成功的应用。比如:文献[17]针对合成孔径雷达(Synthetic Aperture Radar, SAR)目标识别,进行了SAR模拟数据集和实测数据集的知识迁移,将从模拟数据学习到的知识迁移到实际数据中,由此得到的识别性能比仅在实测数据集上进行训练的识别性能有更大的优势;文献[18]针对异构遥感图像分类问题,设计了一套迭代重加权迁移学习框架,完成了目标的有效识别;文献[19]利用迁移学习模型从源域和目标域中深入挖掘信息,将人脸建模为结构化和近似稳定的表征,从而有效提升了人脸识别的准确性。
基于上述分析,针对红外人体目标识别问题,本文提出了一种基于多特征降维和迁移学习的目标识别方法。首先,针对红外人体目标特征提取问题,提出提取目标的形状和亮度两种异构特征进行融合,并通过降维方法获取简洁高效的目标特征。然后,基于迁移学习框架设计了一种有效的分類器应用于红外人体目标的识别过程中,可较大程度地提高识别的准确性。实验结果表明,本文的方法有效提高了复杂背景下红外人体目标识别的性能。
1 本文方法
本文方法的处理流程如图1所示,包括训练和识别两个模块。在训练模块中,分别采用红外和可见光图像构建源训练样本集(源训练样本集中含有红外人体目标和非人体目标图像)和辅助训练样本集(辅助训练样本集中含有可见光人体目标和非人体目标图像);然后,对不同集合里面的图像分别采用HOG方法提取形状特征,并采用亮度自相似(Intensity Self Similarity, ISS)方法提取亮度特征;接着,将两种异构特征进行融合并采用主成分分析法(Principal Component Analysis, PCA)对其进行降维;最后,基于降维后的特征,训练迁移学习分类器。在识别模块中,给定一幅待识别红外图像,同样首先提取其HOG特征和ISS特征,然后对融合特征进行降维,最后基于降维后的特征,利用已经训练好的分类器进行分类识别,即可得到最终的识别结果。
1.1 训练样本集的构建
由于实际红外图像目标样本的规模一般较小,且训练样本和测试样本的语义分布存在一定差异。本文提出使用迁移学习框架来有效弥补红外图像目标样本规模过小的不足,提高泛化性能。因此,首先需要构建源训练样本集和辅助训练样本集,共同组成带标签的训练集合。
分别采用红外和可见光图像构建源训练样本集和辅助训练样本集,记为S1=[s11,s12,…,s1m],S2=[s21,s22,…,s2n],其中m和n分别表示源训练样本和辅助训练样本的个数。将S1和S2进行合并,得到完整的训练样本集:
S=[s1,s2,…,sm,…,sm+n](1)
对每一个训练样本,添加类别标签,对应的类标集设为:
L=[label1,label2,…,labelm,…,labelm+n](2)
其中,labeli∈{0,1}为第i个训练样本图像的类标。源和辅助训练样本类标集分别为Ls=[label1,label2,…,labelm],La=[labelm+1,labelm+2,…,labelm+n]。
1.2 异构多特征的提取
本文提出分别采用HOG方法提取目标的形状信息和ISS方法提取亮度信息,这两种信息是红外人体目标非常显著的特征,两者结合将形成互补,增强图像特征描述的完备性。
1.2.1 基于HOG的形状特征提取
基于HOG的形状特征提取方法提取出的特征对目标局部形状的变化以及光照变化具有鲁棒性,因此,被广泛应用于目标识别、跟踪等领域。
给定一幅待处理的目标样本图像si(1≤i≤m+n),首先利用梯度算子求取每个像素点的横向梯度和纵向梯度,分别设为H(x,y)和Z(x,y),每个像素点的梯度幅度和方向计算式为:
M(x,y)=H(x,y)2+Z(x,y)2(3)
θ(x,y)=arctan[Z(x,y)H(x,y)](4)
然后,将图像分成若干单元,每一单元划分为9个梯度方向,得到一个9维的向量。把相邻的4块单元组成一个块,得到一个36维的特征向量。最后将所有向量连在一起就得到了样本图像的HOG特征向量hogi。
最终,可以得到所有训练样本图像的HOG特征集:
hog_set=[hog1,hog2,…,hogm+n]T(5)
1.2.2 基于ISS的亮度特征提取
与可见光图像相比,红外图像没有丰富的颜色信息可利用,富含的是像素点的亮度信息,因此亮度信息是红外图像的一个非常重要的特征[20]。考虑到红外人体目标图像中,人体头部、手臂及腿部区域亮度一般具有极较高的相似性,而躯干部分的亮度与上述区域相比相似度要低很多,根据这个特点,本文提出计算红外人体目标图像中不同块之间的灰度相似度,来表征人体目标的亮度信息。具体方法如下:
首先,给定一幅待处理的目标样本图像si(1≤i≤m+n),对其进行不重叠分块,设分为了u块。统计每一块的灰度直方图信息Hp(1≤p≤u)。
然后,针对图像中的任意两块,通过其对应的两个向量Hp、Hq之间夹角的余弦值来表征它们之间的相似度,值越大则代表越相似。两块之间的相似度issp,q计算式如下:
issp,q=Hp·Hq‖Hp‖·‖Hq‖(6)
这样,可以获得关于样本图像si的一个u×(u-1)/2维的相似度向量,作为样本图像的基于ISS的亮度特征issi。
最终,可以得到所有训练样本图像的ISS特征集:
iss_set=[iss1,iss2,…,issm+n]T(7)
1.3 基于PCA的融合特征降维
针对1.2节提取的HOG特征集和ISS特征集,将它们进行串联融合,得到所有样本图像的融合特征集feat:
feat=[hog_set,iss_set](8)
考虑到融合后的特征维数较大,且特征向量之间可能存在大量的相关性,造成特征表示的繁冗以及计算效率的降低,因此,提出对特征进行有效的降维。目前,常见的特征降维方法有基于PCA的方法[21]和基于线性判别分析(Linear Discriminant Analysis, LDA)的方法[22],相较于LDA而言,PCA能够保持特征数据的内在信息,去除特征数据之间可能存在的相关性,因此本文采用PCA方法对融合特征向量集feat进行降维。具体过程如下:
首先,针对feat,求其协方差矩阵C并计算其特征值。将特征值按从大到小的顺序进行排列,得到λ1,λ2,…,λp,并得到对应的特征向量v1,v2,…,vp。
然后,计算累计方差贡献率G(k):
G(k)=∑ki=1λi/∑pj=1λj(9)
根據设定的累计方差贡献率阈值,求出主成分的个数k。
第三,选取λ1,λ2,…,λp中前k个特征值λ1,λ2,…,λk所对应的特征向量v1,v2,…,vk构成投影矩阵V,利用投影矩阵V对原特征矩阵feat进行投影,即可得到降维后的特征矩阵feat_p:
feat_p=feat×VT(10)
其中,源训练样本降维后的特征向量集可以表示为Ts=[feat_p1, feat_p2,…, feat_pm]T,辅助训练样本降维后的特征向量集则表示为Ta=[feat_pm+1, feat_pm+2,…, feat_pm+n]T。
1.4 迁移学习分类器的设计
针对降维后的特征向量集feat_p,将其融入迁移学习框架中,提出一种基于迁移学习的红外人体目标分类器,其设计如下:
步骤1 选取SVM作为迁移学习框架中的基本分类器。计算训练数据集feat_ p中所有样本数据的初始权重w1i为:
w1i=1/m,i=1,2,…,m
1/n, i=m+1,m+2,…,m+n (11)
步骤2 设t=1,2,…,N,其中N表示迭代次数。将权重进行归一化:
wti=wti/∑m+ni=1wti(12)
步骤3 输入训练数据集Ts和Ta,及其对应的类标Ls和La、归一化权重wti (i=1,2,…,m+n),采用TradaBoost算法[15]对SVM分类器进行训练,得到分类映射ht:X→Y。
步骤4 计算分类映射ht在Ts上的分类错误率:
et=∑mi=1wti·|ht(feat_pi)-labeli|∑mi=1wti(13)
其中:ht(feat_pi)(i=1,2,…,m)表示第i个训练样本的分类结果;labeli(i=1,2,…,m)表示第i个训练样本的真实类标。
步骤5 根据计算得到的分类错误率,重新调整权重:
wt+1i=
wti·βt-|ht(feat_ pi)-labeli|,i=1,2,…,m
wti·β|ht(feat_ pi)-labeli|,i=m+1,m+2,…,m+n(14)
其中,参数βt=et1-et(当et≥1/2时,调整et为0.499;et=0时,调整et为0.001)。参数β=1/(1+2lnmN)。
步骤6 将步骤2至步骤5重复执行N次。最终可以得到一个经过训练后稳定的SVM分类器。
最后,输入待识别的红外图像。首先提取其HOG和ISS融合并降维后的特征feature,然后利用训练好的分类器hf(x)计算最终分类识别的结果:
识别结果=人体目标, hf(feature)=1
非人体目标,hf(feature)=0 (15)
2 实验与结果分析
2.1 实验环境和数据
为了验证本文提出的基于多特征降维和迁移学习的红外人体目标识别方法的有效性,在CPU主频为1.5GHz、内存为4GB、仿真软件为Matlab R2014a的PC上对算法进行了实验。
实验采用了LSI Far Infrared Pedestrian Dataset[23]和INRIA Person Dataset[24]这两个公共数据集。表1详细介绍了本文实验的数据集。其中,源训练样本集和测试集中的红外图像均来自于LSI Far Infrared Pedestrian Dataset中的Classification Dataset,此红外图像集中包含了形态各异的红外人体目标图像以及不同环境下的红外非人体目标图像,可以满足训练样本和测试样本采集的需求。从LSI图像库中随机挑选了310张红外正样本图像和310张红外负样本图像作为源训练样本图像,另外随机挑选了正负样本圖像各500张作为实验的测试集。样本图像大小均为64×32像素。图2给出了部分源训练样本图像示例。
辅助训练样本集中的可见光图像来源于INRIA数据集,该数据集包含了2416幅人体目标图像和1218幅非人体目标图像,图像大小均为64×32像素。其中,包含人体目标的图像中行人的姿态丰富,所处的背景复杂;而非人体目标图像包含了街道、建筑物、自然风景等不同的形式,满足了本文实验辅助样本所需的多样性。为了满足迁移学习模型中辅助训练样本数至少为源训练样本数的2倍这一要求,从INRIA图像集中选取了正负样本图像各720张来作为辅助训练样本集。图3给出了部分辅助训练样本图像示例。
本文采用识别准确度(Accuracy Rate, AR)和F1-measure(F1)[25]来衡量目标识别的效果,采用多次随机测试的标准差(Standard Deviation, SD)来验证算法的稳定性。AR和F1指标计算方法如下:
其中:TP和FN分别表示正样本被正确识别和错误识别的个数; TN和FP则分别表示负样本被正确识别和错误识别的个数。 precision=TP/(TP+FP)表示识别的精确率,recall=TP/(TP+FN)表示识别的召回率。F1为精确率和召回率的调和均值。显然,AR和F1的值越大,说明识别的效果越理想。
此外,多次随机测试的标准差SD计算方法如下:
SD=1NN-1∑NNi=1(ARi-1NN∑NNi=1ARi)2(18)
其中:NN为随机测试实验的次数;ARi为第i次实验的识别准确度。SD值越小,表明识别性能越稳定。
2.2 异构多特征提取实验
首先,为了验证提出的异构多特征提取和融合算法的有效性,将基于HOG和ISS的融合特征(记为:HOG+ISS)或某单一特征(HOG或ISS)的识别结果进行了对比实验(为了公平起见,分类器选用的都是本文介绍的迁移学习分类器),结果如表2所示。由表2可以发现,使用单一特征HOG和ISS进行识别,AR分别为90.60%和87.30%,F1分别为91.28%和88.25%;而使用两种融合特征HOG+ISS时,AR与F1分别为91.40%和92.04%,与使用单一特征相比均有所提高。因此,本文的多特征策略可以有效提高识别的性能。
2.3 基于PCA的融合特征降维实验
接着,为了验证提出的基于PCA的融合特征降维方法的有效性,对比分析了降维前后融合特征用于识别的性能(为了公平起见,分类器选用的都是本文介绍的迁移学习分类器),实验结果如表2所示。其中,降维后的融合特征记为(HOG+ISS)_p。由表2可以看出,使用降维前的融合特征进行识别,AR和F1分别为91.40%和92.04%;使用PCA降维后的融合特征进行识别,AR和F1分别为94.30%和94.51%,与降维前的特征识别效果相比,AR值提高了2.90个百分点,F1值提高了2.47个百分点。使用降维前的融合特征进行识别的时间为4.41s;而使用降维后的融合特征进行识别的时间为1.06s,其识别效率是降维前的4倍。由此可见,本文提出的基于PCA的融合特征降维策略,不仅大幅提高了识别效率,而且由于降维操作去除了特征数据中相关的冗余信息,为后续识别分析提供了更加有效且紧凑的特征描述,识别的准确性也有较大提升。
此外,选取了其他几种同类别性能较好的特征提取方法进行整体识别性能的对比,分别是:完备局部二值模式(Completed Local Binary Pattern, CLBP)特征[26],HOG特征经过词袋模型(Bag Of Words, BOW)编码后的特征HOG-BOW[27],以及HOG与CLBP的联合特征HOG+CLBP[28]。由表2可知,在识别准确性方面,本文的特征提取方法((HOG+ISS)_p)仅低于HOG+CLBP方法0.3个百分点,优于其他的所有方法,但本文方法的特征维数只有298维,其识别效率比HOG+CLBP方法高出2倍以上。因此本文的方法拥有更好的整体性能。
2.4 基于迁移学习的目标识别实验
然后,为了验证提出的基于迁移学习的分类器分类识别的性能,将提出算法和其他几种性能优良的分类器如SVM、KNN[29]、AdaBoost、NaiveBayes[30]等进行了对比分析(均使用本文提出的融合降维特征),结果如表3所示。由表3可见,针对本文提出的异构多特征融合降维特征,若采用提出的基于迁移学习的分类器进行红外人体目标识别,则AR和F1分别为94.30%和94.51%;而若采用非迁移学习分类器进行识别时, AR和F1最好的结果为92.40%和92.51%,仍低于本文的迁移学习分类器。这一结论表明本文提出的基于迁移学习的红外人体目标分类器有效地从可见光样本图像中提取出了有助于红外人体目标识别的实例,提高了目标识别的性能,一定程度上解决了传统分类器由于红外样本图像过少而导致泛化性能差、目标识别率较低的问题。
2.5 算法的稳定性验证
最后,针对本文提出算法的稳定性进行了分析。重新从LSI图像库中随机挑选了310张红外正样本图像和310张红外负样本图像作为源训练样本图像,另外随机挑选了正负样本图像各500张作为实验的测试集,重复10次。取10次测试实验的平均准确度AR及标准差SD对稳定性进一步评估,结果如表4~5所示。表4给出了前文所提的不同特征提取方法经过10次实验的目标识别结果(分类器采用的都是本文的基于迁移学习的分类器);表5给出了前文所提的不同分类器进行10次实验的目标识别结果(特征采用本文提出的降维后的融合特征)。由表4~5可知,本文提出的方法在进行红外人体目标识别时保持着较高的识别精度,且稳定性均优于其他的方法,整体性能更为优异。
综上可知,本文提出的方法能有效进行红外人体目标的识别:异构多特征提取策略保证了特征的完备性;基于PCA的融合特征降维方法精炼了特征的描述,提高了识别的效率;基于迁移学习的分类器则解决了传统的机器学习方法在训练样本较少的情况下分类识别性能不佳的问题,整个算法有效而稳健。
3 结语
针对红外成像条件下人体目标受干扰严重时目标的识别准确性和鲁棒性较差的问题,本文提出了一种基于HOG与ISS多特征降维和迁移学习的红外人体目标识别方法。该方法首先提取红外人体目标图像基于HOG的形状特征和基于ISS的亮度特征,这两种异构特征的结合能有效提升特征表达的完备性;其次,对融合后的异构特征,提出采用PCA对其进行降维,一方面有利于后续识别效率的提高,另一方面确保信息的紧致性,有助于提升识别的精度;最后,设计的迁移学习分类器在有效训练样本较少的情况下能提高分类器的泛化性能和目标识别的准确度,且识别结果优于传统的分类器方法。虽然本文方法在进行红外人体目标图像识别时取得了较好的效果,但是识别的准确性仍然有进一步提高的空间。因此,寻找更高效准确的特征提取方法以及寻求迁移学习算法的有效改进将是我们接下来的主要研究方向。
参考文献 (References)
[1]WANG X, XU L, ZHANG Y, et al. A novel hybrid method for robust infrared target detection [J]. KSII Transactions on Internet and Information Systems, 2017, 11(10): 5006-5022.
[2]LEE Y, CHAN Y, FU L, et al. Near-infrared-based nighttime pedestrian detection using grouped part models [J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 1929-1940.
[3]劉峰,王思博,王向军,等.多特征级联的低能见度环境红外行人检测方法[J].红外与激光工程,2018,47(6):127-134.(LIU F, WANG S B, WANG X J, et al. Infrared pedestrian detection method in low visibility environment based on multi feature association [J]. Infrared and Laser Engineering, 2018, 47(6): 127-134.)
[4]KIM D S, KIM M, KIM B S, et al. Histograms of local intensity differences for pedestrian classification in far-infrared images [J]. Electronics Letters, 2013, 49(4): 258-260.
[5]SUN J, FAN G, YU L, et al. Concave-convex local binary features for automatic target recognition in infrared imagery [J]. EURASIP Journal on Image and Video Processing, 2014, 2014: Article No. 23.
[18]LI X, ZHANG L, DU B, et al. Iterative reweighting heterogeneous transfer learning framework for supervised remote sensing image classification [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(5): 2022-2035.
[19]REN C, DAI D, HUANG K, et al. Transfer learning of structured representation for face recognition [J]. IEEE Transactions on Image Processing, 2014, 23(12): 5440-5454.
[20]MIRON A, BESBES B, ROGOZAN A, et al. Intensity self similarity features for pedestrian detection in far-infrared images [C]// Proceedings of the 2012 IEEE International Symposium. Piscataway: IEEE, 2012: 1120-1125.
[21]ABDI H, WILLIAMS L J. Principal component analysis [J]. Wiley Interdisciplinary Reviews: Computational Statistics, 2010, 2(4): 433-459.
[22]LI M, YUAN B. 2D-LDA: a statistical linear discriminant analysis for image matrix [J]. Pattern Recognition Letters, 2005, 26(5): 527-532.
[23]KHELLAL A, MA H, FEI Q. Pedestrian classification and detection in far infrared images [C]// Proceedings of the 2015 International Conference on Intelligent Robotics and Applications, LNCS 9244. Cham: Springer, 2015: 511-522.
[24]DALAL N. Finding people in images and videos [D]. Grenoble, France: Institute National Polytechnique de Grenoble, 2006: 106-107.
[25]WANG X, SHEN S, NING C, et al. Multi-class remote sensing objects recognition based on discriminative sparse representation [J]. Applied Optics, 2016, 55(6): 1381-1394.
[26]GUO Z, ZHANG L, ZHANG D. A completed modeling of local binary pattern operator for texture classification [J]. IEEE Transactions on Image Processing, 2010, 19(6): 1657-1663.
[27]KHAN M N A, FAN G, HEISTERKAMP D R, et al. Automatic target recognition in infrared imagery using dense HOG features and relevance grouping of vocabulary [C]// Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Piscataway: IEEE, 2014: 293-298.
[28]HASSAN M A, PARDIANSYAH I, MALIK A S, et al. Enhanced people counting system based head-shoulder detection in dense crowd scenario [C]// Proceedings of the 6th International Conference on Intelligent and Advanced Systems. Piscataway: IEEE, 2016: 1-6.
[29]WANG S, LIU Z. Infrared face recognition based on histogram and k-nearest neighbor classification [C]// Proceedings of the 7th International Symposium on Neural Networks. Berlin: Springer, Heidelberg, 2010: 104-111.
[30]YANG B, LEI Y, YAN B. Distributed multi-human location algorithm using naive Bayes classifier for a binary pyroelectric infrared sensor tracking system [J]. IEEE Sensors Journal, 2015, 16(1): 216-223.
This work is partially supported by the National Natural Science Foundation of China (61603124), the Fundamental Research Funds for the Central Universities (2019B15314), the Six Talents Peak Project of Jiangsu Province (XYDXX-007).
WANG Xin, born in 1981, Ph. D., associate professor. Her research interests include image processing, pattern recognition, computer vision, machine learning.
ZHANG Xin, born in 1995, M. S. candidate. His research interests include image processing, pattern recognition.
NING Chen, born in 1978, Ph. D. candidate, lecturer. His research interests include image processing, machine learning.
收稿日期:2019-06-12;修回日期:2019-08-26;錄用日期:2019-09-25。基金项目:国家自然科学基金资助项目(61603124);教育部中央高校基本科研业务费专项资金项目(2019B15314);江苏省 “六大人才高峰”高层次人才项目(XYDXX-007)。
作者简介:王鑫(1981—),女,安徽阜阳人,副教授,博士,主要研究方向:图像处理、模式识别、计算机视觉、机器学习; 张鑫(1995—),男,江苏泰州人,硕士研究生,主要研究方向:图像处理、模式识别; 宁晨(1978—),男,安徽阜阳人,讲师,博士研究生,主要研究方向:图像处理、机器学习。
文章编号:1001-9081(2019)12-3490-06DOI:10.11772/j.issn.1001-9081.2019060982