| 摘 要:
特征提取是人脸识别过程中的重要步骤,对识别率高低有着非常重要的影响。本文在对主成分分析(PCA)、Fisher线性鉴别分析(FDA)以及核主成分分析(KPCA)三种特征提取方法的优劣性的理论分析研究与实验比较的基础之上,提出一种新的人脸特征提取方法,即PCA+KPCA+FDA(PKFDA)。实验表明,该方法能够有效地提高识别率,并且也没有耗费很多的时间。因此,该方法具有可行性和优越性。 关键词:PCA; KPCA; FDA
1 引 言
目前人脸识别的特征提取方法主要有基于代数特征的方法和基于几何特征的方法[1][2]。
其中主成分分析(PCA)方法应用相当广泛,它是基于信号的二阶统计特性,提取出不具相关性的主要成分[2][3][4][5];Fisher线性鉴别分析(FDA)方法是从高维特征空间里提取出最具有鉴别能力的低维特征,这些特征将同一个类别的所有样本聚集在一起,而不同类样本尽量的分开[2][4][6][7];核主成分分析(KPCA)方法是利用非线性映射,将在输入空间中不可分的样本映射至一高维隐空间,使样本变得线性可分[2][6][8][9]。根据研究分析,我们知道,PCA一定程度上能够满足实时性,但是识别率不是很高;而Fisher线性分析的识别率有所提高,但并没有提高很多;KPCA方法比PCA的识别率有所提高,但耗费的时间太长。一般情况下,要满足实时性的要求,则必然需要牺牲识别率;反之亦然。因此,要尽量在两者之间寻求平衡。本文结合对三种方法的优缺点分析,提出PCA+KPCA+FDA(PKFDA)的特征提取方法。
2 人脸图像的特征提取
2.1 三种特征提取方法的特点分析 2.1.1 PCA特征提取方法 主成分分析(PCA)方法的目的是通过线性变换,寻找一组最优的单位正交向量基(即主元),用它们的线性组合来重建原样本,并使重建后的样本和原样本的误差最小[3]。 PCA方法的弱点是明显的,将图像矩阵转化为图像向量后,造成图像矢量的维数一般都很高,比如,图像的分辨率为100*100,那么所得的图像向量的维数将高达10000。尽管利用奇异值分解定理可以在一定程度上加速 的特征向量的求取速度,但是整个特征抽取过程所耗费的计算量还是相当可观的[4]。 针对这一问题,可以直接对图像矩阵采用主分量分析方法(I-PCA)。该方法在处理图像识别问题时,不需要将图像矩阵转化为列向量,而是直接用图像矩阵本身来构造所谓的图像的总体散布矩阵,然后根据需要,取它的前面n个特征值所对应的标准正交的特征向量作为投影轴即可。 尽管主元分析方法在人脸识别中取得了不错的效果,但是由于它是以所有样本的最优重建为目的的,因此对描述不同类样本之间的差异,它不是最优的。从这个意义上说,用它来描述人脸识别的特征就是不充分的。 2.1.2 线性判决分析方法(FDA) 线性判决分析(FDA)方法[4]是以样本的可分性为目标,通过一组线性变换,使得每类样本的类内离散度最小,类间离散度达到最大。研究表明,该方法充分利用了类别信息,可以得到最利于分类的人脸特征,从而能压制图像之间的与识别信息无关的差异,对光照及人脸表情变化都不太敏感[4][7]。 需要说明的是,在样本可分的条件下,FD可以很好的解决两类甚至多类样本的分类问题。但在实际应用时,很多问题并不具备线性可分性,这时,Fisher线性判别就显得无能为力了,而且有时甚至会产生很大的分类错误。 2.1.3 核主分量分析方法(KPCA) PCA方法只考虑了图像数据中的二阶统计信息,未能利用数据中的高阶统计信息,忽略了多个象素之间的非线性关系。研究表明,一幅图像的高阶统计往往包含了图像边缘或曲线的多个象素之间的非线性关系。而核主分量分析(KPCA)方法[6][8]正是基于输入数据的高阶统计,它描述了多个象素之间的相关性,所以KPCA能够捕获这些重要信息,从而取得更好的效果。KPCA的另一个优点是:可以把在输入空间不可线性分类的问题变换到特征空间实现线性分类问题,从而简化分类器的设计。 核主元分析尽管比主元分析更能有效地描述人脸的复杂变化,但是它得到的非线性主元是以所有样本的最优重建为目的的,并没有考虑不同类样本之间的差异,所以对分类也并非最优。
2.2 特征提取方法的改进——PKFDA 通过对上述几种特征提取方法的分析,我们知道,PCA一定程度上能够满足实时性,但是识别率不是很高;而Fisher线性分析的识别率有所提高,但并没有提高很多;KPCA方法比PCA的识别率有所提高,但耗费的时间太长。一般情况下,要满足实时性的要求,则必然需要牺牲识别率;反之亦然。因此,要尽量在两者之间寻求平衡。基于以上分析,我们提出PCA+KPCA+FDA(PKFDA)的特征提取方法。这样做,既没有牺牲很多的时间,识别率也得到了提高。 具体的实现步骤如下: (1)图像预处理,即对样本库中的和待识别的图像均先进行光照归一化处理,从而提高图像的识别效果; 为了消除面部光照对识别的影响,我们让每一幅图象灰度值的均值和方差都相等[10]。从物理意义上说,就是让每一幅图的直流能量和交流能量都相等。 (2)用PCA或I-PCA方法进行特征提取,即对原始的图像进行降维处理; 具体步骤为:
 (3)用KPCA方法对降维后的训练样本进行进一步的投影; 具体步骤为:
(4)再用Fisher线性鉴别进一步进行特征提取; 具体步骤为: A.先求核主分量分析后的投影向量的类内散布矩阵 和类间散布矩阵 ; B.根据Fisher线性鉴别准则求解特征空间矩阵; C.将核主分量分析后的投影向量投影到该特征空间,进一步进行分类。
 图1 PCA+KPCA+Fisher(PKFDA)人脸识别的算法流程
3 实验分析和比较
下面在ORL人脸库上进行训练和识别实验,每次从中选取20个人的200幅图片进行训练和识别。训练集由每个人的前5幅图像组成,测试集由每个人的后5幅图像组成。实验结果是取的多次实验的平均值。我们的数值试验在Windows XP平台下进行,算法程序由Matlab语言编写。电脑配置为Pentium(R)4 CPU 1.50GHz,512MB内存。核方法中核函数取为多项式核函数: ,d分别取2和3。表1中n表示所选取的特征空间的维数。我们在实验中选用最近邻法(L2-范数)进行分类识别。相应的实验结果见表1。表2是对各种方法的时间的比较统计。需要说明的是,表2中的时间值都是取的多次实验的平均值。
表1 ORL人脸库上各种方法的识别率  表2 ORL人脸库上各种方法的时间计算比较 从上面表1和表2中的实验数据可以看出,在所选取的维数空间中,PCA的识别率最高只能达到80%,PCA+KPCA最高能达到87%,而改进后的特征提取方法PKFDA的识别率可以达到90%以上,并且特征抽取的时间比KPCA减少了近一半, 从而也验证了该算法的有效性。
4 结 论
本文主要对人脸识别过程中的特征提取方法进行了研究和讨论,通过对主成分分析(PCA)、Fisher线性鉴别分析(FDA)以及核主成分分析(KPCA)三种特征提取方法的优劣性的理论分析研究与实验比较,给出了一种新的人脸特征提取方法,即PCA+KPCA+FDA(PKFDA)。实验表明,该方法不仅能有效提高识别率,而且也节约了时间。但是该方法也有一些不足之处:在特征提取过程中,由于采用的是代数特征提取方法,所以是对整体特征进行提取,当人的表情、姿态以及光照等外界条件发生很大的变化时,效果就会受到影响,因此有待于进一步的研究。另外,从理论分析和实验结果可以看出,本文提出的特征提取方法也可以用于其它识别也具有一定的参考价值。
参 考 文 献
[1]Chellappa R, Wilson C L, Sirohey S. Human and machine recogtion of faces: A Survey. Proceeding of the IEEE, 1995, 83(5):705~740 [2]Chunglin Huang, Chingwen Chen. Human facial feature extraction for face interpretation and recognition. Pattern Recognition, 1992, 25(12): 1435一1444. [3]M.A.Turk and A.P.Pentland. Face Recognition Using Eigenface. IEEE Conf.on Computer Version and Pattern Recognition , pp.586-591, 1991 [4]Belhumeur P N,Hespanha J P,Kriegman D J. Eigenfaces vs fisherfaces:Recognition using calss specific linear:projection. In IEEE Trans On PAMI 1997, 19(7). [5]Peng Hui,Zhang Changshui,Rong Gang et al. Reasearch of automated face recognition based on K-L transform. Journal of Tsinghua University (Sei & Teech) (in chinese), 1997, 37(3): 67-70 [6]Zheng W M, Li Z, Zou C R. Foley-Sammon optimal discriminant vectors using kernel approach. IEEE Trans. Neural Net+orks, 2005, 16(1): 1-9 [7]Samal A,Iyengar P A, Autmatic recogniton and analysis of human faces and facial expressions: A survey, Pattern Recognition: 1992, 25, 1(6577). [8]Haasdonk B, Bahlmann C. Learning with distance substitution kernels. Proceedings of the 26th DAGM Symposium, ubingen, Germany, 2004, 228-236 [9]Smola A, Robert Muller K. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computer, 1998: (10): 1299~1319 [10]Adini Y, Moses Y, Ullman S. Face recognition: The problem of compensating for changes in illumination direction. IEEE Trans. Pattern Anal. Machine Intell., 1997, 19(7)
|