摘要: 人臉識別中,發(fā)型遮擋是一種十分常見的遮擋類型,并且對人臉的正確識別具有極大的干擾。提出一種將頭發(fā)的顏色模型和發(fā)型特征相結(jié)合的遮擋檢測方法。首先,采用機(jī)器學(xué)習(xí)的方法,對頭發(fā)的顏色進(jìn)行學(xué)習(xí)建模。然后,利用發(fā)際線的特征,將人臉劃分為若干扇形并分塊,采用逐步精細(xì)的方法對人臉的發(fā)型遮擋區(qū)域進(jìn)行檢測。實驗結(jié)果表明,該方法對人臉區(qū)域發(fā)型遮擋檢測的準(zhǔn)確率和召回率都達(dá)到88%以上,相比PCA檢測方法提高了約20%,驗證了該方法的有效性。
關(guān)鍵詞:人臉識別;發(fā)型遮擋;遮擋檢測
0引言
人臉識別作為模式識別領(lǐng)域的熱點研究問題受到了廣泛的關(guān)注,人臉識別技術(shù)在眾多領(lǐng)域的身份驗證中有著廣闊的應(yīng)用前景[1]。在實際人臉圖像處理過程中,人臉圖像的遮擋會經(jīng)常出現(xiàn),如頭發(fā)、口罩、圍巾等,而遮擋對人臉識別有很大的影響。因此,如何準(zhǔn)確、自動地檢測人臉遮擋區(qū)域成為遮擋人臉識別處理的關(guān)鍵問題之一。
主流的人臉遮擋區(qū)域檢測方法是基于PCA分析檢測方法[23]。該方法包括兩個關(guān)鍵步驟:在分析階段,將遮擋人臉圖像投影到人臉特征空間,并利用投影系數(shù)重建人臉;在檢測階段,將遮擋人臉圖像與重建人臉圖像進(jìn)行比較,差異越大,判定為遮擋的可能性越大。遮擋區(qū)域根據(jù)重建人臉與原始遮擋人臉的差異來估計?;谄骄四樀娜四樥趽鯀^(qū)域檢測方法[4]與基于PCA分析檢測方法類似,只是參考圖片選取的是平均臉圖像。
在遮擋人臉識別中,頭發(fā)是極為常見的遮擋物體,給識別帶來較大的不利影響。目前,基于PCA或平均臉的分析檢測方法在很大程度上依賴于參考樣本,對于人臉的位置、姿勢等十分敏感,而發(fā)型遮擋往往伴隨著不同的人臉姿勢。本文在分析了各類遮擋檢測算法后,通過建立發(fā)色模型并結(jié)合發(fā)型特征,提出了一種針對發(fā)型遮擋的人臉遮擋區(qū)域檢測方法。
1方法概述
本文方法主要分為兩個部分:發(fā)色模型的線下學(xué)習(xí)和發(fā)型遮擋區(qū)域的在線檢測。線下學(xué)習(xí)是利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行發(fā)色和膚色的學(xué)習(xí),建立頭發(fā)的顏色模型,以便于在線檢測使用;在線檢測是實時檢測遮擋圖片的發(fā)型遮擋區(qū)域,給出檢測結(jié)果。
(1)圖1給出了發(fā)色模型學(xué)習(xí)的詳細(xì)步驟:對發(fā)色和膚色RGB樣本數(shù)據(jù),利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行發(fā)色和膚色訓(xùn)練學(xué)習(xí),得到一個發(fā)色模型。給定一個像素點的RGB值,可以通過該模型粗略評估其是頭發(fā)的概率。

(2)圖2給出了發(fā)型遮擋區(qū)域的檢測步驟:給定一幅圖像,首先根據(jù)人臉進(jìn)行歸一化;之后,以嘴部中心為圓心,將給定的人臉區(qū)域按照角度劃分為若干扇形;對于每個扇形,按照半徑長度平均劃分為相等數(shù)量的區(qū)塊;然后,對于每個扇形區(qū)塊,按照距離圓心的距離,由遠(yuǎn)及近進(jìn)行粗略檢測。對于一個扇區(qū),取發(fā)色區(qū)塊的下一個(離圓心更近的)區(qū)塊進(jìn)行精細(xì)分割。
2結(jié)合發(fā)色模型和發(fā)型特征的遮擋檢測
發(fā)型特征包括:長度、體積、發(fā)色等。 對于解決發(fā)型遮擋的檢測問題,可以利用發(fā)色、發(fā)際線等特征。本文將發(fā)色模型和發(fā)型特征進(jìn)行有機(jī)結(jié)合,對人臉的面部發(fā)型遮擋區(qū)域進(jìn)行檢測。
2.1基于人工神經(jīng)網(wǎng)絡(luò)的發(fā)色模型
2.1.1BP人工神經(jīng)網(wǎng)絡(luò)簡介
BP神經(jīng)網(wǎng)絡(luò)[5]是人工神經(jīng)網(wǎng)絡(luò)的一種,它是采用誤差反向傳播的多層前饋神經(jīng)網(wǎng)絡(luò)。其中,3層的BP 網(wǎng)絡(luò)包括一個輸入層、一個隱含層、一個輸出層,如圖3所示。

圖3三層BP神經(jīng)網(wǎng)路BP神經(jīng)網(wǎng)絡(luò)的基本思想是采用信號的正向傳播和誤差的反向傳播。在正向傳播中,從輸入層傳入的數(shù)據(jù),依次在各隱含層進(jìn)行處理,最終到達(dá)輸出層。如果輸出值與期望輸出不同,則將輸出層的誤差作為調(diào)整信號進(jìn)行反向傳播,根據(jù)誤差不斷調(diào)整權(quán)值和閾值,最終得到網(wǎng)絡(luò)可以接受的精度并輸出。
2.1.2發(fā)色模型
頭發(fā)的顏色與皮膚的顏色往往有比較明顯的區(qū)別,利用發(fā)色能夠有效提高面部發(fā)型遮擋區(qū)域檢測的正確率。
2.2基于發(fā)型特征的扇形分割
給定輸入圖像和發(fā)型區(qū)域,以嘴部位置的中心區(qū)域為圓心,將嘴部以上的區(qū)域以每10°劃分為一個扇形,共18個徑長不等的扇形(以下簡稱為扇區(qū)),按照逆時針方向記為S1~S18。對任意的扇形區(qū)域Si,按照徑長平均分為10個區(qū)塊(以下簡稱為區(qū)塊),按照離圓心的距離由遠(yuǎn)及近依次標(biāo)記為Si,1~Si,10。
2.2.1粗略檢測
形式地,將X={xij:xij∈S}定義為區(qū)塊S的像素點,用Ix表示一個像素點的顏色向量,Ix=(Rx,Gx,Bx)T;LX=(l1,l2,…,lm)T表示標(biāo)號向量,其中m表示區(qū)塊S中的像素點數(shù),并且lx=1表示x屬于頭發(fā),lx=0表示x屬于皮膚。將一個像素是頭發(fā)的概率表示為P(lx=1),簡單地,P(lx=1)=ax,其中,ax是ANN發(fā)色模型的輸出值。
對于人臉區(qū)域的每個扇形,首先對最外層區(qū)塊(S1,1,S2,1,…,S18,1)進(jìn)行檢測。區(qū)塊Si,1中的像素點x,將其RGB值作為ANN發(fā)色模型的輸入,得到輸出值ax。當(dāng)該點的預(yù)測為頭發(fā)概率大于給定閾值時,則認(rèn)為該像素點屬于頭發(fā)區(qū)域。如果區(qū)塊Si,1中的像素大部分都判定為頭發(fā)區(qū)域時,則認(rèn)為該區(qū)塊Si,1屬于頭發(fā)區(qū)域,記為預(yù)測遮擋塊。對所有的扇區(qū),由遠(yuǎn)及近地進(jìn)行區(qū)塊的檢測,直到區(qū)塊不再是預(yù)測遮擋塊為止。每個扇區(qū)中第一個不是預(yù)測遮擋塊的區(qū)塊稱為精細(xì)分割塊(以下簡稱精割塊),放到下一步進(jìn)行圖割[6]處理。
2.2.2精細(xì)分割
經(jīng)過2.2.1節(jié)中粗略檢測得到了若干個精割塊,下一步是在此范圍內(nèi)進(jìn)行精細(xì)的分割。采用221中相同的定義,將X={xij:xij∈S}定義為精割塊S的像素點,用Ix表示像素點的顏色向量,Ix=(Rx,Gx,Bx)T;LX=(l1,l2,…,lm)T表示標(biāo)號向量,其中m表示精割塊S中的像素點數(shù),并且lx=1表示x屬于頭發(fā),lx=0表示x屬于皮膚。將一個像素是頭發(fā)的概率表示為P(lx=1)。定義如下能量函數(shù):
E(L)=C(L)+αB(L)(1)
其中,α用以權(quán)衡兩項的重要性;C(L)表示像素點的預(yù)測概率;B(L)是平滑項,用以描述相鄰像素標(biāo)號互異時的懲罰代價。任意精割塊S中像素的最終的標(biāo)號向量L*X,通過使式(1)達(dá)到最小值來獲得。式(1)中的第一項C(L)定義為:
C(L)=1nx∑x∈Xc(lx)(2)
其中,nx表示精割塊S中像素點的數(shù)量, c(lx)表示發(fā)色模型對像素點x的預(yù)測概率。
式(1)中第二項中的B(L)定義為:

其中,np表示像素點p的相鄰點的個數(shù),σ表示圖像的平均平滑度。式(4)采用8鄰域系統(tǒng),選擇像素點的相鄰點。由于精割塊的形狀大小不同,進(jìn)行了均值化處理。
2.2.3優(yōu)化
直接對式(1)進(jìn)行最小化計算,復(fù)雜度較高,計算量非常大。本文提出了一種求近似解的計算方法。首先,將精割塊S中的像素按照ANN預(yù)測的發(fā)色程度按照從小到大排列;然后,將區(qū)塊內(nèi)所有像素的區(qū)塊起始標(biāo)號都置為1,按照發(fā)色的概率從小到大排序依次將像素標(biāo)號置為0;最后,分別計算能量函數(shù)的值。選取使能量函數(shù)達(dá)到最小值時的標(biāo)號向量作為最優(yōu)解。
3實驗和結(jié)果分析
實驗數(shù)據(jù)采集28個人的人臉圖像,分為正面、左側(cè)面和右側(cè)面三個姿勢,偏轉(zhuǎn)角度在10°~30°之間,發(fā)型遮擋包括正面單側(cè)遮擋、正面兩側(cè)遮擋、左側(cè)面遮擋、右側(cè)面遮擋、發(fā)簾遮擋等類型。人臉圖像庫包括28人269張發(fā)型遮擋圖像,每張圖像歸一化為50×75像素。
將樣本數(shù)據(jù)劃分為遮擋與未遮擋兩類,并且人工標(biāo)注所有遮擋樣本的發(fā)型遮擋區(qū)域。測試PCA遮擋檢測及本文所提出遮擋檢測方法的準(zhǔn)確率P、召回率R及Fvalue。Fvalue的定義為2PRP+R。其中,P表示面部遮擋檢測的頭發(fā)區(qū)域和人工標(biāo)注的頭發(fā)區(qū)域一致的像素所占的比例,R表示面部人工標(biāo)注的頭發(fā)區(qū)域和遮擋檢測的頭發(fā)區(qū)域一致的像素所占的比例。對所有實驗分別調(diào)整參數(shù)以達(dá)到最優(yōu)的Fvalue值。下面通過兩個試驗對比本文方法與PCA檢測方法的優(yōu)劣。
實驗1該實驗采用數(shù)據(jù)集中的正面人臉,數(shù)據(jù)包含109張遮擋人臉圖像,實驗結(jié)果如表1所示。

由表1可以看出,在正面人臉的條件下,PCA檢測方法的Fvalue為69%,相應(yīng)的準(zhǔn)確率和召回率分別為63%和76%。本文方法比PCA檢測方法的Fvalue提高了20%,準(zhǔn)確率和召回率分別提高了27%和12%。實驗2該實驗采用全部的數(shù)據(jù),包含269張不同姿勢的遮擋人臉圖像,實驗結(jié)果如表2所示。
由表2可以看出,在不同姿勢的人臉條件下,PCA檢測方法的Fvalue為57%,相比正面人臉條件下降低了12%,相應(yīng)的準(zhǔn)確率和召回率降低10%左右。而本文方法與正面人臉條件下的Fvalue相比變化不大,說明比PCA檢測方法具有更強的魯棒性。
4結(jié)論
發(fā)型遮擋對人臉識別具有極大的干擾,如何準(zhǔn)確獲取遮擋區(qū)域是處理遮擋中需要解決的問題。由于各種形狀和不同紋理,使得發(fā)型遮擋區(qū)域檢測非常困難 。實驗表明,本文提出的方法比PCA遮擋檢測方法具有更高的準(zhǔn)確率和召回率,驗證了該方法的有效性。
參考文獻(xiàn)
?。?] CHELLAPPA R, WILSON C L, SIROHEY S. Human and machine recognition of faces: a survey[J]. Proceedings of the IEEE, 1995, 83(5): 705741.
[2] 杜成, 蘇光大. 用于人臉識別的正面人臉圖像眼鏡摘除[J]. 清華大學(xué)學(xué)報(自然科學(xué)版), 2005, 45(7): 928930.
?。?] 王志明, 陶建華. 人臉遮擋區(qū)域檢測與重建[J]. 計算機(jī)研究與發(fā)展, 2015, 47(1): 1622.
?。?] 李冬梅, 熊承義, 高志榮,等. 基于異值區(qū)域消除的遮擋人臉識別[J]. 計算機(jī)科學(xué), 2015, 42(3):289295.
[5] MCCLELLAND J L, KAWAMOTO A H. Parallel distributed processing[C]. Rumelhart and McClelland (eds.), 1986(I):4576.
?。?] BOYKOV Y, VEKSLER O, ZABIH R. Fast approximate energy minimization via graph cuts[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(11): 12221239.
