摘 要: 介紹了一種基于膚色與手形的動(dòng)態(tài)人手跟蹤方法。根據(jù)檢測(cè)過(guò)程中所用到的人手基本特征,提出了一種基于色度-飽和度自適應(yīng)閾值膚色分割與成對(duì)幾何直方圖(PGH)匹配的人手圖像檢測(cè)方法。為了克服跟蹤過(guò)程中背景色干擾的問(wèn)題,實(shí)現(xiàn)了基于Kalman濾波器的預(yù)測(cè)跟蹤。實(shí)驗(yàn)結(jié)果表明,該動(dòng)態(tài)人手跟蹤方法計(jì)算簡(jiǎn)便、實(shí)時(shí)性好、跟蹤精度高,可應(yīng)用在大多數(shù)復(fù)雜場(chǎng)景。
關(guān)鍵詞: 膚色概率直方圖;成對(duì)幾何直方圖;卡爾曼濾波器
隨著計(jì)算機(jī)性能的不斷提高和機(jī)器視覺(jué)領(lǐng)域研究的不斷深入,人機(jī)交互技術(shù)日益成為機(jī)器視覺(jué)領(lǐng)域的研究熱點(diǎn)?;跈C(jī)器視覺(jué)的手勢(shì)識(shí)別作為其重要的研究?jī)?nèi)容之一,在許多領(lǐng)域有著重要的應(yīng)用。最近幾年,尤其在智能家居以及3D體感游戲領(lǐng)域,手勢(shì)識(shí)別得到了廣泛的應(yīng)用,因此受到越來(lái)越廣泛的關(guān)注。
根據(jù)識(shí)別特征的不同,手勢(shì)識(shí)別分為基于標(biāo)記的手勢(shì)識(shí)別和基于裸手的手勢(shì)識(shí)別系統(tǒng),而裸手手勢(shì)識(shí)別又分為靜態(tài)手勢(shì)識(shí)別和動(dòng)態(tài)手勢(shì)識(shí)別[1]。目前,基于裸手的動(dòng)態(tài)手勢(shì)識(shí)別是手勢(shì)識(shí)別中最重要的領(lǐng)域[2],相對(duì)于靜態(tài)手勢(shì)識(shí)別而言,動(dòng)態(tài)手勢(shì)識(shí)別有著更靈活、更廣泛的應(yīng)用。但是人手是一個(gè)多關(guān)節(jié)非剛性物體,在運(yùn)動(dòng)過(guò)程中會(huì)呈現(xiàn)出多種多樣的手勢(shì)形態(tài),在跟蹤過(guò)程中還會(huì)伴有手勢(shì)遮擋和膚色干擾等情況。所以,如何對(duì)人手進(jìn)行有效的視覺(jué)檢測(cè)與跟蹤是實(shí)現(xiàn)動(dòng)態(tài)手勢(shì)識(shí)別和理解的關(guān)鍵,也是機(jī)器視覺(jué)機(jī)和人機(jī)交互領(lǐng)域中一個(gè)富有挑戰(zhàn)的重要課題。
1 相關(guān)工作
按照運(yùn)動(dòng)目標(biāo)跟蹤策略的不同,對(duì)于動(dòng)態(tài)人手跟蹤可以分為基于模型和基于表象兩種方法。
基于表象的方法又叫非模型跟蹤方法,它可細(xì)分為基于區(qū)域的跟蹤、基于活動(dòng)輪廓[3]以及基于其他圖像特征的跟蹤方法[4]。該方法的優(yōu)點(diǎn)是實(shí)時(shí)性較好,但由于所跟蹤特征很容易受遮擋或光線條件變化等外界因素的干擾,難以保證魯棒性?;谀P偷姆椒ㄒ獙?duì)跟蹤目標(biāo)建立特征模型,通過(guò)比較觀測(cè)和預(yù)測(cè)數(shù)據(jù)來(lái)修正模型中的參數(shù)。該類方法性能的實(shí)現(xiàn)依賴于初始化過(guò)程,如果初始化合理,即可達(dá)到精確的估計(jì)。同時(shí)該類方法還面臨著高維空間中搜索的難題,如采用粒子濾波器跟蹤人手運(yùn)動(dòng),當(dāng)狀態(tài)空間維數(shù)過(guò)高時(shí),需要大量的粒子來(lái)估計(jì)高維空間中的概率分布。因此這種方法計(jì)算復(fù)雜度高、計(jì)算量較大,很難保證實(shí)時(shí)性。
針對(duì)以上問(wèn)題,提出了一種快速魯棒的人手檢測(cè)與跟蹤算法,在背景相對(duì)復(fù)雜、存在類膚色干擾的情況下,該方法也能夠有效地對(duì)動(dòng)態(tài)人手進(jìn)行實(shí)時(shí)跟蹤。具體框圖如圖1所示。




經(jīng)過(guò)對(duì)比可以看出,Camshift+Kalman實(shí)時(shí)性最好,但誤檢率最高;Haar+Adaboost方法漏檢率較低,但是跟蹤速度相對(duì)較慢,誤檢率較高;Chamfer Matching方法誤檢率與漏檢率都較低,但是跟蹤速度最慢,很難達(dá)到實(shí)時(shí)跟蹤的要求;本文所提出的SPDH+PGH+Kalman方法,誤檢率和漏檢率與Haar+Adaboost方法相當(dāng),跟蹤速度接近Camshift+Kalman方法,滿足實(shí)時(shí)性跟蹤,具有較強(qiáng)的魯棒性,且能夠適用于大多數(shù)復(fù)雜場(chǎng)景。
本文提出了一種基于膚色與形狀的手勢(shì)檢測(cè)與跟蹤方法,該方法簡(jiǎn)單可靠,具有較強(qiáng)的快速性與魯棒性。在跟蹤過(guò)程中,手部運(yùn)動(dòng)盡量保持恒速運(yùn)動(dòng),跟蹤效果比較好。本文提出的方法尚有需要改進(jìn)之處,當(dāng)背景光照較強(qiáng)烈時(shí),容易出現(xiàn)漏檢情況。因?yàn)閺?qiáng)光照的干擾,視頻中部分膚色區(qū)域的色調(diào)“污染”嚴(yán)重,所以影響了自適應(yīng)閾值膚色分割的效果。
參考文獻(xiàn)
[1] 楊波,宋曉娜,馮志全,等.復(fù)雜背景下基于空間分布特征的手勢(shì)識(shí)別算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2010,22(10):1841-1848.
[2] 滕達(dá),楊壽保,劉巖,等.基于“大小手”的徒手手勢(shì)實(shí)時(shí)識(shí)別[J].計(jì)算機(jī)應(yīng)用,2006,26(9):2041-2043.
[3] 王亮,胡衛(wèi)明,譚鐵牛.人運(yùn)動(dòng)的視覺(jué)分析綜述[J].計(jì)算機(jī)學(xué)報(bào),2002,25(3):225-237.
[4] HOCH M, LITWINOWICZP. A practical solution for tracking edges in image sequences with snakes[J]. The Visual Computer, 1996, 12(2):75-83.
[5] 趙懷勛,鄭敏,李志強(qiáng).一種自適應(yīng)光照的膚色識(shí)別算法[J].微電子學(xué)與計(jì)算機(jī),2006,24[3]:158-160.
[6] Zhang Mingji, Wang Weiqiang, Zheng Qingfang, et al. Skin-color detection based on adaptive thresholds[C].Proceedings of the Third International Conference on Image and Graphics, 2004: 250-253.
[7] 洪紅,朱秀昌.一種新的人手圖像跟蹤算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(3):88-91.
[8] 于仕琪,劉瑞禎.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.
[9] 劉玉進(jìn),蔡勇,武匯岳.一種膚色干擾下的變形手勢(shì)跟蹤方法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(35):164-167.
