123,123,123

基于机器视觉的人数识别研究综述

2017年微型机与应用第7期

孙莹莹1，宋寅卯1，王蓬2

1.郑州轻工业学院建筑环境工程学院，河南郑州 450002；　　2. 郑州轻工业学院电气信息工程学院，河南郑州450002

摘要： 机器视觉技术由于其非破坏性、精度高、速度快等特点，在现在科技发展中已经被广泛地研究和应用，更多地被用到视频监控中。文章对机器视觉人数识别近几年的发展做了详细的论述，主要从个体识别法和群体识别法两大方面进行分析，具体可分为四方面：特征识别法、形状识别法、模型学习识别法和人群密度识别法。根据各种不同识别算法思想的研究，对当前研究方向上亟待解决的问题做出了分析，并对未来人数识别的研究做出展望。

關(guān)鍵詞： 机器视觉人数识别人群密度人员跟踪

Abstract：

Key words :

　　孫瑩瑩1，宋寅卯1，王蓬2

　　（1.鄭州輕工業(yè)學(xué)院建筑環(huán)境工程學(xué)院，河南鄭州 450002；2. 鄭州輕工業(yè)學(xué)院電氣信息工程學(xué)院，河南鄭州450002）

摘要：機(jī)器視覺技術(shù)由于其非破壞性、精度高、速度快等特點(diǎn)，在現(xiàn)在科技發(fā)展中已經(jīng)被廣泛地研究和應(yīng)用，更多地被用到視頻監(jiān)控中。文章對機(jī)器視覺人數(shù)識別近幾年的發(fā)展做了詳細(xì)的論述，主要從個體識別法和群體識別法兩大方面進(jìn)行分析，具體可分為四方面：特征識別法、形狀識別法、模型學(xué)習(xí)識別法和人群密度識別法。根據(jù)各種不同識別算法思想的研究，對當(dāng)前研究方向上亟待解決的問題做出了分析，并對未來人數(shù)識別的研究做出展望。

　　關(guān)鍵詞：機(jī)器視覺；人數(shù)識別；人群密度；人員跟蹤；人員檢測

　　中圖分類號：TP391文獻(xiàn)標(biāo)識碼：ADOI： 10.19358/j.issn.1674-7720.2017.07.003

　　引用格式：孫瑩瑩，宋寅卯，王蓬.基于機(jī)器視覺的人數(shù)識別研究綜述［J］.微型機(jī)與應(yīng)用，2017,36（7）：9-11，18.

0引言

　　機(jī)器視覺是用計算機(jī)模擬人的視覺功能，從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測、測量和控制［1］。目前，機(jī)器視覺技術(shù)向著智能化、目的化方向發(fā)展。

　　人數(shù)識別涉及數(shù)字視頻處理、模式識別、計算機(jī)視覺以及人工智能多個領(lǐng)域，是一個跨學(xué)科、跨領(lǐng)域的前沿課題，也是當(dāng)今智能視覺系統(tǒng)研究中一個十分活躍的新領(lǐng)域。國際上的高級視頻和錄像（Advanced Video and SignalBased Surveillance）論壇每年都會舉辦PETS的會議專門針對于人群行為分析［23］。國內(nèi)外有不少對于人數(shù)識別的解決方案，其中絕大部分是基于機(jī)器視覺的。基于機(jī)器視覺的人數(shù)識別不僅具有很強(qiáng)的科學(xué)研究價值，還具有很強(qiáng)的實(shí)用價值，其成本低，使用周期長，統(tǒng)計準(zhǔn)確率高。

　　本文根據(jù)近幾年人數(shù)識別研究成果，做出總結(jié)，將其分為4種識別方法，分別為特征識別、形狀識別、模型學(xué)習(xí)識別和人群密度識別。前三種旨在檢測和跟蹤個體，多用于中低人群密度的場合；第4種主要是跳過單個行人的檢測和跟蹤過程，將人群整體作為研究對象。

1特征識別法

　　特征識別法是指根據(jù)已選取的目標(biāo)特征，在圖像序列中匹配搜索目標(biāo)，從而實(shí)現(xiàn)運(yùn)動目標(biāo)的跟蹤識別。在識別算法中，選取有效的特征集，會提高檢測效率，減少錯誤率。

　　顏色特征對平面旋轉(zhuǎn)、非剛性變形具有很強(qiáng)的魯棒性，同時能夠容忍部分遮擋。在文獻(xiàn)［4］中，Comaniciu提出了基于顏色直方圖（Color Histogram）非剛性目標(biāo)的跟蹤識別方法。但是由于顏色特征對光照變化的敏感性，為了提高識別效果，可采用多特征結(jié)合［5］的方式。王強(qiáng)［6］等人提出了一種人頭的顏色與形狀特征相結(jié)合的人數(shù)識別方法，此方法對圖像進(jìn)行二值化，以降低陰影和光照變化造成的影響；然后根據(jù)形狀特征對人頭進(jìn)行檢測與跟蹤，最后對目標(biāo)的運(yùn)動軌跡進(jìn)行跟蹤分析，估計出當(dāng)前場景中的人數(shù)。在光照變化頻繁的地方也可采用邊緣特征，文獻(xiàn)［7］提出了基于邊緣方向直方圖特征的跟蹤方法，該方法對光照變化不敏感，并且比單一輪廓邊緣特征具有更豐富的信息。單一的邊緣特征［8-9］往往存在計算復(fù)雜度高、無法適應(yīng)目標(biāo)形變的問題。而顏色與邊緣特征具有互補(bǔ)特性，將兩種信息融合能夠建立更可靠的目標(biāo)特征模型。光流特征通過計算像素點(diǎn)光流的幅值和方向構(gòu)建動態(tài)圖像的幾何變化和輻射度變化，Decarlo［10］利用光流特征實(shí)現(xiàn)了對人臉目標(biāo)的跟蹤。由于光流法運(yùn)算量較大，很難滿足實(shí)時性要求，并且光流法對遮擋、光照變化以及運(yùn)動噪聲比較敏感，因此光流法的實(shí)際應(yīng)用并不常見。

2形狀識別法

　　形狀識別法的思想是建立一個表示目標(biāo)形狀的模板，然后計算目標(biāo)模板和候選目標(biāo)形狀的相似度，從而確定當(dāng)前幀運(yùn)動目標(biāo)最可能的位置。常用人體的形狀特征作為模板，如人體的軀干特征、人頭輪廓［11］特征。

　　文獻(xiàn)［12］中提到了一種根據(jù)雙橢圓模型檢測人頭作為人數(shù)統(tǒng)計依據(jù)的方法，得到運(yùn)動目標(biāo)的輪廓特征后檢測出頭部橢圓，這種方法提高了檢測精度，減了少誤判，然而如果是畫面比較模糊的情況下，就不能準(zhǔn)確地確定目標(biāo)。為了解決模糊場景下的人員識別，常慶龍、夏洪山［13］在視頻檢測過程中引入了一個自適應(yīng)的人物檢測窗口，對監(jiān)控視頻中的行人進(jìn)行檢測和計數(shù)。該算法對場景圖像質(zhì)量要求低，不需要繁瑣的訓(xùn)練過程，只需要一定的參數(shù)配置步驟即可實(shí)現(xiàn)感興趣區(qū)域的行人快速檢測，但此算法仍然有不足之處，即對于復(fù)雜場合的人群誤檢率較高。而趙軍偉［14］等人在這方面做得較好，用數(shù)學(xué)形態(tài)學(xué)與HSI顏色空間相結(jié)合的方法有效地去除圖像中非人頭區(qū)域的干擾和噪聲，通過邊緣檢測得到人頭候選區(qū)域，最后利用人頭輪廓信息進(jìn)行判定識別目標(biāo)。為了提高視頻監(jiān)控中人數(shù)統(tǒng)計的實(shí)時性，文獻(xiàn)［15］中也使用了數(shù)學(xué)形態(tài)學(xué)與顏色空間相結(jié)合的方法，用輪廓的幾何特征檢測人頭，相比之下，此方法更具體、詳細(xì)，可適用多種不同復(fù)雜的場合，也能保證檢測的實(shí)時性，在動態(tài)場景下的行人檢測取得了較好的效果。

3學(xué)習(xí)識別法

　　模型學(xué)習(xí)識別法是對要跟蹤的目標(biāo)特征建立模型并學(xué)習(xí)，進(jìn)而對學(xué)習(xí)得到的模型用于檢測，最后統(tǒng)計出人數(shù)。模型學(xué)習(xí)的算法需要具備快速、連續(xù)的學(xué)習(xí)能力，通過增量學(xué)習(xí)更新目標(biāo)的特征描述來處理表征的變化。

　　2009年，賈慧星［16］提出智能監(jiān)控中基于機(jī)器學(xué)習(xí)的自動人數(shù)統(tǒng)計系統(tǒng)，通過機(jī)器學(xué)習(xí)對視頻序列中的人肩部位進(jìn)行準(zhǔn)確地檢測。該方法克服了連通域分析和簡單模板匹配的不足，魯棒性增強(qiáng)，但是只適用于場景中的初步測試，而且計算量較大，效率不高。在此基礎(chǔ)上，劉子源、蔣承志［17］使用人肩部建立Harr特征分類器，過濾背景，排除干擾，提高了檢測精度，減少了檢測時間。除人肩外，較多算法用人臉作為學(xué)習(xí)模型，江偉堅［18］等人提出兩組Harrlike特征擴(kuò)展集（正臉和側(cè)臉），通過Adaboost算法訓(xùn)練出雙通道級聯(lián)分類器（用于側(cè)臉和正臉的識別），此方法使用較少的弱分類器，檢測效率高，計算速度快，對多角度人臉檢測有較好的魯棒性。以上算法采樣的視覺角度建立在行人平視圖上，而垂直攝像頭可以降低遮擋程度，文獻(xiàn)［19］中，用俯視的方式采樣，建立基于Adaboost的人頭檢測分類器，實(shí)現(xiàn)人數(shù)統(tǒng)計，但是仍然存在誤檢和漏檢的情況。為了對此進(jìn)行改善，唐春暉［20］提出了一種基于梯度方向直方圖的俯視行人的檢測方法。它將俯視人頭的梯度方向直方圖作為檢測目標(biāo)的特征，通過訓(xùn)練樣本提取的特征向量在支持向量機(jī)(SVM)中訓(xùn)練。此方法對目標(biāo)尺度變化相對不敏感且效率更高,處理速度也明顯提升。

4人群密度識別法

　　人群密度識別法是將人群作為一個整體的研究對象，分析人群的圖像特征，然后建立人群特征與人數(shù)之間的映射關(guān)系從而實(shí)現(xiàn)人群計數(shù)。其圖像特征又分為基于像素特征和基于紋理特征兩大類。

　　王明吉、肖桂丹［21］等利用運(yùn)動目標(biāo)標(biāo)記的方法實(shí)現(xiàn)計數(shù)，標(biāo)記圖像中的像素，形成標(biāo)簽圖像，根據(jù)標(biāo)簽圖像初步確定目標(biāo)數(shù)量。此方法穩(wěn)定性強(qiáng)、準(zhǔn)確率較高，但由于基于像素特征的識別法計算簡單，因此在高密度場合往往使用基于紋理的分析法。Chan［22］采用混合紋理模型來提取分割運(yùn)動人群，利用訓(xùn)練回歸函數(shù)的方法得出人數(shù)與特征量關(guān)系函數(shù)，進(jìn)而對檢測區(qū)域人數(shù)實(shí)現(xiàn)估計。由于訓(xùn)練集不夠強(qiáng)大，很容易出現(xiàn)誤差，準(zhǔn)確率就不能保證，而且計算量較大。之后，李虎［23］等人提出一種基于 PCA 和多元統(tǒng)計回歸的人數(shù)統(tǒng)計方法，使用 PCA 方法提取信息，得到特征量與行人密度間的函數(shù)關(guān)系后對高斯回歸模型進(jìn)行修正，以提高回歸模型的精度，統(tǒng)計出行人密度，有較高的準(zhǔn)確率。紋理分析法中，比較經(jīng)典的方法是使用灰度共生矩陣紋理特征。文獻(xiàn)［24］中采用一種基于線性內(nèi)插透視矯正的SURF算法，對獲得的前景圖像提取多特征，將傳統(tǒng)的灰度共生矩陣紋理特征與SURF算法特征相結(jié)合，克服遮擋和攝像機(jī)透視畸形的影響，有效地提高了統(tǒng)計精度，有較強(qiáng)的適應(yīng)性，準(zhǔn)確率也可以得到保證。

5人數(shù)識別算法難點(diǎn)

　　人數(shù)識別算法包括人員檢測算法、人員跟蹤算法和人群密度算法。研究算法一直追求魯棒性好、準(zhǔn)確率高、快速性好的特點(diǎn)。雖然關(guān)于人數(shù)識別算法的研究已經(jīng)持續(xù)了很多年，研究者們提出了各種各樣的識別方法，但是還沒有形成一個適用于所用應(yīng)用場合的統(tǒng)一理論框架或體系，而且算法在實(shí)際應(yīng)用中遇到的很多問題仍然沒有得到很好的解決，這些問題即是難點(diǎn)，又是以后的研究重點(diǎn)，表1是對各算法中遇到的難點(diǎn)問題的總結(jié)。

6展望和結(jié)束語

　　隨著智能視頻跟蹤系統(tǒng)的發(fā)展，對目標(biāo)跟蹤技術(shù)的要求也成為一個研究熱點(diǎn)。實(shí)現(xiàn)一個速度快、精度高、實(shí)時性好的識別系統(tǒng)是研究的重要方向之一。但是通常情況下，各特點(diǎn)之間相互矛盾。提高復(fù)雜環(huán)境下的多目標(biāo)識別亟待解決。針對目標(biāo)識別技術(shù)中出現(xiàn)的目標(biāo)遮擋、背景干擾等問題，可引入超像素概念［25］，能夠捕獲圖像冗余信息，降低后續(xù)處理任務(wù)復(fù)雜度。不同的機(jī)器學(xué)習(xí)方法對模型的自適應(yīng)有嚴(yán)重的影響，針對在識別工程中出現(xiàn)的運(yùn)動和變化不確定性，已有的子空間學(xué)習(xí)、度量空間學(xué)習(xí)、稀疏字典學(xué)習(xí)和深度學(xué)習(xí)都有很好的效果。如何結(jié)合學(xué)習(xí)機(jī)制更好地實(shí)現(xiàn)算法自適應(yīng)性有待深入研究。

　　隨著物聯(lián)網(wǎng)的發(fā)展，智能視頻監(jiān)控系統(tǒng)已成為熱點(diǎn)之一，使人數(shù)識別算法也成為熱點(diǎn)。本文介紹了基于機(jī)器視覺的人數(shù)統(tǒng)計的研究；通過對近年來具有代表性的人數(shù)識別算法研究分析，總結(jié)出人數(shù)識別算法主要有基于個人的識別和基于群體的識別；相比傳統(tǒng)的人數(shù)識別算法，增加了對高密度人群的詳細(xì)分析?？偨Y(jié)了近年來人數(shù)識別算法中亟待解決的問題，并對其提出展望。

　　參考文獻(xiàn)

　　［1］章煒.機(jī)器視覺技術(shù)發(fā)展及其工業(yè)應(yīng)用［J］.紅外,2005,27(2):11-17.

　?。?］ KRAHNSTOEVER N, TU P, SEBASTIAN T, et al. Multiview detection and tracking of travelers and luggage in mass transit environments［C］. In: IEEE International Workshop on Performance Evaluation of Trackling and Surveillance and CVPR, 2006.

　　［3］ KRAHNSTOEVER N, YU T, PATWARDHAN K A, et al. Multicamera person tracking in crowded environments［C］.Twelfth IEEE International Workshop on PERFORMANCE Evaluation of Tracking and Surveillance， 2010:1-7.

　?。?］ COMANICIU D, RAMESH V, MEER P. Kernelbased object rracking［J］. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2003, 25(5):564-575.

　　［5］林景亮,唐杰.一種融合膚色和Haar特征的人臉檢測方法［J］. 微型機(jī)與應(yīng)用,2013, 32(8):35-37.

　?。?］王強(qiáng)，馮燕．基于顏色和形狀信息的快速人數(shù)統(tǒng)計方法［J］．計算機(jī)測量與控制，2010(9)：101-105．

　?。?］ SHEN C, HENGEL A V, DICK A. Probabilistic multiple cue integration for particle filter based tracking［C］. Proceedings of the International Conference on Digital Image Computing: Techniques and Applications, Sydney, 2003, 1: 399-408.

　?。?］ BIRCHFIELD S T, RANGARAJAN S. Spatioframs versus histograms for regionbased tracking［C］.Proceedings of the IEEE Computer Society Conference on Computer Vision and Recognition, San Diego, CA, United States,2005,2:1158-1163.

　?。?］ LI P H, ZHANG T W, PECE A E C. Visual contour tracking based on particle filters［J］. Image and Vision Computing, 2003, 21(1): 111-123.

　?。?0］ DE CARLO D, METAXAS D. Optical flow constraints on deformable models with applications to face tracking［J］. International Journal of Computer Vision, 2000, 38(2): 99-127.

　　［11］周先春,唐娟, 汪美玲.曲率與小波輪廓增強(qiáng)的人臉識別算法［J］.電子技術(shù)應(yīng)用, 2015, 41(10):161-164.

　?。?2］張繼法,梅雪,許松松.一種基于雙橢圓模型的視頻人數(shù)統(tǒng)計方法［J］.計算機(jī)科學(xué)，2012,39(26)：499-502．

　?。?3］常慶龍,夏洪山.基于自適應(yīng)滑動窗的模糊場景行人快速檢測［J］.電視技術(shù)，2012,36(19)：177-182．

　?。?4］趙軍偉,侯清濤,李金屏，等.基于數(shù)學(xué)形態(tài)學(xué)和 HSI 顏色空間的人頭檢測［J］.山東大學(xué)學(xué)報(工學(xué)版)，2013，43(2)：6-10．

　?。?5］高春霞,董寶田,王愛麗.基于人頭顏色空間和輪廓信息的行人檢測方法研究［J］.交通運(yùn)輸系統(tǒng)工程與信息,2015,15(4):70-78.

　?。?6］賈慧星,章毓晉.智能視頻監(jiān)控中基于機(jī)器學(xué)習(xí)的自動人數(shù)統(tǒng)計［J］.視頻應(yīng)用與工程,2009,34(4):78-81.

　　［17］劉子源,蔣承志.基于OpenCV和Haar特征分類器的圖像人數(shù)檢測［J］.遼寧科技大學(xué)學(xué)報,2011,34(4):384-388.

　?。?8］江偉堅,郭躬德,賴智銘.基于新Harrlike特征的Adaboost人臉檢測算法［J］.山東大學(xué)學(xué)報（工學(xué)版），2014,44(2):43-48.

　?。?9］張志勛，張磊，楊凡.一種改進(jìn)的Adaboost人臉檢測方法［J］.自動化與儀器儀表,2013(6):143145.

　?。?0］唐春暉.一種基于梯度方向直方圖的俯視行人的檢測方法［J］.模式識別與人工智能,2015,28(1):1926.

　?。?1］王明吉，肖桂丹，胡曉曦.一種實(shí)用的多運(yùn)動目標(biāo)標(biāo)記與計數(shù)新方法［J］．計算機(jī)仿真，2009,26(8):199-203.

　?。?2］ CHAN A B, LIANG Z S J, VASCONCELOS N. Privacy preserving crowd monitoring: counting people without people models or tracking［C］. Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recoynition (CVPR08). Washington, DC, USA: IEEE Computer Society,2008:1-7.

　　［23］李虎,張二虎,段敬紅．基于PCA 和多元統(tǒng)計回歸的人群人數(shù)統(tǒng)計方法［J］．計算機(jī)工程與應(yīng)用，2014,50(11)：206-209．

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容