人臉識別系統(tǒng)畢業(yè)論文_第1頁
人臉識別系統(tǒng)畢業(yè)論文_第2頁
人臉識別系統(tǒng)畢業(yè)論文_第3頁
人臉識別系統(tǒng)畢業(yè)論文_第4頁
人臉識別系統(tǒng)畢業(yè)論文_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGE廣西大學(xué)畢業(yè)設(shè)計論文 人臉識別系統(tǒng)PAGEPAGE68PAGE11摘要生物認(rèn)證技術(shù)是依靠人類自身所固有的生理或行為特征進(jìn)行身份驗證的一種手段。而生物認(rèn)證中的人臉特征又是人與人之間互相辨識的最重要和最直觀的生物特征。由于人臉識別的無侵害性和對用戶最自然、最直觀的方式,使人臉識別成為最容易被接受的生物特征識別方式。但由于人臉在成像過程中受到諸如光照、表情、姿態(tài)等各種因素的影響,使得人臉識別是當(dāng)前最富挑戰(zhàn)性的研究課題之一。本文對人體生物認(rèn)證在現(xiàn)實生活中的重要作用、人臉檢測和人臉識別技術(shù)研究的意義、系統(tǒng)要完成的任務(wù)、系統(tǒng)的評價標(biāo)準(zhǔn)、人臉檢測和人臉識別技術(shù)的發(fā)展的主要特點、實現(xiàn)方法等進(jìn)行了介紹,并指出了當(dāng)前人臉檢測與人臉識別領(lǐng)域的研究重點與難點,著重介紹和推導(dǎo)了人臉檢測和識別的相關(guān)算法,比如:AdaBoost算法、具有局部互聯(lián)結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)反向傳播算法數(shù)學(xué),以及在分析了傳統(tǒng)的彈性圖匹配的基礎(chǔ)上提出了人臉識別的基于局部特征分析(LFA)與最優(yōu)化匹配的人臉識別算法,該算法首先利用神經(jīng)網(wǎng)絡(luò)的方法估計出在識別人臉中起重要作用的一些特征點(如瞳孔、眼角、眉心、眉角、嘴角等),之后利用Gabor小波的局部多尺度分析特性提取特征點的多尺度特征。這樣人臉的每一個特征點就被一系列的Gabor小波系數(shù)所表示,最后對待識人臉與人臉庫中人臉的相應(yīng)特征點多尺度特征進(jìn)行最優(yōu)化匹配找出需要的人臉。最后,介紹了CMOS圖像傳感器、ARM9微處理器,設(shè)計了一個基于ARM9的人臉識別系統(tǒng)。關(guān)鍵字:生物認(rèn)證、人臉識別、神經(jīng)網(wǎng)絡(luò)、ARM HumanfacerecognitionsystemAbstractBiometricrecognitionrealizespersonalidentificationbasedontheinherentphysicalorbehavioralcharacteristicsofhumanbeing,amongwhichfacialfeaturesarethemostimportantandintuitionalones.Facerecognitionhasbecomethemostacceptablebiometricrecognitionmethodbecauseofitsnoviolationofprivacyandintuition.Facerecognitionischallenginginthepatternrecognitionduetotheinfluenceofillumination|,expressionandpose.Inthispaper,wepresentacomprehensivereviewoffacedetectionandrecognition,whichincludesthefacedetection,facerecognitionandthecurrentdevelopmentintheliterature.Wealsogiveapresentationofthemajorpointsandchallengesinthefacedetectionandrecognitionresearch.Onthebaseofourresearch,introducedandtransmitalgorithmboutfacedetectionandfacerecognition,suchas:AdaBoostalgorithm,theproofforBPNeuralnetworkalgorithm.Andtraditionalelasticgraphmatchingisanalyzedandafacerecognitionalgorithmbasedonlocalfeatureanalysisandoptimizationmatchingisputforward.Firstly,someimportantfacefeatures(suchaspupil,canthus,centerofeyebrow,cornersofeyebrow,cornersofmouth)arelocatedusingneutralnetwork.Secondly,themultiscalefeaturesofthefeaturepointsareextractedusingthelocalmutiscaleanalysisfeatureoftheGaborwavelet.Inthisway,everyfacefeaturepointisrepresentedbyaseriesofGaborwaveletcoefficients.Finally,inordertofindthefacewanted,thetestfaceiscomparedwiththemultiscalefeaturesofthecorrespondingfeaturepointsinthefacedatabaseusingtheoptimizationmatching.Finally,thisarticleintroducesbasicfunctionsofCMOSandARM,designedasimplehumanfacerecognitionsystemonthebaseofARM.Keywords:Biometricrecognition,Facerecognition,Neuralnetwork,ARM 目錄第一章緒論11.1人體生物認(rèn)證技術(shù)11.2人臉識別原理41.2.1.人臉檢測與人臉識別的研究內(nèi)容41.2.2.人臉檢測與人臉識別的評價標(biāo)準(zhǔn)41.2.3.人臉檢測與人臉識別的技術(shù)挑戰(zhàn)51.2.4.人臉檢測與人臉識別的實用價值61.3論文的主要研究內(nèi)容7第二章人臉檢測方法82.1基于知識的方法82.2基于模板匹配的方法112.3基于學(xué)習(xí)的方法12第三章人臉檢測算法……………193.1AdaBoost算法:193.1.1Boost算法的一個直觀解釋3.1.2算法3.1的分類誤差估計3.1.3具有局部互聯(lián)結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)反向傳播算法數(shù)學(xué)推導(dǎo)……………..….23.2人臉檢測算法273.2.1圖像預(yù)處理283.2.2從局部到整體的人臉檢測293.3實驗結(jié)果……………..29第四章人臉識別方法334.1基于KL變換的特征臉識別方法334.2.基于幾何特征的方法354.3相關(guān)性匹配方法36第五章基于局部特征分析與最優(yōu)化匹配的人臉識別算法405.1圖像預(yù)處理405.1.1人臉圖像特征點定位5.1.2利用Gabor小波提取人臉局部的多尺度特征5.1.3局部特征的最優(yōu)化匹配5.2人臉匹配識別455.3實驗結(jié)果……….………….….…46第六章基于ARM的人臉識別系統(tǒng)設(shè)計……….……466.1CMOS圖像傳感器簡介…………..………466.2ARM介紹……………...…………….……..…476.3人臉識別系統(tǒng)的硬件設(shè)計……...516.4人臉識別系統(tǒng)的軟件設(shè)計…………….……57第七章總結(jié)與展望58參考文獻(xiàn)……………….….59致謝……………………61附錄一:人臉檢測主程序………………..63附錄二:人臉識別主程序………………..65 第一章緒論1.1人體生物認(rèn)證技術(shù)在人們的日常生活中,經(jīng)常會遇到這樣一些情況:丟失鑰匙而進(jìn)不了門;忘記密碼而無法在ATM機(jī)上取錢;電腦中的重要資料被非法復(fù)制;手機(jī)被他人盜用;銀行存款被人冒提取。這些都會對生活帶來不便,甚至?xí)斐删薮髶p失。先進(jìn)的身份認(rèn)證技術(shù)就可以避免這些現(xiàn)象的發(fā)生。目前,身份認(rèn)證所采用的方法主要基于身份標(biāo)示物品(如鑰匙、證件、卡等)和身份標(biāo)示知識(如用戶名和密碼等)來確定其身份。但兩者都存在著一些缺陷:標(biāo)示物品容易丟失或被偽造,標(biāo)示知識容易遺忘或被記錯。更為嚴(yán)重的是這些傳統(tǒng)的身份識別方法往往無法區(qū)分標(biāo)識物品的真正擁有者和取得標(biāo)示物品的冒充者,一旦他人獲得了這些標(biāo)示物品,就可以擁有相同的權(quán)利。因此,我們急需一種更加方便、有效、安全的身份認(rèn)證技術(shù)來保障我們的生活,這種技術(shù)就是生物認(rèn)證技術(shù)—我們自己的人體就是最安全、最有效的密碼和鑰匙。生物認(rèn)證(Biometric)所依據(jù)的不是傳統(tǒng)的標(biāo)識物品或標(biāo)示知識,而是依靠人類自身所固有的生理或行為特征進(jìn)行身份驗證的一種解決方案。生理特征與生俱來多為先天性的,如指紋、掌紋、掌形、虹膜、視網(wǎng)膜、靜脈、手形、人臉、DNA、骨架、耳型等人體的生理特征,以及說話者的聲音、簽名的動作、行走的步態(tài)、擊打鍵盤的力度等個人的行為特征。生物認(rèn)證的技術(shù)核心在于如何獲取這些生物特征,并將其轉(zhuǎn)換為數(shù)字信息,存儲于計算機(jī)中,利用可靠的匹配算法來完成驗證與識別個人身份的過程[1]。與傳統(tǒng)的身份認(rèn)證手段相比,基于生物認(rèn)證的身份驗證技術(shù)具有以下特點:不易遺忘或丟失;防偽性能好,不易偽造或被盜;“隨身攜帶",隨時隨地可用。但并不是所有的生物特征都能夠用來進(jìn)行生物認(rèn)證,能夠用于生物認(rèn)證的生物特征應(yīng)該具有以下的特點:廣泛性:每個人都應(yīng)該具有這種特征;唯一性:每個人擁有的特征應(yīng)該各不相同;穩(wěn)定性:所選擇的特征應(yīng)該不隨時間發(fā)生變化;可采集性:所選擇的特征應(yīng)該便于測量;同時實際的應(yīng)用還給基于生物特征的身份鑒別系統(tǒng)提出了更多的要求,如:1)性能的要求:所選擇的生物統(tǒng)計特征能夠達(dá)到多高的識別率,對于資源的要求如何,識別的效率如何;2)可接受性:使用者在多大程度上愿意接受基于所選擇的生物統(tǒng)計特征的系統(tǒng);3)安全性能:系統(tǒng)是否能夠防止被攻擊;4)是否具有相關(guān)的、可信的研究背景作為技術(shù)支持;5)提取的特征容量、特征模板是否占有較小的存儲空間;6)價格:是否達(dá)到用戶所接受的價格;7)速度:是否具有較高的注冊和識別速度;8)是否具有非侵犯性。人體生物的生物特征包括生理特征和行為特征兩大類。人體的生理特征主要包括人臉、指紋、掌紋、掌形、虹膜、視網(wǎng)膜、靜脈、DNA、顱骨等,這些特征是與生俱來的,是先天形成的;而行為特征包括聲紋、簽名、步態(tài)、耳形、按鍵節(jié)奏、身體氣味等,這些特征是由后天的生活環(huán)境和生活習(xí)慣決定的。這些生物特征本身固有的特點決定了其在生物認(rèn)證中所起的作用是不同的。表1對各種生物認(rèn)證技術(shù)作了一個簡單的比較。表1各種生物認(rèn)證技術(shù)的比較[2]生物特征普遍性唯一性穩(wěn)定性可采集性準(zhǔn)確性可接受性安全性設(shè)備成本指紋中高高中高中中中掌紋高高高高極高高高高掌形中中中高中中中中虹膜極高極高極高高極高高高高視網(wǎng)膜極高極高極高低極高低高高靜脈高高高高高高高高DNA極高極高極高低極高低低高聲紋高低低高低高低低簽名中低低高低高低低步態(tài)中低低高低高中低人臉高低中高低高低低氣味高高高低低中低高耳形中中高中中高中低“9.11”事件是生物特征認(rèn)證技術(shù)在全球發(fā)展的一個轉(zhuǎn)折點。普通公眾對生物識別技術(shù)的了解也是“9.11”的曝光后而大幅度提高,種種因素,促成了“9.11”以后全球生物特征認(rèn)證市場的加速增長。在國際生物認(rèn)證組織最新的市場預(yù)測報告中,即使考慮到全球的經(jīng)濟(jì)發(fā)展的不景氣,調(diào)低了2005年的市場預(yù)測值,即使這樣到2005年為止,全球生物特征技術(shù)市場規(guī)模將仍將達(dá)到22億美元規(guī)模,到2007年整體市場容量被調(diào)高到了40億美元。這充分說明了業(yè)界對生物特征識別技術(shù)發(fā)展的信心。圖1-1由國際生物認(rèn)證組織(IBG)提供1999年—2005年生物識別技術(shù)產(chǎn)值增長趨勢2003年,聯(lián)合國的國際民用航空組織(ICAO)近期對188個成員國發(fā)布了航空領(lǐng)域使用生物特征認(rèn)證技術(shù)的規(guī)劃,提出將在個人護(hù)照中加入生物特征(包括指紋識別、虹膜識別、人臉識別),并在進(jìn)入各個國家的邊境時進(jìn)行個人身份的確認(rèn)。目前,此規(guī)劃已經(jīng)在美國、歐盟、澳大利亞、日本、韓國、南非等國家和地區(qū)通過,計劃在2004年底左右開始實施。遺憾的是其中不包括中國。在我國,生物認(rèn)證技術(shù)除了能夠繁榮一個新興的產(chǎn)業(yè),更重要的是其提供的身份鑒別能力對國家安全的重要意義:首先,中國作為最耀眼的社會主義國家,國家安全問題仍然需要警惕;其次,中國人口多、流動性大,需要有更為先進(jìn)的身份鑒別技術(shù)來保證社會秩序;再次,生物認(rèn)證技術(shù)將有效解決國內(nèi)的假冒偽劣證件、證書問題;最后也是最實際的、需要迫切面對的問題,那就是2008年奧運會和2010年世博會,如果能將生物認(rèn)證技術(shù)用于大型集會的身份鑒別無疑能夠更加確保大會的安全。幸慶的是由清華大學(xué)電子工程系蘇光大教授主持人臉綜合識別系統(tǒng)研制成功,經(jīng)過近一年的試運行,已通過了由公安部主持專家鑒定,并將用于2008年北京奧運會的。1.2人臉識別原理[2]人臉識別可以說是人們?nèi)粘V凶畛S玫纳矸荽_認(rèn)手段,也是當(dāng)前一個活躍的研究領(lǐng)域,極富有挑戰(zhàn)性。人臉識別就是通過與計算機(jī)相連的攝像頭動態(tài)捕捉人的面部,同時把捕捉到的人臉與預(yù)先錄入的人員庫存中的人臉進(jìn)行相比較識別,原理如圖1-2所示。由圖可以看出,人臉檢測是人臉識別的前提,而人臉檢測和人臉識別是人臉識別系統(tǒng)的關(guān)鍵。圖1-2人臉識別系統(tǒng)原理框圖1.2.1人臉檢測與人臉識別的研究內(nèi)容(1)人臉檢測(FaceDetection)人臉檢測(FaceDetection)是指在輸入圖像中確定所有人臉(如果存在)的位置、大小、位姿的過程。Yang等將人臉檢測定義為:任意給定一幅圖像或者一組圖像序列,人臉檢測的目的就在于判定該圖像或者圖像序列中是否存在人臉。如果存在,則返回其位置和空間分布[1]。(2)人臉識別人臉識別細(xì)分為兩類,一類是回答我是誰的問題,即辨認(rèn)(Identification),另一類是回答這個人是我嗎?即確認(rèn)(Verification)。顯然,用于Identification模式的識別系統(tǒng)對算法的運算速度的要求要高于Verification模式的識別系統(tǒng)[1]。從人臉自動識別技術(shù)所依據(jù)的理論來講,人臉檢測與人臉識別都是模式識別問題。人臉檢測是把所有的人臉作為一個模式,而非人臉作為另一個模式,人臉檢測的過程就是將人臉模式與非人臉模式區(qū)別開來。人臉識別是把每一個人的人臉作為一個模式來對待,不同人的臉屬于不同的模式類,人臉識別的過程是將屬于不同人的臉歸于各自的模式。換句話說,人臉檢測強(qiáng)調(diào)的是人臉之間的共性,而人臉識別則要區(qū)分不同人臉之間的差異,二者同屬于模式分類問題。1.2.2人臉識別系統(tǒng)的評價標(biāo)準(zhǔn)人臉識別系統(tǒng)的最后重要一步,即進(jìn)行性能評價。和其他識別系統(tǒng)一樣人臉識別系統(tǒng)的性能時很難進(jìn)行評價的,在評價時必須注意以下幾點:(1)必須有足夠用于評價的大量測試樣本;(2)樣本圖像應(yīng)與實際應(yīng)用中出現(xiàn)的圖像盡可能相似而且要有代表性;(3)除了討論系統(tǒng)的錯誤接受率外,還應(yīng)該考慮系統(tǒng)的錯誤拒絕率。評價一個人臉識別系統(tǒng)主要有如下標(biāo)準(zhǔn):(1)系統(tǒng)識別率:即要求系統(tǒng)的識別率高,主要用錯誤的接受率和錯誤拒絕率這兩個性能指標(biāo)評價,識別率與其之間的關(guān)系為:識別率=100%-錯誤接受率-錯誤拒絕率。(2)對樣本的約束:在不影響識別性能的情況下,要求訓(xùn)練樣本數(shù)盡可能少,測試樣本應(yīng)比實際應(yīng)用的更復(fù)雜,同時要考慮系統(tǒng)的魯棒廣義化問題。(3)速度和硬件要求:希望訓(xùn)練速度和識別響應(yīng)速度盡可能快,而且對硬件設(shè)備要求不是很高。(4)人機(jī)界面:希望人機(jī)界面友好,并且不影響系統(tǒng)在實際中的應(yīng)用。1.2.3人臉檢測與人臉識別的技術(shù)挑戰(zhàn)進(jìn)入90年代,隨著各種相關(guān)研究的深入,人臉檢測開始作為一個獨立的課題受到研究者的重視。同時人臉檢測的應(yīng)用背景也已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、媒體資產(chǎn)管理、視覺監(jiān)測等方面有著重要的應(yīng)用價值。人臉檢測研究本身也具有重要的學(xué)術(shù)價值。人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的三維非剛體自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測問題極具挑戰(zhàn)性,主要表現(xiàn)在:(1)人臉由于外貌、表情、膚色等不同,具有模式的可變性;(2)一般意義下的人臉上,可能存在眼鏡、胡須等附屬物;(3)作為三維物體的人臉的影像不可避免地受到光照條件(光源的分布、強(qiáng)度、方向等)的影響;(4)人臉和攝像機(jī)的相對角度;(5)人臉有時會不可避免地會被部分遮擋等等;(6)人臉?biāo)幈尘暗膹?fù)雜程度直接影響人臉的檢測。因此,如果能夠找到解決這些問題的方法,成功構(gòu)造出人臉檢測與跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測問題提供重要的啟示。人類的人臉識別能力很強(qiáng),能夠記住并辨別上千個不同人臉,可是計算機(jī)則困難多了。其表現(xiàn)在:人臉表情豐富;人臉隨年齡增長而變化;人臉?biāo)蓤D像受光照、成像角度及成像距離等影響;而且從二維圖像重建三維人臉是病態(tài)(ill-posed)過程,目前尚沒有很好的描述人臉的三維模型。1.2.4人臉識別系統(tǒng)的實用價值人臉自動識別系統(tǒng)作為一種重要的個人身份鑒別方法,最早用于罪犯照片管理和刑偵破案,現(xiàn)在這種技術(shù)在安全系統(tǒng)和商貿(mào)系統(tǒng)中都有很多的應(yīng)用,與其他身份鑒別方法相比,人臉識別具有直接、友好、方便和魯棒性強(qiáng)等特點。其應(yīng)用領(lǐng)域主要有以下幾類:刑偵破案:在獲得罪犯照片后,可以通過人臉識別技術(shù),在存儲的罪犯照片數(shù)據(jù)庫中找出最為相象的幾個人列為嫌疑犯。罪犯數(shù)據(jù)通常非常大,如果由人工完成搜索,不僅效率低,而且容易出錯,因為人在看過上百幅人臉圖像后,記憶力就會急劇下降。所以這項工作必須使用計算機(jī)完成。人臉識別用于刑偵破案始于七十年代初期,通常采用基于局部幾何特征方法。入口控制:入口控制的范圍比較廣,它可能是設(shè)在樓宇、單位或私人住宅入口處的安全檢查,也可能是計算機(jī)系統(tǒng)或情報系統(tǒng)等的入口控制。在樓宇或者某些安全部門的入口處,比較常用的手段是核查證件,當(dāng)人員頻繁出入時,請保安人員再三檢查證件非常麻煩,而且安全系數(shù)也不高。人臉識別技術(shù)還能用于設(shè)計新穎的私人住宅門鎖,人臉是最為安全可靠的“鑰匙”。2001年美國“9·11”事件的發(fā)生,使得人臉識別技術(shù)的應(yīng)用得到了極大的重視,現(xiàn)在,美國多個機(jī)場都增加了人臉識別安檢系統(tǒng),以防范恐怖分子再次實施恐怖活動。視頻監(jiān)視:在許多公司、銀行、公共場所都設(shè)有24小時的視頻監(jiān)視,另外偵察破案時也要用攝像機(jī)對罪犯進(jìn)行跟蹤。證件驗證:身份證、駕駛執(zhí)照以及其他證件上都有照片,采用人臉識別技術(shù),證件的驗證工作就可交給機(jī)器完成,從而實現(xiàn)自動化智能管理。軍隊安全系統(tǒng):目前,全軍軍事重地有相當(dāng)一部分是靠傳統(tǒng)的鐵門加警衛(wèi)24小時站崗,存在著容易被找到規(guī)律、利用管理人員的疏忽以及鑰匙、密碼可能被復(fù)制盜取的隱患,而且由于地形隱蔽分散,不利于管理和監(jiān)控?;谌四樧R別的門禁系統(tǒng)通過初始化人臉庫,可以限定開門人員數(shù)量,免除了鑰匙密碼被盜的后顧之憂,而且可以全天候自動監(jiān)控并記錄,便于追查。銀行系統(tǒng)我國銀行金融系統(tǒng)對安全控制有著極高的要求。由于近年來金融詐騙、搶劫的發(fā)生率有所增加,對傳統(tǒng)安全措施提出了新的挑戰(zhàn)。人臉識別技術(shù)不需要任何電子或機(jī)械的“鑰匙”,可以杜絕丟失鑰匙、密碼的現(xiàn)象,如果配合IC卡、指紋識別等技術(shù)可以使安全系數(shù)成倍增長,具有很高的性能價格比。目前銀行系統(tǒng)正在開展保險柜出租、托管業(yè)務(wù),使用人臉識別系統(tǒng)不但可以提升銀行的安全系數(shù),還能大大提高銀行在客戶中的可信度。總之,人臉識別可以用于入口控制、視頻監(jiān)視、證件驗證和刑偵破案等領(lǐng)域一方面明顯的提高了工作效率;另一方面,也具有極高的安全性和可靠性。同時人臉識別還可以應(yīng)用于電信會議、機(jī)器人智能化等領(lǐng)域,前景非常廣闊。1.3論文的主要研究內(nèi)容本論文首先說明人體生物認(rèn)證在現(xiàn)實生活中的重要作用,傳述了人臉識別系統(tǒng)的原理及構(gòu)成,著重論述了人臉檢測和人臉識別技術(shù)研究的意義以及人臉識別系統(tǒng)要完成的任務(wù)、系統(tǒng)的評價標(biāo)準(zhǔn)、實現(xiàn)方法等,并應(yīng)用先進(jìn)ARM9微處理器設(shè)計了一套較為完整的人臉識別系統(tǒng)。著重在以下三個方面進(jìn)行了較為細(xì)致的探討。(1)介紹了對人臉進(jìn)行的檢測和識別的方法及相應(yīng)算法,并對相關(guān)算法數(shù)學(xué)推導(dǎo)和證明,利用VC++軟件編程實現(xiàn)相關(guān)算法,進(jìn)行人臉檢測實驗,取得較好的效果。(2)在分析了傳統(tǒng)的彈性圖匹配的基礎(chǔ)上,提出了一種基于局部特征分析(LFA)與最優(yōu)化匹配的人臉識別算法,并用MATLAB軟件編程實現(xiàn)相關(guān)算法,對Yale大學(xué)的人臉庫和ORL人臉庫進(jìn)行實驗。(3)設(shè)計了基于ARM9微處理器的人臉識別系統(tǒng)。 第二章人臉檢測方法人臉檢測(FaceDetection)是指在輸入圖像中確定所有人臉(如果存在)的位置、大小、位姿的過程。人臉檢測方法主要分為以下三類:1.基于知識的方法;2.基于模板匹配的方法;3.基于學(xué)習(xí)的方法。這種分類并不十分嚴(yán)格,某些分類之間可能存在明顯的交叉。1.基于知識的方法基于知識的方法首先抽取幾何形狀、灰度、紋理等特征并形成一定的規(guī)則,然后檢驗這些規(guī)則是否符合人臉的先驗知識。這類方法一般檢測速度都很快,但精度較差,主要用來人臉的粗檢測。2.基于模板匹配的方法這類基于模板匹配的方法利用人臉的部分或全部的標(biāo)準(zhǔn)特征模板和輸入圖像中所有的區(qū)域執(zhí)行匹配操作,利用模板和區(qū)域之間所得的匹配度量來檢測人臉。這類方法的速度一般要慢于方法1,但精度一般稍好于方法1(這取決于圖像預(yù)處理的水平)。這類方法一般使用快速傅利葉變換或快速數(shù)論變換來加快匹配速度。3.基于學(xué)習(xí)的方法這類基于學(xué)習(xí)的方法一般依靠統(tǒng)計分析和機(jī)器學(xué)習(xí)技術(shù)來學(xué)習(xí)人臉樣本和非人臉樣本,從而達(dá)到區(qū)分人臉和非人臉的目的。這類方法如果學(xué)習(xí)樣本比較充分,分類器選擇得當(dāng)一般來說精度要好于上述二種方法。但這類方法大多需要很大的計算開銷,所以一般結(jié)合上述二種方法中的一種或二種來使用。2.1基于知識的方法:這種方法來源于研究人員對人臉信息的認(rèn)識,研究人員很容易總結(jié)一些規(guī)則描述人臉的特征和它們之間的相互關(guān)系。例如人臉的幾何形狀滿足一般性的約束,人臉面部器官的分布大致符合三庭五眼的規(guī)則。正視時,人臉可近似為橢圓形或長方形,是一個左右對稱的物體(正常人正常情況下),人的面部是由比較平坦的面部皮膚和按一定規(guī)則分布在其上的器官(眉毛、眼睛、鼻子、嘴巴)來構(gòu)成的,皮膚區(qū)域的顏色較亮,各器官的顏色較暗,這些知識是人眼認(rèn)知人臉的基本依據(jù)。對于人臉檢測來說,人們利用這些知識,發(fā)展了眾多的基于知識規(guī)則的人臉檢測算法。隨著這種基于知識規(guī)則的人臉檢測算法的應(yīng)用也帶來了一個問題,就是定義一個對所有臉都適用的規(guī)則是非常困難的(甚至是不可能的)。如果規(guī)則定義的過于嚴(yán)格,環(huán)境稍有變化(例如光照條件的變化、表情的變化等)就有許多正常的人臉不能通過所有的規(guī)則而不能被檢測。如果規(guī)則定義的過于寬泛,就會出現(xiàn)許多不是人臉的區(qū)域被當(dāng)作人臉區(qū)域而檢測到。此外,很難把這種方法推廣到檢測不同姿態(tài)人臉的問題中去。下面介紹典型的幾種:1.利用人臉圖像空間分布規(guī)律的知識利用人臉模式的圖像不變性,即人臉共有的獨特空間圖像分布的相互關(guān)系,人臉上的亮度分布有一定的順序結(jié)構(gòu),圖像中灰度分布最符合這種不變性的部分就是人臉部分。圖2-1馬賽克法三層結(jié)構(gòu)示意2.利用人臉器官分布規(guī)律的知識人臉器官分布比較規(guī)律,適用于證件照片上頭部位置比較固定的情況,最常見的是眼睛定位,常用的方法是對于邊緣圖像作垂直和水平方向的“積分投影”并結(jié)合五官分布的先驗知識。利用眼睛部位水平邊緣線豐富的特點定位出眼睛在垂直方向上的大致位置[4]。用垂直方向邊緣圖像的積分投影檢測臉的兩側(cè)和鼻子,水平方向邊緣積分投影用于定位眼睛、嘴巴和鼻子。人臉具有一定的軸對稱性,器官也具有一定的對稱性,比如人的左右眼睛是對稱的等[5]。

圖2-2馬賽克法第一層四分塊利用廣義對稱變換理論和邊緣圖像確定人臉對稱軸,然后根據(jù)人臉五官分布的約束條件及在對稱軸上對稱值最大的地方定位眼睛和嘴巴[6]。提出連續(xù)對稱性檢測方法,檢測一個圓形區(qū)域的對稱性,利用人臉的五官特性,從而確定是否為人臉[7]。3.馬賽克圖像法(mosaicimagemethod)馬賽克是一種簡單的圖像多分辨率表示方法,建立了一個基于知識的三層檢測系統(tǒng)[8]。

圖2-3馬賽克法第二層方框圖第一層針對4×4的馬賽克圖像塊(quartet),根據(jù)相應(yīng)的知識規(guī)則尋找人臉候選區(qū)域;第二層針對8×8的馬賽克圖像塊(octet),也是根據(jù)知識規(guī)則從各候選區(qū)域中確定人臉區(qū)域;第三層在人臉區(qū)域內(nèi)采用改進(jìn)的邊緣檢測算法進(jìn)一步確定眼、嘴等器官的位置。圖2-1為其總體方框圖,圖2-2為第一層4×4的馬賽克圖像塊(quartet),圖2-3為第二層的方框圖,圖2-4為第三層的方框圖。圖2-4馬賽克法第三層方框圖2.2基于模板匹配的方法模板匹配法就是計算出固定目標(biāo)模板和候選圖像區(qū)域之間的相關(guān)性或差異性,作為匹配準(zhǔn)則來搜索人臉,這種方法具有簡單、直觀的特點。當(dāng)人臉的模式過于復(fù)雜而不能用單一模板建模時,可以使用幾個相關(guān)模板檢測那些相對穩(wěn)定的人臉局部特征。1.可變形模板法(Deformabletemplatesmethod) 這是哈佛大學(xué)以A.Yuille為首的研究小組提出的一種器官精確定位方法[12]、[13]、[14]。所謂可變形模板,是對眼睛、嘴巴等面部器官形狀的一種參數(shù)化描述,如2-5眼睛可以用一個圓外加兩條拋物線段來表示。同時,與模板的性質(zhì)相對應(yīng),定義一個與圖像中邊緣(edges)、峰值(peak)、谷值(valleys)等相關(guān)的能量函數(shù)。將模板動態(tài)地作用于圖像,通過修改其參數(shù)使能量函數(shù)值達(dá)到最小,也就是通過模板的變形在圖像中找到其最佳匹配。由于可變形模板法利用了全局性信息,因而提高了人臉檢測的可靠性,但同時也暴露出初始位置難于確定、權(quán)值選取依賴經(jīng)驗、可能陷入局部極小、計算量大等不足。眼模型嘴模型圖2-5兩種可變形模板對于可變形模板法的改進(jìn)可分為以下幾類:1、對于能量函數(shù)的修正;2、對于可變形模板的補(bǔ)充。例如:頭部輪廓、面額和下巴的可變形模板;3、對于模板初始位置的估計算法。例如:角點檢測(cornerdetection)、數(shù)學(xué)形態(tài)濾波器(morphologicalfilter)等;4、對于匹配方式的改進(jìn)。例如:基于區(qū)域的策略(region-basedstrategy)、自適應(yīng)哈夫變換(AHT,AdaptiveHoughTransform)等。2.活躍輪廓模型法(activecontourmodelmethod)活躍輪廓模型法亦稱蛇形法(snakesmethod)?;钴S輪廓是一條在外部約束力作用下的能量最小化樣條曲線。它通過迭代的方法可以不斷修正,逐步趨近圖像中的線條或邊緣。采用這個方法完成了頭部輪廓、眉毛及鼻孔的檢測[15]。類似地,也用它進(jìn)行頭部輪廓檢測[16]。2.3基于學(xué)習(xí)的方法1.特征臉方法(eigenfacemethod)美國MIT的M.Turk和A.Pentland在人臉識別領(lǐng)域中提出了著名的特征臉方法[17],同時也將它用于人臉檢測。特征臉的基本思想是任意輸入圖像都可以表示為“特征臉”的線性組合,線性組合的系數(shù)反應(yīng)了該人臉的特性。特征臉方法的實質(zhì)是通過K-L變換獲得人臉模式在整個圖像空間中的降維子空間(稱為“臉空間”),并根據(jù)待識別樣本到臉空間的距離確定它是否屬于人臉模式。如果對人臉輪廓或面部器官進(jìn)行同樣的計算,便可將特征臉方法用于人臉輪廓檢測或面部器官檢測。一幅大小的人臉圖像[]按列相連而構(gòu)成一個維矢量:它可被視為維空間中的一個點,由于人臉結(jié)構(gòu)的相似性,當(dāng)把許多這樣的人臉圖像歸一化之后,這些圖像在這一高維空間中不是隨機(jī)散亂地分布的,而是存在某種規(guī)律,這樣,可以通過K-L變換用一個低維子空間描述人臉圖像。由于K-L變換方法在本質(zhì)上依賴于圖像灰度在空間分布上的相關(guān)性,在進(jìn)行K-L變換之前,對待檢測的人臉圖像需要進(jìn)行一系列的預(yù)處理,以達(dá)到位置校準(zhǔn)和灰度歸一的目的。以歸一化后的標(biāo)準(zhǔn)圖像作為訓(xùn)練樣本集,以該樣本集的總體散布矩陣,計算總體散布矩陣的特征值和正交歸一特征向量。對任一待識別樣本,通過向“特征臉”子空間投影求出其系數(shù)向量,其重建圖像的信噪比為:若其小于預(yù)先設(shè)定的閾值,則可判斷f不是人臉圖像。只利用前若干張?zhí)卣髂槍⑷四樝蛄客队暗街髟涌臻gF和與正交的補(bǔ)空間[18]。距離度量也分成兩部分,一個稱為DIFS(DistanceInFeatureSpace),另一個稱DFFS(DistanceFromFeatureSpace)。在很多情況下,只計算DIFS就能獲得很好的分類效果。特征空間的分解示意如圖2-6所示。圖2-6特征空間的分解2.人工神經(jīng)網(wǎng)絡(luò)方法(neuralnetworksmethod)神經(jīng)網(wǎng)絡(luò)具有記憶功能,當(dāng)訓(xùn)練樣本比較全面時神經(jīng)網(wǎng)絡(luò)可以處理比較復(fù)雜的檢測問題,所以許多檢測算法采用神經(jīng)網(wǎng)絡(luò)方法。人臉模式、眼睛模式和嘴巴模式等都有比較明顯的特點,因此可以采用神經(jīng)網(wǎng)絡(luò)的識別方法。多層感知器(MLP)早就被用于人臉模式的分類,先用Kohonen網(wǎng)絡(luò)對原始訓(xùn)練集進(jìn)行粗分類,然后用MLP網(wǎng)絡(luò)進(jìn)行精確分類,檢測效果比較理想[19]。用一個分級的特征檢測系統(tǒng)定位眼睛和嘴巴,降低分辨率后的圖像輸入四個已被訓(xùn)練過的多層感知器,能對左右眼睛、嘴巴和人臉中心進(jìn)行粗定位,然后再經(jīng)過處理定位出比較精確的眼睛的上下左右四個眼角定點并分割嘴巴區(qū)域。該方法對光照變換、人臉傾斜角度較大或遇到訓(xùn)練集里沒有的較大的眼睛時,定位效果會變差[20]。使用分層網(wǎng)絡(luò),該網(wǎng)絡(luò)由四個BP子網(wǎng)組成,分別檢測人臉。預(yù)處理時先對原圖進(jìn)行邊緣增強(qiáng)。網(wǎng)絡(luò)分為兩層,“子層”網(wǎng)有三個,分別檢測眼睛、鼻子和嘴巴?!案笇印本W(wǎng)判斷“子層”能否構(gòu)成一張人臉[21]。神經(jīng)網(wǎng)絡(luò)方法能夠適應(yīng)較為復(fù)雜的人臉檢測,準(zhǔn)確性也比較高,所以使用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測的算法比較多。但是,由于人臉屬于高維矢量,導(dǎo)致網(wǎng)絡(luò)中訓(xùn)練節(jié)點眾多,算法往往需要大量的訓(xùn)練樣本,因此,神經(jīng)網(wǎng)絡(luò)方法的研究著重于系統(tǒng)的優(yōu)化訓(xùn)練。利用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)時,則既需要正例,也需要反例。選擇適當(dāng)?shù)挠?xùn)練樣本(尤其是反例的選擇)、適當(dāng)?shù)木W(wǎng)絡(luò)結(jié)構(gòu)以及適當(dāng)?shù)膶W(xué)習(xí)算法,將使得神經(jīng)網(wǎng)絡(luò)在用于人臉檢測時具有很強(qiáng)的學(xué)習(xí)能力和推廣能力。一種基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN,ProbabilisticDecision-BasedNeuralNetwork)分別進(jìn)行人臉和眼睛的檢測[22]。這里著重介紹神經(jīng)網(wǎng)絡(luò)方法中兩項有代表性的工作。采用橢圓k-均值算法(ellipticalk-meansclusteringalgorithm)。對4150個人臉樣本和6189個非人臉樣本進(jìn)行聚類分析,各自形成6個聚類,以此作為一種基于分布的人臉模型(distribution-basedfacemodel)。同時,以樣本到各個聚類的距離作為其特征矢量,對前向多層神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,利用這個神經(jīng)網(wǎng)絡(luò)分類器實現(xiàn)人臉檢測。使用BP網(wǎng)絡(luò)進(jìn)行人臉檢測,網(wǎng)絡(luò)具有的隱節(jié)點,分別對應(yīng)于輸入圖像的局部特征。該算法在訓(xùn)練過程中自動生成“非人臉樣本”,其方法是輸入不含人臉的場景圖像,將被誤判為人臉的子圖像作為“非人臉”樣本[25]。為了提高正確率,系統(tǒng)還同時對幾個網(wǎng)絡(luò)分別處理出來的結(jié)果進(jìn)行綜合調(diào)整。同時,將大量的人臉樣本和非人臉樣本直接送入若干個具有不同感受野(receptivefields)的前向多層神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和識別,然后通過對發(fā)生重疊的檢測區(qū)域進(jìn)行仲裁,得到最后的檢測結(jié)果。如圖2-7所示,其中左邊半部分為脫機(jī)進(jìn)行,右半部分為聯(lián)機(jī)進(jìn)行,系統(tǒng)分為以下四個步驟:1)定位和姿態(tài)估計首先用人工神經(jīng)網(wǎng)絡(luò)的方法,對樣本脫機(jī)訓(xùn)練。樣本包括正例(人臉)和反例(非人臉)。訓(xùn)練正例時,為了將面部特征(如眼、口、鼻等)位置的不同而引起的差異降低到最小,需要進(jìn)行對齊處理。在聯(lián)機(jī)檢測時,因為無法獲得這些面部特征的準(zhǔn)確位置,所以不能用來定位候選人臉,而是采用窮舉的方法搜索所有的位置和比例,尋找所有候選區(qū)域。為了提高搜索效率,采用了一種改進(jìn)的搜索算法,代價是檢測率有所降低。對于非端正人臉的處理也在這一步完成。用一個人工神經(jīng)網(wǎng)絡(luò)判斷輸入圖像中人臉的傾斜角度。然后根據(jù)傾斜角度將可能的人臉旋轉(zhuǎn)變換為正面端正的人臉,再用同樣的方法檢測人臉。2)預(yù)處理為了進(jìn)一步減少由于光照或成像條件不同帶來的差異,圖像需要經(jīng)過標(biāo)準(zhǔn)化預(yù)處理(如直方圖均衡化)以調(diào)整總體的亮度和對比度。另外,還使用了基于面部結(jié)構(gòu)知識的光照補(bǔ)償算法進(jìn)行光照修正。3)檢測前兩步對所有可能的人臉區(qū)域的位置、姿態(tài)和光照進(jìn)行了標(biāo)準(zhǔn)化處理,接下來要決定他們是否是人臉。這由經(jīng)過了大量人臉及非人臉樣本訓(xùn)練的人工神經(jīng)網(wǎng)絡(luò)來完成。對于正面、半側(cè)面和全側(cè)面人臉的不同情況,使用不同的神經(jīng)元網(wǎng)絡(luò)。4)仲裁檢測結(jié)果還要經(jīng)過仲裁。仲裁在多個使用不同結(jié)構(gòu)、不同訓(xùn)練策略的神經(jīng)網(wǎng)絡(luò)之間進(jìn)行。通過一些簡單的啟發(fā)式規(guī)則將判斷結(jié)果進(jìn)行綜合,可以有效地提高正確率,減少誤報率。圖2-7Rowley等人提出的人臉檢測系統(tǒng)3.基于支持向量機(jī)的方法支持向量機(jī)(SupportVectorMachine簡稱為SVM)是AT&TBell實驗室的V.Vapnik領(lǐng)導(dǎo)的小組提出來的一種模式識別算法[7]。其思想是用關(guān)鍵點代替整個樣本集合,從而解決大數(shù)據(jù)量樣本的分類問題。以兩類樣本的分類問題為例,如圖2-8所示,圖中虛線是分界面(超平面)。顯然,我們希望兩類之間的間隔越遠(yuǎn)越好,從這個角度講,(a)的分類器要比(b)好。定義類間隔為兩類樣本中最接近的那些點到分解面的距離之和,這些點被稱為支持向量(SupportVectors),如圖2-8(a),箭頭所指的兩點即為支持向量。所以,只要確定出支持向量,就能夠求出分界面,其它的樣本點可以忽略。由于支持向量的個數(shù)遠(yuǎn)遠(yuǎn)少于所有樣本點的個數(shù),從而能夠大大提高分類速度。正因為SVM有如此好的特性,最近有越來越多的學(xué)者把他應(yīng)用于人臉檢測的研究中[17]。(a)(b)圖2-8支持向量機(jī)原理示意圖第三章人臉檢測的算法本章詳細(xì)地介紹了著名的AdaBoost算法,通過訓(xùn)練出了AdaBoost算法在訓(xùn)練觀測基礎(chǔ)上,給出了一個逼近估計的一個證明。闡述了指數(shù)損失函數(shù)和AdaBoost算法的內(nèi)在聯(lián)系,指出了AdaBoost算法正是通過前向分步加法建模方法使指數(shù)損失極小化,也正是這種內(nèi)在聯(lián)系給出了AdaBoost算法的一個很直觀的解釋。其次給出了具有局部互聯(lián)結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)反向傳播算法數(shù)學(xué)推導(dǎo)。最后設(shè)計并實現(xiàn)了一個以AdaBoost算法、局部互聯(lián)的多層感知機(jī)為主的疊層分類器,應(yīng)用這個分類器對人臉進(jìn)行檢測及面部器官的定位。3.1AbaBoost算法Boost近十年來為解決模式分類問題而提出的最有效的學(xué)習(xí)思想之一。Boost方法的主要動機(jī)是合并許多“弱”分類器的輸出以產(chǎn)生有效的“投票委員會”的過程。從這一角度看Boost與其它基于委員會的方法具有相似之處。然而,我們將看到聯(lián)系是極其表面的,Boost在本質(zhì)上是不同的。我們從最流行的Boost算法開始,介紹由Freund和Schapire在1997年提出的名為AbaBoost算法[8]。考慮一個2-類問題,輸出變量編碼為。給定預(yù)測子變量的向量,分類器產(chǎn)生在中取值的預(yù)測。訓(xùn)練樣本上的誤差率是:(3.1.一個弱分類器的誤差只比隨機(jī)猜測略好一些,Boost的目的就是連續(xù)對反復(fù)修改的數(shù)據(jù)應(yīng)用弱分類算法,由此產(chǎn)生一個弱分類器序列。然后一個加權(quán)的多數(shù)表決來合并全部預(yù)測,以產(chǎn)生最終預(yù)測:(3.1.2這里提升算法來計算,并對每個的貢獻(xiàn)加權(quán)。它們的作用是對序列中較精確的分類器給予較高的影響。圖3-1AdaBoost過程的示意圖。最終分類器:圖3-1AdaBoost過程示意圖在每個Boost步,數(shù)據(jù)修改就是對每一訓(xùn)練觀測實施加權(quán),開始時,所有權(quán)都初始化為,以便第一步能夠簡單地用通常的方式在數(shù)據(jù)上訓(xùn)練分類器。對每一相繼的迭代,觀測的權(quán)值被分別修改,并且分類算法被再次應(yīng)用于加權(quán)觀測。在第步那些被分類器誤分類的訓(xùn)練觀測相對應(yīng)的觀測權(quán)值提高,而被正確分類的訓(xùn)練觀測相對應(yīng)的觀測權(quán)值降低。這樣隨著迭代的進(jìn)行,那些很難正確分類的訓(xùn)練觀測受到了不斷增長的影響,因此,每個后繼分類器被強(qiáng)制關(guān)注被前面的分類器誤分類的訓(xùn)練觀測。算法3.1給出了AdaBoost算法的細(xì)節(jié)。被誤分類的訓(xùn)練觀測的觀測權(quán)值被放大一個因子,增加了對導(dǎo)出序列中下一個分類器的相對影響。算法3.1AdaBoost初始化對到使用權(quán)值,用分類器擬合訓(xùn)練觀測計算計算輸出3.1Boost算法的成功其實并不很神秘,它的關(guān)鍵在。Boost是一種擬合基本“基”函數(shù)集上的加法展開式的方法。這里每個基函數(shù)都是分類器∈{-1,1},。更一般地,基函數(shù)展開式取如下形式:(3.1.3其中是展開式系數(shù),通常是多元變量的簡單函數(shù),由參數(shù)γ的集合刻畫。例如:在單隱層神經(jīng)網(wǎng)絡(luò)中,,其中是一個S型函數(shù),而γ對輸入變量的一個線性組合參數(shù)化。通常,通過極小化對訓(xùn)練數(shù)據(jù)取平均的損失函數(shù)來擬合這些模型,如平方誤差,(3.1.4對許多損失函數(shù)或基函數(shù),都需要計算密集的數(shù)值優(yōu)化技術(shù)。然而,當(dāng)僅擬合單個基函數(shù)的子問題的快速求解可行時,通常能夠找到一個較簡單的方案,(3.1.5通過相繼添加新的基函數(shù)到展開式,而不調(diào)整已添加的參數(shù)和系數(shù),前向分步加法建模逼近解式(3.1.4)。前向分步加法建模在算法3.2中給出。在第m次迭代,我們求解最優(yōu)基函數(shù)和相應(yīng)的系數(shù),并添加到當(dāng)前展開式中。這樣可以產(chǎn)生,并重復(fù)這個過程。先前添加的相并不改變。對于平方誤差損失:我們有:其中,是當(dāng)前模型在第個觀測上的誤差(殘差)。這樣對于平方誤差損失,每一步把對當(dāng)前殘差擬合最好的項加到展開式中。算法3.2前向分步加法建模初始化對于計算置現(xiàn)在我們證明AdaBoost算法(見算法3.1)等價于使用如下?lián)p失函數(shù)的前向分步加法建模(見算法3.2):(3.1.6對于AdaBoost,基函數(shù)是單個分類器,使用損失函數(shù),必須求解:(3.1.7得到每步要添加的分類器和相應(yīng)得系數(shù)這可以表示為:(3.1.8其中為了以后討論問題的方便單位化得:因為每個即不依賴也不依賴它可以看作是應(yīng)用于每個觀測的權(quán)值。該權(quán)值依賴于,所以,個體權(quán)值隨每次迭代而改變。式(3.1.8)的解可以通過兩步獲得。第一步,對任意的,關(guān)于式(3.(3.1.9滿足(3.1.9)式得就是預(yù)測時極小化加權(quán)誤差率的分類器。將(3.1.8)的標(biāo)準(zhǔn)用下式表示,這一點容易明白:(3.1.10另外由我們定義的加權(quán)誤差率(3.1.11聯(lián)合(3.1.10),(3.1.11)及(3.1.12然后逼近被更新為(3.1.13它導(dǎo)致下一次迭代的權(quán)值是:(3.1.14因此我們得出結(jié)論:AdaBoost算法通過前向分步加法建模方法使指數(shù)損失(.2(3.1.15由(3.1.(3.1.16即(.3數(shù)學(xué)推導(dǎo)符號及變量約定:神經(jīng)網(wǎng)絡(luò)的層數(shù):;神經(jīng)網(wǎng)絡(luò)各層的節(jié)點數(shù):;目標(biāo)矢量記為:;則有第層到第層的變換為:(3.1.18(3.1.19其中為第層第個節(jié)點和第層節(jié)點互連的集合,為第層第個節(jié)點的輸出則第個樣本輸入時,其誤差為各輸出單元誤差之和,滿足:(3.1.20則總誤差為;(3.1.21具體學(xué)習(xí)算法的解析式推導(dǎo)如下:令為迭代次數(shù),可得到每一層的權(quán)的迭代公式為(3.1.22(3.1.23當(dāng)時:(3.1.24當(dāng)時:(3.1.25由(3.1.23)、(3.1.24)、(3.即可組成一個反向傳播算法,具體如下:3.1.由(3.1.23)、(3.1.計算倒數(shù)第二層的。計算倒數(shù)第二層的分為兩步通過(3.1.25)和上一層計算得到的計算得到。后通過(3.1.23)計算本層的依次類推即可求出每層的。3.2人臉檢測算法3.2.1圖像預(yù)處理各種條件(環(huán)境光過強(qiáng)、過弱、側(cè)光等等)都會對待檢測人臉的圖像產(chǎn)生影響。為了減弱客觀環(huán)境對圖像的影響及后續(xù)處理上的方便我們分兩步對圖像進(jìn)行預(yù)處理。第一步:對原圖像做一次a1*a2鄰域的濾波處理,以消除一些噪音的影響。(3.2.1)在這里代表原始圖像,代表的寬為a1,高為a2的矩形鄰域的積分圖像(在這里我們選擇),)代表原圖像經(jīng)過(3.2.1)式濾波后得到的圖像。第二步:應(yīng)用蒙片鈍化法對圖像進(jìn)行再處理。(3.2.2根據(jù)被檢測圖像大小的不同,的選擇有所不同,在圖像大小為320*240的情況下,我們選擇。從式(3.2.1)可以看出,圖像與原圖像相比大體上消除了光照對圖像局部的影響。(a)(b)(c)圖3-4是一個有著很強(qiáng)側(cè)光影響的原始圖片經(jīng)過第一、第二步處理的效果后續(xù)的人臉檢測就是在上進(jìn)行的。(a)(b)(c)圖3-2圖像的預(yù)處理3.2.2從局部到整體的人臉檢測本小節(jié)主要分為四部分:第一部分為眼睛的檢測,這部分作者構(gòu)造了一組眼睛BP網(wǎng)絡(luò)分類器,這組分類器在眼睛檢測的訓(xùn)練集上通過AdaBoost算法的加權(quán)合并形成一個有很強(qiáng)分類能力及很高冗余度的眼睛分類器。之后應(yīng)用這個分類器在被檢測的圖像上確定眼睛的候選區(qū)域。第二部分為人嘴的檢測,這部分作者構(gòu)造了一組人嘴BP網(wǎng)絡(luò)分類器,這組分類器在人嘴檢測的訓(xùn)練集上通過AdaBoost算法的加權(quán)合并形成一個有很強(qiáng)分類能力的人嘴分類器。之后應(yīng)用這個分類器在第一部分確定的眼睛候選區(qū)域上判斷與候選區(qū)域相關(guān)的位置是否有人嘴存在。第三部分為人臉的檢測,這部分作者構(gòu)造了一組人臉BP網(wǎng)絡(luò)分類器,這組分類器在人臉檢測的訓(xùn)練集上通過AdaBoost算法的加權(quán)合并形成一個有很強(qiáng)分類能力的人臉分類器。之后應(yīng)用這個分類器在第一部分與第二部分確定的眼睛與嘴的候選區(qū)域上判斷與候選區(qū)域相關(guān)的位置是否是人臉存在。1.眼睛分類器的結(jié)構(gòu)(a)(b)(c)圖3-3眼睛BP網(wǎng)絡(luò)分類器感受野示意圖眼睛分類器由三個簡單的BP神經(jīng)網(wǎng)絡(luò)組成如圖3-5所示。(a)圖EYE_BP1的輸入層由7個節(jié)點組成,每個節(jié)點的感受野是圖像中特定位置的14*3矩形區(qū)域內(nèi)灰度的均值。EYE_BP1的作用主要是檢測眼睛在水平方向上所表現(xiàn)的特征。EYE_BP2的輸入層也由7個節(jié)點組成,與EYE_BP1不同(b)圖EYE_BP2中每個節(jié)點的感受野是圖像中特定位置的3*14矩形區(qū)域內(nèi)灰度的均值。EYE_BP2主要是檢測眼睛在豎直方向上所表現(xiàn)的特征。(c)圖EYE_BP3的輸入層由21個節(jié)點組成,每個節(jié)點的感受野是圖像中特定位置的3*6矩形區(qū)域內(nèi)灰度的均值。EYE_BP3主要是檢測眼睛在細(xì)節(jié)上的特征。我們在眼睛檢測的訓(xùn)練集上通過AdaBoost算法訓(xùn)練這三個分類器時,首先訓(xùn)練所有的正樣本(眼睛的樣本),以保證對對所有的正樣本(眼睛)100%正確地分類,之后在逐步添加負(fù)樣本(非眼睛樣本)進(jìn)行訓(xùn)練,為了保證分類器有足夠的冗余,負(fù)樣本添加的要適度。這樣訓(xùn)練得到的分類器檢測率在訓(xùn)練集上是100%,但誤檢率可能會比較高。這可以通過下兩步的分類器迅速降低誤檢率。2.人嘴分類器的結(jié)構(gòu)(a)(b)(c)圖3-4人嘴BP網(wǎng)絡(luò)分類器感受野示意圖人嘴分類器所用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和眼睛分類器所用的BP神經(jīng)網(wǎng)絡(luò)分類器的結(jié)構(gòu)基本一樣,只是感受野的大小不同,如圖3-6所示。人嘴分類器的訓(xùn)練過程和眼睛分類器的完全一樣。只是人嘴的訓(xùn)練樣本的采集要在眼睛分類器確定的候選區(qū)域上進(jìn)行,這樣做的目的是極大地減少了非人嘴樣本的數(shù)量。加快分類器的訓(xùn)練速度,提高分類器的冗余。3.人臉分類器的結(jié)構(gòu)圖3-5人臉BP網(wǎng)絡(luò)分類器感受野示意圖人臉分類器的結(jié)構(gòu)我們使用了多個完全一樣的局部互聯(lián)BP網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)和Rowley使用的用于檢測人臉的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)完全一樣見圖3-7。訓(xùn)練方法同眼睛和人嘴的分類器結(jié)構(gòu)完全一樣。但在這里我們并沒有使用固定數(shù)目的BP分類器,目的是可以用增加BP神經(jīng)網(wǎng)絡(luò)的數(shù)量來滿足不同的人臉檢測精度要求。人臉的訓(xùn)練樣本的采集同人嘴的訓(xùn)練樣本的采集一樣,也要在眼睛和人嘴的候選區(qū)域上進(jìn)行,目的同人嘴分類器訓(xùn)練樣本的選擇相同。為了提高系統(tǒng)的執(zhí)行速度我們采用了以下幾種策略:(1)由于每個BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點的輸入值都對應(yīng)圖像中一個矩形區(qū)域的均值,而圖像中每一點矩形鄰域的均值可以通過積分圖像的方法以極快的速度求得。(2)我們知道計算機(jī)浮點運算的速度要遠(yuǎn)低于定點運算的速度,所以我們對BP神經(jīng)網(wǎng)絡(luò)的計算采用查表的方法將浮點運算轉(zhuǎn)換為定點來計算,這又進(jìn)一步加快了運算速度。(3)為了檢測不同尺度的人臉,我們并沒有對圖像采用金字塔式的搜索算法,而是采用與之相等價的算法,即將BP神經(jīng)網(wǎng)絡(luò)的感受野逐次以1.15倍地放大,之后再應(yīng)用積分圖像法求放大后矩形區(qū)域的均值。這樣做不僅僅是加快了運算速度,而且還減少了由于采用金字塔算法對圖像進(jìn)行放縮而帶來的失真,是一舉兩得之法。整個人臉檢測的系統(tǒng)流程如圖3-6。圖3-6人臉檢測系統(tǒng)流程圖3.3.實驗結(jié)果這里利用VC++軟件編程實現(xiàn)圖像預(yù)處理及ABoost算法,并利用靜態(tài)圖像實驗人臉檢測的圖像如圖3-9基于ABoost算法檢測到的人臉(a)人臉區(qū)域;(b)標(biāo)記人眼;(c)標(biāo)記人嘴(d)邊緣提取,基本上滿足要求,如果時間充足的話,對程序和算法再進(jìn)行修進(jìn)應(yīng)該會得到更好的結(jié)果。(a)(b)(c)(d)圖3-7基于ABoost算法檢測到的人臉第四章人臉識別方法與人臉檢測相比,人們對人臉識別的研究要深入得多,本章討論其中有代表性的幾種方法:4.1基于KL變換的特征臉識別方法基本原理:KL變換又稱作Hotelling變換,是圖象壓縮中的一種最優(yōu)的正交變換。人們將它用于統(tǒng)計特征提取,從而形成了子空間法模式識別的基礎(chǔ)[7]。若將KL變換用于人臉識別,則需假設(shè)人臉處于低維線性空間,且不同人臉具有可分性。由于高維圖像空間KL變換后可得到一組新的正交基,因此可通過保留部分正交基,以生成低維人臉空間。而低維空間的基則是通過分析人臉訓(xùn)練樣本集的統(tǒng)計特性來獲得。KL變換的生成矩陣可以是訓(xùn)練樣本集的總體散布矩陣,也可以是訓(xùn)練樣本集的類間散布矩陣,即可采用同一人的數(shù)張圖像的平均來進(jìn)行訓(xùn)練,這樣可在一定程度上消除光線等的干擾,且計算量也得到減少,而識別率不會下降。也就是說,根據(jù)總體散布矩陣或類間散布矩陣可求出一組正交的特征向量其對應(yīng)的全部特征值分別為,這樣,在新的正交空間中,人臉樣本就可以表示為:(4.1)若通過選用個特征向量作為正交基,則在該正交空間的子空間中,就可得到以下近似表達(dá)式:(4.2)如將子空間的正交基按照圖像陣列排列,則可以看出這些正交基呈現(xiàn)人臉的形狀,因此這些正交基也被稱作特征臉,這種人臉識別方法也叫特征臉方法(如圖4-1)。關(guān)于正交基的選擇有不同的考慮,即與較大特征值對應(yīng)的正交基(也稱主分量)可用來表達(dá)人臉的大體形狀,而具體細(xì)節(jié)還需要用與小特征值對應(yīng)的特征向量(也稱次分量)來加以描述,因此也可理解為低頻成分用主分量表示,而高頻成分用次分量表示。其中,采用主分量作正交基的方法稱為主分量方法(PCA)。同時,也有人采用次分量作為正交基,原因是所有人臉的大體形狀和結(jié)構(gòu)相似,真正用來區(qū)別不同人臉的信息是那些用次分量表達(dá)的高頻成分。圖4-1KL變換用于人臉識別的一個形象說明由訓(xùn)練得到特征臉后,將待識別人臉投影到新的維人臉空間,即用一系列特征臉的線性加權(quán)和來表示它,這樣即得到一投影系數(shù)向量來代表待識別人臉,這時候,人臉識別問題已轉(zhuǎn)化為低維空間的坐標(biāo)系數(shù)矢量分類問題,而分類最簡單的做法是最小距離分類。KL變換在90年代初受到了很大的重視,實際用于人臉識別也取得了很好的效果,其識別率從70~100%不等,這取決于人臉庫圖像的質(zhì)量。從壓縮能量的角度來看,KL變換是最優(yōu)的,它不僅使得從維空間降到維空間前后的均方誤差最小,而且變換后的低維空間有很好的人臉表達(dá)能力,然而這不是說已經(jīng)具有很好的人臉辨別能力。選擇訓(xùn)練樣本的散布矩陣作為KL變換的生成矩陣,是由于其最大特征向量抓住了該樣本集合的主要分布,但這是圖像統(tǒng)計,而不是人臉統(tǒng)計方法。它雖然考慮了圖像之間所有的差異,但由于它不管這樣的差異是由照明、發(fā)型變更或背景導(dǎo)致,還是屬于人臉的內(nèi)在差異,因此特征臉識別的方法用于人臉識別存在理論的缺陷[13]。由于對KL變換而言,外在因素帶來的圖像差異和人臉本身帶來的差異是不加任何區(qū)分的,因此,不管如何選擇正交基,也不能根本解決問題。其改善的一個思路是針對干擾所在,對輸入圖像作規(guī)范化處理,其中包括將輸入圖的均值方差歸一化、人臉尺寸歸一化等;另一種改進(jìn)是考慮到局部人臉圖像受外在干擾相對較小,在進(jìn)行人臉識別時,除計算特征臉之外,還可利用KL變換計算出特征眼睛、特征嘴巴等。然后將局部特征向量加權(quán)進(jìn)行匹配,就能夠得到一些好的效果。4.2基于幾何特征的方法幾何特征方法采用的特征包括人臉五官如眼睛、鼻子和嘴巴等的局部形狀特征,臉型特征及五官在臉上分布的幾何結(jié)構(gòu)特征。提取特征時往往要用到臉部圖譜結(jié)構(gòu)的一些先驗知識,早期采用從側(cè)面輪廓線提取特征的方法比較多,以后的工作則較多的采用人臉正面的特征,因為證件照大多是正面照,而且正面的特征信息比側(cè)面的更豐富,特征的抗干擾能力也比較強(qiáng)。幾何特征法用幾何特征矢量表示人臉,用層次聚類的思想設(shè)計分類器達(dá)到識別目的。幾何特征矢量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,分量通常包括人臉指定兩點間的歐氏距離、曲率和角度等。幾何特征矢量必須具有一定的獨特性,能夠反映不同人臉之間的差別,同時必須具有一定的彈性,消除時間跨度、光照等因素的影響。圖像上邊緣點的積分投影曲線常被用于對眼睛、鼻子和嘴巴等進(jìn)行定位。一維的“積分投影”曲線包含圖像在某一方向的結(jié)構(gòu)信息,它是提取人臉特征的基本手段,用于提取嘴角和眼角等特征需要原灰度圖像光照均勻,層次分明,能提取到準(zhǔn)確的邊緣?!皬椥阅0濉笔且环N更為準(zhǔn)確的提取特征的方法,而所謂的“彈性模板”就是模板在匹配特征形狀時,其平移、形狀和旋轉(zhuǎn)都是可調(diào)的。對灰度圖像進(jìn)行形態(tài)濾波,然后求出谷值區(qū)域、峰值區(qū)域和邊緣區(qū)域圖像,以此構(gòu)造能量函數(shù),最小化能量函數(shù)的過程就是模板逐漸與特征形狀匹配的過程[14]。他們設(shè)計的眼睛模板是用圓代表眼球形狀、拋物線描述內(nèi)眼瞼的形狀、嘴巴模板由幾根拋物線組成。彈性模板適用于提取有確定形狀的目標(biāo)輪廓,對于眉毛、下巴和鼻孔等不確定形狀,提出了活動輪廓模板(snake)提取它們的特征[15]。用形態(tài)濾波求出原圖的谷值圖,從而突出眼睛和嘴巴等,用霍夫變換結(jié)合約束條件檢測眼球,彈性模板用于提取眼睛輪廓和嘴巴輪廓。同時,還利用邊緣圖像和霍夫變換檢測臉頰和下巴。對于臉頰和下巴的檢測都依靠眼睛和嘴巴的定位結(jié)果確定變換的搜索區(qū)域?;趲缀翁卣髯R別最后歸結(jié)為特征矢量之間的距離。距離是測度兩個特征矢量之間相似性的一種度量,基于歐氏距離的判決是最常用的方法,大多數(shù)方法均簡單采用歐氏距離作為相似性度量。4.3相關(guān)性匹配方法1.傳統(tǒng)模板匹配法在模板匹配中,人臉標(biāo)準(zhǔn)模板由人工來定義。對于輸入圖像,分別計算標(biāo)準(zhǔn)板中的臉部輪廓、眼睛、鼻子等的相關(guān)值。模板匹配法通常采用“歸一化互相關(guān)”,直接計算兩幅灰度圖像之間的相關(guān)程度,由相關(guān)程度來決定人臉的存在,并要求兩幅圖像上的目標(biāo)具有相同的尺度、取向和光照,所以必須進(jìn)行尺度歸一、灰度歸一的圖像預(yù)處理。Buhr的方法使用眼睛模板定位眼睛,然后用雙眼之間的距離進(jìn)行尺度歸一。匹配首先在低分辨率的圖像中進(jìn)行,對相關(guān)性大的圖像進(jìn)行五官的局部模板相關(guān)匹配,當(dāng)四分之三的局部模板具有很大的相似度,認(rèn)為待識別圖像與庫中圖像屬于同一人。首先提取特征點,然后根據(jù)特征點分出歸一化后的眼睛、嘴巴、鼻子和臉的模板,進(jìn)行相關(guān)性匹配識別。2.可變形模板匹配法可變形模板法可以視為幾何特征方法的一種改進(jìn),其基本思想是:設(shè)計一個參數(shù)可調(diào)的器官模型,即可變形模板,定義一個能量函數(shù),通過調(diào)整模型參數(shù)使得能量函數(shù)最小化,此時的模型參數(shù)即為對象的幾何特征??勺冃文0宸椒ù嬖趦蓚€問題,一是能量函數(shù)中各種代價的加權(quán)系數(shù)只能由經(jīng)驗確定,難以推廣;二是能量函數(shù)在優(yōu)化過程中十分耗時,難以實際應(yīng)用。圖4-2人臉可變形匹配法針對畸變不變性的物體識別提出了動態(tài)鏈模型(DynamicLinkArchitecture,DLA),將物體用稀疏圖形來描述,(見圖4-2),其頂點用部能量譜的多尺度描述來標(biāo)記,邊則表示拓?fù)溥B接關(guān)系,并用幾何距離來標(biāo)記。對象的識別是利用基于匹配代價函數(shù)優(yōu)化的可變形圖匹配技術(shù)實現(xiàn)的。用可變形模板去建模預(yù)先的可變形人臉特征[13]。這種方法中,人臉特征被描述成參數(shù)模板。輸入圖像的邊緣、波峰值、波谷值被對應(yīng)于模板的參數(shù),而構(gòu)成一個能量函數(shù)。通過調(diào)整參數(shù),將函數(shù)能量最小的可變形模型作為人臉的最佳匹配。將人臉圖像建模為可變形的3D網(wǎng)格表面,從而將人臉模板匹配問題轉(zhuǎn)化為可變形曲面的可變形匹配模型。利用有限元分析的方法進(jìn)行曲面變形,并根據(jù)變形的情況判斷兩張圖片是否為同一個人。3.基于小波特征的彈性匹配方法采用屬性拓?fù)鋱D表示人臉,提出了彈性匹配的方法。拓?fù)鋱D的任一頂點均包含特征矢量,記錄人臉在該頂點位置的分布信息,二維拓?fù)鋱D的頂點矢量采用人臉經(jīng)小波變換后的特征矢量。用拓?fù)鋱D分別代表已知和待識別的人臉,根據(jù)匹配拓?fù)鋱D算出他們的“距離”,作為人臉的相似度準(zhǔn)則。圖4-3定義在人臉上的二維拓?fù)鋱D在KL變換中,待識別人臉X和庫中人臉C之間采用了通常的歐氏距離來進(jìn)行匹配。雖然歐氏距離計算簡單,但是當(dāng)X和C只有位移、膨脹(如affine變換)或是表情不同時,則歐氏距離不會等于零,甚至很大,此外,若C作為人臉庫中的已知人臉模板,應(yīng)該是描述人臉的關(guān)鍵特征,它的維數(shù)并不需要和待識別人臉一樣,因而此時歐氏距離就不合適,而彈性圖匹配法是在二維的空間中定義了這樣一個距離,它對通常的人臉變形具有一定的不變性,也不要求C、X維數(shù)一定相同。可采用屬性拓?fù)鋱D來表達(dá)人臉(圖4-3采用的是規(guī)則的二維網(wǎng)格圖),其拓?fù)鋱D的任一頂點均包含一特征矢量,它記錄了人臉在該頂點位置的分布信息(如圖4-3),二維拓?fù)鋱D的頂點矢量就是人臉經(jīng)小波變換后的特征矢量。在圖像的敏感位置(如輪廓線、突出點等),小波變換后生成的特征矢量的模較大。用拓?fù)鋱D分別代表已知和待識別人臉,還可根據(jù)匹配拓?fù)鋱D算出它們的“距離”,作為人臉的相似度準(zhǔn)則。人臉的相似度可用拓?fù)鋱D的“距離”來表示,而最佳的匹配應(yīng)同時考慮頂點特征矢量的匹配和相對幾何位置的匹配。圖4-4表示人臉特征的二維矢量由圖4-5(和圖4-4一樣,它們的每一頂點均為一特征矢量)可見,特征匹配即:上的頂點與中相對應(yīng)的頂點,,為匹配函數(shù)),其特征的匹配度則表示和頂點的特征矢量相似度,而幾何位置的匹配則為中相近的兩頂點,匹配后,中對應(yīng)的兩頂點也應(yīng)該相近,用了以下能量函數(shù)E(M)來評價待識別人臉圖像矢量場和庫中已知人臉的矢量場之間的匹配程度。圖4-5定義在已知臉和待識別臉上的二維網(wǎng)格和(4-3)上式中的第一項是計算兩個矢量場中對應(yīng)的局部特征和的相似程度,第二項則是計算局部位置關(guān)系和匹配次序。由此可見,最佳匹配也就是最小能量函數(shù)時的匹配在求能量函數(shù)實現(xiàn)匹配的時候,可以有如下兩種匹配的方法:其中一種是嚴(yán)格的匹配方法;另一種匹配即所謂彈性圖匹配方法。網(wǎng)格經(jīng)過了變形,即由原來網(wǎng)格中的一點對中一點的嚴(yán)格匹配,變成了中一點和中一點了;鄰域范圍內(nèi)的匹配,其目的是為了進(jìn)一步減小能量函數(shù),通過最終收斂到一個最小值,來實現(xiàn)彈性匹配正是這樣的匹配容忍了表情的細(xì)微變化。第五章基于局部特征分析與最優(yōu)化匹配的人臉識別算法生物學(xué)的研究表明2DGabor小波[8]是對高級脊椎動物視覺皮層中的神經(jīng)元的良好逼近,是對時域和頻域精確度的一種折中。因此利用2DGabor小波變換的系數(shù)幅值作為特征有著良好的視覺特性和生物學(xué)背景。本章結(jié)合神經(jīng)網(wǎng)絡(luò)用于人臉特征定位、Gabor小波的局部多尺度分析特性和特征點子空間上的最優(yōu)化匹配方法進(jìn)行人臉識別,取得了較好的效果。5.1圖像預(yù)處理1.對人臉圖像進(jìn)行縮放到64×64大小。2.對縮放后的人臉圖像進(jìn)行基于小波和神經(jīng)網(wǎng)絡(luò)的光照補(bǔ)償。5.1.在我們的系統(tǒng)中我們選擇了15個特征點,如圖5-1所示:圖5-1人臉特征點分布圖在特征點的定位上,我們使用了六個BP神經(jīng)網(wǎng)絡(luò)進(jìn)行特征點定位。其中第一個用于瞳孔的定位,第二個用于眼角的定位,第三個用于眉心的定位,第四個用于眉角的定位,第五個用于鼻尖的定位,第六個用于嘴角的定位。定位方法以瞳孔為例,我們首先采集一些瞳孔樣本和非瞳孔樣本送入瞳孔定位神經(jīng)網(wǎng)絡(luò)進(jìn)行分類訓(xùn)練。瞳孔樣本的輸出為1,非瞳孔樣本的輸出為-1。之后使用瞳孔定位神經(jīng)網(wǎng)絡(luò)進(jìn)行瞳孔定位,如果定位錯誤我們將這個反例再次送入神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),這樣經(jīng)過多次的反復(fù)學(xué)習(xí)訓(xùn)練,瞳孔定位神經(jīng)網(wǎng)絡(luò)就具備了瞳孔定位的能力,其他定位神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以此類推。5.1.2Gabor小波是小波的一種,這是它的公式:這里這里為Gaussian的標(biāo)準(zhǔn)方差,v為頻率參數(shù),為方向參數(shù)。從外形上看,Gabor小波被封裝在一個Gaussion分布的形狀中,而且它的積分為零。如果要將Gabor小波在三維中顯示出來,應(yīng)該是下面這個樣子,(a)是實部(偶函數(shù)),(b)實部是虛部(奇函數(shù)),如圖5-2所示。(a)實部(b)虛部圖5-2Gabor的圖像通過改變頻率參數(shù)v和方向參數(shù)μ,可以得到一組不同的Gabor濾波器。出于速度和效果的綜合考慮,一般使用8個方向和5種頻率,這樣,一共可以產(chǎn)生5×8=40個不同的Gabor濾波器。對于大小為64×64的圖像,最小和最大頻率的波長分別為8和2個象素。將人臉圖像的每一個特征點分別與每一個Gabor濾波器做卷積,會得到40個結(jié)果(注意:實部和虛部必須分開才能做卷積)。對人臉圖像的每一個特征點而言,則會產(chǎn)生40個輸出的復(fù)數(shù),這40個輸出的復(fù)數(shù)就代表了這個特征點局部的多尺度Gabor特征,我們將這40個復(fù)數(shù)的實部和虛部分別單位化并按濾波器的順序排列好組成這個點的特征向量。5.1局部特征的最優(yōu)化匹配是通過局部特征的特征向量最優(yōu)化匹配來實現(xiàn)的[8]。一般來說,人臉庫中屬于同一個人的人臉有多張(例如不同表情、不同光照、不同姿勢、不同時期的人臉等),這些同一個人的每張人臉相同位置特征點所對應(yīng)的特征向量張成了一個線性子空間(例如:同一個人每張人臉左眼瞳孔特征點所對應(yīng)的特征向量張成了一個左眼瞳孔的線性子空間)。這樣同一個人的人臉有多少個特征點就張成了多少個相應(yīng)的線性子空間。將待識人臉與人臉庫的每一張人臉計算相似度[8],并在人臉庫中找出與待識人臉有最大相似度的人臉作為識別結(jié)果。顯然這種方法沒有利用特征點的特征向量張成線性子空間所內(nèi)含該特征點的共性。我們的方法則充分利用了Gabor小波優(yōu)良局部特征分析的優(yōu)點和特征向量張成線性子空間所內(nèi)含該特征點的共性。通過最優(yōu)化的方法在人臉庫中每個人(注:不是每張臉,一個人可有多張臉)每個特征點對應(yīng)的線性子空間中找到這樣一個最優(yōu)特征向量,這個最優(yōu)特征向量向待識人臉相應(yīng)特征點所對應(yīng)特征向量的投影值最大。記其中:為某特征點的維數(shù)(在這里)。為該特征點對應(yīng)子空間的維數(shù)。為人臉庫中第人該特征點所對應(yīng)的特征向量。C為待識人臉某特征點所對應(yīng)的特征向量。X為未知量。其意義為最優(yōu)特征向量在其子空間中的坐標(biāo)。并且滿足、,,,…線性無關(guān)。于是我們的問題就轉(zhuǎn)化為求得以下函數(shù)的極值:(5.1)兩邊求導(dǎo)可得:(5.2)由得:(5.3)由,,…線性無關(guān):故為一是對稱的正定矩陣,由此得:(5.4)令(5.5) (5.6)(5.7)故當(dāng)(5.8)取得極值,其中為自由變量()。將X代入約束條件或即可求得和X。則AX就是我們要求得的最優(yōu)特征向量。5.2人臉匹配識別在系統(tǒng)中設(shè)定了兩種閾值與權(quán)值。一種是局部特征點閾值與權(quán)值,給每個特征點設(shè)置了不同的閾值與權(quán)值,左右眼的瞳孔、眉心給予了最大的閾值與權(quán)值,每只眼的左右眼角、眉角給予了稍小的閾值與權(quán)值,鼻尖次之,因為嘴角的變化較大所以被給予閾值與權(quán)值最小。這種閾值要求每個特征點的相似度都要超過它。二是整體閾值,這種閾值要求對各特征點的閾值加權(quán)后要超過它。匹配的同時滿足以上條件才能確認(rèn)識別結(jié)果。圖5-3Yale庫的部分人臉5.3.實驗結(jié)果實驗對Yale大學(xué)的人臉庫和ORL人臉庫做了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論