



全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
.基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉朝向識(shí)別摘要 人臉識(shí)別是當(dāng)今模式識(shí)別和人工智能的一個(gè)重要的研究方向。人臉的朝向識(shí)別是一個(gè)復(fù)雜的模式識(shí)別問題。在實(shí)際應(yīng)用中,大量圖像和視頻源中人臉的位置、朝向、旋轉(zhuǎn)角度都是不固定的,這大大增加了人臉識(shí)別的難度。為了解決這些問題,本實(shí)驗(yàn)采用了LVQ神經(jīng)網(wǎng)絡(luò)模型對(duì)圖像中的人臉朝向識(shí)別進(jìn)行研究。本實(shí)驗(yàn)基于matlab平臺(tái)設(shè)計(jì)LVQ神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)人臉朝向的判斷。實(shí)驗(yàn)結(jié)果表明,LVQ神經(jīng)網(wǎng)絡(luò)可以根據(jù)輸入圖像的二值信息,以較高的準(zhǔn)確率判別該圖像中的人臉朝向。關(guān)鍵字: 人臉朝向識(shí)別; LVQ神經(jīng)網(wǎng)絡(luò); matlab; 特征提取人臉識(shí)別是一個(gè)活躍的研究領(lǐng)域。盡管相對(duì)于虹膜和指紋識(shí)別,人臉識(shí)別的準(zhǔn)確還比較低,但人臉的易采集、非接觸的優(yōu)點(diǎn),讓人臉識(shí)別受到越來越多的關(guān)注。人臉識(shí)別對(duì)人臉位置和狀態(tài)都有一定的限制,實(shí)際應(yīng)用中,圖像和視頻源中人臉的位置,朝向和旋轉(zhuǎn)都不是固定的,這就為我們后續(xù)的人臉識(shí)別有了更大的難度。在人臉識(shí)別的研究領(lǐng)域中,人臉朝向識(shí)別是其中的一個(gè)分支。在以往的研究中,絕大多數(shù)的研究人員希望能夠消除人臉朝向在人臉識(shí)別中的不良影響,但在復(fù)雜的實(shí)際環(huán)境中,我們無法忽略人臉朝向?qū)θ四樧R(shí)別的影響。因此,對(duì)人臉朝向的判定和識(shí)別是非常有必要和有意義的。1 LVQ神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)向量量化 (Learning Vector Quantization,LVQ) 神經(jīng)網(wǎng)絡(luò),屬于前向神經(jīng)網(wǎng)絡(luò)類型,在模式識(shí)別和優(yōu)化領(lǐng)域有著廣泛的應(yīng)用。LVQ神經(jīng)網(wǎng)絡(luò)由三層組成,即輸入層、隱含層和輸出層,網(wǎng)絡(luò)在輸入層與隱含層間為全連接,而在隱含層與輸出層間為部分連接,每個(gè)輸出層神經(jīng)元與隱含層神經(jīng)元的不同組相連接。隱含層和輸出層神經(jīng)元之間的連接權(quán)值固定為1。輸入層和隱含層神經(jīng)元間連接的權(quán)值建立參考矢量的分量(對(duì)每個(gè)隱含神經(jīng)元指定一個(gè)參考矢量)。在網(wǎng)絡(luò)訓(xùn)練過程中,這些權(quán)值被修改。隱含層神經(jīng)元(或稱為Kohnen神經(jīng)元)和輸出神經(jīng)元都具有二進(jìn)制輸出值。當(dāng)某個(gè)輸入模式被送至網(wǎng)絡(luò)時(shí),參考矢量最接近輸入模式的隱含神經(jīng)元因獲得激發(fā)而贏得競爭,因而允許它產(chǎn)生一個(gè)“1”,而其它隱含層神經(jīng)元都被迫產(chǎn)生“0”。與包含獲勝神經(jīng)元的隱含層神經(jīng)元組相連接的輸出神經(jīng)元也發(fā)出“1”,而其它輸出神經(jīng)元均發(fā)出“0”。產(chǎn)生“1”的輸出神經(jīng)元給出輸入模式的類,由此可見,每個(gè)輸出神經(jīng)元被用于表示不同的類。2 人臉朝向識(shí)別的設(shè)計(jì)2.1 問題描述現(xiàn)采集到一組不同人臉朝向的圖像,這組圖像來自于10個(gè)人,每人5張圖片,人臉朝向分為:左方、左前方、正面、右前方、右方,如圖2-1所示。創(chuàng)建一個(gè)LVQ神經(jīng)網(wǎng)絡(luò),對(duì)給出的人臉進(jìn)行朝向的判定與識(shí)別。2-1 人臉朝向識(shí)別圖2.2 建立模型2.2.1 設(shè)計(jì)思路通過觀察不難發(fā)現(xiàn),當(dāng)人臉朝向不同的方向時(shí),眼睛在圖像中的位置差別較大。所以,將眼睛位置的特征信息作為LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別的輸入,將5個(gè)朝向作為其輸出。在對(duì)訓(xùn)練集進(jìn)行訓(xùn)練之后,得到具有預(yù)測功能的神經(jīng)網(wǎng)絡(luò),對(duì)測試集中的圖片進(jìn)行人臉朝向的預(yù)測。2.2.2 設(shè)計(jì)步驟根據(jù)上述的設(shè)計(jì)思路,可以歸納為如下步驟,如圖2-2所示。圖2-2 設(shè)計(jì)步驟流程圖(1)眼部特征向量的提取在設(shè)計(jì)思路中,可以知道人臉朝向不同時(shí),其眼睛所在的位置也有所不同。因此,選取描述人眼位置的特征向量作為LVQ神經(jīng)網(wǎng)絡(luò)的輸入。方法:將整幅圖像分為6行8列,人眼的位置信息可以用第2行的8個(gè)子矩陣來描述,邊緣檢測后8個(gè)子矩陣中的值為“1”的像素點(diǎn)的個(gè)數(shù)與人臉朝向有直接關(guān)系。只要分別統(tǒng)計(jì)出第2行8個(gè)子矩陣中值為“1”的像素點(diǎn)的個(gè)數(shù)即可。(2)生成訓(xùn)練集和測試集為了保證訓(xùn)練集數(shù)據(jù)的隨機(jī)性,我們隨機(jī)選取圖像庫中的30張圖片作為訓(xùn)練數(shù)據(jù),選取20張圖片作為測試數(shù)據(jù)。(3)LVQ網(wǎng)絡(luò)的創(chuàng)建因?yàn)長VQ神經(jīng)網(wǎng)絡(luò)具有不需要將輸入向量正交化、歸一化的優(yōu)點(diǎn),利用Matlab工具中的newlvq()函數(shù)構(gòu)建一個(gè)LVQ神經(jīng)網(wǎng)絡(luò)。(4)LVQ網(wǎng)絡(luò)的訓(xùn)練將訓(xùn)練集中輸入向量送入LVQ神經(jīng)網(wǎng)絡(luò),之后對(duì)網(wǎng)絡(luò)中權(quán)值進(jìn)行迭代調(diào)整,達(dá)到要求。利用Matlab中的網(wǎng)絡(luò)訓(xùn)練函數(shù)train()對(duì)LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)。(5)人臉朝向的識(shí)別網(wǎng)絡(luò)訓(xùn)練收斂后,對(duì)測試集的數(shù)據(jù)進(jìn)行預(yù)測。對(duì)于任意給定的圖像,只需將其特征向量提取出來,便可以進(jìn)行識(shí)別。3 人臉朝向識(shí)別的實(shí)現(xiàn)Matlab提供了許多函數(shù)能夠讓我們?cè)贛atlab環(huán)境下可以實(shí)現(xiàn)上述步驟。3.1 清空環(huán)境變量在程序運(yùn)行之前,需要清空工作空間中的變量和命令窗口的命令。源代碼如下:clear allclc3.2 眼部特征向量的提取首先將圖像中描述眼部信息的特征向量提取出來,即統(tǒng)計(jì)出第2行8個(gè)子矩陣中值為“1”的像素點(diǎn)的個(gè)數(shù),源代碼如下:% 人臉特征向量提取 % 人數(shù)M=10;% 人臉朝向類別數(shù)N=5; % 特征向量提取pixel_value=feature_extraction(M,N);feature_extraction()為人臉特征向量提取子函數(shù),函數(shù)體如下:% 特征提取子函數(shù)function pixel_value=feature_extraction(m,n)pixel_value=zeros(50,8);sample_number=0;for i=1:m for j=1:n str=strcat(Images,num2str(i),_,num2str(j),.bmp); %將字符串進(jìn)行水平連接 img= imread(str); %將圖像轉(zhuǎn)換為對(duì)應(yīng)的矩陣 rows cols= size(img); img_edge=edge(img,Sobel); %用sobel邊緣提取算子來提取邊緣 sub_rows=floor(rows/6); sub_cols=floor(cols/8); sample_number=sample_number+1; for subblock_i=1:8 for ii=sub_rows+1:2*sub_rows for jj=(subblock_i-1)*sub_cols+1:subblock_i*sub_cols pixel_value(sample_number,subblock_i)=. pixel_value(sample_number,subblock_i)+img_edge(ii,jj); end end end endend3.3 生成訓(xùn)練集和測試集將圖片庫中圖片的眼部特征向量提取出來,隨機(jī)分為兩組,即訓(xùn)練集組和測試集組。訓(xùn)練集中包括30幅圖像的特征向量,測試集中包括20幅圖像的特征向量,具體源代碼如下:% 訓(xùn)練集/測試集產(chǎn)生% 產(chǎn)生圖像序號(hào)的隨機(jī)序列rand_label=randperm(M*N); %產(chǎn)生一個(gè)從1到m*n的隨機(jī)序列% 人臉朝向標(biāo)號(hào)direction_label=repmat(1:N,1,M); %用于矩陣復(fù)制% 訓(xùn)練集train_label=rand_label(1:30);P_train=pixel_value(train_label,:);Tc_train=direction_label(train_label);% 測試集test_label=rand_label(31:end);P_test=pixel_value(test_label,:);Tc_test=direction_label(test_label);3.4 創(chuàng)建LVQ神經(jīng)網(wǎng)絡(luò)利用newlvq()函數(shù)來創(chuàng)建LVQ神經(jīng)網(wǎng)絡(luò),隱含層神經(jīng)元個(gè)數(shù)設(shè)置為20,具體源代碼如下:% 計(jì)算PCfor i=1:5 ratei=length(find(Tc_train=i)/30;end% 創(chuàng)建LVQ網(wǎng)絡(luò)net=newlvq(minmax(P_train),20,cellmat(rate);% 設(shè)置訓(xùn)練參數(shù)net.trainParam.epoch = 100;net.trainParam.goal = 0.001;net. trainParam.lr = 0.13.5 訓(xùn)練LVQ神經(jīng)網(wǎng)絡(luò) 用Matlab提供的train()函數(shù)對(duì)LVQ神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí),源代碼如下: net = train(n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年城市地下綜合管廊專項(xiàng)債券資金申請(qǐng)項(xiàng)目投資風(fēng)險(xiǎn)控制報(bào)告
- 2025年學(xué)前教育信息化:幼兒心理健康教育信息化報(bào)告
- 2025年金融行業(yè)反洗錢監(jiān)管科技應(yīng)用報(bào)告:技術(shù)創(chuàng)新與合規(guī)挑戰(zhàn)
- 工業(yè)互聯(lián)網(wǎng)網(wǎng)絡(luò)運(yùn)維 課件 任務(wù)2.3-3 網(wǎng)絡(luò)設(shè)備選型-組態(tài)軟件選型
- 畢生發(fā)展心理學(xué)(第2版)課件 第七章 幼兒心理的發(fā)展(上)
- 20XX年副科級(jí)以上領(lǐng)導(dǎo)干部及中青年后備干部理論考試試卷
- 四川省建設(shè)工程安全b證考試試題及答案
- 養(yǎng)發(fā)美發(fā)管理辦法
- 兼崗薪酬管理辦法
- 內(nèi)務(wù)清潔管理辦法
- GB/T 1766-2008色漆和清漆涂層老化的評(píng)級(jí)方法
- 銀行新職員員工考試試卷
- 駕駛員安全駕車個(gè)人責(zé)任書三篇
- 廣西建工80塔吊使用說明書TCT5512
- DB15T 1889-2020 防風(fēng)栽培技術(shù)規(guī)程
- 混凝土基本性能試驗(yàn)報(bào)告
- 代付農(nóng)民工工資委托付款書(模板)
- JJF1075-2015 鉗形電流表校準(zhǔn)規(guī)范-(高清現(xiàn)行)
- 公路水運(yùn)工程試驗(yàn)檢測機(jī)構(gòu)資質(zhì)評(píng)審培訓(xùn)共34頁課件
- 奶油的加工工藝
- CSR管理體系策略
評(píng)論
0/150
提交評(píng)論