燕山大學(xué)畢業(yè)設(shè)計(jì):基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)_第1頁
燕山大學(xué)畢業(yè)設(shè)計(jì):基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)_第2頁
燕山大學(xué)畢業(yè)設(shè)計(jì):基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)_第3頁
燕山大學(xué)畢業(yè)設(shè)計(jì):基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)_第4頁
燕山大學(xué)畢業(yè)設(shè)計(jì):基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于特定說話人識別的門禁系統(tǒng)設(shè)計(jì)指導(dǎo)老師:學(xué)生姓名:日期:燕山大學(xué)目目錄錄第一章緒論

第二章說話人識別系統(tǒng)的理論研究

第三章門禁系統(tǒng)的整體設(shè)計(jì)

第四章說話人識別門禁系統(tǒng)的軟件設(shè)計(jì)

第五章門禁系統(tǒng)的仿真與結(jié)果分析一、研究背景及意義

對語音處理技術(shù)可以追溯到1876,該年貝爾創(chuàng)造了,他是人類有史以來的第一人將語音信號傳輸?shù)竭h(yuǎn)處通過電訊號。在眾多的生物認(rèn)證技術(shù)中,說話人識別技術(shù)表現(xiàn)出很多應(yīng)用上的優(yōu)勢。聲紋識別有不會遺失無須記憶、使用方便具有獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性國內(nèi)外動態(tài)1966年,美國法院第一次采用語譜圖進(jìn)行了取證70年代中期BSAtal研究了線性預(yù)測LPC(LinearPredictiveCoding)系數(shù)、倒譜系數(shù)等不同的特征參數(shù),并論證了倒譜系數(shù)在進(jìn)行說話人識別中是比較理想的特征參數(shù)清華大學(xué)在1988年創(chuàng)造了無限詞匯漢語聽寫機(jī),四達(dá)公司等單位在90年代初使之產(chǎn)品化、商品化說話人識別原理說話人識別系統(tǒng)分為兩個階段,即訓(xùn)練(學(xué)習(xí))和識別階段。在訓(xùn)練階段,系統(tǒng)根據(jù)每個使用者說出的假設(shè)干訓(xùn)練語句建立相應(yīng)的參考模板。而在識別階段,由待識別人說的語音中導(dǎo)出參量要與訓(xùn)練過程中的參考參量集或模板加以比較。用VQ方法計(jì)算平均失真測度,選取距離最小者判斷說話人是誰。三、訓(xùn)練識別過程中需要注意的問題對語音信號的預(yù)加重、分幀、加窗、端點(diǎn)檢測和特征提取建立說話人的參考模板和測試模板計(jì)算測試模板與參考模板的最小累計(jì)距離說話人識別原理圖預(yù)加重和端點(diǎn)檢測的作用中預(yù)加重作用:語音信號頻譜的高頻局部能量較小,容易受到干擾,以及信號的高頻局部在6dB/倍頻程下降800Hz。因此,在語音信號的分析時,先要以提高高頻局部。對聲音信號進(jìn)行預(yù)加重,還有兩個好處:1、能夠?qū)?shù)字化的語音信號平滑過度,2、能夠降低在之后的聲音處理中受到精度的影響。端點(diǎn)檢測作用:除非在高信噪比的聲學(xué)環(huán)境中(如消聲室或隔音室)的語音外,從背景噪聲中鑒別語音不是一件簡單的事?,F(xiàn)實(shí)環(huán)境中,靜音段經(jīng)常由于受到噪聲的污染能量值不為零,導(dǎo)致系統(tǒng)誤判,性能降低。對語音信號進(jìn)行端點(diǎn)檢測,有利于降低系統(tǒng)運(yùn)算量,提高系統(tǒng)性能。用信號的幅度作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限,就認(rèn)為語音開始,幅度降低到門限以下就認(rèn)為語音結(jié)束。特征提取的過程:在訓(xùn)練過程中通過說話人說的語句,提取出惟一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的特征,這些特征參數(shù)構(gòu)成參考模板;在識別過程中將識別時說話人說的語句進(jìn)行特征提取,構(gòu)成一個待識別模板。模式匹配的過程:將待識別模板和訓(xùn)練的參考模板進(jìn)行匹配,計(jì)算平均失真測度〔采用歐氏距離〕,距離最小者為說話者。特征提取和模式匹配的過程美爾頻率倒譜參數(shù)〔MFCC〕MFCC參數(shù)是基于人的聽覺特性利用人耳聽覺的屏蔽效應(yīng),在Mel標(biāo)度頻率域提取出來的倒譜特征參數(shù)。其提取流程圖如下:MFCC提取的具體步驟1、聲音信號舉行分幀、加窗,后做離散傅立葉變換,從而得到頻譜分布信息。2、計(jì)算頻譜的振幅的平方,就可以得到能量譜。3、將能量譜通過一組Mel尺度的三角形濾波器組。4、算出每一個濾波器組輸出的對數(shù)能量。5、通過離散弦變換〔DCT〕得到了MFCC系數(shù)。矢量量化方法介紹基于VQ的識別模型:基于VQ的說話人識別系統(tǒng),矢量量化起著雙重作用。在訓(xùn)練階段,把每一個說話者所提取的特征參數(shù)進(jìn)行分類,產(chǎn)生不同碼字組成的碼本。在識別(匹配)階段,用VQ方法計(jì)算平均失真測度(本系統(tǒng)在計(jì)算距離d時,采用歐氏距離測度),從而判斷說話人是誰。用矢量量化聚類法生成碼本:將每個待識的說話人看作是一個信源,用一個碼本來表征。碼本是從該說話人的訓(xùn)練序列中提取的MFCC特征矢量聚類而生成。只要訓(xùn)練的序列足夠長,可認(rèn)為這個碼本有效地包含了說話人的個人特征,而與講話的內(nèi)容無關(guān)。本文采用基于分裂的LBG的算法來設(shè)計(jì)VQ碼本,其流程圖如下:LBG的算法具體過程:1、從幀中提取出來的特征向量的均值作為第一碼字矢量2、將當(dāng)前的碼本根據(jù)下面規(guī)那么分裂,形成2m個碼字3、根據(jù)得到的碼本把所有的訓(xùn)練序列(特征矢量)進(jìn)行分類,然后按照下面兩個公式計(jì)算訓(xùn)練矢量量化失真量的總和以及相對失真。假設(shè)相對失真小于某一閾值ε,迭代結(jié)束,當(dāng)前的碼書就是設(shè)計(jì)好的2m個碼字的碼書,轉(zhuǎn)5。否那么,轉(zhuǎn)下一步。4、重新計(jì)算各個區(qū)域的新型心,得到新的碼書,轉(zhuǎn)3。5、重復(fù)2,3和4步,直到形成有M個碼字的碼書(M是所要求的碼字?jǐn)?shù))。門禁系統(tǒng)的整體結(jié)構(gòu)系統(tǒng)硬件布局如圖以下圖所示,主要包含6大板塊為:1.語音輸入板塊,利用采用麥克風(fēng)來實(shí)現(xiàn)。2.音頻編解碼板塊,本系統(tǒng)用TLV320AIC23來實(shí)現(xiàn)對語音信號的采集與傳輸。3.DSP處理器有很多種,經(jīng)過查閱多方資料,最后選擇了型號為TMS320VC5509A的,對語音信號進(jìn)行處理。4.SDRAM模塊,這個版塊是存儲數(shù)據(jù)的。5.FLASH模塊,其功能是保存說話人識別的參考模板。6.無線模塊,其功能是負(fù)責(zé)用戶端與主機(jī)端之間的無線通信。電源電路時鐘電路音頻模塊TMS320VC5509與SDRAM接口圖TMS320VC5509與FLASH接口圖說話人識別的結(jié)構(gòu)框圖時鐘初始化化系統(tǒng)上電期間,因?yàn)殡妷翰▌拥鹊脑?時鐘震蕩狀態(tài)是不穩(wěn)定的,為了讓TMS320VC5509APGE工作正常,就需要對時鐘進(jìn)行初始化設(shè)置,等待時鐘穩(wěn)定后再操作,否那么會影響到其他模塊工作。化門禁系統(tǒng)的仿真與結(jié)果分析本文的識別方法確定為矢量量化方法,美爾倒譜參數(shù)〔MFCC〕被確定為特征參數(shù)。在軟件仿真下,把麥克風(fēng)連接PC,將錄音軟件設(shè)成單聲道,采樣頻率被定為8KHz,量化精度被確定16位,預(yù)加重系數(shù)被定為,每幀的語音時間為30ms,240點(diǎn)是一個幀,幀移為80,窗函數(shù)使用漢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論