




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第4章短時傅里葉變換4.1短時傅里葉變換的定義4.2短時傅里葉變換的理解4.3短時傅里葉變換的實現(xiàn)4.4短時傅里葉變換的應(yīng)用案例24.1短時傅里葉變換的定義傅里葉變換FT對于聲音非平穩(wěn)信號,其頻率成分隨時間變化,僅使用FT無法同時獲取信號的時間和頻率信息短時傅里葉變換STFT34.1短時傅里葉變換的定義離散信號STFT連續(xù)信號STFTSTFT使用窗函數(shù)將信號分段,并對每一段應(yīng)用傅里葉變換。窗的大小決定了時間和頻率的分辨率:窗越長,頻率分辨率越高,時間分辨率越低;窗越短,時間分辨率越高,頻率分辨率越低。對于時變的非穩(wěn)態(tài)信號,高頻適合小窗口,低頻適合大窗口44.1短時傅里葉變換的定義在實際應(yīng)用中,信號通常是有限長度的,這限制了頻率分辨率。離散化可以幫助在有限的數(shù)據(jù)長度內(nèi)更有效地進行頻率分析。類似于時域采樣,對頻域在單位圓上進行離散化采樣,就可以得到頻率離散的STFT頻域離散化可以使傅里葉變換更容易在計算機上實現(xiàn)。通過使用快速傅里葉變換(FFT)算法,計算效率可以大大提高。54.1短時傅里葉變換的定義STFT的輸出是一個二維函數(shù),通常表示為時頻譜圖,其中橫軸表示時間,縱軸表示頻率,用不同的顏色表示信號在該時間和頻率位置的能量或幅度。在STFT時頻譜圖中,時域被分幀,并對每一幀計算傅立葉變換以獲得頻率。幀位置在整個數(shù)據(jù)中滑動以獲得STFT系數(shù)。64.2短時傅里葉變換的理解對于非平穩(wěn)信號,傅立葉變換只能反映整個信號當中有哪些頻率成分,而無法反映各個成分出現(xiàn)的時間,信號各個頻率成分的大小隨時間變化的情況,各個時刻的瞬時頻率及其幅值,而短時傅里葉變換STFT則能捕獲這些傅里葉變換丟失的信息。74.2短時傅里葉變換的理解圖原始信號的時域波形及頻譜圖圖時域反轉(zhuǎn)后信號的時域波形及頻譜圖84.2短時傅里葉變換的理解圖x(t)時域波形及頻譜圖圖x(t)加入突變后的時域波形及頻譜圖將信號x(t)=2cos(20t)+4sin(60t)的某個位置加入一個高頻突變,其圖像如下圖所示94.2短時傅里葉變換的理解圖x(t)加入突變后的時域波形及頻譜圖在頻譜圖中,這樣的變化并沒有被很好的捕捉到。注意下圖框中部分,顯然傅里葉變換把突變解釋為了一些列低成分高頻信號的疊加,并未很好地反映突變擾動給信號帶來的變化。104.2短時傅里葉變換的理解圖原始信號的時域波形及頻譜圖圖時域反轉(zhuǎn)后信號的時域波形及頻譜圖114.2短時傅里葉變換的理解圖STFT濾波器組框圖在濾波器形勢下,STFT的另外一個表達式為:圖STFT合成框圖窗函數(shù)的帶寬ΔfΔf是窗函數(shù)頻率分辨率的二階矩,計算的是能量加權(quán)的平均頻率的平方,與單純平均頻率的平方的差值。這給出了關(guān)于窗函數(shù)的頻率分布的“寬度”的量度。與之類似還有時間分辨率Δt,這是窗函數(shù)在時間域中能量分布的寬度窗函數(shù)的帶寬Δf分辨率數(shù)值越小則分辨率越高,時間分辨率和頻率分辨率不能無限制提高,因為它們的乘積必須滿足一個下限:
即不可能同時在時間和頻率上有高分辨率,在保證一個維度的分辨率時會犧牲另一個維度的分辨率。高斯窗函數(shù)是滿足下界的窗函數(shù),在時域和頻域都具有最優(yōu)的分辨率,然而在實際應(yīng)用中并不是首選,這是因為相比于海明窗等,高斯窗的旁瓣的降落緩慢,容易導(dǎo)致頻譜的泄露。144.3短時傅里葉變換的實現(xiàn)15MFCC的提取和應(yīng)用聲音去噪算法的實現(xiàn)聲音信號熵的提取應(yīng)用4.4短時傅里葉變換的應(yīng)用案例164.1.1MFCC的提取和應(yīng)用
倒譜是語音信號處理中常用的一種特征表示方法。它是對信號頻譜的對數(shù)譜的反變換。倒譜能夠提取語音信號的周期性特征,對于聲調(diào)、共振峰和聲帶振動等特征具有較好的描述能力。設(shè)語音信號為s[n],其離散傅里葉變換DFT為S(k),則其倒譜系數(shù)為174.1.1MFCC的提取和應(yīng)用梅爾倒譜系數(shù)(MFCC)是在Mel標度頻率域提取出來的倒譜參數(shù)。倒譜和梅爾頻率倒譜的區(qū)別在于,梅爾頻率倒譜的頻帶劃分是在梅爾刻度上等距劃分的,它更接近人類的聽覺系統(tǒng),Mel標度描述了人耳頻率的非線性特征,對低頻較敏感而對高頻不敏感圖頻率和MEL頻率曲線圖184.1.1MFCC的提取和應(yīng)用MFCC的計算步驟有:1.預(yù)加重2.分幀3.加窗4.快速傅里葉變換5.濾波器6.離散余弦變換7.取對數(shù)預(yù)加重
預(yù)加重例:分幀取N個采樣點集合成一個觀測單位,稱為一幀,N的值通常為256或512,覆蓋時間約為20到30ms。為避免兩幀之間變化過大,相鄰兩幀之間有一定重疊,重疊區(qū)域包含M個采樣點,通常為N的1/3至1/2。若語音信號的采樣頻率為8kHz,幀長度取256個采樣點,則對應(yīng)的時間長度為256/8000×1000=32ms加窗窗函數(shù)的主要目的是加強幀左右的連續(xù)性。在頻域分析中,將時域信號分割成窗口后,會在每個窗口內(nèi)進行頻譜分析。如果不加窗函數(shù)直接對窗口內(nèi)的信號進行傅里葉變換,由于窗口的大小不是無限長的,導(dǎo)致實際頻譜的能量會泄漏到其它的頻率成分上去。窗函數(shù)在時域上對信號進行加權(quán),以平滑地將信號從無限延伸的形式轉(zhuǎn)換為有限長度的形式。這樣做可以減少信號在窗口邊界處的不連續(xù)性,從而減輕頻譜泄漏的影響。加窗
加窗圖不同a值下海明窗函數(shù)曲線圖快速傅里葉變換圖原始信號和加窗信號對應(yīng)的波形和能量譜圖濾波器
m表示濾波器的個數(shù),f(m)表示每個濾波器的中心頻率。頻譜有包絡(luò)和精細結(jié)構(gòu),分別對應(yīng)音色與音高。對于語音識別來講,音色是主要的有用信息,音高一般沒有用。在每個三角形內(nèi)積分,就可以消除精細結(jié)構(gòu),只保留音色的信息。離散余弦變換DCT
取對數(shù)標準的倒譜參數(shù)MFCC只反映了語音參數(shù)的靜態(tài)特性,語音的動態(tài)特性可以用這些靜態(tài)特征的差分譜來描述。把動、靜態(tài)特征結(jié)合起來才能有效提高系統(tǒng)的識別性能。差分參數(shù)的計算可以采用下面的公式:
代碼實現(xiàn)圖MFCC頻譜圖304.4.2.1譜減法去噪譜減法是一種發(fā)展較早且應(yīng)用較為成熟的語音去噪算法,該算法利用加性噪聲與語音不相關(guān)的特點,在假設(shè)噪聲是統(tǒng)計平穩(wěn)的前提下,用無語音間隙測算到的噪聲頻譜估計值取代有語音期間噪聲的頻譜,與含噪語音頻譜相減,從而獲得語音頻譜的估計值。譜減法具有算法簡單、運算量小的特點,便于實現(xiàn)快速處理,往往能夠獲得較高的輸出信噪比,所以被廣泛采用。該算法的不足之處是處理后會產(chǎn)生具有一定節(jié)奏性起伏的背景噪聲。314.4.2.1譜減法去噪324.4.3聲音信號熵的提取應(yīng)用
334.4.3聲音信號熵的提取應(yīng)用聲音信號的熵描述的是信號中所有可能值的信息量的期望值,或者說是平均信息量,用來度量信號的不確定性。聲音信號熵是對聲音信號的信息量和不確定性的度量,它可以幫助我們從聲音中提取有用的特征和信息。對于一個離散的聲音信號X,其信息熵H(X)為:代碼實現(xiàn)圖聲音信號的信息熵354.4.3聲音信號熵的提取應(yīng)用
代碼實現(xiàn)圖聲音信號的能量熵圖聲音信號的頻譜熵1、在聲音信號處理中,為什么要使用短時傅里葉變換?短時傅里葉變換有什么具體的作用?2、請完成一個信號的短時傅里葉變換代碼實現(xiàn),并分別畫出其時域波形和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高鐵組織考試題及答案
- 企業(yè)績效評估與激勵方案
- 社會經(jīng)濟調(diào)查試題及答案
- IT系統(tǒng)故障排查與維護流程模板
- 2025年病案考試題庫及答案
- 2025年丙肝有關(guān)的考試題及答案
- 售后服務(wù)流程優(yōu)化模板客戶體驗提升版
- 教師招聘政治真題及答案
- 產(chǎn)品研發(fā)流程化管理體系
- 2025年保育員基礎(chǔ)知識綜合考試試題及答案
- 食品安全管理制度打印版
- 湖北省武漢市外國語學(xué)校2024-2025學(xué)年上學(xué)期10月九年級物理試題(含解析)
- “成于大氣 信達天下”-成信校史課程知到課后答案智慧樹章節(jié)測試答案2025年春成都信息工程大學(xué)
- 2025年上海市青浦區(qū)中考英語一模試卷
- 特種設(shè)備之行車、吊裝安全操作培訓(xùn)
- 2200m3高爐安裝工程施工組織設(shè)計方案
- 初中生物教師培訓(xùn)講座
- HG∕T 3792-2014 交聯(lián)型氟樹脂涂料
- 2021湖南省衡陽市珠暉區(qū)事業(yè)單位考試歷年真題【近10年真題解析】
- 新生兒高膽紅素血癥護理查房(模板)
- 《民航客艙設(shè)備操作與管理》課件-項目三 客艙應(yīng)急設(shè)備
評論
0/150
提交評論