聲音信號處理與項目實踐 課件 第5章 聲音信號的線性預測編碼_第1頁
聲音信號處理與項目實踐 課件 第5章 聲音信號的線性預測編碼_第2頁
聲音信號處理與項目實踐 課件 第5章 聲音信號的線性預測編碼_第3頁
聲音信號處理與項目實踐 課件 第5章 聲音信號的線性預測編碼_第4頁
聲音信號處理與項目實踐 課件 第5章 聲音信號的線性預測編碼_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第5章聲音信號的線性預測編碼5.1線性預測基本原理5.2線性預測的解析算法5.3線性預測分析應用案例線性預測編碼(LPC)的基本思想由于語音信號的每個樣點之間存在相關性,所以能夠使用過去的樣點值來預測和推理現(xiàn)在與將來的樣點值。換句話說,對一個語音的抽樣能夠用過去若干個語音的抽樣來逼近。通過使實際語音抽樣和線性預測下的語音抽樣之間的誤差在某個準則下達到最小值來決定最優(yōu)的一組預測系數,而這組預測系數就客觀反映了語音信號的特性35.1線性預測基本原理線性預測的基本原理是用過去的樣點值來預測某個模型現(xiàn)在或者未來的樣點值

45.1線性預測基本原理

55.1線性預測基本原理可以用準周期脈沖或白噪聲激勵一個線性時不變系統(tǒng)聲道所產生的輸出作為語音的模型,用公式表達為

65.1線性預測基本原理根據的形式不同,有三種不同的信號模型:1、若H(z)同時含有極點和零點,稱作自回歸—滑動平均模型(AutoregressiveMovingAverage,ARMA),這是一種常見的模型。2、若H(z)的分子多項式為常數,即b=0,此時為全極點模型,當前模型的輸出只取決于過去的信號值,這種模型稱為自回歸模型(Autoregressive,AR)。3、若H(z)的分母多項式為1,即a=0,此時成為全零點模型,稱為滑動平均模型(MovingAverage,MA)。此時模型的輸出只由模型的輸入來決定。75.1線性預測基本原理實際上語音信號處理中最常見的模型是全極點模型,這是因為如果不考慮鼻音和摩擦音,那么語音的聲道傳遞函數就是一個全極點模型;而對于鼻音和摩擦音,細致的聲學理論表明其聲道傳輸函數既有極點又有零點,但這時如果模型的階數p足夠高,可以用全極點模型來近似表示極零點模型,因為一個零點可以用許多極點來近似。85.1線性預測基本原理可以用線性預測分析的方法來估計全極點模型參數。采用全極點模型,輻射、聲道以及聲門激勵的組合譜效應的傳輸函數為:其中p為預測器階數,G為聲道濾波器增益,S(z)和E(z)為語音抽樣s(n)和激勵信號e(n)的z變換。95.1線性預測基本原理語音信號s(n)和激勵信號e(n)之間的關系可以用下列的差分方程來表示:即語音樣點間有相關性,可以用過去的樣點值來預測未來的樣點值。對于濁音,e(n)是以基音周期重復的單位沖激;對于清音,e(n)時恒穩(wěn)白噪聲105.1線性預測基本原理在模型參數估計過程中,把下面的系統(tǒng)稱為線性預測器:

115.1線性預測基本原理A(z)稱作逆濾波器,其傳輸函數為:

125.1線性預測基本原理下面推導線性預測方程,把某一幀內的短時平均預測誤差定義為:

上式表明采用最佳預測系數時,預測誤差與過去的語音樣點正交。135.1線性預測基本原理

則有:

145.1線性預測基本原理考慮前式有:

155.2線性預測的解析算法

165.2線性預測的解析算法

即因此有175.2線性預測的解析算法展開為矩陣形式為:這種方程叫Yule-Walker方程,方程左邊的矩陣稱為托普利茲(Toeplitz)矩陣,它是以主對角線對稱的,而且其沿著對角線平行方向的各軸向的元素值都相等。這種Yule-Walker方程可用萊文遜-杜賓(Levinson-Durbin)遞推算法來高效地求解。Durbin快速推算法將簡寫為:Durbin快速推算法將上式分為上下兩部分運算Durbin快速推算法將上式分為上下兩部分運算Durbin快速推算法令則有Durbin快速推算法

則將左右同乘Durbin快速推算法得到帶入有Durbin快速推算法最終解得

Durbin快速推算法

則得到帶入Durbin快速推算法由式有:再代入得到=Durbin快速推算法歸納得到:285.2線性預測的解析算法完整的遞推過程如下:295.3線性預測分析應用案例

而預測誤差的傳遞函數可寫為305.3.1基音檢測估計利用線性預測倒譜法進行基音檢測315.3.1基音檢測估計首先,運行SetII和PartII將語音信號讀入并且分幀,并進行了端點檢測。其次,對一句話提取每一幀的數據,加漢明窗,用lpc函數求出預測系數并計算預測誤差。最后利用求倒譜的方法對預測誤差計算倒譜,最終得到左圖結果。325.3.1基音檢測估計利用簡化逆濾波法進行基音檢測335.3.1基音檢測估計該方法的基本思想是:先對話音信號進行LPC分析和逆濾波,獲得語音信號的預測誤差,然后將預測誤差信號通過自相關器和峰值檢測,以獲得基音周期。語音信號通過線性預測逆濾波器后達到頻譜的平坦化,因為逆濾波器是一個使頻譜平坦化的濾波器,所以它提供了一個簡化的頻譜平滑器。預測誤差是自相關器的輸入,通過在自相關函數中尋找最大值,可以求出基音的周期。345.3.2共振峰估計對一段語音利用LPC內插法檢測共振峰估計355.3.1基音檢測估計首先,在程序中使用LPC函數求出了預測系數,直接調用了lpcar2pf函數由預測系數計算出功率譜。lpcar2pf函數是voicebox語音工具箱中的一個函數。其次,用findpeaks函數從功率譜曲線上找出峰值和峰值的位置。最后得到如左圖的運行結果365.3.2共振峰估計讀入一段語音數據并采用Extfrmnt函數檢測共振峰軌跡375.3.1基音檢測估計左圖語音數據的波形和端點檢測的結果右圖在語音信號語譜圖上疊加共振峰的軌跡1、

概述聲音信號的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論