《數(shù)字通信原理》課件第2章_第1頁(yè)
《數(shù)字通信原理》課件第2章_第2頁(yè)
《數(shù)字通信原理》課件第2章_第3頁(yè)
《數(shù)字通信原理》課件第2章_第4頁(yè)
《數(shù)字通信原理》課件第2章_第5頁(yè)
已閱讀5頁(yè),還剩297頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章信源編碼2.1概述

2.2模擬信號(hào)的數(shù)字化

2.3語(yǔ)音編碼

2.4圖像編碼

習(xí)題

2.1概

2.1.1壓縮編碼的重要性信源編碼主要解決數(shù)字通信系統(tǒng)的有效性問(wèn)題。近代信源編碼的理論和方法,主要也是圍繞壓縮編碼展開(kāi)的。壓縮編碼的目標(biāo)是盡可能用最少的信息序列來(lái)傳輸最大的信息量。在當(dāng)今“信息爆炸”的時(shí)代,壓縮編碼的作用及其社會(huì)效益、經(jīng)濟(jì)效益將會(huì)越來(lái)越明顯。壓縮編碼也稱為數(shù)據(jù)壓縮,數(shù)據(jù)壓縮的主要途徑有以下三種:

(1)減小物理空間,如減小對(duì)存儲(chǔ)器、磁盤、磁帶和光盤等數(shù)據(jù)存儲(chǔ)媒體的空間要求。

(2)減少時(shí)間區(qū)間,如減小傳輸信息所需的時(shí)間等。

(3)減小頻譜區(qū)域,

如減小傳輸信息所需的帶寬等。

這三者之間是相互關(guān)聯(lián)的,如減小存儲(chǔ)空間也意味著提高了傳輸效率和節(jié)省了占用的頻譜。在第3章中我們將采用頻帶壓縮方法,通過(guò)選用不同的調(diào)制和解調(diào)方式,可以在相同的頻帶上傳輸更高的數(shù)碼率,從而提高單位頻帶的利用率。壓編編碼是提高數(shù)字通信系統(tǒng)有效性最重要的途徑和最有效的方法。

在第1章中我們介紹了采用數(shù)字通信具有許多優(yōu)越性,但這是以數(shù)據(jù)量的增大為“代價(jià)”的。如果不進(jìn)行數(shù)據(jù)壓縮,則很多應(yīng)用就無(wú)法實(shí)用化。例如一路廣播級(jí)的彩色電視,若按4∶2∶2的分量編碼標(biāo)準(zhǔn)格式,用13.5/6.75/6.75MHz頻率進(jìn)行抽樣,假定每像素用8比特編碼,其數(shù)碼率為(13.5+2×6.75)×8=216Mb/s。若實(shí)時(shí)傳送,則需要3375個(gè)64kb/s的數(shù)字話路。而如果將其數(shù)據(jù)壓縮到原來(lái)的1/100,則只需約33.8個(gè)64kb/s的數(shù)字話路。顯然壓縮編碼的效益是非常明顯的。

2.1.2壓縮編碼分類

根據(jù)恢復(fù)信源的準(zhǔn)確度,可將信源壓縮編碼方法分為無(wú)失真編碼和限失真編碼。無(wú)失真編碼也稱為信息保持編碼,它要求在對(duì)信源進(jìn)行編解碼的過(guò)程中不能丟失信息,以便完整準(zhǔn)確地重建原始信號(hào)。無(wú)失真編碼的優(yōu)點(diǎn)是明顯的,但缺點(diǎn)是壓縮比較低,通常不會(huì)超過(guò)3∶1。限失真編碼,即在對(duì)信源進(jìn)行編解碼過(guò)程中允許丟失一部分信息,通過(guò)控制失真程度,從而可實(shí)現(xiàn)較大的壓縮比。

根據(jù)壓縮編碼的實(shí)現(xiàn)方式,可將信源壓縮編碼方法分為統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼和識(shí)別編碼,如表

2-1所示。

2-1壓縮編碼的簡(jiǎn)單分類

(1)統(tǒng)計(jì)編碼是指利用消息或消息序列出現(xiàn)概率的分布特性,尋找其出現(xiàn)概率與碼字長(zhǎng)度間的最佳匹配,也稱概率匹配編碼,其目的是使總的代碼長(zhǎng)度最短。

(2)預(yù)測(cè)編碼是利用信號(hào)之間的相關(guān)性來(lái)預(yù)測(cè)未來(lái)的信號(hào),通過(guò)對(duì)預(yù)測(cè)的誤差進(jìn)行編碼來(lái)壓縮數(shù)據(jù)量。

(3)變換編碼是一種非常有效的限失真編碼方法。其基本的思想是利用信號(hào)在不同函數(shù)空間分布的不同,選擇合適的函數(shù)變換,將信號(hào)從一種信號(hào)空間變換到另一種更有利于進(jìn)行壓縮編碼,然后再對(duì)變換系數(shù)進(jìn)行編碼。

(4)識(shí)別編碼是通過(guò)對(duì)信號(hào)的特征進(jìn)行分解,與匯集這些基本特征的樣本進(jìn)行比較對(duì)照識(shí)別,

選擇失真最小的樣本編碼。

識(shí)別編碼的效率很高,

是壓縮編碼研究的熱點(diǎn)之一。

2.1.3編碼器的模型

為了描述信源編碼過(guò)程,我們可將其抽象成一個(gè)如圖2-1所示的“編碼器”。其中消息集X的元素x稱為信號(hào)單元(或消息);輸出集稱為代碼(或碼組),其元素W稱為碼字;A是構(gòu)成碼字的符號(hào)集,其元素a稱為碼元(或符號(hào))。其編碼過(guò)程是:如果在它的輸入端送入一個(gè)xi,則其輸出端將輸出一個(gè)被指定與xi相對(duì)應(yīng)的wi,且所有的w都是按規(guī)定的編碼方法用a來(lái)構(gòu)成的。即以符號(hào)A構(gòu)成代碼W,建立X與W的對(duì)應(yīng)關(guān)系。圖

2-1編碼器的模型

2.2模擬信號(hào)的數(shù)字化2.2.1模擬信號(hào)的抽樣

1.低通模擬信號(hào)的抽樣所謂抽樣,就是在一系列離散點(diǎn)上對(duì)連續(xù)模擬信號(hào)抽取樣值的過(guò)程,輸出的抽樣信號(hào)(抽樣序列)sT(t)可以表示為原始連續(xù)模擬信號(hào)s(t)與一個(gè)周期性的抽樣脈沖fT(t)相乘的積,即(2.2-1)

抽樣定理是模擬信號(hào)數(shù)字化的理論基礎(chǔ)。抽樣定理(一維抽樣)指出:一個(gè)連續(xù)模擬信號(hào)s(t)的頻率|f|≤fm,fm為低通模擬信號(hào)的最高頻率。如果抽樣頻率滿足fs≥2fm,則s(t)可以由抽樣序列惟一地確定。即可通過(guò)截止頻率為fm的理想低通濾波器由抽樣信號(hào)準(zhǔn)確地恢復(fù)出原始模擬信號(hào)。Ts=1/fs為抽樣的最大間隔,稱為奈奎斯特間隔。由于抽樣時(shí)間間隔相等,所以此抽樣定理又稱均勻抽樣定理。在矩形坐標(biāo)上進(jìn)行均勻抽樣(簡(jiǎn)稱矩形抽樣),可得到二維抽樣定理:若二維信號(hào)s(x,y)的空間頻率u和v分別限制在|u|≤Um和|v|≤Vm,則只要抽樣周期Δx、Δy滿足Δx≤1/2Um和Δy≤1/2Vm,就可以準(zhǔn)確地由抽樣信號(hào)恢復(fù)原始信號(hào)s(x,y)。矩形抽樣的概念可以推廣到二維以上,此時(shí)相當(dāng)于在超立方體點(diǎn)陣上抽樣。下面我們討論一維抽樣。

1)理想抽樣理想情況下,抽樣脈沖fT(t)是周期為Ts的單位沖激沖序列δT(t),即

(2.2-2)

對(duì)于最高頻率小于fm的低通模擬信號(hào)s(t),如圖2-2(a)所示。s(t)與周期性單位沖激脈沖δT(t)相乘,δT(t)如圖2-2(c)所示,其重復(fù)周期為Ts,重復(fù)頻率fs=1/Ts,可得到如圖2-2(e)所示的抽樣信號(hào)sT(t),即(2.2-3)

根據(jù)傅里葉變換的頻域卷積性質(zhì),s(t)δT(t)的傅里葉變換等于S(f)和ΔT(f)的卷積,因此sT(t)的傅里葉變換ST(f)可以寫為ST(f)=S(f)*ΔT(f)(2.2-4)

式中,S(f)為s(t)的頻譜,如圖2-2(b)所示;ΔT(f)為周期性單位沖激脈沖δT(t)的頻譜,

如圖

2-2(d)所示。

(2.2-5)

將式(2.2-5)代入式(2.2-4)得

(2.2-6)

其中,S(f-nfs)為S(f)平移nfs的結(jié)果。上式表明:第一,抽樣信號(hào)sT(t)的頻譜ST(f)與原信號(hào)s(t)的頻譜S(f)只差一個(gè)常數(shù)因子(1/Ts);第二,抽樣信號(hào)sT(t)的頻譜ST(f)是無(wú)數(shù)個(gè)頻率間隔為fs的原信號(hào)頻譜S(f)的疊加;第三,如果抽樣頻率的間隔fs≥2fm,即滿足奈奎斯特(Nyquist)準(zhǔn)則,則ST(f)中包含的每個(gè)原信號(hào)頻譜S(f)之間互不重疊,如圖2-2(f)所示,這樣就能無(wú)失真地從ST(f)中分離出信號(hào)s(t)的頻譜S(f),并能容易地從S(f)中得到s(t),即能從抽樣信號(hào)中準(zhǔn)確地恢復(fù)出原信號(hào)。圖2-2理想抽樣(a)低通模擬信號(hào)波形;(b)低通模擬信號(hào)頻譜;(c)周期單位沖激脈沖波形;(d)周期單位沖激脈沖頻譜;

(e)抽樣信號(hào)波形;

(f)

抽樣信號(hào)頻譜

圖2-2理想抽樣(a)低通模擬信號(hào)波形;(b)低通模擬信號(hào)頻譜;(c)周期單位沖激脈沖波形;(d)周期單位沖激脈沖頻譜;

(e)抽樣信號(hào)波形;

(f)

抽樣信號(hào)頻譜

抽樣頻率fs的選取對(duì)信號(hào)恢復(fù)會(huì)有什么影響?下面分三種情況加以討論。

(1)若選取fs=2fm,則相鄰周期的頻譜間互不重疊,如圖2-3(a)所示。頻率間隔為fs

,經(jīng)過(guò)理想低通濾波器,理論上可以由抽樣信號(hào)恢復(fù)原信號(hào),但需要無(wú)限陡峭截止邊緣的濾波器,這種理想低通濾波器是無(wú)法實(shí)現(xiàn)的。

(2)若選取fs<2fm,即欠抽樣,則相鄰周期的頻譜將發(fā)生頻譜重疊,稱為混疊,如圖2-3(b)所示。因此不能從ST(f)中準(zhǔn)確地分離出信號(hào)s(t)的頻譜S(f),某些信息將會(huì)丟失。

(3)若選取fs>2fm,即過(guò)抽樣,如圖2-3(c)所示,用一個(gè)截止頻率為fm的理想低通濾波器就能準(zhǔn)確地從抽樣信號(hào)中恢復(fù)出原信號(hào)。因此,在實(shí)際工作中,常選取fs≥2.2fm。例如話音信號(hào)的最高頻率限制在3400Hz,這時(shí)滿足抽樣定理的最低頻率應(yīng)為fsmin=6800Hz,為了防止抽樣混疊,需要留有一定的過(guò)渡帶寬(又稱保護(hù)帶),ITU-T規(guī)定話音信號(hào)的抽樣頻率為8000Hz,這樣就留有8000-6800=1200Hz作為濾波器的過(guò)渡帶寬,這樣就可以降低對(duì)濾波器的要求。

2-3抽樣頻率的選取對(duì)信號(hào)恢復(fù)的影響

應(yīng)當(dāng)指出,抽樣頻率fs并非越高越好,fs越高,數(shù)據(jù)量就越大,信道的利用率就越低。

通常只要滿足fs

>2fm,并留有一定頻寬的過(guò)渡帶寬即可。

2)自然抽樣實(shí)際中由于理想的單位沖激脈沖序列δT(t)是不可能獲得的,因此通常采用的抽樣脈沖fT(t)是一個(gè)周期為Ts、脈沖寬度為τ、幅度為1/τ的矩形脈沖序列,又稱為開(kāi)關(guān)信號(hào),如圖2-4(b)所示。模擬信號(hào)s(t),如圖2-4(a)所示,與開(kāi)關(guān)信號(hào)fT(t)相乘,得到如圖2-4(c)所示抽樣信號(hào)sT(t)。圖

2-4自然抽樣

之所以稱為自然抽樣,是因?yàn)槌闃有盘?hào)sT(t)中每個(gè)脈沖的頂部保持了脈沖時(shí)間間隔內(nèi)相應(yīng)的模擬信號(hào)部分的形狀。

2.帶通模擬信號(hào)的抽樣

以上討論的抽樣定理是對(duì)低通模擬信號(hào)的情況而言的。下面我們來(lái)討論帶通模擬信號(hào)的抽樣問(wèn)題。例如,話音信號(hào)的頻帶為300~3400Hz,其帶寬B=fm-fl=3400-300=3100Hz,其中fl為帶通模擬信號(hào)的最低頻率,fm為帶通模擬信號(hào)的最高頻率。當(dāng)fl

<B時(shí),通常稱為低通信號(hào),語(yǔ)音信號(hào)fl=300Hz小于B=3100Hz,故為低通信號(hào)。當(dāng)fl

>B時(shí),通常稱為帶通信號(hào)。例如載波60路群信號(hào),其頻帶為312~552kHz,帶寬為B=552-312=240kHz,fl=312kHz大于B=240kHz,因此是帶通信號(hào)。對(duì)低通信號(hào)來(lái)說(shuō),其抽樣頻率應(yīng)滿足fs≥2fm

的條件。對(duì)帶通信號(hào)的抽樣頻率,如果仍按fs≥2fm抽樣,顯然能滿足奈奎斯特抽樣速率,但由于fs太高,降低了信道頻帶的利用率。例如,假設(shè)某帶通信號(hào)的頻帶為20~30kHz,如果按fs=2fm=2×30=60kHz,則抽樣信號(hào)的頻譜不會(huì)發(fā)生混疊現(xiàn)象,但0~20kHz這段頻譜沒(méi)有利用,顯然信道的利用率不高。問(wèn)題是如何選取帶通信號(hào)的抽樣頻率fs

。設(shè)低通模擬信號(hào)s(t)的頻譜為S(f),其最高頻率為

fm=nB+kB

0<k<1(2.2-7)

式中,n是小于fm/B的最大整數(shù)。無(wú)混疊所要求的抽樣頻率fs為

(2.2-8)

當(dāng)原信號(hào)最高頻率是寬帶的整數(shù)倍時(shí),即fm=nB,此時(shí)fm-nB=0,fs=2B,這表明:只要求抽樣頻率等于帶通信號(hào)帶寬的2倍,而不是低通信號(hào)抽樣頻率所要求的最高頻率的2倍。顯然對(duì)抽樣頻率的要求降低了,

提高了信道頻帶的利用率。

將式(2.2-7)代入式(2.2-8),

式(2.2-8)可以改寫為

式中,B為信號(hào)帶寬;n為小于fm/B的最大整數(shù),0<k<1。當(dāng)n較大時(shí),fs≈2B。2.2.2抽樣信號(hào)的標(biāo)量量化

1.量化原理經(jīng)過(guò)抽樣后,每秒得到的抽樣值(簡(jiǎn)稱樣值)的數(shù)目就已確定,但抽樣信號(hào)在幅度上仍然是連續(xù)變化的。每個(gè)樣值可有無(wú)限多種可能的幅度值,必須經(jīng)過(guò)量化將其轉(zhuǎn)換成幅度離散的數(shù)字信號(hào),即用某個(gè)特定的量化電平值代替抽樣信號(hào)幅度,

這就是我們要討論的量化問(wèn)題。

量化器的功能是按照一定的規(guī)則對(duì)抽樣信號(hào)值作近似表示,使經(jīng)量化器輸出的幅值的大小為有限個(gè)數(shù)。由于以有限個(gè)離散值近似表示無(wú)限個(gè)連續(xù)值,所以模擬信號(hào)經(jīng)過(guò)量化后必然會(huì)丟失一部分信息,產(chǎn)生誤差,這個(gè)誤差稱為量化誤差,由此產(chǎn)生的失真稱為量化失真,也稱為量化噪聲。因此,在對(duì)抽樣信號(hào)進(jìn)行量化時(shí),需要考慮以下兩個(gè)方面的問(wèn)題:

(1)若給定量化電平數(shù)L,如何使量化失真最小。

(2)若給定量化失真的要求,如何使表示每個(gè)樣值所需的平均比特?cái)?shù)最少。

2.標(biāo)量量化標(biāo)量量化也稱無(wú)記憶量化,是指對(duì)抽樣信號(hào)序列的每個(gè)樣值分別進(jìn)行量化處理,即每次只量化一個(gè)抽樣值。量化的方法是將抽樣信號(hào)的樣值幅度的最大變化范圍劃分成若干相鄰的量化區(qū)間(量化間隔),當(dāng)樣值幅度落在某一量化區(qū)間內(nèi)時(shí),其輸出就用該量化區(qū)間所對(duì)應(yīng)的某一固定離散的量化電平(量化值)來(lái)表示。

我們先來(lái)看一個(gè)例子,假設(shè)模擬信號(hào)s(t)幅度(電壓)的變化范圍為-4~+4V,每個(gè)量化間隔為1V,量化電平數(shù)共有八個(gè),落入每個(gè)量化區(qū)間內(nèi)的連續(xù)抽樣值都可用一個(gè)量化電平來(lái)近似表示,量化電平取各個(gè)量化區(qū)間電壓的中間值,如表2-2所示。例如連續(xù)抽樣值為0.8V,顯然它落在(0~1)量化區(qū)間內(nèi),其量化電平為0.5V,量化誤差=0.5-0.8=-0.3V。

2-2模擬值與量化值的關(guān)系

現(xiàn)在我們來(lái)討論更一般的情況。設(shè)模擬信號(hào)的抽樣值為s(nTs),其中Ts為抽樣周期,n為整數(shù)。如果我們用N個(gè)不同的二進(jìn)制數(shù)字碼元來(lái)表示抽樣值的幅度,則N個(gè)不同的二進(jìn)制碼元可表示L=2N個(gè)不同的抽樣值。因此必須將抽樣值的范圍劃分為L(zhǎng)個(gè)量化區(qū)間,每量化區(qū)間用一個(gè)量化電平表示,共有L個(gè)量化電平qk(k=0,1,2,…,L-1)。圖2-5是標(biāo)量量化器的模型,當(dāng)量化器的輸入s(nTs)屬于量化區(qū)間(dk,dk+1)時(shí),量化器輸出的量化值sq(nTs)為sq(nTs)=qk,dk≤s(nTs)≤dk+1

(2.2-10)

量化誤差為s(nTs)-sq(nTs),簡(jiǎn)寫為sn-sq,如圖2-5所示,每個(gè)樣值量化所需的比特?cái)?shù)為N=lbL

(2.2-11)

2-5標(biāo)量量化

在數(shù)字通信系統(tǒng)中,所傳輸?shù)男盘?hào)通常是隨機(jī)信號(hào),例如語(yǔ)音、圖像等,因此量化誤差也是一個(gè)隨機(jī)信號(hào),我們可以采用概率論和隨機(jī)過(guò)程的理論來(lái)描述它的統(tǒng)計(jì)特性。衡量量化器性能指標(biāo)的是量化信噪比,即量化器輸出信號(hào)功率與量化噪聲功率之比。假定輸入樣值信號(hào)s(nTs)(簡(jiǎn)記為sn)的概率密度為f(sn),量化噪聲的平均功率為(2.2-12)

量化器輸出信號(hào)的平均功率為

(2.2-13)

量化器的量化信噪比為

(2.2-14)

3.均勻量化均勻量化也稱為線性量化,是指整個(gè)量化區(qū)域上的各個(gè)量化間隔相等,

(2.2-15)

設(shè)模擬抽樣信號(hào)的取值范圍為[-V,V],量化級(jí)數(shù)為L(zhǎng),則均勻量化的量化間隔為Δ=2V/L。

量化電平為

k=0,1,2,…,L-1(2.2-16)

對(duì)于均勻量化,當(dāng)信源(模擬信號(hào))的概率密度函數(shù)為f(sn)時(shí),則量化噪聲的平均功率為量化器輸出信號(hào)的平均功率為

【例2-1】

已經(jīng)模擬信號(hào)抽樣值的密度函數(shù)為

若按4電平進(jìn)行均勻量化,試求信號(hào)量化噪聲功率比。

信號(hào)幅度范圍為-1≤x≤1,按4電平進(jìn)行均勻量化,量化級(jí)間隔為

量化區(qū)間的終點(diǎn)dk,k=0,1,2,3,4分別為-1,-0.5,0,0.5,1;量化電平值qk,k=1,2,3,4分別為-0.75,-0.25,0.25,0.75;量化器輸出的信號(hào)功率為

量化噪聲功率為

量化信噪比為

當(dāng)信源(模擬信號(hào))的概率密度函數(shù)f(sn)均勻分布,即時(shí),可以證明,量化信噪比為當(dāng)L>>1時(shí),上式可寫為

上式表明,均勻量化器的量化信噪比隨量化電平數(shù)L的增大而增大。通常在給定信號(hào)最大幅度的情況下,量化電平數(shù)越多,量化噪聲就越小,量化器的量化信噪比就越高,量化誤差也就越小。均勻量化的優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單,但由于量化間隔是固定的,不能隨信號(hào)的幅度而變化,當(dāng)信號(hào)較大時(shí),量化器的量化信噪比大;當(dāng)信號(hào)較小時(shí),量化器的量化噪聲較大,量化信噪比較小。為了克服該缺點(diǎn),在實(shí)際應(yīng)用中,通常采用非均勻量化,即采用量化間隔不均勻的量化,以改善小信號(hào)時(shí)的量化信噪比。

4.最佳量化由于實(shí)際信源的概率分布通常是非均勻分布的,采用均勻量化器往往難以得到最佳的量化效果。顯然,降低量化噪聲的自然選擇是要采用量化特性與信源的概率分布特性相匹配的非均勻量化器,即出現(xiàn)概率大的抽樣信號(hào)幅度可選擇較小的量化間隔,而出現(xiàn)概率較小的抽樣信號(hào)幅度可選擇較大的量化間隔,從而降低總的量化噪聲平均功率,這就是最佳量化的基本思想。

對(duì)于給定的信源,設(shè)其抽樣信號(hào)幅度的概率分布為f(sn),假定模擬抽樣信號(hào)的取值范圍為[a,b],我們以均方誤差最小來(lái)定義最佳量化,也就是使式(2.2-12)最小。通常量化電平數(shù)L較大,f(sn)在[dk,dk+1]中可視為常數(shù),對(duì)式(2.2-12)求極值可得到解最佳分層電平{dk}和最佳量化電平{qk},即令(2.2-18)

(2.2-19)

因?yàn)閐0=a,dL=b,所以式(2.2-12)只需對(duì)1≤k≤L-1求解,可得

(2.2-20)

由式(2.2-19)可得

(2.2-21)

上式表明最佳分層電平dk應(yīng)位于量化器輸出最佳量化電平qk和qk+1的中點(diǎn),而最佳量化電平qk位于概率密度f(wàn)(sn)在量化間隔(dk,dk+1)的概率質(zhì)心上。顯然,由式(2.2-21)求qk并不容易,一是積分不確定,二是dk依賴于qk。因此只能通過(guò)反復(fù)迭代的辦法來(lái)計(jì)算,其迭代步驟是:

(1)任選q0。

(2)由 ,計(jì)算d1。

(3)計(jì)算q1=2d1-q0。

(4)繼續(xù)該過(guò)程直到計(jì)算出qL-1

。

(5)檢驗(yàn)qL-1是否為dL-1至dL段的概率質(zhì)心,即 是否成立(在一定誤差范圍內(nèi))。若成立,則結(jié)束;反之,選取另一個(gè)q0,重復(fù)(2)~(5)。這就是Max-Lloyd算法,由該算法得到的量化器稱為L(zhǎng)loyd量化器或Max量化器。由于最佳標(biāo)量量化器的實(shí)現(xiàn)比較困難,因此,該算法的理論意義大于其實(shí)用價(jià)值:一是為標(biāo)量量化的設(shè)計(jì)提供了一個(gè)基準(zhǔn),二是其設(shè)計(jì)思想可推廣到矢量量化。

5.壓擴(kuò)量化

在實(shí)際應(yīng)用中,對(duì)不同的信源概率分布使用不同的非均勻量化器是不太現(xiàn)實(shí)的。實(shí)現(xiàn)非均勻量化的有效方法之一是采用壓縮擴(kuò)張技術(shù),即壓擴(kuò)量化。壓擴(kuò)量化的基本原理是在發(fā)送端對(duì)輸入量化器的信號(hào)先用一個(gè)非線性函數(shù)變換y=c(x)壓縮后再進(jìn)行均勻量化;在接收端則用該非線性函數(shù)的反函數(shù)x=c-1(y)對(duì)量化值進(jìn)行“擴(kuò)張”,從而可恢復(fù)原信號(hào),如圖2-6所示。壓縮的目的是將小信號(hào)放大,將大信號(hào)縮??;擴(kuò)張的目的與壓縮相反。圖

2-6壓擴(kuò)量化原理框圖

壓擴(kuò)量化適合于小信號(hào)出現(xiàn)概率較大的情況,如語(yǔ)音信號(hào),由于信號(hào)幅度較小時(shí),量化間隔小,因此量化誤差較小。盡管大信號(hào)的量化誤差會(huì)變大,但因其出現(xiàn)概率小,故總的量化誤差還是減小了,從而提高了量化信噪比。對(duì)話音信號(hào),國(guó)際電信聯(lián)盟(ITU-T)制定了兩種對(duì)數(shù)壓縮律,即A壓縮律和μ壓縮律。我國(guó)大陸、歐洲各國(guó)以及國(guó)際間互連時(shí)采用A壓縮律及相應(yīng)的13折線法,北美、日本等國(guó)家采用μ壓縮律及相應(yīng)的15折線法。

1)A壓縮律A壓縮律的對(duì)數(shù)特性為

(2.2-22)

式中,x為壓縮器歸一化輸入電壓;y為壓縮器歸一化輸出電壓;A為常數(shù)(A=87.56),決定壓縮程度。2)μ壓縮律μ壓縮律的對(duì)數(shù)特性為

(2.2-23)

式中,x為壓縮器歸一化輸入電壓;y為壓縮器歸一化輸出電壓;μ為常數(shù)(μ=255),決定壓縮程度。2.2.3矢量量化

1.基本原理矢量量化不僅是一種非常有效的量化技術(shù),更是一種高效率的壓縮編碼技術(shù)。其基本思想是:將若干個(gè)時(shí)間離散幅度連續(xù)的抽樣值分成一組,形成多維矢量空間的一個(gè)矢量,再對(duì)該矢量進(jìn)行量化處理,從而有效地提高量化效率,

如圖

2-7所示。

2-7矢量量化原理框圖

設(shè)抽樣信號(hào)由N·K個(gè)抽樣值組成,將每K個(gè)抽樣值分為一組,形成N個(gè)K維隨機(jī)矢量,所構(gòu)成的信源空間為X={X1,X2,…,XN},其中第j個(gè)矢量可記為Xj=(xj1,xj2,…,xjK)

T,j=1,2,…,N

式中,xj1,xj2,…,xjK是K個(gè)時(shí)間離散幅度連續(xù)的抽樣值。

矢量量化器中,輸入矢量Xj被量化為另一幅度離散的K維實(shí)數(shù)矢量Yi,i=1,2,…,L。所有Yi構(gòu)成輸出空間Y,也稱碼書(shū)(或碼本),Y={Y1,Y2,…,YL},其中第i個(gè)碼矢(或碼字)Yi=(yi1,yi2,…,yiK)T,

i=1,2,…,L

式中,yi1,yi2,…,yiK是K個(gè)時(shí)間離散、幅度離散的值,L是碼書(shū)長(zhǎng)度。矢量量化可歸納為用Yi代表Xj,即Yi=Q(Xj),1≤i≤L,1≤j≤N

(2.2-24)

式中,Q為量化函數(shù)。

在矢量量化器中,信道所傳輸?shù)男畔⒉皇荵i本身,而是Yi在碼書(shū)中的位置信息i。如果將碼書(shū)Y看作是一本有L頁(yè)的字典,每頁(yè)代表一個(gè)Yi,i代表其頁(yè)號(hào)。L個(gè)碼字需要lbL個(gè)比特來(lái)表示。因此,可得到矢量量化的比特率,即(2.2-25)

式中,lbL為每個(gè)矢量所需要的編碼比特?cái)?shù);K為每個(gè)矢量所包含的樣值數(shù)。顯然,當(dāng)K=1時(shí)矢量量化變?yōu)闃?biāo)量量化。理論上,在L一定的情況下,K越大,壓縮效率越高,但量化失真也就越大。

量化失真的大小與碼書(shū)的設(shè)計(jì)好壞密切相關(guān)。

2.碼書(shū)設(shè)計(jì)

當(dāng)矢量Xj量化為Yi時(shí),會(huì)產(chǎn)生量化失真,通常X的分類越細(xì),碼書(shū)中的碼矢越多,失真就越小,因此只要適當(dāng)?shù)剡x取碼矢數(shù)量,就能控制失真量不超過(guò)給定值。矢量量化器的任務(wù)就是在給定比特率的條件下,使總的量化失真最小,矢量量化的關(guān)鍵在于碼書(shū)設(shè)計(jì)。在矢量量化器中,碼書(shū)設(shè)計(jì)的原則是量化失真最小。具體講,就是尋找一個(gè)L元最佳量化器Q,使其平均失真D(Q)最小,即(2.2-26)

最佳量化器Q的設(shè)計(jì)也就是最佳碼書(shū)的設(shè)計(jì),最佳矢量量化器設(shè)計(jì)主要表現(xiàn)在以下兩個(gè)方面:(1)如何劃分RK(K維歐里幾德空間)以得到合適的L個(gè)子空間Ri,對(duì)RK的分割應(yīng)滿足Ri={X∈RK:d(X,Yi)≤d(X,Yj);i≠j}該分割稱為Voronoi分割。

(2)如何從這L個(gè)子空間Ri中選取各自合適的代表矢量Yi,即當(dāng)子空間分割X∈Ri確定時(shí),Voronoi胞腔的質(zhì)心就是矢量量化器的碼矢,即(2.2-28)

對(duì)此,Linde、Buzo和Gray將最佳標(biāo)量量化的Lloyd-Max算法推廣到了多維空間,提出了最佳碼書(shū)設(shè)計(jì)的LBG算法。LBG算法既可以根據(jù)信源概率分布來(lái)產(chǎn)生,也可以是基于訓(xùn)序列的,下面是基于訓(xùn)練序列的LBG算法:

(1)給定碼字的長(zhǎng)度L,相對(duì)失真門限值ε,初始碼書(shū)Y(0),訓(xùn)練序列TS={Xn;n=1,2,…,N},N>>L。(2)對(duì)碼書(shū)Y(m)={Yi(m)

;i=1,2,…,L},從迭代次數(shù)m=0開(kāi)始,以實(shí)現(xiàn)對(duì)訓(xùn)練序列TS的最小失真分割,即若對(duì)所有的j=1,2,…,L都成立,則判定Xn∈Ri,其失真測(cè)度通常采用均方誤差(或歐氏距離),即式中,yik(m)

為第m次迭代得到的碼書(shū)Y(m)中碼字Y(m)的第k個(gè)分量;xnk為Xn的第k個(gè)分量。(3)

計(jì)算平均失真:若 ,D(m)小于允許的平均失真D(取D(-1)=∞),則輸入Y(m)作為碼書(shū),結(jié)束迭代過(guò)程;否則進(jìn)行下一步。(4)求出各分割的幾何中心(算術(shù)平均值)Gi,i=1,2,…,L;取m=m+1,并令新碼書(shū)回到步驟(2)繼續(xù)迭代。

3.初始碼書(shū)的選定采用LBG算法設(shè)計(jì)碼書(shū)時(shí),初始碼書(shū)的選擇比較重要,常用的方法有隨機(jī)法和分裂法。隨機(jī)法是指從訓(xùn)練序列中隨機(jī)選取L個(gè)矢量作為初始碼字,隨機(jī)法的優(yōu)點(diǎn)之一是不需要進(jìn)行初始化計(jì)算,從而可大大減少計(jì)算時(shí)間;隨機(jī)法的另一個(gè)優(yōu)點(diǎn)是由于初始碼字選自訓(xùn)練序列中,因此不存在空胞腔問(wèn)題。隨機(jī)法的缺點(diǎn)之一是可能會(huì)選到一些非典型的矢量作碼字,導(dǎo)致該胞腔只有很少矢量,甚至只有一個(gè)初始碼字,而且每次迭代又都保留這些非典型矢量或非典型矢量的質(zhì)心。隨機(jī)法的另一個(gè)缺點(diǎn)是會(huì)造成某些空間把胞腔分得過(guò)細(xì),而有些空間分得太大。

這兩個(gè)缺點(diǎn)都會(huì)導(dǎo)致碼書(shū)中有限個(gè)碼字得不到充分利用,從而影響碼書(shū)的性能。

分裂法也由Linde、Buzo和Gray提出,具體步驟是:

(1)計(jì)算所有訓(xùn)練序列TS的質(zhì)心,將此質(zhì)心作為第一個(gè)碼字Y1(0)。

(2)用一個(gè)合適的參數(shù)A乘以碼字Y1(0),形成第二個(gè)碼字Y2(0)

。

(3)以碼字Y1(0)

、Y2(0)作為簡(jiǎn)單的初始碼書(shū),即用前面的LBG算法設(shè)計(jì)僅含兩個(gè)碼字的碼書(shū)Y(m)={Y1(m),Y2(m)

}。

(4)將碼書(shū)Y(m)中的兩個(gè)碼字Y1(m)

、Y2(m)分別乘以合適的參數(shù)B,得到四個(gè)碼字Y1(m)

、Y2(m)

、BY1(m)、BY2(m)

。

(5)以這四個(gè)碼字為基礎(chǔ),按步驟(3)生成四個(gè)碼字的碼書(shū),再乘以合適的參數(shù)C將碼字?jǐn)U大為八個(gè)。如此反復(fù),經(jīng)過(guò)lbL次迭代計(jì)算,就可得到L個(gè)碼字的初始碼書(shū)。一般來(lái)說(shuō),采用分裂法得到的初始碼書(shū),其性能較好,但這是以計(jì)算量的陡增為代價(jià)的。

4.降低復(fù)雜度矢量量化的復(fù)雜度隨矢量維數(shù)呈指數(shù)增長(zhǎng),復(fù)雜度主要指運(yùn)算量和存儲(chǔ)量。前面介紹的矢量量化器采用的是全搜索算法。當(dāng)矢量維數(shù)K和碼書(shū)長(zhǎng)度L較大時(shí),矢量量化器的復(fù)雜度很大,因此在實(shí)際應(yīng)用中,人們致力于研究各種降低矢量量化復(fù)雜度的方法,例如尋找好的快速搜索算法,

使碼書(shū)結(jié)構(gòu)化等。

1)樹(shù)形搜索矢量量化器樹(shù)形搜索可分為二叉樹(shù)和多叉樹(shù)。二叉樹(shù)碼書(shū)大小L=2K,K為正整數(shù)。在形成二叉樹(shù)碼書(shū)時(shí),首先形成僅包含兩個(gè)碼字Y0和Y1的碼書(shū)。然后根據(jù)分割原則(Voronoi分割)將所有輸入矢量的集合為兩個(gè)子集,各以Y0和Y1為質(zhì)心。下一步對(duì)這兩個(gè)子集再分別進(jìn)行矢量量化,形成四個(gè)碼字Y00,Y01,Y10,Y11

的碼書(shū)。由上面的四個(gè)碼字為質(zhì)心,繼續(xù)往下分裂,分裂K次后可得L=2K個(gè)碼字。圖2-8給出了L=23=8個(gè)碼字的分裂過(guò)程,共K=3層。圖

2-8二叉樹(shù)矢量量化器(L=8)

二叉樹(shù)算法完成搜索所需的失真計(jì)算次數(shù)為2K次,失真大小比較次數(shù)為K次;而全搜索時(shí)失真計(jì)算次數(shù)為2K次,失真大小比較為2K-1次。顯然,當(dāng)K值較大時(shí),二叉樹(shù)算法的復(fù)雜度將大大降低。

2)多級(jí)矢量量化器多級(jí)矢量量化器由若干個(gè)普通矢量量化器級(jí)聯(lián)而成,如圖2-9所示。它的第一級(jí)是一個(gè)包含L1個(gè)碼字的碼書(shū)1的矢量量化器,對(duì)每一個(gè)輸入矢量Xj,矢量量化器從碼書(shū)1中找到與之匹配的碼字Yi(1)

,并計(jì)算出Xj與Yi(1)的誤差矢量Δ(Xj-Yi(1)

)。該誤差矢量作為第二級(jí)矢量量化器的輸入,第二級(jí)矢量量化器包含一個(gè)L2個(gè)碼字的碼書(shū)2。這樣就構(gòu)成了多級(jí)矢量量化器。多級(jí)矢量量化器無(wú)論在搜索計(jì)算量方面還是減少碼字存儲(chǔ)量方面都有明顯的效果。圖

2-9多級(jí)矢量量化器

2.2.4編碼

這里的編碼是指對(duì)量化樣值進(jìn)行編碼,常用的方法有自然二進(jìn)制碼和折疊二進(jìn)制碼,如表2-3所示。表中,16個(gè)量化值分成兩部分:序號(hào)0~7的量化值對(duì)應(yīng)于負(fù)極性電壓,

序號(hào)

8~15的量化值對(duì)應(yīng)于正極性電壓。

2-3自然二進(jìn)制碼和折疊二進(jìn)制碼

對(duì)于自然二進(jìn)制碼,上述兩部分之間沒(méi)有什么關(guān)聯(lián)。但對(duì)于折疊二進(jìn)制,則存在折疊關(guān)系,除了其最高位符號(hào)相反外,其上下兩部分是對(duì)稱排列的。折疊碼在應(yīng)用時(shí)可用最高位來(lái)表示電壓的正、負(fù)極性,而用其他位來(lái)表示電壓的絕對(duì)值,因而適合于對(duì)雙極性信號(hào)的編碼。折疊碼的另一個(gè)優(yōu)點(diǎn)是如果最高位出現(xiàn)誤碼,相當(dāng)于信號(hào)的極性發(fā)生反轉(zhuǎn),這時(shí)誤差的大小與信號(hào)電壓成正比,因此小信號(hào)時(shí)產(chǎn)生的誤差較小,這對(duì)于出現(xiàn)概率大的話音信號(hào)很適合。例如,碼組1000發(fā)生1位差錯(cuò)變?yōu)?000,若用自然二進(jìn)碼,則其電壓值由8變成了0,其誤差為8;若用折疊碼,則其電壓值由8變成了7,其誤差為1。因此,在實(shí)際中大多采用折疊二進(jìn)制碼。

2.3語(yǔ)

2.3.1語(yǔ)音編碼概述

1.語(yǔ)音編碼分類

2-4語(yǔ)音編碼分類

(1)波形編碼是從語(yǔ)音信號(hào)的時(shí)域波形出發(fā),以精確再現(xiàn)原話音的波形為目的,對(duì)波形的抽樣值、預(yù)測(cè)值或預(yù)測(cè)誤差值進(jìn)行編碼,目的是盡可能降低表示每個(gè)語(yǔ)音樣值的比特?cái)?shù),同時(shí)保持相對(duì)好的語(yǔ)音質(zhì)量,力求使重建信號(hào)波形接近原信號(hào)波形。波形編碼的優(yōu)點(diǎn)是適應(yīng)能力強(qiáng)、

算法簡(jiǎn)單、

易于實(shí)現(xiàn)、

語(yǔ)音質(zhì)量好;

缺點(diǎn)是編碼速率較高。

(2)參數(shù)編碼是從語(yǔ)音信號(hào)產(chǎn)生的機(jī)理出發(fā),以語(yǔ)音信號(hào)產(chǎn)生的數(shù)字模型為基礎(chǔ),對(duì)數(shù)字語(yǔ)音信號(hào)進(jìn)行分析,提取描述語(yǔ)音信號(hào)的特征參數(shù),這些特征參數(shù)攜帶有語(yǔ)音信號(hào)的主要信息,因此只需要很少的比特來(lái)表示這些特征參數(shù),在解碼端可以由這些特征參數(shù)來(lái)重新合成語(yǔ)音信號(hào)。參數(shù)編碼的壓縮效率取決于語(yǔ)音特征參數(shù)的分析和提取,以及使用何種類型的合成器。參數(shù)編碼方法不是以重建語(yǔ)音信號(hào)波形為目的,而是力求使重建語(yǔ)音信號(hào)具有盡可能高的可懂度。

參數(shù)編碼的優(yōu)點(diǎn)是編碼速率低,

缺點(diǎn)是合成的語(yǔ)音自然度較差。

(3)混合編碼是一種綜合波形編碼和參數(shù)編碼的方法,在保留參數(shù)編碼優(yōu)點(diǎn)的基礎(chǔ)上,引入波形編碼算法,

力求盡可能改善語(yǔ)音的自然度,

提高語(yǔ)音質(zhì)量。

2.語(yǔ)音編碼的主要性能指標(biāo)

1)語(yǔ)音質(zhì)量自然度和可懂度是衡量語(yǔ)音質(zhì)量的兩大指標(biāo)。在數(shù)字通信中,語(yǔ)音質(zhì)量通??煞譃樗募?jí):廣播級(jí)質(zhì)量、長(zhǎng)途通信質(zhì)量、通信質(zhì)量、合成語(yǔ)音質(zhì)量。廣播級(jí)語(yǔ)音質(zhì)量為高質(zhì)量的寬帶(8kHz)廣播解說(shuō)語(yǔ)音;長(zhǎng)途電話質(zhì)量為與傳統(tǒng)模擬電話帶寬(300~3400Hz)語(yǔ)音信號(hào)相當(dāng)?shù)馁|(zhì)量;通信質(zhì)量是指語(yǔ)音質(zhì)量有所下降,但仍保證足夠高的自然度和可懂度,能滿足大多數(shù)專用通信系統(tǒng)的要求;合成語(yǔ)音質(zhì)量是語(yǔ)音仍保持足夠高的可懂度,

但在自然度及保留說(shuō)話者個(gè)性特色等方面不夠好。

目前,評(píng)價(jià)語(yǔ)音質(zhì)量的方法有主觀評(píng)價(jià)和客觀評(píng)價(jià)。主觀評(píng)價(jià)是以人在聽(tīng)話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺(jué)來(lái)評(píng)定的,常用的方法是采用表2-5所示的五級(jí)質(zhì)量MOS(平均意見(jiàn)得分,簡(jiǎn)稱MOS分)判分,即多人聽(tīng)完測(cè)試語(yǔ)音后打分,求平均得分。由于受主、客觀因素的影響,每次所測(cè)得的MOS分可能存在差異,因此,要求參加聽(tīng)音測(cè)試的人數(shù)足夠多、所測(cè)語(yǔ)音素材也需足夠豐富,

同時(shí)盡量保持相同的測(cè)試條件。

2-5MOS分五級(jí)標(biāo)準(zhǔn)及對(duì)應(yīng)的語(yǔ)音質(zhì)量

客觀評(píng)價(jià)通常采用信噪比作為評(píng)價(jià)尺度,即抽樣信號(hào)方差σ2s與重建誤差信號(hào)方差σ2e的比值,則

(2.3-1)

2)編碼速率

編碼速率可用“比特/秒(b/s)”來(lái)度量,它表示傳輸每秒鐘的語(yǔ)音信號(hào)所需的比特?cái)?shù);也可以用“比特/樣值”度量,它表示平均每個(gè)樣值用多少比特編碼。從語(yǔ)音壓縮的角度來(lái)看,編碼速率是體現(xiàn)語(yǔ)音壓縮編碼算法效率的重要指標(biāo)。而從通信的角度看,編碼速率應(yīng)與業(yè)務(wù)質(zhì)量和數(shù)字傳輸體制相適應(yīng)。編碼速率越高,語(yǔ)音質(zhì)量越好,但要求傳輸帶寬就越大。

3)編解碼延時(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行分析、壓縮、解壓縮等處理會(huì)產(chǎn)生明顯的編解碼延時(shí)。一般來(lái)說(shuō),語(yǔ)音編碼的算法越復(fù)雜,所產(chǎn)生的編解碼延時(shí)就越大。通常要求語(yǔ)音編解碼的延時(shí)應(yīng)限制在100ms以內(nèi)。

4)算法復(fù)雜度通常,語(yǔ)音編碼算法的復(fù)雜度與語(yǔ)音質(zhì)量有比較密切的關(guān)聯(lián)。在相同編碼速率的情況下,采用更復(fù)雜的算法能獲得更好的語(yǔ)音質(zhì)量。但算法的復(fù)雜度會(huì)增加硬件和軟件實(shí)現(xiàn)的難度,增加設(shè)備的成本。大多數(shù)實(shí)用的算法都是在保持語(yǔ)音質(zhì)量的前提下,盡可能降低算法的復(fù)雜度。

3.語(yǔ)音編碼的主要途徑

語(yǔ)音編碼的主要途徑有:

(1)利用語(yǔ)音信號(hào)的冗余度,并設(shè)法除去之,從而達(dá)到壓縮語(yǔ)音數(shù)據(jù)的目的。語(yǔ)音信號(hào)的冗余度主要來(lái)源于:語(yǔ)音信號(hào)幅度分布的非均勻性和樣值之間的相關(guān)性。語(yǔ)音信號(hào)的長(zhǎng)時(shí)和短時(shí)幅度統(tǒng)計(jì)特性表明,語(yǔ)音信號(hào)小幅度(小信號(hào))出現(xiàn)的概率大,大幅度(大信號(hào))出現(xiàn)的概率小。語(yǔ)音信號(hào)樣值之間存在很強(qiáng)的相關(guān)性。

(2)利用人類的發(fā)音機(jī)理,語(yǔ)音是由肺部呼出的氣流通過(guò)聲門形成的激勵(lì)信號(hào)聲道,再經(jīng)口唇輻射而產(chǎn)生的。我們可通過(guò)對(duì)語(yǔ)音信號(hào)形成機(jī)理的分析來(lái)構(gòu)造語(yǔ)音生成模型,這樣只需傳輸該模型的特征參數(shù)來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的高效壓縮。

(3)利用人耳的聽(tīng)覺(jué)特性,例如人類聽(tīng)覺(jué)的“掩蓋效應(yīng)”,即一個(gè)強(qiáng)的聲音能抑制另一個(gè)同時(shí)存在弱的聲音,“噪聲譜形變技術(shù)”利用該特性來(lái)抑制與語(yǔ)音信號(hào)同時(shí)存在的量化噪聲。同時(shí),由于人類的聽(tīng)覺(jué)系統(tǒng)對(duì)低頻聲音比較敏感,而對(duì)高頻聲音不敏感,因此,可以采用“子帶編碼技術(shù)”。有人類的聽(tīng)覺(jué)對(duì)信號(hào)的相位特性不敏感,線性預(yù)測(cè)聲碼器就利用了該特性,由于無(wú)需傳送語(yǔ)音的相位信息,因此能顯著降低數(shù)碼率。感覺(jué)加權(quán)濾波器頻率特性中的峰、谷值正好與語(yǔ)音譜相反,它能改變實(shí)際誤差信號(hào)的頻譜,使其具有與語(yǔ)音信號(hào)譜類似的包絡(luò)。這種處理正好與人耳感覺(jué)上的“掩蓋效應(yīng)”相吻合,因而能產(chǎn)生較好的主觀聽(tīng)覺(jué)效果。

4.語(yǔ)音編碼標(biāo)準(zhǔn)

1)ITU-T制定的語(yǔ)音編碼標(biāo)準(zhǔn)國(guó)際電信聯(lián)盟—電信標(biāo)準(zhǔn)化部門(ITU-T)負(fù)責(zé)制定長(zhǎng)途電話標(biāo)準(zhǔn)的國(guó)際標(biāo)準(zhǔn)化組織。到目前為止,

ITU-T已經(jīng)制定了若干個(gè)語(yǔ)音編碼標(biāo)準(zhǔn),

如表

2-6所示。

2-6ITU-T制定的語(yǔ)音編碼標(biāo)準(zhǔn)

2)數(shù)字蜂窩移動(dòng)通信的語(yǔ)音編碼標(biāo)準(zhǔn)數(shù)字蜂窩移動(dòng)通信的語(yǔ)音編碼標(biāo)準(zhǔn)主要由一些地區(qū)性標(biāo)準(zhǔn)化組織制定。歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)(ETSI)負(fù)責(zé)制定歐洲數(shù)字蜂窩移動(dòng)通信標(biāo)準(zhǔn),1988年ETSI通過(guò)了GSM標(biāo)準(zhǔn),其語(yǔ)音編碼采用編碼速率為13kb/s的長(zhǎng)時(shí)預(yù)測(cè)規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(RPE-LTP)算法。北美電信工業(yè)協(xié)會(huì)(TIA)負(fù)責(zé)制定北美數(shù)字蜂窩移動(dòng)通信標(biāo)準(zhǔn),1989年通過(guò)了IS-54標(biāo)準(zhǔn),其語(yǔ)音編碼采用編碼速率為8kb/s的矢量和激勵(lì)線性預(yù)測(cè)(VSELP)算法。1993年,TIA又通過(guò)了IS-95CDMA數(shù)字蜂窩電話標(biāo)準(zhǔn),其語(yǔ)音編碼采用8.5~0.8kb/s的碼激勵(lì)線性預(yù)測(cè)(QCELP)變速率編碼算法。表

2-7給出了各種數(shù)字蜂窩移動(dòng)通信系統(tǒng)的語(yǔ)音編碼標(biāo)準(zhǔn)。

2-7數(shù)字蜂窩移動(dòng)通信系統(tǒng)的語(yǔ)音編碼標(biāo)準(zhǔn)

3)其他語(yǔ)音編碼標(biāo)準(zhǔn)美國(guó)國(guó)防部(DOD)制定的聯(lián)邦標(biāo)準(zhǔn)FS-1015采用2.4kb/s的10階LPC聲碼器,FS-1016標(biāo)準(zhǔn)(4.8kb/s)采用CELP算法。

國(guó)際海事衛(wèi)星組織(INMARSAT)制定的語(yǔ)音編碼標(biāo)準(zhǔn),采用改進(jìn)型多帶激勵(lì)(IMBE)算法,編碼速率為4.15kb/s,與傳統(tǒng)的LPC聲碼器相比,IMBE算法明顯改善了合成語(yǔ)音的自然度、可懂度和抗噪聲能力。

2.3.2語(yǔ)音信號(hào)的波形編碼

1.脈沖編碼調(diào)制(PCM)

1)抽樣脈沖編碼調(diào)制的編碼過(guò)程可以用圖2-10所示的原理框圖來(lái)說(shuō)明,其步驟是:首先用一個(gè)抗混疊濾波器將輸入模擬語(yǔ)音信號(hào)的頻譜限制到適當(dāng)?shù)膶挾?;然后以稍高于奈奎斯特抽樣速率的頻率對(duì)語(yǔ)音信號(hào)進(jìn)行等間隔抽樣,并對(duì)抽樣值進(jìn)行量化;最后用一組二進(jìn)制編碼表示各量化后的抽樣值,形成PCM數(shù)字語(yǔ)音信號(hào)。

2-10PCM編碼原理圖

由于語(yǔ)音信號(hào)頻譜包含4kHz以上的頻率成分,因此為了防止混疊失真和噪聲干擾,必須在抽樣前使用一個(gè)抗混疊濾波器來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行濾波。同時(shí),為了防止50Hz市電頻率干擾,

抗混疊濾波器實(shí)際上做成一個(gè)100~3400Hz的帶通濾波器。

2)量化語(yǔ)音信號(hào)的抽樣速率fs通常取8kHz,即每秒產(chǎn)生8000個(gè)樣值,如果采用均勻量化,一般認(rèn)為每樣值11比特的均勻量化PCM系統(tǒng)就能滿足高質(zhì)量的電話通信要求。G.711定義了兩種非均勻量化的對(duì)數(shù)PCM:A律13折線壓擴(kuò)和μ律15折線壓擴(kuò),采用8比特非線性編碼。由于我國(guó)采用A壓縮律,

故下面介紹A律13折線法。

式(2.2-22)的A壓縮律表示式是一條連續(xù)的平滑曲線,可采用數(shù)字電路來(lái)近似實(shí)現(xiàn),如圖2-11所示。具體實(shí)現(xiàn)方法是:對(duì)x軸在0~±1(歸一化)范圍內(nèi)以1/2遞減規(guī)律分成8個(gè)不均勻段,其分段點(diǎn)為±1/2,±1/4,±1/8,±1/16,±1/32,±1/64,±1/128;對(duì)y軸在0~±1(歸一化)范圍內(nèi)以均勻分段方式分成8個(gè)均勻段,其分段點(diǎn)為±1/8,±2/8,±3/8,±4/8,±5/8,±6/8,±7/8和±1。從原點(diǎn)出發(fā),將各段對(duì)應(yīng)的分界點(diǎn)連成折線。圖2-11采用數(shù)字電路近似實(shí)現(xiàn)A律13折線(a)8段折線的分段;

(b)A律13折線壓縮特性

由于正、負(fù)方向各有八段折線,因此一共有16段折線。鑒于正、負(fù)方向Ⅰ、Ⅱ段斜率相同,可看作為一段折線,因此共13段折線,如表2-8所示。在每段折線內(nèi)再進(jìn)行16級(jí)均勻量化,總的量化電平數(shù)為L(zhǎng)=16×16=256,對(duì)應(yīng)的編碼比特?cái)?shù)為8位,最小量化間隔位于第Ⅰ、Ⅱ段,即Δ稱為一個(gè)量化單位,由于正負(fù)信號(hào)區(qū)間(0,1)和(-1,0)內(nèi)各包括2048個(gè)量化單位,

因此總共有2×2048=4096個(gè)量化單位。

2-8

按A律特性和折線求X值的對(duì)比

3)編碼

PCM采用折疊二進(jìn)制碼,8位碼組a1a2…a8的碼位安排如下:a1為極性碼,a1=1表示正極性,反之表示負(fù)極性;a2a3a4為段落碼,共8種組合,分別表示對(duì)應(yīng)的8個(gè)分段,第Ⅰ段至第Ⅷ段,通常采用自然碼;a5a6a7a8為段內(nèi)電平碼,共16種組合,表示每段的16個(gè)分級(jí),通常采用自然碼。表2-9是A律13折線編碼碼位與電平的對(duì)應(yīng)關(guān)系。其中量化段序號(hào)表示量化電平所屬的量化段,例如電平638Δ就屬于第Ⅶ量化段。由段落碼可以確定各量化段的起始電平和各量化段的量化間隔Δi(每一段的最小量化間隔),例如第Ⅰ段ΔⅠ=(1/128)÷16=1/2048=Δ。段內(nèi)碼是表示相對(duì)于該量化段中各碼位的權(quán)值,例如第Ⅳ段時(shí),a5碼位的權(quán)值為8Δi=8×4Δ=32Δ;第Ⅷ段時(shí),a5碼位的權(quán)值為8Δi=8×64Δ=512Δ。表

2-9A律13折線編碼碼位與電平的對(duì)應(yīng)關(guān)系

2.差值脈沖編碼調(diào)制(DPCM)

由于語(yǔ)音信號(hào)相鄰樣值之間存在著很強(qiáng)的相關(guān)性,即語(yǔ)音信號(hào)的一個(gè)抽樣值與相鄰的一個(gè)抽樣值的差值幅度范圍一定遠(yuǎn)小于原信號(hào)抽樣值的幅度范圍。因此,在保持相同語(yǔ)音質(zhì)量的條件下,可以減少量化電平數(shù),降低數(shù)碼率。語(yǔ)音信號(hào)的自相關(guān)性越強(qiáng),壓縮率就越大。這就是差值脈沖編碼調(diào)制的基本原理。

(2.3-2)

差值脈沖編碼調(diào)制通常采用預(yù)測(cè)方式來(lái)實(shí)現(xiàn)。所謂預(yù)測(cè)是指利用信號(hào)在某一時(shí)間以前的狀態(tài)來(lái)對(duì)它的未來(lái)值做出估值。例如,其信號(hào)的最高頻為fm,設(shè)以1/Ts的速率(fs=1/Ts≥2fm)對(duì)信號(hào)s(t)進(jìn)行抽樣,在t=nTs時(shí)刻前可得到s(nTs-Ts),s(nTs-2Ts),…,s(nTs-NTs)等一組抽樣值,用前面N個(gè)抽樣值來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的樣值。編碼信號(hào)只是當(dāng)前樣值與預(yù)測(cè)值之間的差值,如圖2-12所示。其中,s(nTs)為當(dāng)前的信源樣值,預(yù)測(cè)器的輸入s(nTs)為重建語(yǔ)音信號(hào)。預(yù)測(cè)值的輸出為^式中,ci為不同時(shí)刻抽樣值的加權(quán)系數(shù),顯然通過(guò)改變調(diào)整ci值,可使預(yù)測(cè)值s(nTs)更接近于s(nTs)。s(nTs)與s(nTs)的差值為~~

差值編碼就是對(duì)e(nTs)進(jìn)行量化和編碼,如圖2-12所示。在接收端為了恢復(fù)原信號(hào)也必須進(jìn)行與發(fā)送端相同的預(yù)測(cè)。

2-12DPCM原理框圖

差值e(nTs)作為量化器的輸入,eq(nTs)為量化器的輸出。量化后的每個(gè)預(yù)測(cè)誤差eq(nTs)被編碼成二進(jìn)制數(shù)字序列,通過(guò)信道傳送到接收端。在本地該誤差eq(nTs)被加到本地與預(yù)測(cè)值s(nTs)相加而得到s(nTs)。

接收端采用與發(fā)送端相同的預(yù)測(cè)器,預(yù)測(cè)器的輸出s(nTs)與eq(nTs)相加產(chǎn)生s(nTs)。s(nTs)既是所要求的預(yù)測(cè)器的激勵(lì)信號(hào),也是所要求的接收語(yǔ)音重建信號(hào)。在無(wú)傳輸誤碼的情況下,解碼器輸出的重建信號(hào)s(nTs)與編碼器端用于預(yù)測(cè)的s(nTs)相同。^~~^^^^(2.3-4)

上式表明,DPCM的總量化誤差Nq僅與差值信號(hào)eq(nTs)的量化誤差有關(guān)。

DPCM系統(tǒng)的量化信噪比可表示為

(2.3-5)

式中,是把差值序列作為信號(hào)量化時(shí)量化器的量化信噪比,與PCM系統(tǒng)的量化信噪比相當(dāng)。Gp為DPCM系統(tǒng)相對(duì)于PCM系統(tǒng)而言的信噪比增益,稱為預(yù)測(cè)增益。選擇合適的預(yù)測(cè)方法,可使差值功率E[n2(nTs)]遠(yuǎn)小于信號(hào)功率E[s2(nTs)],Gp將大于1,即可獲得系統(tǒng)增益。通常Gp約為6~11dB。

3.自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)

在差值脈沖編碼調(diào)制的基礎(chǔ)上,采用自適應(yīng)技術(shù)能進(jìn)一步改善量化噪聲特性(這里的自適應(yīng)包括自適應(yīng)預(yù)測(cè)和自適應(yīng)量化)稱為自適應(yīng)差值編碼調(diào)制(ADPCM)。

1)自適應(yīng)預(yù)測(cè)自適應(yīng)預(yù)測(cè)是指預(yù)測(cè)系數(shù)自適應(yīng)地隨語(yǔ)音信號(hào)變化,

此時(shí)式(2.3-2)變?yōu)?/p>

式中,ci(nTs)不再固定,而是自適應(yīng)的。自適應(yīng)預(yù)測(cè)的基本思想就是使均方預(yù)測(cè)誤差最小,通過(guò)改變預(yù)測(cè)系數(shù)ci(nTs),使預(yù)測(cè)器自適應(yīng)地匹配于語(yǔ)音信號(hào)的瞬時(shí)變化。一般來(lái)說(shuō),自適應(yīng)預(yù)測(cè)較固定預(yù)測(cè)能獲得3~4dB的預(yù)測(cè)增益。自適應(yīng)預(yù)測(cè)可分為前向自適應(yīng)預(yù)測(cè)和后向自適應(yīng)預(yù)測(cè),前向自適應(yīng)預(yù)測(cè)的預(yù)測(cè)系數(shù)可通過(guò)使誤差最小來(lái)求得。通常假定短時(shí)間內(nèi)的語(yǔ)音信號(hào)參量保持恒定,因此可根據(jù)短時(shí)均方預(yù)測(cè)誤差最小的原則來(lái)確定預(yù)測(cè)系數(shù)ci(nTs)

。通常ci(nTs)是按幀變化的,即按10~30ms為一幀來(lái)確定求和的樣值數(shù)L和預(yù)測(cè)系數(shù)ci(nTs)

。為了保證接收端正確恢復(fù)原信號(hào),因而預(yù)測(cè)系數(shù)ci(nTs)必須作為邊信息傳送到接收端。

后向自適應(yīng)預(yù)測(cè)以解碼信號(hào)s(nTs)作為參照,通過(guò)使誤差

最小來(lái)求得。由于s(nTs)在接收端可以得到,因此后向自適應(yīng)預(yù)測(cè)無(wú)需傳送邊信息。^^2)自適應(yīng)量化自適應(yīng)量化是指量化器的特性自適應(yīng)地隨輸入信號(hào)幅度而變化,即自適應(yīng)量化器的量化間隔自適應(yīng)地隨輸入信號(hào)的變化而改變,并與輸入信號(hào)的幅度方差保持匹配,例如在一個(gè)固定量化器前加一個(gè)自適應(yīng)的增益控制,使進(jìn)入量化器的輸入信號(hào)方差保持不變。與自適應(yīng)預(yù)測(cè)器一樣,自適應(yīng)量化也分為前向自適應(yīng)量化和后向自適應(yīng)量化。

所謂前向自適應(yīng)量化是指信號(hào)s(nTs)的能量或方差是由輸入信號(hào)s(nTs)本身估算出來(lái)的,根據(jù)所估算出來(lái)的方差σ2(nTs)來(lái)改變量化間隔Δ(nTs)或增益G(nTs),即(2.3-6)

式中,Δ0為均勻量化器的最小量化間隔;G0為信號(hào)的最大增益。顯然,(nTs)正比于σ(nTs),G(nTs)反比于σ(nTs),由通過(guò)自適應(yīng)調(diào)整Δ(nTs)或G(nTs)可得到如圖2-13所示的前向自適應(yīng)量化ADPCM系統(tǒng)。其特點(diǎn)是Δ(nTs)和G(nTs)要作為邊信息傳送到接收端。圖2-13前向自適應(yīng)量化ADPCM原理框圖(a)量化間隔自適應(yīng)原理框圖;(b)增益自適應(yīng)系統(tǒng)原理框圖

圖2-13前向自適應(yīng)量化ADPCM原理框圖(a)量化間隔自適應(yīng)原理框圖;(b)增益自適應(yīng)系統(tǒng)原理框圖

后向自適應(yīng)量化的特點(diǎn)是輸入信號(hào)的方差是由量化器的輸出來(lái)估算的,量化間隔Δ(nTs)和增益G(nTs)仍按式(2.3-6)隨方差σ(nTs)變化,如圖2-14所示。后向自適應(yīng)量化的特點(diǎn)是無(wú)需傳送Δ(nTs)和G(nTs),缺點(diǎn)是對(duì)傳輸產(chǎn)生的誤差比較敏感,因?yàn)閭鬏斦`碼將影響到Δ(nTs)和G(nTs)的自適應(yīng),并且該影響還會(huì)進(jìn)一步擴(kuò)散。圖2-14后向自適應(yīng)量化ADPCM原理框圖(a)量化間隔自適應(yīng)原理框圖;

(b)增益自適應(yīng)原理框圖

一般而言,前向自適應(yīng)系統(tǒng)的信噪比要比后向自適應(yīng)系統(tǒng)的高,但前向自適應(yīng)需要傳送邊信息,且計(jì)算短時(shí)方差會(huì)產(chǎn)生一段時(shí)間的延遲。而后向自適應(yīng)無(wú)需傳送邊信息,且沒(méi)有延時(shí)。

4.子帶編碼(SBC)

1)子帶編碼的基本原理子帶編碼的基本思想是:采用帶通濾波器先將輸入信號(hào)分割成n個(gè)不同的頻帶分量(子帶),然后再分別對(duì)每個(gè)子帶進(jìn)行抽樣、量化和編碼。子帶編碼是一種頻域編碼,即將信號(hào)分解成不同頻帶分量來(lái)去除信號(hào)的相關(guān)性,從而得到一組互不相關(guān)的信號(hào)。如圖2-15所示。

2-15子帶編碼原理框圖

對(duì)語(yǔ)音信號(hào)進(jìn)行子帶編碼具有以下特點(diǎn):

(1)將語(yǔ)音信號(hào)分成若干子帶,就可以根據(jù)人耳的聽(tīng)覺(jué)特性來(lái)合理分配各個(gè)子帶的比特?cái)?shù),以獲得更好的主觀聽(tīng)覺(jué)效果。例如,由于語(yǔ)音的基音和共振峰主要集中在低頻段,因此可分配較多的比特來(lái)表示其樣值;而對(duì)出現(xiàn)摩擦音和類似摩擦噪聲的高頻段可以分配較少的比特,從而可充分地壓縮語(yǔ)音數(shù)據(jù),降低編碼速率。

(2)由于各子帶的量化噪聲限制在本子帶內(nèi),相互獨(dú)立,互不干擾,因此能避免能量較小頻段上的信號(hào)被其他頻段的量化噪聲所淹沒(méi),從而改善語(yǔ)音編碼的質(zhì)量。

(3)由于各個(gè)子帶的帶寬遠(yuǎn)小于語(yǔ)音信號(hào)的帶寬,因此可使其抽樣速率降低至各個(gè)子帶帶寬的2倍。

2)子帶編碼系統(tǒng)的設(shè)計(jì)子帶數(shù)目、子帶劃分、編碼參數(shù)和子帶比特分配是設(shè)計(jì)子帶編碼系統(tǒng)的四個(gè)主要問(wèn)題,例如假設(shè)一個(gè)子帶編碼系統(tǒng)將語(yǔ)音信號(hào)劃分成N個(gè)子帶,各子帶的帶寬為Bi(i=1,2,…,N),每個(gè)子帶信號(hào)的抽樣頻率為fsi=2Bi,每個(gè)子帶使用bi比特進(jìn)行編碼,則子帶編碼系統(tǒng)總的編碼速率R為

如何合理地劃分子帶是子帶編碼的關(guān)鍵,其基本的原則是使劃分的各子帶對(duì)主觀聽(tīng)覺(jué)的貢獻(xiàn)大致相等。因此,應(yīng)使對(duì)主觀聽(tīng)覺(jué)貢獻(xiàn)較大的低頻段的子帶較窄,使對(duì)主觀感覺(jué)貢獻(xiàn)較小的高頻段的子帶較寬。為了防止抽樣混疊,子帶間應(yīng)留有小的保護(hù)帶寬。

(2.3-7)例如,16,24,32kb/s語(yǔ)音子帶編碼系統(tǒng)將4kHz的語(yǔ)音信號(hào)分成為五個(gè)子帶,如表2-10所示。32kb/s子帶編碼系統(tǒng)使用了全部五個(gè)子帶,以確保較高的語(yǔ)音編碼質(zhì)量;為了降低編碼速率,16kb/s和24kb/s子帶編碼系統(tǒng)只使用了四個(gè)低頻子帶,而丟棄了3000~4000Hz的高頻子帶。每個(gè)子帶的抽樣頻從

8kHz下降到

1kHz和

2kHz。低頻子帶分配了更多的比特。

表2-1016,24,32kb/s語(yǔ)音子帶編碼系統(tǒng)設(shè)計(jì)參數(shù)2.3.3語(yǔ)音信號(hào)的參數(shù)編碼前一節(jié)介紹的波形編碼的典型編碼速率為16~64kb/s,本節(jié)介紹采用參數(shù)編碼來(lái)進(jìn)一步降低語(yǔ)音信號(hào)編碼速率的方法。參數(shù)編碼的原理是根據(jù)對(duì)人類語(yǔ)音信號(hào)形成機(jī)理的分析,構(gòu)建語(yǔ)音生成模型,

提取、

編碼和傳送語(yǔ)音信號(hào)的主要特征信息,

從而實(shí)現(xiàn)更高的壓縮效率。

1.語(yǔ)音信號(hào)模型

1)語(yǔ)音生成模型人類的發(fā)音器官由三部分組成:①肺和氣管產(chǎn)生氣源;②喉和聲帶稱為氣門;③由咽腔、口腔和鼻腔組成的聲道。肺的發(fā)音功能主要是產(chǎn)生壓縮氣體,通過(guò)氣管傳送到聲音生成系統(tǒng)。圖2-16給出了語(yǔ)音生成模型。激勵(lì)一般在聲門處完成,其功能可以通過(guò)發(fā)聲、耳語(yǔ)、摩擦、壓縮和振動(dòng)幾種方式實(shí)現(xiàn),其中由聲帶振動(dòng)而產(chǎn)生的激勵(lì)是最重要的激勵(lì)方式。對(duì)激勵(lì)產(chǎn)生的氣流再加入某些不同的信息,稱為“調(diào)制”?!罢{(diào)制”過(guò)程主要是通過(guò)口腔、鼻腔和咽腔不同位置和形狀變化而產(chǎn)生的。不同的聲道形狀具有不同的固有頻率。語(yǔ)音的“調(diào)制”就是通過(guò)改變聲道形狀來(lái)產(chǎn)生不同的共振峰,從而產(chǎn)生不同的元音和輔音。當(dāng)聲波離開(kāi)聲道時(shí)還將受到嘴唇輻射的作用。

2-16語(yǔ)音生成模型

2)語(yǔ)音信號(hào)特性對(duì)于濁音、清音和爆破音這三種不同類型的語(yǔ)音來(lái)說(shuō),激勵(lì)源是不同的。濁音又稱有聲音,它的激勵(lì)源位于聲門處,由聲帶振動(dòng)形成的準(zhǔn)周期性脈沖序列;清音又稱無(wú)聲音,發(fā)音時(shí)聲帶不振動(dòng),聲道緊縮成窄通道,氣流通過(guò)時(shí)產(chǎn)生湍流,類似于噪聲;爆破音激勵(lì)源位于聲道某個(gè)閉合點(diǎn)處,在該點(diǎn)建立起來(lái)的氣壓及其突然釋放便形成爆破音。語(yǔ)音主要是濁音和清音。

圖2-17所示的是一段濁音的時(shí)域波形及其頻譜(線狀譜)。顯然,濁音在時(shí)域上具有準(zhǔn)周期性,周期為TP;在頻域上具有周期性起伏的諧波結(jié)構(gòu),相鄰譜線之間的間隔即等于基音頻率,基音頻率由聲帶張開(kāi)閉合的周期決定,通常男性的基音頻率為50~250Hz,女性的基音頻率為100~500Hz。在濁音的線狀譜中有幾個(gè)共振峰,通常在5kHz以下有3~5個(gè)共振峰,前三個(gè)共振峰在3kHz以下,它們反映了語(yǔ)音信號(hào)的基本特征。圖2-17濁音波形及其線狀譜(a)濁音的時(shí)域波形;

(b)濁音的頻譜波形

語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)隨機(jī)信號(hào),由于濁音的基音周期和信號(hào)幅度均隨時(shí)間緩慢變化,因此,可以認(rèn)為在一小段時(shí)間里(一般為10~30ms)語(yǔ)音信號(hào)近似不變。即語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性,可以將語(yǔ)音信號(hào)分成一個(gè)一個(gè)的幀,幀長(zhǎng)為20ms左右,在以8kHz抽樣時(shí),也就約160個(gè)樣值左右。語(yǔ)音信號(hào)的分幀通常采用可移動(dòng)的有限長(zhǎng)度窗口進(jìn)行加權(quán)的方法來(lái)實(shí)現(xiàn),加窗語(yǔ)音信號(hào)sw(n)=s(n)w(n),其中w(n)為窗函數(shù)。例如矩形窗和漢明窗。矩形窗為(2.3-8)

漢明窗為

(2.3-9)

式中,L為語(yǔ)音樣值數(shù)。

3)語(yǔ)音信號(hào)產(chǎn)生模型在早期的語(yǔ)音信號(hào)處理研究中,廣泛使用的是二元激勵(lì)模型,如圖2-18所示。圖中清/濁音開(kāi)關(guān)控制激勵(lì)源的改變。當(dāng)開(kāi)關(guān)接在濁音位置時(shí),激勵(lì)源為準(zhǔn)周期脈沖序列發(fā)生器,模擬濁音激勵(lì)源,脈沖重復(fù)頻率由基音頻率fp確定;當(dāng)開(kāi)關(guān)接在清音位置時(shí),激勵(lì)源為隨機(jī)噪聲發(fā)生器,模擬清音激勵(lì)源。增益控制用來(lái)調(diào)整輸出語(yǔ)音信號(hào)的幅度。時(shí)變線性系統(tǒng)用來(lái)模擬聲道的特性,其時(shí)變參數(shù)用于反映語(yǔ)音信號(hào)的時(shí)變特性。圖

2-18語(yǔ)音信號(hào)產(chǎn)生模型

二元激勵(lì)模型的特點(diǎn)是簡(jiǎn)單明了,但存在某些局限性,例如用時(shí)變線性系統(tǒng)的傳輸函數(shù)來(lái)模擬聲道特性時(shí),其線性系統(tǒng)的參數(shù)是固定不變的,這對(duì)于聲道參數(shù)變化很小的持續(xù)音(例如單元音)來(lái)說(shuō)是比較準(zhǔn)確的,但對(duì)聲道參數(shù)變化大的暫音(例如阻塞音或爆破音)來(lái)說(shuō)就不太準(zhǔn)確了。另外,對(duì)于鼻音和摩擦音,模擬語(yǔ)音時(shí)還應(yīng)考慮零點(diǎn)。同時(shí),濁音和清音這兩種激勵(lì)也并非是簡(jiǎn)單的疊加關(guān)系。因此,需要研究新的激勵(lì)模型來(lái)取代二元激勵(lì)模型,例如在一個(gè)基音周期內(nèi)采用多個(gè)脈沖來(lái)構(gòu)建激勵(lì)模型等,

我們稍后加以討論。

4)語(yǔ)音信號(hào)的線性預(yù)測(cè)模型由圖2-18可知,輸出語(yǔ)音信號(hào)s(n)與激勵(lì)信號(hào)u(n)的時(shí)域關(guān)系為(2.3-10)

式中,G為增益;ai(i=1,2,…,N)為時(shí)變線性濾波器參數(shù);N為預(yù)測(cè)器的階數(shù)。

上式表明,當(dāng)前的輸出信號(hào)樣值可以由當(dāng)前的輸入樣值Gu(n)與過(guò)去輸出樣值的加權(quán)和來(lái)表示,即線性預(yù)測(cè),其預(yù)測(cè)誤差為(2.3-11)

線性預(yù)測(cè)的基本問(wèn)題可表述為:由語(yǔ)音信號(hào)s(n)求一組預(yù)測(cè)系數(shù){ai;i=1,2,…,N},用該組預(yù)測(cè)系數(shù)作為語(yǔ)音信號(hào)產(chǎn)生模型中系統(tǒng)傳輸函數(shù)h(t)的參數(shù)(即聲道參數(shù)),它使得在一段語(yǔ)音波形中均方預(yù)測(cè)誤差e(n)最小。短時(shí)均方預(yù)測(cè)誤差為(2.3-12)

在式(2.3-12)中對(duì)ai求偏導(dǎo)數(shù)為零,可得該語(yǔ)音段使均勻誤差最小的參數(shù){ai

;i=1,2,…,N}。

2.線性預(yù)測(cè)(LPC)聲碼器聲碼器是聲音編碼器的簡(jiǎn)稱,其作用是降低編碼速率。通常聲碼器的編碼速率為1~3kb/s。圖2-19是線性預(yù)測(cè)聲碼器的原理框圖。在發(fā)送端,根據(jù)語(yǔ)音信號(hào)產(chǎn)生模型,分析和提取描述語(yǔ)音信號(hào)的特征參數(shù):時(shí)變線性濾波器參數(shù){ai;i=1,2,…,N}、增益G、基音周期TP和清/濁音判決信息U/V。因此,當(dāng)預(yù)測(cè)器階數(shù)為N、語(yǔ)音幀長(zhǎng)度為L(zhǎng)時(shí),一幀內(nèi)L個(gè)原始輸入語(yǔ)音樣值完全能用ai、G、TP和U/V這四個(gè)特征參數(shù)來(lái)表示,而表示這幾個(gè)語(yǔ)音信號(hào)的特征參數(shù)只需要很少的比特,從而大大降低了語(yǔ)音編碼速率。圖

2-19線性預(yù)測(cè)聲碼器原理框圖

在發(fā)送端,對(duì)數(shù)字語(yǔ)音信號(hào)s(n)逐幀進(jìn)行短時(shí)(由加窗實(shí)現(xiàn))線性預(yù)測(cè)分析得到時(shí)變線性濾波器參數(shù){ai

;i=1,2,…,N}和增益G。預(yù)加重的目的是加強(qiáng)語(yǔ)音頻譜中的高頻共振峰,使語(yǔ)音短時(shí)譜和線性預(yù)測(cè)分析中的預(yù)測(cè)誤差信號(hào)譜變得比較平坦,以提高參數(shù){ai}的估值精度,線性預(yù)測(cè)分析通常用自相關(guān)法。同時(shí),提取清/濁音判決和基音信息。將{ai}、G、TP和U/V編碼量化后傳送到接收端。在接收端,合成器由假定的語(yǔ)音信號(hào)產(chǎn)生模型組成,通過(guò)所接收到的特征參數(shù)來(lái)合成輸出語(yǔ)音。由解碼器得到參數(shù){ai}、G、TP、U/V,用G、TP

、U/V產(chǎn)生激勵(lì)信號(hào),參數(shù){ai}用于形成合成濾波器,合成后得到的信號(hào)經(jīng)過(guò)反預(yù)加重后,可得到重建的數(shù)字語(yǔ)音信號(hào)。^^^^^^^^

線性預(yù)編碼器存在以下不足:①編碼語(yǔ)音的自然度較差,其主要原因是二元激勵(lì)模型過(guò)于簡(jiǎn)單,不能完全反映語(yǔ)音信息的豐富內(nèi)涵;②系統(tǒng)的魯棒性降低,由于二元激勵(lì)模型中清/濁音判決和語(yǔ)音譜中共振峰的作用,影響了清/濁判決和基音提取的準(zhǔn)確性;同時(shí),噪聲干擾也會(huì)影響清/濁判決和基音提取的準(zhǔn)確性;③語(yǔ)音譜包絡(luò)中共振峰的位置和帶寬估計(jì)有時(shí)會(huì)產(chǎn)生較大的失真。這些不足影響了LPC聲碼器語(yǔ)音質(zhì)量和編碼效率的提高。對(duì)此,人們提出了很多改進(jìn)方法,例如線性預(yù)測(cè)合成分析編碼(AbS-LPC)等,可顯著改善LPC聲碼器合成語(yǔ)音的自然度和清晰度,提高系統(tǒng)的魯棒性。

2.3.4語(yǔ)音信號(hào)的混合編碼

1.多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)在多脈沖激勵(lì)線性預(yù)測(cè)編碼中,無(wú)論是清音還是濁音,都是用一幀中的有限個(gè)脈沖經(jīng)過(guò)最優(yōu)估值后作為激勵(lì)信號(hào)源,如圖2-20所示。原始語(yǔ)音信號(hào)s(n)以幀為單位進(jìn)行處理,幀長(zhǎng)通常為10~20ms。原始語(yǔ)音信號(hào)先進(jìn)行線性預(yù)測(cè)分析,計(jì)算出線性預(yù)測(cè)系數(shù){ai}。然后在當(dāng)前幀內(nèi)每隔5ms或10ms用合成分析法估計(jì)一次激勵(lì)脈沖。將激勵(lì)脈沖輸入合成器得到合成語(yǔ)音,合成語(yǔ)音與原始語(yǔ)音相減可得到誤差信號(hào)e(n)。根據(jù)最小加權(quán)均方誤差準(zhǔn)則,分析出一組位置、幅度最佳的激勵(lì)脈沖,然后與線性預(yù)測(cè)參數(shù){ai}一起編碼送入信道。圖2-20多脈沖激勵(lì)線性預(yù)測(cè)編碼原理框圖(a)編碼器;

(b)解碼器

多脈沖激勵(lì)線性預(yù)測(cè)編碼的關(guān)鍵是:在幀長(zhǎng)為L(zhǎng)的一幀內(nèi),只允許用N個(gè)脈沖來(lái)表示激勵(lì)信號(hào),如何求得這N個(gè)脈沖在幀內(nèi)的位置和幅度,使得合成語(yǔ)音與原始語(yǔ)音的感覺(jué)加權(quán)均方誤差最小。該多脈沖激勵(lì)信號(hào)可由一個(gè)稀疏的脈沖序列來(lái)表示,即(2.3-13)

式中,gi、n和N分別表示脈沖的幅度、位置和數(shù)目,這就是所要編碼的信息。典型的應(yīng)用是INMASAT-Aero系統(tǒng),它采用了9.6kb/s的MPLPC算法作為其語(yǔ)音編碼標(biāo)準(zhǔn)。感覺(jué)加權(quán)濾波器的依據(jù)是人耳聽(tīng)覺(jué)的“掩蓋效應(yīng)”。例如在語(yǔ)音頻譜中,能量較高頻段(如共振峰處)的噪聲相對(duì)于能量較低頻段的噪聲而言不易被感知。因此,在度量原始語(yǔ)音與合成語(yǔ)音之間的誤差時(shí)可以計(jì)入這一因素,在語(yǔ)音能量高的頻段,允許二者的誤差大一些,反之則小一些。為此,可引入一個(gè)頻率感覺(jué)加權(quán)濾波器W(f)來(lái)計(jì)算原始語(yǔ)音與合成語(yǔ)音之間的誤差,即(2.3-14)

式中,fs是抽樣頻率;S(f)和S(f)分別是原始語(yǔ)音和合成語(yǔ)音的傅里葉變換。顯然,如果|S(f)-S(f)|2W(f)在整個(gè)積分域內(nèi)保持常數(shù)值,則可使e(n)達(dá)到最小。這可以通過(guò)調(diào)整激勵(lì)參數(shù)來(lái)實(shí)現(xiàn),在能量較大的語(yǔ)音頻段內(nèi)選擇較小

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論