《語音與音頻編碼》課件第7章_第1頁
《語音與音頻編碼》課件第7章_第2頁
《語音與音頻編碼》課件第7章_第3頁
《語音與音頻編碼》課件第7章_第4頁
《語音與音頻編碼》課件第7章_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

7.1概述

7.2Dolby(杜比)環(huán)繞聲編碼標(biāo)準(zhǔn)

7.3DTS環(huán)繞聲編碼標(biāo)準(zhǔn)

7.4音頻編碼文件格式

7.5小結(jié)

習(xí)題七第七章環(huán)繞聲編碼標(biāo)準(zhǔn)及音頻編碼文件格式最初的環(huán)繞聲技術(shù)是從電影當(dāng)中發(fā)展過來的。

DTS-HD是在杜比公司宣布DolbyDigitalPlus和DolbyTrueHD出現(xiàn)后而針對高清時代產(chǎn)生的,是目前DTS公司最新的環(huán)繞聲格式名稱,能兼容所有DTS公司的格式,包括DTS、DTSESDiscrete、DTSESMatrix、DTSNeo:6和DTS96/24。

對于這兩個有代表性的環(huán)繞聲家族,到底哪個更適合現(xiàn)在發(fā)展的需要,每一個又具有什么特點,下面分別作一介紹。7.1概述7.2.1DolbyAC-3音頻壓縮算法

DolbyAC-3系統(tǒng)的其他優(yōu)點可以總結(jié)如下:

(1)真正的立體環(huán)繞聲。

(2)全音頻范圍的寬頻帶和各個通道完全隔離。

(3)極寬廣且可控的動態(tài)范圍。

(4)與現(xiàn)行音響系統(tǒng)的兼容性。7.2Dolby(杜比)環(huán)繞聲編碼標(biāo)準(zhǔn)

1.DolbyAC-3音頻編碼原理

DolbyAC-3是在AC-1和AC-2基礎(chǔ)上發(fā)展出來的多通道編碼技術(shù),AC-1采用自適應(yīng)Δ調(diào)制和模擬的壓縮擴展技術(shù),它不是感知編碼器。而AC-2是一個單聲道的編碼器,在用于雙聲道或多聲道時,各聲道是獨立的,它是感知編碼器。AC-3保留了AC-2的許多特點,如窗處理、變換編碼、自適應(yīng)比特分配;AC-3還利用了多通道立體聲信號間的大量冗余性,對它們進行“聯(lián)合編碼”,從而獲得了很高的編碼效率。圖7.1為DolbyAC-3編碼器原理框圖。圖7.2為DolbyAC-3編碼流程圖。圖7.1DolbyAC-3編碼器原理框圖圖7.2DolbyAC-3編碼流程圖

1)窗處理和分析濾波器組

在處理音頻信號時,一般都是分塊處理。每塊包含512個采樣值,有50%的重疊,所以每塊都有256個采樣值是新的。同時,每個音頻的采樣值都會出現(xiàn)在兩個塊中,要處理的采樣值就成了雙倍數(shù)值,但為了提高時域分辨率和消除塊效應(yīng),這是必需的步驟。對這個音頻數(shù)據(jù)分塊的完成,主要是靠窗函數(shù)來實現(xiàn)的,用512點的窗函數(shù)乘以512個采樣值矢量就可以得到。分析濾波器組的作用就是把音頻信號從時域變換到頻域,便于心理聲學(xué)模型的計算,同時也是變換編碼的基礎(chǔ)。

2)頻譜包絡(luò)編碼

經(jīng)窗處理和分析濾波器組的處理,得到的頻域變換系數(shù)轉(zhuǎn)換為二進制浮點。浮點運算通常由處理指數(shù)和處理尾數(shù)的兩個定點組成,即浮點數(shù)是由一個純小數(shù)乘上一個指數(shù)值,純小數(shù)部分被稱為浮點數(shù)的尾數(shù)。指數(shù)值決定了數(shù)的表示范圍,是頻率系數(shù)二進制前導(dǎo)0的個數(shù),其范圍限定在0~24之間,尾數(shù)的位數(shù)決定了數(shù)的有效精度。

3)比特分配

在AC-3編碼器的比特分配技術(shù)中,采用了已廣泛應(yīng)用的前向和后向自適應(yīng)比特分配原則。前向自適應(yīng)方法是編碼器計算比特分配,并把比特分配信息明確地編入數(shù)據(jù)比特流中。由于編碼器可以獲得有關(guān)輸入信號的所有信息,因此可以達到最精確的比特分配。它的特點是在編碼器中使用聽覺模型,因此修改模型對解碼器沒有影響。由于解碼器不用計算比特分配信息,因此解碼器比較簡單,容易實現(xiàn)。它的缺點是要占用一部分有效比特,用來傳送比特分配信息,因而影響了編碼器的編碼效率。

4)尾數(shù)量化

尾數(shù)量化的功能是按照比特分配程序的比特數(shù)對尾數(shù)進行量化。分配給每個尾數(shù)的比特數(shù)可由一張對照表查到,這張對照表是按輸入信號的功率譜密度和估計的噪聲電平閾值的差值建立的。每個尾數(shù)的量化精度在1~24比特之間。在給定的比特下,編碼器需要將比特數(shù)以最佳方式分配給每個尾數(shù),以獲取較高的聲音質(zhì)量。因此需對每個歸一化尾數(shù)的比特進行優(yōu)選分配,用頻譜包絡(luò)決定分配給每個尾數(shù)多少比特。

5)聲道耦合和矩陣重組

矩陣重組是指相關(guān)性強的聲道進行變換編碼。在兩聲道模式下,僅對原始信息的和、差進行編碼以減少數(shù)據(jù)量。矩陣重組不僅可以提高編碼效率,還有利于杜比環(huán)繞聲的兼容。

6)DolbyAC-3幀結(jié)構(gòu)

將以上模塊的各部分融合,形成AC-3數(shù)據(jù)流格式,輸出連續(xù)的幀匯成數(shù)據(jù)流。AC-3幀格式如圖7.3所示。圖7.3DolbyAC-3幀結(jié)構(gòu)圖

2.DolbyAC-3解碼原理

解碼過程基本上是編碼的逆過程。AC-3解碼器的基本原理框圖如圖7.4所示,解碼流程如圖7.5所示。圖7.4DolbyAC-3解碼器的原理框圖圖7.5DolbyAC-3解碼器的流程圖7.2.2DolbyDigitalPlus編解碼技術(shù)

杜比實驗室的杜比數(shù)字技術(shù)的高效率編碼在數(shù)字電視以及DVD5.1聲道的音效上,都立下了汗馬功勞。隨后,杜比公司又發(fā)布了杜比數(shù)字SurroundEX技術(shù),在5.1聲道的基礎(chǔ)上增加了一個后中置聲道,成為6.1聲道,使得臨場感得到了增強,且提高了兼容性,但缺乏定位性。于是推出了Dolby

ProLogicIIx技術(shù),變成了7.1聲道,該技術(shù)能通過復(fù)雜的矩陣運算將兩聲道的音軌分離為7.1聲道還原,可以應(yīng)用在電影和游戲領(lǐng)域。當(dāng)邁進高清時代以后,杜比公司隆重推出了全新的DolbyDigitalPlus音頻環(huán)繞聲格式。7.2.3DolbyTrueHD編解碼技術(shù)

DolbyTrueHD是杜比公司發(fā)布的最新音頻編碼技術(shù),它是一種近乎100%無損的音頻技術(shù),提供的非刪減式多聲道音頻技術(shù)可以帶來質(zhì)樸的錄音棚母帶的效果,與原始錄制的音效相比沒有任何信號損失。在這種格式中,它支持中繼數(shù)據(jù),并拓展了元數(shù)據(jù)支持的范圍,使音樂制作者和創(chuàng)作者可以對音頻播放過程進行更高級的控制,獲得更先進的音頻操控處理,保證各種聆聽環(huán)境都能有非凡的音效,帶來最佳優(yōu)化的音樂表現(xiàn)。而對于目前以迅雷不及掩耳之勢席卷人們視聽感受的高清,DolbyTrueHD也占有很大的份額,在每一臺HDDVD播放機中,它是標(biāo)準(zhǔn)音頻配置,而且藍光光盤播放機都開始使用該技術(shù),同時好萊塢影片發(fā)行商已經(jīng)發(fā)布超過280部基于HDDVD和Blue-ray格式并搭載了這種杜比技術(shù)的影片。它的特點可以總結(jié)如下:

(1)完全無損的編碼技術(shù),提供與母帶完全一致的聽覺享受;

(2)碼率可達18Mb/s;

(3)支持多達8個分離式24b/96kHz全頻帶聲道,為了獲得無可挑剔的環(huán)繞聲而提供比以往更多的分離式聲道;

(4)得到HDMIver1.3ade的支持;

(5)具有支持對白歸一化與動態(tài)范圍控制的元數(shù)據(jù)功能,當(dāng)切換到另一個杜比數(shù)字和杜比TrueHD時,對白歸一化可以保持相同的音量水平,動態(tài)范圍控制能夠進行應(yīng)需而變的音頻播放,降低尖峰音量,同時能夠體會音軌中的所有細節(jié)。

表7.1是傳輸5.1或7.1聲道DolbyTrueHD無損音軌時,音效是電影音效、采樣頻率是48kHz、6聲道時對于碼率的要求,以及信號經(jīng)過DolbyTrueHD的非刪減式壓縮編碼后的變化。表7.1傳輸5.1或7.1聲道DolbyTrueHD無損音軌對于碼率的要求7.3.1DTS環(huán)繞聲技術(shù)

DTS數(shù)字影院系統(tǒng)是杜比數(shù)字環(huán)繞聲出現(xiàn)兩年之后出現(xiàn)

的又一種環(huán)繞聲系統(tǒng)。7.3DTS環(huán)繞聲編碼標(biāo)準(zhǔn)7.3.2DTSHD環(huán)繞聲技術(shù)

當(dāng)杜比公司在日本宣布了自己的下一代DolbyDigitalPlus和DolbyTrueHD之后,DTS公司也不甘示弱地宣布了最新研發(fā)的DTSHD(HighDefinition)環(huán)繞聲技術(shù)標(biāo)準(zhǔn),使得未來影音市場的競爭將會更加激烈。DTSHD是被業(yè)界稱為DTS++的新標(biāo)準(zhǔn),是DTS標(biāo)準(zhǔn)的無縫升級版本,它將會用在藍光DVD中??梢灾С职―TS、DTS-ES、DTS96/24在內(nèi)的全系列環(huán)繞聲處理技術(shù),這表示DTSHD標(biāo)準(zhǔn)在提供高級技術(shù)擴展的同時更具備了良好的兼容特性。另外,它還具備更高音質(zhì)、實現(xiàn)多聲道模式和網(wǎng)上下載內(nèi)容的互動性。它的特點總結(jié)如下:

(1)以7.1聲道為起點,支持1.5Mb/s以上的高比特率,取樣頻率為8~192kHz,與現(xiàn)在的普通DVD影碟所采用的DTS768kb/s等壓縮技術(shù)相比,它的音質(zhì)得到了更大的提升。

(2)數(shù)據(jù)流量可以根據(jù)要求的聲音品質(zhì)而進行靈活的轉(zhuǎn)換,通過采用DTS的無損壓縮技術(shù)MLP(MeridianLosslessPacking),它比原來有了更大的改進。

(3)支持32個聲道的環(huán)繞輸出,為將來環(huán)繞系統(tǒng)提供了更廣闊的擴展方向。由于數(shù)據(jù)量較大,使用HDMI或IEEE1394作為數(shù)碼傳輸接口。7.4.1概述

根據(jù)音頻壓縮的技術(shù)原理不同,音頻壓縮編碼方法也各具特點。7.4音頻編碼文件格式7.4.2無損壓縮的音頻編碼文件格式

1.WAV

WAV是微軟公司開發(fā)的一種聲音文件格式,它本身是一種波形聲音文件,是最早的數(shù)字音頻格式。

2.APE

APE是目前流行的、由Monkey’sAudio出品的一種數(shù)字音樂文件格式,并且是目前世界上唯一得到公認(rèn)的音頻無損壓縮格式。

3.FLAC

FLAC是FreeLosslessAudioCoder的簡稱,又稱為OggFLAC,它是Ogg計劃的一部分,因此也是一種開源、免費的音頻格式,而且兼容幾乎所有的操作系統(tǒng)平臺。

4.Applelossless

Applelossless是蘋果公司的產(chǎn)品,當(dāng)然它只能在蘋果的音樂播放器上播放,這也是它沒有流行起來的原因。但是,這種格式制作非常方便,只需用iTunes軟件即可直接把音樂CD制作成AppleLossless文件,不過也只有Apple自己的軟件才能播放這種格式。7.4.3有損壓縮的音頻編碼文件格式

1.MP3

MP3是Fraunhofer-IIS研究所的研究成果。

2.MP3PRO

在MP3出現(xiàn)疲態(tài)的時候,為了掌握MP3未來的命運,F(xiàn)raunhofer-IIS研究所連同CodingTechnologies公司和法國的Thomsonmultimedia公司,共同推出了MP3PRO。

3.RealMedia

RealMedia是由RealNetworks公司發(fā)明的,其特點是可以在低達28.8kb/s的帶寬下提供足夠好的音質(zhì)讓用戶能在線聆聽。

4.WindowsMedia

WindowsMedia與RealMedia一樣,也是一種網(wǎng)絡(luò)流媒體技術(shù),它是微軟公司就網(wǎng)絡(luò)流媒體對于互聯(lián)網(wǎng)的不可估量的作用而產(chǎn)生的。

5.MIDI

數(shù)字音頻文件又可以分為波形文件和非波形文件。所謂波形文件,就是指直接記錄了原始音樂的波形,這種波形可以進行直接播放,比如前面所說的WAV、MP3、Real等都屬于波形音頻文件。

6.OggVorbis

OggVorbis是一種音頻壓縮格式,Vorbis是這種音頻壓縮機制的名字,而Ogg則是一個計劃的名字,該計劃意圖設(shè)計一個完全開放源碼的多媒體系統(tǒng)。

7.VQF

VQF指的是TwinVQ(TransformdomainWeightedInterleaveVectorQuantization)技術(shù),是日本NipponTelegraphandTelephone集團屬下的NTTHumanInterfaceLaboratories開發(fā)的一種音頻壓縮技術(shù)。該技術(shù)受到著名的YAMAHA公司的支持。VQF或TVQ是其文件的文件類型名。

8.Mod

Module(簡稱Mod)數(shù)碼音樂文件由一組樂器的聲音采樣、曲譜和時序信息組成,由它控制Mod播放器何時以何種音高去演奏在某條音軌的某個樣本,附帶演奏一些效果,比如顫音等。

9.AIFF

AIFF是Apple電腦支持的標(biāo)準(zhǔn)音頻格式,屬于uickTime技術(shù)的一部分。

10.au

au是UNIX下一種常用的音頻格式,起源于Sun公司的Solaris系統(tǒng)。

11.VOC

VOC是創(chuàng)新公司發(fā)明的音頻文件格式。

12.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論