音頻編解碼知識培訓資料課件_第1頁
音頻編解碼知識培訓資料課件_第2頁
音頻編解碼知識培訓資料課件_第3頁
音頻編解碼知識培訓資料課件_第4頁
音頻編解碼知識培訓資料課件_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

音頻編解碼知識培訓資料

定制人員:徐超目錄概述性能指標實現(xiàn)方法本司產(chǎn)品所涉音頻編解碼介紹及使用說明總結(jié)概述

音頻編碼(壓縮)技術(shù)指的是對原始數(shù)字音頻信號流(PCM編碼)運用適當?shù)臄?shù)字信號處理技術(shù),在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統(tǒng)后可能引入大量的噪聲和一定的失真。直接采用PCM碼流進行存儲和傳輸存在非常大的冗余度。事實上,在無損的條件下對聲音至少可進行4:1壓縮,即只用25%的數(shù)字量保留所有的信息.性能指標速率:高速率、中速率、低速率 壓縮比質(zhì)量:客觀評價 主觀評價延時:質(zhì)量和延時的關(guān)系 不同業(yè)務對延時的要求復雜性:算法的復雜性及軟硬件實現(xiàn)的復雜性

實現(xiàn)方法波形編碼 將波形直接變換成數(shù)字碼流。特點:比特率較高、解碼后質(zhì)量較高、延時較小??梢苑譃椋簳r域波形編碼,如PCM、ADPCM等;頻域波形編碼,如:子帶編碼(SBC)。參數(shù)編碼從信源信號的某個域中提取特征參數(shù),并變換成數(shù)字碼流。特點:比特率較低、解碼后質(zhì)量較低、延時較大。如:各種聲碼器?;旌暇幋a 將以上二種方法混合,特點:以較低的比特率獲得較高的質(zhì)量,延時適中,復雜。如:G723.1,G728,G729語音編碼等。

音頻編解碼介紹與使用說明

我們公司產(chǎn)品中所涉及的音頻編解碼器有:G.711G.722G.723.1G.728G.729G.7221.CMP3AAC-LC及AAC-LDG.719下面分別予以介紹.

G.711簡介

G.711是ITU-T制定的一個語音壓縮標準.輸入PCM碼流為采樣率為8000Hz,壓縮處理后輸出64kbps的碼流.把每個16位PCM樣本數(shù)據(jù)壓縮為8位,壓縮率為2:1.G.711標準下有兩種壓縮算法。一種是μ-law,主要運用于北美和日本;另一種是A-law,主要運用于世界上其他地區(qū)。使用說明輸入碼流屬性:采樣率為8000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:240個樣本(時長為30ms)壓縮比:2:1碼率:64Kbps

G.722簡介ITUG.722于1988年標準化,是第一個用于16KHZ采樣率的標準化寬帶語音編碼算法。該編解碼器將8KHz的頻帶分為兩個子頻帶,并用ADPCM算法在子頻帶中進行編碼。輸入PCM碼流為采樣率為16000Hz,是一種支持三種比特率64,56和48kbps的多碼率語音編碼算法。使用說明輸入碼流屬性:采樣率為16000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:576個樣本(時長為36ms)壓縮比:4:1碼率:64Kbps

G.723.1簡介G.723.1是ITU-T制定的一個語音壓縮標準.輸入PCM碼流為采樣率為8000Hz,支持兩種編碼比特率5.3和6.3kbps。算法復雜度較高,音頻質(zhì)量比較低.但是壓縮率較高,可達到1:24。使用說明輸入碼流屬性:采樣率為8000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:240個樣本(時長為30ms)壓縮比:1:20(碼率為6.3kbps),1:24(碼率為5.3kbps)我司產(chǎn)品中當前已很少使用.

G.728簡介1992年9月,CCITT(ITU一個永久性機構(gòu)組織:國際電報電話咨詢委員會)發(fā)布了語音編解碼標準.這個語音編碼草案是由AT&T提交給CCITT的.G.728是一種低延時語音壓縮標準,輸入PCM碼流為采樣率為8000Hz,壓縮比為1:8,并且有0.625ms的編碼算法延時。使用說明輸入碼流屬性:采樣率為8000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:80個樣本(時長為10ms)壓縮比:8:1碼率為:16Kbps

G.729簡介

G.729協(xié)議在1996年3月通過的8Kbps的語音編解碼協(xié)議。輸入PCM碼流采樣率為8000Hz,壓縮比為1:16。G.729編解碼器具有很高的語音質(zhì)量和很低的延時。使用說明輸入碼流屬性:采樣率為8000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:80個樣本(時長為10ms)壓縮比:16:1碼率為:8Kbps

G.7221.C簡介G.722.1.C是一個高質(zhì)量低復雜度、帶寬為14khz的寬帶音頻編碼器算法,輸入PCM碼流采樣率為32000Hz,傳輸碼流比特率有24Kbps、32Kbps和48Kbps三種。使用說明輸入碼流屬性:采樣率為32000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:640個樣本(時長為20ms)壓縮比:約21:1(碼率為24Kbps),16:1(碼率為32bps),11:1(碼率為48Kbps)碼率為有三種:24Kbps、32Kbps和48Kbps(說明:我司一般采用的碼率為:24Kbps)

MP3(1)簡介

在1991年,MP3由位于德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發(fā)明和標準化的。MP3就是一種音頻壓縮技術(shù),由于這種壓縮方式的全稱叫MPEGAudioLayer3,所以人們把它簡稱為MP3。MPEG-1Layer3允許使用的碼率是32、40、48、56、64、80、96、112、128、160、192、224、256和320Kbps,允許的采樣頻率是32、44.1和48kHz。44.1kHz是最為經(jīng)常使用的速度(與CD的采樣速率相同)。MPEG-2包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

MP3(2)使用說明

說明:下面幾點說明僅針對我們公司的mp3庫。輸入碼流屬性:采樣率為32000Hz,位寬為16比特的雙聲道PCM碼流.(說明:實際上我們的mp3編碼是一種偽雙聲道編碼,即編解碼內(nèi)部是單聲道編解碼,編碼前處理先把雙聲道處理成單聲道;在解碼器中,解碼后處理把解出的一個聲道復制到另一個聲道)每幀處理的幀長:2304個樣本(時長為36ms)壓縮比:約20:1碼率:50~55Kbps

AAC-LC及AAC-LD(1)簡介AAC(AdvancedAudioCoding),中文稱為“高級音頻編碼”,出現(xiàn)于1997年,基于MPEG-2的音頻編碼技術(shù)。由FraunhoferIIS、杜比實驗室、AT&T、Sony(索尼)等公司共同開發(fā),目的是取代MP3格式。2000年,MPEG-4標準出現(xiàn)后,AAC重新集成了其特性,加入了PNS技術(shù)和LTP技術(shù),為了區(qū)別于傳統(tǒng)的MPEG-2AAC又稱為MPEG-4AAC。AAC有多種編解碼方案,參見表1.

AAC-LC及AAC-LD(2)

文件方案MPEG-2AACLC低復雜度(簡單TNS,無預測和增益控制)LowComplexityMPEG-2AACMain主方案(除增益控制之外)MPEG-2AACSSR可變?nèi)勇蔛calableSamplingRateMPEG-4AACLC低復雜度(PNS)MPEG-4AACMain主方案(PNS)MPEG-4AACSSR可變?nèi)勇蔛calableSamplingRateMPEG-4AACLTP長時預測規(guī)格(PNS+LTP)LongTermPredictionMPEG-4AACLD低延遲規(guī)格LowDelayMPEG-4AACHE高效率規(guī)格(SBR(V1)+PS(V2))HighEfficiency表1AAC的所有編解碼方案AAC-LC及AAC-LDAAC使用說明

說明:表2列表說明僅針對我們公司的AAC-LC及AAC-LD庫。表2AAC-LC及AAC-LD使用說明表

項目

標準

采樣率(Hz)位寬(bit)單聲道/雙聲道每幀輸入樣本數(shù)輸出碼率(bps)壓縮比AAC_LC16k16單102448k約5:116k16雙204848k約11:132k16單102472k約7:132k16雙204872k約14:148k16單1024128k6:148k16雙2048128k12:1AAC_LD24k16單51232k12:124k16雙102464k12:132k16單51248k約11:132k16雙102496k約11:148k16單51264k12:148k16雙1024128k12:1G.719簡介

2008年5月ITU-T批準了新型的G.719全帶寬(full-band)編解碼器。這種編解碼器依據(jù)的就是Polycom的Siren?22以及Ericsson的先進音頻技術(shù)。其覆蓋的音頻頻帶達到22KHz,且對帶寬的要求低,僅為32Kbps-128Kbps,可留出更多的可用帶寬來提高視頻質(zhì)量。G.719幀時長20毫秒,算法延遲40毫秒。這是目前超寬頻帶編解碼器可提供的最低時延,讓實時溝通更加自然。使用說明輸入碼流屬性:采樣率為48000Hz,位寬為16比特的單聲道PCM碼流.每幀處理的幀長:960個樣本(時長為20ms)壓縮比:12:1(碼率為64Kbps時)碼率:64Kbps(我們公司產(chǎn)品中選用的碼率)

總結(jié)右表為我們公司音頻編解碼器的一個總結(jié)性列表,從中可以方便的查到各個編解碼器支持的輸入碼流屬性、碼率及壓縮比等信息。說明:此僅供科達開發(fā)人員內(nèi)部使用。

目標

采樣率(Hz)位寬(bit)單聲道/雙聲道輸入碼率(bps)輸出碼率(bps)壓縮比G.7118K16單128k64k2:1G.72216k16單256k48k,56k,64k4:1G.723.18k16單128k5.3k,6.3k24:120:1G.7288k16單128k16k8:1G.7298k16單128k8k16:1G.722.1.C32k16單512k24k,32k,48k約21:116:1約11:1Mp332k16雙1024k可變(50~55k)約20:1AAC_LC16k16單256k48k約5:116k16雙512k48k約11:132k16單5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論