




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
音頻處理技術(shù)1.2多媒體特性與關(guān)鍵技術(shù)聲學(xué)基本知識(shí)物理學(xué)意義上的聲音心理學(xué)與生理學(xué)意義上的聲音聲音信號(hào)的數(shù)字化過(guò)程采樣量化數(shù)據(jù)壓縮算法簡(jiǎn)介相關(guān)標(biāo)準(zhǔn)簡(jiǎn)介音頻文件格式音頻處理軟件1.1物理學(xué)意義上的聲音聲音的本質(zhì)聲音是由于物體的振動(dòng)產(chǎn)生的機(jī)械波1.1物理學(xué)意義上的聲音聲音的頻率20Hz——20kHz:聲波(人耳可聞)20kHz以上:超聲波20Hz以下:次聲波聲音的強(qiáng)度:與聲波的振幅成正比聲波在單位時(shí)間內(nèi)作用在與其傳遞方向垂直的單位面積上的能量聲音的種類(lèi)純音:振幅和頻率均為常數(shù)的聲音復(fù)音:多種不同頻率和振幅的混合聲音基音:復(fù)印中頻率最低的聲音,復(fù)音的基調(diào)泛音、諧音:其他頻率聲音的統(tǒng)稱(chēng)噪音:多頻率、多強(qiáng)度的無(wú)規(guī)律聲音頻率振幅頻率振幅純音復(fù)音基音泛音/諧音1.1物理學(xué)意義上的聲音聲音強(qiáng)度的計(jì)量聲強(qiáng)(物理學(xué)上常用)聲強(qiáng)是指單位時(shí)間(1秒鐘)內(nèi)聲音通過(guò)垂直于聲音傳播方向單位面積(cm2)的聲能量。聲壓(聽(tīng)覺(jué)生理學(xué)上常用)聲音在空氣中傳播而改變了空氣原來(lái)的恒定靜壓力,導(dǎo)致了原有靜壓力的微小增加。1.1物理學(xué)意義上的聲音這兩種1.2生理及心理學(xué)意義上的聲音人耳聽(tīng)到的聲音≠自然界的聲音聽(tīng)域(AuditoryArea):人耳可聞的聲音范圍頻率范圍:20Hz-20kHz強(qiáng)度范圍:可用聲壓、聲壓級(jí)、聲強(qiáng)、聲強(qiáng)級(jí)表示聽(tīng)閾(AuditoryThreshold):人耳可聞的最小強(qiáng)度痛閾:引起人耳疼痛的最小強(qiáng)度聲強(qiáng)與響度的關(guān)系聲強(qiáng):聲音強(qiáng)度的客觀度量(概念與度量前面已述)響度:聲音強(qiáng)度的主觀感受響度:聲音強(qiáng)度的主觀感受響度與聲強(qiáng)不是線性關(guān)系聲音能量(強(qiáng)度)增加近4倍,主觀感覺(jué)響度增加1倍響度與聲音能量是一種近似對(duì)數(shù)關(guān)系響度與頻率有關(guān):1000~4000Hz的聲音人耳聽(tīng)起來(lái)最響響度的單位為宋(sone)頻率1000Hz,強(qiáng)度為聽(tīng)閾以上40dB(感覺(jué)級(jí))的純音所產(chǎn)生的響度為1sone。絕對(duì)聽(tīng)覺(jué)閾限指一個(gè)人在沒(méi)有噪聲的環(huán)境下,能夠產(chǎn)生聽(tīng)覺(jué),感知到一個(gè)純音信號(hào)(某各頻率點(diǎn))的最小能量幅度。通常絕對(duì)聽(tīng)覺(jué)門(mén)限用聲壓級(jí)表示(dB)人耳的等響度曲線音調(diào):聲音頻率的主觀感受音調(diào)的高低與頻率的高低一致頻率不變,強(qiáng)度的變化對(duì)音調(diào)稍有影響。強(qiáng)度增大時(shí),低頻率音調(diào)顯得更低,而高頻率音調(diào)顯得更高。音色:人耳對(duì)復(fù)合音中各種諧音成分總和的主觀印象人耳通過(guò)音色區(qū)分不同的樂(lè)器,如:基音為100Hz的鋼琴聲與基音100Hz的黑管聲音的
基音頻率相同鋼琴有15個(gè)泛音(諧音)黑管有10個(gè)泛音(諧音)聲音的掩蔽效應(yīng)當(dāng)兩個(gè)響度不等的聲音作用于人耳時(shí),響度較高的頻率成分的存在會(huì)影響到對(duì)響度較低的頻率成分的感知同時(shí)掩蔽(頻域掩蔽)掩蔽聲音與被掩蔽聲音同時(shí)出現(xiàn)當(dāng)兩個(gè)或更多的音頻信號(hào)到達(dá)人內(nèi)耳時(shí),掩蔽聲與被掩蔽聲同時(shí)作用發(fā)生掩蔽效應(yīng),就稱(chēng)同時(shí)掩蔽。即在一個(gè)臨界頻帶內(nèi),一個(gè)大的信號(hào)可以掩蔽掉若干小的信號(hào),無(wú)論這個(gè)信號(hào)是音調(diào)還是噪音。25個(gè)臨界頻帶臨界頻帶頻率(Hz)臨界頻帶頻率(Hz)低端高端寬度低端高端寬度0010010013200023203201100200100142320270038022003001001527003150450330040010016315037005504400510110173700440070055106301201844005300900663077014019530064001100777092015020640077001300892010801602177009500180091080127019022950012000250010127014802102312000155003500111480172024024155002205065501217202000280
異時(shí)掩蔽(時(shí)域掩蔽)掩蔽聲音與被掩蔽聲音不同時(shí)出現(xiàn)一個(gè)強(qiáng)音頻信號(hào)可以掩蔽到之前若干時(shí)間和之后若干時(shí)間的音頻信號(hào)的感知,即導(dǎo)前掩蔽或滯后掩蔽對(duì)之前音頻信號(hào)的掩蔽效應(yīng)衰減的很快,大概只能掩蔽到幾毫秒對(duì)之后音頻信號(hào)的掩蔽可以持續(xù)到最長(zhǎng)200ms的時(shí)間。2.聲音信號(hào)的數(shù)字化過(guò)程從聲波到數(shù)字音頻文件的過(guò)程拾音放大A/D轉(zhuǎn)換(模數(shù)轉(zhuǎn)換)采樣量化編碼聲—電模擬信號(hào)模擬信號(hào)—數(shù)字信號(hào)—二進(jìn)制數(shù)據(jù)采樣與量化:模數(shù)轉(zhuǎn)換的核心采樣(Sampling)采樣:把模擬信號(hào)在時(shí)間域上以固定的時(shí)間間隔對(duì)波形的值進(jìn)行抽取,再用若干位二進(jìn)制數(shù)表示采樣周期:兩個(gè)取樣點(diǎn)之間的間隔稱(chēng)為采樣頻率:采樣周期的倒數(shù)采樣定理:當(dāng)采樣頻率大于信號(hào)最高頻率的兩倍時(shí),在采樣過(guò)程中就不會(huì)丟失信息,能不失真地還原出原始的聲音信號(hào)
若超過(guò)此取樣頻率,就會(huì)包含冗余的信息
若低于此頻率,則將產(chǎn)生不同程度的失真對(duì)于音頻,最常用的采樣頻率有三種:44.1KHz22.05KHz11.025KHz哪種采樣頻率產(chǎn)生的數(shù)字音頻音質(zhì)最佳?Why?聲道數(shù):聲音通道的個(gè)數(shù),指一次采樣的聲音波形個(gè)數(shù)。
單聲道一次采樣一個(gè)聲音波形
雙聲道一次采樣兩個(gè)聲音波形,又稱(chēng)為“立體聲”。量化(Quantity)量化的目的是將采樣后的信號(hào)波形的幅度值(樣本)進(jìn)行離散化處理,樣本從模擬量轉(zhuǎn)化成了數(shù)字量。量化位數(shù)(量化級(jí)):用于表示幅度值(樣本)的二進(jìn)制位數(shù)
量化位數(shù)越多,所得到的量化值越接近原始波形的采樣值。一個(gè)量化器就是將整個(gè)信號(hào)的幅度值分成若干個(gè)有限的區(qū)間,并且把落入同一個(gè)區(qū)間的樣本點(diǎn)都用同一個(gè)幅度值來(lái)表示,這個(gè)幅度值稱(chēng)為量化值。均勻量化非均勻量化數(shù)據(jù)率的概念數(shù)據(jù)率(比特率):
一秒鐘的數(shù)字音頻信號(hào)所需的二進(jìn)制位數(shù)單位:bps(bitspersecond位每秒)計(jì)算公式:采樣率×采樣位數(shù)×聲道數(shù)例如:44.1KHz、16bit的立體聲數(shù)字音頻信號(hào)的數(shù)據(jù)率
44.1k*16b*2=1411.2kbps這就是CD音頻的數(shù)據(jù)率如果不進(jìn)行任何編碼和壓縮,
則產(chǎn)生的聲音文件體積會(huì)非常大,不利于存儲(chǔ)和傳輸減小音頻文件大小的思路1.降低采樣頻率和量化位數(shù)——降低音質(zhì)2.數(shù)據(jù)壓縮(編碼)無(wú)損壓縮算法減少數(shù)據(jù)量,但不減少信息量典型實(shí)例:哈夫曼編碼、Winrar有損壓縮算法原理:有選擇地舍棄一些信息,如人類(lèi)不敏感信息典型實(shí)例:PCM編碼(WAV)、MPEG編碼(MP3)數(shù)據(jù)壓縮算法常用音頻編碼標(biāo)準(zhǔn)編碼方法算法名稱(chēng)數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM均勻量化
公共網(wǎng)ISDN配音4.0~4.5μ(A)μ(A)64kbpsG.711APCM自適應(yīng)量化
DPCM差值量化ADPCM自適應(yīng)差值量化32kbpsG.721SB—
ADPCM子帶—自適應(yīng)差值量化64kbpsG.7225.3kbps6.3kbpsG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼2.4kbps
保密話聲2.5~3.5混合編碼CELPC碼激勵(lì)LPC4.6kbps
移動(dòng)通信3.7~4.0VSELP矢量和激勵(lì)LPC8kbps
語(yǔ)音通信RPE-LTP長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2kbps
ISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbpsG.728G.729
MPEG多自帶感知編碼128kbps
CD5.0
AC-3感知編碼
音響5.0編碼(壓縮)的效果CD音質(zhì)的音頻未編碼(壓縮):1411.2kbps經(jīng)MPEG-Layer3算法壓縮后(mp3格式):128kbps1分鐘的原始CD音頻文件大?。?0.34MB1分鐘的接近CD音質(zhì)的MP3文件:0.96MB衡量音質(zhì)的指標(biāo)采樣頻率量化位數(shù)(量化級(jí))例如:CD音質(zhì):44.1kHz16bitDVD-Audio音質(zhì):192kHz24bit(目前最高音質(zhì))衡量編碼算法(壓縮效率)的指標(biāo)同等音質(zhì)(采樣頻率、量化位數(shù)、聲道數(shù))下的
數(shù)據(jù)率。典型音頻編碼簡(jiǎn)介PCM(PulsePulseCodeModulation脈沖代碼調(diào)制編碼)原理:直接存儲(chǔ)采樣量化后的數(shù)據(jù)特點(diǎn):沒(méi)有編碼的編碼
數(shù)據(jù)量大、無(wú)失真代表文件格式:wav文件PCM的實(shí)際應(yīng)用形式:加入了壓縮算法A律PCM:我國(guó)和歐洲采用μ律PCM:日本和北美采用標(biāo)準(zhǔn)制定組織:CCITT(CommitteeConsultationInternationalTechnicandTelegraph)國(guó)際電報(bào)電話咨詢(xún)委員會(huì)標(biāo)準(zhǔn)名稱(chēng):G.711MPEG1(MovingPictureExpertsGroup)音頻編碼特點(diǎn):根據(jù)人的聽(tīng)覺(jué)特性進(jìn)行編碼
有損壓縮
音質(zhì)較好,文件體積較小
三種層次的編碼系統(tǒng),可根據(jù)需要選用
層次越高,性能越好編碼層次MPEG-Layer1MPEG-Layer2MPEG-Layer3代表文件格式:mp3標(biāo)準(zhǔn)制定組織:ISO(InternationalStandardOrganization)
國(guó)際標(biāo)準(zhǔn)化組織IEC(InternationalElectroTechnicalCommission)
國(guó)際電工委員會(huì)標(biāo)準(zhǔn)名稱(chēng):ISO/IEC11172-3(MPEG-音頻)AC音頻編碼AC-1應(yīng)用的編碼技術(shù)是自適應(yīng)增量調(diào)制20kHz寬帶立體聲音頻信號(hào)編碼后的數(shù)據(jù)率為512kb/sAC-1曾在衛(wèi)星電視和調(diào)頻廣播上得到廣泛應(yīng)用。1990年DOLBY實(shí)驗(yàn)室推出了立體聲編碼標(biāo)準(zhǔn)AC-2比特率(數(shù)據(jù)率)降至256kb/s以下AC-2被應(yīng)用在PC聲卡和綜合業(yè)務(wù)數(shù)字網(wǎng)等方面。AC-3音頻編碼標(biāo)準(zhǔn)的起源是DOLBYAC-1。AC-31994年,日本先鋒公司宣布與美國(guó)杜比實(shí)驗(yàn)室合作研制成功一種嶄新的環(huán)繞聲制式,并命名為“杜比AC-3”(DolbySurroundAudioCoding-3)。1997年初,杜比實(shí)驗(yàn)室正式將“杜比AC-3環(huán)繞聲”改為“杜比數(shù)碼環(huán)繞聲”(DolbySurroundDigital),我們常稱(chēng)為DolbyDigital。杜比AC-3提供的環(huán)繞聲系統(tǒng)由5個(gè)全頻域聲道和1個(gè)超低音聲道組成,被稱(chēng)為5.1聲道。6個(gè)聲道的信息在制作和還原過(guò)程中全部數(shù)字化,信息損失很少,是一種高音質(zhì)音頻標(biāo)準(zhǔn)。DVD中的音頻編碼采用AC-3標(biāo)準(zhǔn)播放AC-3格式的音頻文件,需要安裝解碼插件
如:AC-3Filter3音頻文件格式波形格式WAVWAV是MicrosoftWindows本身提供的音頻格式,用.wav作為擴(kuò)展名,其文件格式稱(chēng)為波形文件格式(WAVEFileFormat)WAV格式是一種文件格式,而非一種編碼文件格式:文件數(shù)據(jù)的組織結(jié)構(gòu)編碼:編碼(壓縮)算法比如:書(shū)信是一種文件格式,英語(yǔ)是一種編碼。WAV格式可以支持多種音頻編碼基于PCM編碼的WAV格式是應(yīng)用最廣泛的音頻文件格式,所有音頻播放、編輯軟件都支持。WAV是一種RIFF文件格式RIFF(ResourceInterchangeFileFormat)在Windows環(huán)境下,大部分多媒體文件都遵循RIFF結(jié)構(gòu)來(lái)存放信息,RIFF可以看做是一種樹(shù)狀結(jié)構(gòu),其基本構(gòu)成單位為Chunk,就像樹(shù)形結(jié)構(gòu)中的節(jié)點(diǎn),每個(gè)Chunk由辨別碼、數(shù)據(jù)長(zhǎng)度及數(shù)據(jù)組成。記錄采樣頻率、
采樣位數(shù)等參數(shù)記錄聲音數(shù)據(jù)WAV格式的特點(diǎn)通用性極強(qiáng)(基于PCM編碼的)一般音質(zhì)較好(基于PCM編碼的)占用存儲(chǔ)空間較大音頻素材與中間處理結(jié)果的最佳格式MIDI格式MIDI(MusicalInstrumentDigitalInterface)的首寫(xiě)字母組合詞,可譯成“電子樂(lè)器數(shù)字接口”。用于在音樂(lè)合成器(MusicSynthesizers)、樂(lè)器(MusicalInstruments)和計(jì)算機(jī)之間交換音樂(lè)信息、播放和錄制音樂(lè)的一種標(biāo)準(zhǔn)協(xié)議。MIDI標(biāo)準(zhǔn)確定了將計(jì)算機(jī)與電聲樂(lè)器、錄音設(shè)備連接起來(lái)所需的電纜線、硬件及通信協(xié)議。MIDI可用于基于計(jì)算機(jī)的作曲和電子音樂(lè)合成制作MP3格式MP3文件格式TAG_V2(ID3V2)+Frame+TAG_V1(ID3V1)ID3V1:存放歌曲的描述信息
歌名、作者、專(zhuān)輯名、年份、附注、音樂(lè)類(lèi)別
位于文件尾
mp3播放器軟件廣泛支持ID3V2:對(duì)ID3V1的擴(kuò)展
可存放更多描述信息如專(zhuān)輯封面圖等
位于文件頭
軟件支持有限Frame:一系列的幀,存放音頻編碼信息Frame:一系列的幀,存放音頻編碼信息幀的個(gè)數(shù)由文件大小和幀長(zhǎng)決定每個(gè)FRAME的長(zhǎng)度可能不固定,也可能固定,
由數(shù)據(jù)率bitrate決定恒定數(shù)據(jù)率(CBR):96kbps、128kbps、192kbps變化數(shù)據(jù)率(VBR):針對(duì)歌曲不同的部分采用不同的數(shù)據(jù)率,用以節(jié)省存儲(chǔ)空間。數(shù)據(jù)率越高,音質(zhì)越好每個(gè)FRAME
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)員工績(jī)效考核評(píng)價(jià)標(biāo)準(zhǔn)手冊(cè)
- 2025年溫州南白象街道社區(qū)衛(wèi)生服務(wù)中心面向社會(huì)公開(kāi)招聘1人考前自測(cè)高頻考點(diǎn)模擬試題附答案詳解(考試直接用)
- 網(wǎng)絡(luò)安全服務(wù)保證承諾書(shū)5篇
- 2025黑龍江哈爾濱工程大學(xué)智能科學(xué)與工程學(xué)院崗位招聘4人模擬試卷完整答案詳解
- 2025年甘肅省平?jīng)鍪嗅轻紖^(qū)衛(wèi)生健康系統(tǒng)臨時(shí)聘用人員招聘考前自測(cè)高頻考點(diǎn)模擬試題有答案詳解
- 2025年甘肅省平?jīng)鍪嗅轻紖^(qū)人民法院招聘司法輔助人員模擬試卷及答案詳解(奪冠)
- 2025年福建省晉江市社會(huì)保險(xiǎn)中心招募青年見(jiàn)習(xí)人員2人模擬試卷及答案詳解(名校卷)
- 企業(yè)采購(gòu)合同審核與簽訂流程規(guī)范
- 2025黑龍江伊春市鐵力市鄉(xiāng)鎮(zhèn)衛(wèi)生院招聘醫(yī)學(xué)畢業(yè)生2人考前自測(cè)高頻考點(diǎn)模擬試題及完整答案詳解
- 2025年安徽省立醫(yī)院醫(yī)技及醫(yī)輔人員招聘131人考前自測(cè)高頻考點(diǎn)模擬試題參考答案詳解
- 課程設(shè)計(jì)-MATLAB與通信仿真設(shè)計(jì)題目及程序
- 盤(pán)扣式腳手架計(jì)算書(shū)
- 第6課 推動(dòng)形成全面對(duì)外開(kāi)放新格局高一思想政治《中國(guó)特色社會(huì)主義》同(高教版2023基礎(chǔ)模塊)
- 矩陣論同步學(xué)習(xí)輔導(dǎo) 張凱院 西北工業(yè)大學(xué)出版社
- GB/T 24218.1-2009紡織品非織造布試驗(yàn)方法第1部分:?jiǎn)挝幻娣e質(zhì)量的測(cè)定
- GB/T 10357.1-2013家具力學(xué)性能試驗(yàn)第1部分:桌類(lèi)強(qiáng)度和耐久性
- GB 16541-1996豎井罐籠提升信號(hào)系統(tǒng)安全技術(shù)要求
- GB 10068-2000軸中心高為56mm及以上電機(jī)的機(jī)械振動(dòng)振動(dòng)的測(cè)量、評(píng)定及限值
- 車(chē)輛模型課件
- 游泳訓(xùn)練理論與方法技術(shù)要點(diǎn)課件
- 促進(jìn)深度學(xué)習(xí)的課堂教學(xué)策略專(zhuān)題研究
評(píng)論
0/150
提交評(píng)論