語音與圖像信號處理大綱自學考試_第1頁
語音與圖像信號處理大綱自學考試_第2頁
語音與圖像信號處理大綱自學考試_第3頁
語音與圖像信號處理大綱自學考試_第4頁
語音與圖像信號處理大綱自學考試_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

高綱0975江蘇省高等教化自學考試大綱27483語音與圖像信號處理南京理工大學編江蘇省高等教化自學考試委員會辦公室Ⅰ課程性質(zhì)與設置目的要求《語音與圖象信號處理》是江蘇省高等教化自學考試電子工程專業(yè)的必修課,是為了培育和檢驗自學應考者信號處理的基本知識和基本技能而設置的一門專業(yè)課程,本課程分為兩大部分,第一部分是語音信號處理,第二部分是數(shù)字圖象處理。語音信號處理是一門比較好用的電子工程的專業(yè)課程,語音是人類獲得信息的重要來源和利用信息的重要手段。通過語言相互傳遞信息是人類最重要的基本功能之一。語言是人類特有的功能,它是創(chuàng)建和記載幾千年人類文明史的根本手段,沒有語言就沒有今日的人類文明。語音是語言的聲學表現(xiàn),是相互傳遞信息的最重要的手段,是人類最重要,最有效,最常用和最便利的交換信息的形式。語音中除包含實際發(fā)音內(nèi)容的語言信息外,還包括發(fā)音者是誰及喜怒哀樂等各種信息。在人類已構(gòu)成的通信系統(tǒng)中,語音通信方式早已成為主要的信息傳遞途徑之一,具有最便利和最快捷的特點。語言和語音也是人類進行思維的一種依托,它與人的智力活動親密相關,與文化和社會的進步緊密相連,具有最大的信息容量和最高的智力水平。語音信號處理是探討用數(shù)字信號處理技術對語音信號進行處理的一門學科,它是一門新興的學科,同時又是綜合性的多學科領域和涉及面很廣的交叉學科。除了語音之外,圖像是人類獲得信息的另外一個重要來源,大約70%的信息是通過人眼獲得的圖像信息。圖像信號是指將圖像作為一種二維信號,采納數(shù)字信號處理的方法來對圖像進行描述。今后為了表示便利,圖像信號就稱為圖像。在近代科學探討,軍事技術,工農(nóng)業(yè)生產(chǎn),氣象,醫(yī)學等領域中,人們越來越多地利用圖像來相識和推斷事物,解決實際問題。例如:人們利用人造衛(wèi)星所拍攝的地面照片,來分析獲得地球資源,全球氣象和污染狀況,利用“和平號”宇宙飛船所拍攝的月球表面照片,分析月球的形成。在醫(yī)學上,通過CT斷層掃描,醫(yī)生可以視察和診斷人體內(nèi)部是否有病變組織。在公安偵破中,采納指紋提取并處理進行破案。在軍事上,目標的自動識別和自動跟蹤都須要進行圖像處理。圖像信號的數(shù)字處理技術,依據(jù)人們通常的習慣,也稱為數(shù)字圖像處理技術,是指用計算機對圖像進行處理。它建立在以計算機為中心的包括各種輸入,輸出及顯示設備在內(nèi)的數(shù)字圖像處理系統(tǒng)上進行的。有時,結(jié)合數(shù)字語音處理系統(tǒng),構(gòu)成多媒體處理系統(tǒng)。設置本課程的目的要求:使自學應考者能夠駕馭與人類親密相關的兩種信息:語音信號和圖象信號的基本概念和基本原理,能夠應用數(shù)字信號處理的基本原理和方法對語音信號和圖象信號進行各種處理,如:語音信號數(shù)字模型的建立,語音信號的數(shù)字化,語音信號的分析,合成,識別,編碼的基本原理的基本方法,數(shù)字圖象信號的采集,表達,各種變換方法和圖象信號的編碼壓縮等。同時能夠?qū)φZ音信號和圖象信號處理的最新探討成果與發(fā)展趨勢有所了解,以適應現(xiàn)代社會對信息處理越來越高的要求。Ⅱ考試目標(考核知識點,考核要點)第一部分語音信號處理緒論考核知識點語音信號處理的基本概念語音信號處理的發(fā)展概況考核要點語音信號處理的基本概念1.識記:(1)語音信號對人類的重要性。(2)數(shù)字語音的優(yōu)點。(3)語音學的基本概念。(4)語音信號處理的應用領域。語音信號處理的發(fā)展概況1.識記:(1)語音信號處理的發(fā)展歷史。(2)語音編碼,語音合成,語音識別的基本概念。語音編碼技術是伴隨著語音的數(shù)字化而產(chǎn)生的,目前主要應用在數(shù)字語音通信領域。語音合成的目的是使計算機能象人一樣說話說話,而語音識別使能夠聽懂人說的話?;A知識考核知識點語音產(chǎn)生的過程語音信號的特性語音信號產(chǎn)生的數(shù)字模型人耳的聽覺特性考核要求語音產(chǎn)生的過程識記:聲音是一種波,能被人耳聽到,振動頻率在20Hz~20kHz之間。自然界中包含各種各樣的聲音,而語音是聲音的一種,它是由人的發(fā)音器官發(fā)出的,具有肯定語法和意義的聲音。領悟:(1)語音產(chǎn)生的過程與人類發(fā)聲的基本原理。(2)清音,濁音,共振峰的基本概念。語音由聲帶振動或不經(jīng)聲帶振動產(chǎn)生,其中由聲帶振動產(chǎn)生的音統(tǒng)稱為濁音,而不由聲帶振動而產(chǎn)生的音統(tǒng)稱為清音。聲道是一個分布參數(shù)系統(tǒng),它是一個諧振腔,有很多諧振頻率,稱為共振峰,它是聲道的重要聲學特征。語音信號的特性識記:(1)語音的物理性質(zhì),包括音質(zhì),音調(diào),音強,音長等特性。語音是人的發(fā)音器官發(fā)出的一種聲波,具有聲音的物理屬性。其中音質(zhì)是一種聲音區(qū)分于其它聲音的基本特征。音調(diào)就是聲音的凹凸,取決于聲波的頻率:頻率高則音調(diào)高,頻率低則音調(diào)低。響度就是聲音的強弱,又稱音量。它是由聲波振動幅度確定的。聲音變的長短也稱音長,它取決于發(fā)音持續(xù)時間的長短。(2)音素,音節(jié),單詞,句子的基本概念以及它們之間的關系。音素是語音的最小,最基本的組成單位,音素都有其獨立的各不相同的發(fā)音方法和發(fā)音部位,它是使聽者能區(qū)分一個單詞和另一個單詞的聲音的基礎。音節(jié)是最小的語言片段,一個音節(jié)由一個或幾個音素組成。單詞是由音節(jié)結(jié)合而成的更大單位,是有意義的語言的最小單位。句子是單詞的進一步組合。(3)漢語的特點,漢語音節(jié)的組成。領悟:語音的時間波形和頻譜特性,聲門激勵和聲道響應的頻譜特性,特殊是清音和濁音的頻譜特性,共振峰特性,二者之間的區(qū)分。語音信號產(chǎn)生的數(shù)字模型識記:(1)語音信號被看成是線性時不變系統(tǒng)(聲道)在隨機噪聲或準調(diào)周期脈沖序列激勵下的輸出。在滿意這樣的假設條件下,產(chǎn)生了語音信號的基本數(shù)字模型,是語音處理技術的基礎。(2)語音信號產(chǎn)生的數(shù)字模型框圖。領悟:(1)語音信號數(shù)字模型各部分的組成依據(jù)和頻譜特點,包括激勵模型,聲道模型(聲管模型和共振模型)和輻射模型。(2)聲道模型中的聲管模型和共振峰模型的特點,共振峰模型的三種形式。語音感知與人耳的聽覺特性識記:(1)聲音的三要素:響度,音調(diào)和音色的基本概念。人的聽覺系統(tǒng)具有困難的特性,沒有哪一種物理儀器具有人耳那樣的特性。聽覺機構(gòu)不但是一個特別靈敏的聲音接收器,還具有選擇性,此外還有判別聲音的強弱,音調(diào)和音色的本事。響度是人耳對聲音的強弱程度的主管反映,響度取決于聲音的幅度,主要是聲壓的函數(shù),但和頻率和波形也有關,人耳對300-4000Hz的聲音感覺最靈敏。音調(diào)也稱音高,是一種主觀心理量,是人耳對聲音頻率凹凸的感受。音色也叫音質(zhì),反映了聲音屬性。人依據(jù)音色在主觀感覺上區(qū)分具有相同響度和音調(diào)的兩個聲音。(2)聽覺“掩蔽效應”的基本概念與應用。時域分析考核知識點語音信號的數(shù)字化和預處理短時能量分析短時過零分析短時相關分析考核要求語音信號的數(shù)字化和預處理識記:(1)取樣和量化的基本概念。為了將原始的模擬語音信號變成數(shù)字信號,必需經(jīng)過取樣和量化兩個步驟,從而得到在時間和幅度上均離散的數(shù)字語音信號。取樣是將時間上連續(xù)的語音信號離散化為一個樣本序列。依據(jù)取樣定理,當取樣頻率大于兩倍信號帶寬時,取樣過程不會丟失信息,且從取樣信號中可以精確地重構(gòu)原始信號的波形。量化是指將取樣后得到的樣本序列的幅度再離散化,量化過程是將整個幅度值分割為有限個區(qū)間,將落入同一區(qū)間的樣本給予相同的幅度值。(2)量化噪聲的特性(3)抗混迭濾波器的作用。它是一個具有良好截止特性的模擬低通濾波器,主要是為了防止混迭失真和噪聲干擾。(4)短時分析技術的基本概念。語音信號是一種隨時間而變化的信號,可能是濁音激勵也可能是清音激勵,濁音的基音周期以及信號幅度等語音特性也都隨時間變化,但這種變化是緩慢的,在一小段短時間內(nèi)10~30ms,語音信號近似不變。于是,我們把變化的語音信號分成一些相繼的短時間段來處理。而每一段時間段具有固定的特性,這種方法稱為“短時”處理方法。短時能量分析識記:語音信號的能量分析是基于語音信號能量隨時間有相當大的變化,特殊是清音段的能量一般比濁音段的小得多。能量分析包括能量和幅度兩個方面。領悟:(1)直角窗與海明窗的頻率特性。,海明窗的帶寬大約是同等寬度矩形窗帶寬的兩倍。此外,漢明窗在通帶外的衰減要比矩形窗小得多,而且通帶與阻帶的起伏比較小。(2)窗口長度的選取原則。選擇太大,則短時能量隨時間變化就很小,不能充分反映語音信號的幅度變化;而選擇得小,即選擇等于或小于一個基音周期時,將依據(jù)信號波形的微小變化而起伏不定,以致短時能量不夠勻化和平滑。因此,折衷考慮的值,在通常狀況下,當取樣頻率為10KHz時,=100~200被認為是合適的。(3)短時平均能量的主要用途。依據(jù)短時能量函數(shù)可以大致區(qū)分濁音和清音,在高信噪比狀況下,利用短時能量函數(shù)也可區(qū)分有聲和無聲。短時過零分析識記:過零分析與平均過零率的基本概念。對于離散時間信號的相鄰兩個取樣值具有不同符號時,便出現(xiàn)“過零”現(xiàn)象。單位時間過零的次數(shù)叫做“過零率”。對于窄帶信號,過零率可以比較精確地反映該信號的頻率。在寬帶信號狀況下,過零率只能粗略反映信號的頻譜特性。領悟:短時過零分析的用途。如何區(qū)分清音與濁音短時相關分析識記:(1)短時自相關函數(shù)的物理意義,性質(zhì)。對于濁音語音來說,短時自相關函數(shù)具有明顯的峰值且呈周期分布,而對于清音來說,則沒有很強的自相關周期峰,其性質(zhì)類似于噪聲。(2)短時平均幅度差函數(shù)的概念與用途。領悟:(1)短時自相關函數(shù)的方框圖表示。(2)利用短時自相關函數(shù)區(qū)分清/濁音的方法。短時傅里葉分析考核知識點傅里葉分析在信號分析與處理中的地位與作用短時傅里葉變換的定義與物理意義短時傅里葉變換的取樣率語音信號的短時綜合考核要點傅里葉分析在信號分析與處理中的地位與作用識記:傅里葉分析的重要性,短時傅里葉分析的基本概念。在語音信號處理中,傅立葉表示在傳統(tǒng)上始終起主要作用。其緣由一方面在于穩(wěn)態(tài)語音的產(chǎn)生模型由線性系統(tǒng)組成,此系統(tǒng)被一隨時間作周期變化或隨機變化的源所激勵,因而系統(tǒng)輸出頻譜反映了激勵與聲道頻率響應特性。另一方面,語音信號的頻譜具有特別明顯的語言聲學意義,可以獲得某些重要的語音特征。同時,語音的感知過程與人類聽覺系統(tǒng)具有頻譜分析功能是親密相關的。短時傅里葉變換的定義與物理意義識記:(1)短時傅里葉分析的重要性。短時傅里葉分析是分析緩慢時變頻譜的一種簡便方法,是用穩(wěn)態(tài)分析方法處理非穩(wěn)態(tài)信號的一種方法,在語音處理中是一個特別重要的工具。(2))短時傅里葉變換的定義。領悟:(1)標準傅里葉變換的說明。(2)窗口序列具有的特性。(3)海明窗與直角窗對濁音語音的頻譜分析對比。(4)短時傅里葉變換的濾波器的說明,濾波器框圖的組成。短時傅里葉變換的取樣率識記:(1)時域取樣率的基本概念。(2)頻域取樣率的基本概念。(3)總?cè)勇实幕靖拍?。?)寬帶和窄帶語譜圖的概念和特點領悟:理解分析加窗與不加窗時總?cè)勇实膮^(qū)分。(四),語音信號的短時綜合1.領悟:濾器組求和法的基本原理與實現(xiàn)框圖,與快速傅里葉變換求和法的關系。同態(tài)濾波及倒譜分析考核知識點卷積與解卷積的基本概念同態(tài)信號處理的基本原理復倒譜和倒譜的基本概念語音信號兩個卷積重量復倒譜的性質(zhì)避開相位卷繞的幾種算法考核要求卷積與解卷積的基本概念識記:(1)依據(jù)語音信號的產(chǎn)生模型,可以將其用一個線性非時變系統(tǒng)的輸出表示,即看作是聲門激勵信號和聲道沖激響應的卷積。(2)為了分別加性組合信號,常采納線性濾波方法。而為了分別非加性信號(如乘積性或卷積性組合)信號,常采納同態(tài)濾波技術。同態(tài)信號處理的基本原理識記:同態(tài)信號處理的基本概念與作用。同態(tài)信號處理的作用就是將非線性問題轉(zhuǎn)化為線性問題來求解。依據(jù)實現(xiàn)原理分為乘積同態(tài)處理和卷積同態(tài)處理。領悟:(1)特征系統(tǒng)與逆特征系統(tǒng)的組成。(2)同態(tài)信號處理的基本實現(xiàn)方法,實現(xiàn)框圖。復倒譜和倒譜識記:復倒譜與倒譜的基本概念,定義。語音信號兩個卷積重量復倒譜的性質(zhì)識記:(1)一個周期沖激的有限長度序列,其復倒譜也是一個周期沖激序列,而且長度Np不變,只是序列變?yōu)闊o限長度序列。同時其振幅隨著K值的增大而衰減。(2)聲道沖激響應序列復倒譜的性質(zhì)。(3)聲門激勵的特點。領悟:聲道沖激響度序列的全零點模型描述,各個零點對系統(tǒng)響應的影響。避開相位卷繞的幾種算法領悟:(1)相位卷繞的基本概念。(2)利用微分法消退相位卷繞的實現(xiàn)框圖。(3)利用最小相位法求信號復倒譜的實現(xiàn)框圖。語音信號的線性預料分析考核知識點線性預料分析的基本概念線性預料分析的基本原理利用自相關法求解線性預料方程組利用協(xié)方差法求解線性預料方程組利用格型法求解線性預料方程組LPC譜估計和LPC復倒譜線譜對分析原理與參數(shù)求解語音信號的極零點模型考核要點線性預料分析的基本概念識記:線性預料分析所包含的基本概念是,一個語音的抽樣能夠用過去若干個語音抽樣的線性組合來靠近。通過使實際語音抽樣和線性預料抽樣之間差值的平方和(在一個有限間隔上)達到最小值,即進行最小均方誤差的靠近,能夠確定唯一的一組預料系數(shù)。線性預料分析的基本原理識記:(1)采納全極點模型分析語音信號的理論依據(jù)。全極點模型最易于計算,對全極點模型作參數(shù)估計是對線性方程組的求解過程;有時無法知道輸入序列;人的聽覺對于那種只能用零點來表示的頻譜陡峭谷點是遲鈍的;假如不考慮鼻音和摩擦音,則語音的聲道傳遞函數(shù)就是一個全極點模型。(2)線性預料(LPC)譜的特點領悟:線性預料分析的物理意義與優(yōu)越性。線性預料方程組的建立識記:最小均方誤差準則。利用自相關法和協(xié)方差法求解線性預料方程組識記:(1)自相關矩陣的特點。(2)協(xié)方差矩陣的特點領悟:自相關法和協(xié)方差法二者的特點比較。3.應用:協(xié)方差法的線性預料方程組矩陣表示,圖解表示。利用格型法求解線性預料方程組識記:(1)格型法的基本原理。(2)反射系數(shù)的概念。(3)格型濾波器的優(yōu)點。LPC譜估計和LPC復倒譜識記:(1)線性預料分析的階數(shù)P的選取原則,首先要保證有足夠的極點來模擬聲道響應的諧振結(jié)構(gòu),但P值達到12~14后,若進一步增加則誤差改善很小。(2)在線性預料分析中,分析幀長度N同樣重要,N盡可能小有好處,在LPC線性方程組求解中,計算量都與N成正比。但譜估計的精度隨著N的增加而提高。通常取N為2~3個基音周期長度。(3)復倒譜分析的優(yōu)點。矢量量化考核知識點矢量量化概述。矢量量化的基本原理失真測度最佳矢量量化器和碼本的設計考核要求矢量量化概述識記:(1)矢量量化的理論依據(jù)與優(yōu)越性。依據(jù)仙農(nóng)信息論可以得出,矢量量化總是優(yōu)于標量量化,且矢量維數(shù)越大性能越優(yōu)越。因為矢量量化有效利用了矢量中各重量間的各種相互關聯(lián)的性質(zhì)。采納矢量量化技術對信號波形數(shù)據(jù)進行壓縮,可以獲得特別高的壓縮比。(2)矢量量化的基本概念。矢量量化是將若干個取樣信號分成一組,即構(gòu)成一個矢量,然后對此矢量一次進行量化,即作為一個整體進行量化。矢量量化的基本原理識記:(1)矢量量化的過程。將語音信號波形的K個樣點的每一幀,或有K個參數(shù)的每一幀參數(shù),構(gòu)成K維空間中的一個矢量,然后對這個矢量進行量化。矢量測度識記:(1)失真測度必需具備的幾個特性。必需在主觀評價上有意義;必需是易于處理的;平均失真存在且可計算;易于硬件實現(xiàn)。(2)歐式距離-均方誤差的基本概念。最佳矢量量化器和碼本設計識記:(1)矢量量化器最佳設計的兩個條件。最佳劃分和最佳碼書。(2)初始碼書的生成方法。隨機選取法,分裂法和乘積碼法(五)降低困難度的矢量量化系統(tǒng)1.識記:(1)矢量量化系統(tǒng)的組成。(2)矢量量化的3個關鍵問題(3)降低困難度的設計方法分類(4)無記憶量化系統(tǒng)和有記憶量化系統(tǒng)的基本概念第八章隱馬爾可夫模型(不做要求)第九章語音檢測分析一,考核知識點(一)基音檢測(二)共振峰估值二,考核要點(一)基音檢測1.識記:(1)基音檢測的重要性與難點?;舻奶崛『凸烙嬍钦Z音信號處理中特別重要的一個問題,精確地檢測語音信號的基音周期對于高質(zhì)量的語音分析與合成,語音壓縮編碼,語音識別和說話人確認等具有重要意義。在低速率語音編碼中,精確的基音檢測是特別關鍵的,它直接影響到整個系統(tǒng)的性能。(2)基音檢測的3個探討方面(3)基音檢測的三種方法:波形估計法,相關處理法和變換法。(3)清/濁音推斷的協(xié)助參量。2.領悟:(1)中心削波法的基本原理,三電平削波函數(shù)的特性。(2)利用倒譜法提取基音的基本原理與實現(xiàn)方法。(3)利用簡化逆濾波器法進行基音檢測的基本原理與實現(xiàn)方法。(二)共振峰估值1.識記:(1)共振峰估計中存在的問題。(2)帶通濾波器組法提取共振峰特性的基本原理。(3)倒譜法難以解決的問題(4)用LPC法進行共振峰估計的兩種方案2.領悟:(1)倒譜法對清音和濁音的檢測效果對比(2)清音和濁音的DFT譜特性比較(3)LPC法的優(yōu)缺點語音編碼(一)—波形編碼考核知識點語音編碼的目的與應用前景語音信號的壓縮編碼原理脈沖編碼的調(diào)制(PCM)及其自適應預料編碼及自適應預料編碼原理自適應差分脈沖編碼調(diào)制及自適應增量調(diào)制子帶編碼自適應變換編碼考核要求語音編碼的目的與應用前景識記:(1)語音編碼的目的是在保持可以接受的失真的狀況下采納盡可能少的比特數(shù)表示語音。(2)語音信號數(shù)字傳輸?shù)膬?yōu)點。(3)語音壓縮編碼須要折衷考慮的3個方面(4)語音編碼的兩類應用(5)語音編碼的分類語音信號的壓縮編碼原理識記:(1)語音壓縮的必要性。語音編碼的目的是在保持可以接受的失真狀況下,采納盡可能少的比特數(shù)表示語音。假如對語音直接數(shù)字化,則傳輸或存儲語音的數(shù)據(jù)量太大。為了降低傳輸或存儲的費用,必需對其壓縮。(2)語音壓縮的兩個基本依據(jù)。(3)冗余度的基本概念(4)語音通信質(zhì)量的分類。(5)波形編碼與聲碼器的性能比較。脈沖編碼調(diào)制及其自適應識記:(1)PCM的基本概念。(2)勻稱PCM中,信噪比與量化比特數(shù)的關系。(3)非勻稱PCM的基本思想。(4)u律與A律的壓擴特性。領悟:自適應PCM的基本原理與實現(xiàn)框圖。預料編碼及其自適應APC識記:(1)預料編碼的基本概念。(2)短時預料與長時預料的基本概念。(3)噪聲整形的基本概念自適應差分脈沖編碼調(diào)制(ADPCM)及自適應增量調(diào)制(ADM)識記:(1)DPCM和ADPCM的基本概念,ADPCM的國際標準。(2)增量調(diào)制的基本概念。(3)自適應增量調(diào)制的基本概念。領悟:(1)駕馭DM編碼中斜率達載和顆粒噪聲產(chǎn)生的緣由及克服的方法。(2)連續(xù)可變斜率增量調(diào)制的實現(xiàn)原理。子帶編碼識記:(1)頻域編碼的兩個基本原則。(2)子帶編碼的基本概念與實現(xiàn)方法。(3)子帶編碼的優(yōu)點(3)正交鏡象濾波器(QMF)的基本概念。領悟:(1)子帶編碼中,子帶的分割與重建語音質(zhì)量的關系。(2)正交鏡象濾波器的幅頻特性。應用:通過正交鏡象濾波器復原原始信號的原理與方法。自適應變換編碼識記:(1)自適應變換編碼的基本概念。變換編碼是一種優(yōu)秀的高質(zhì)量的語音壓縮編碼方法,它將時域的語音信號變換到頻域,變換后的數(shù)值表示信號中不同頻率重量的強度,然后將這些變換系數(shù)依據(jù)比特安排的結(jié)果進行量化編碼。領悟:(1)正交變換采納DCT變換的緣由(2)自適應變換編碼的基本原理與實現(xiàn)框圖。第十一章語音編碼(二)——聲碼器技術及混合編碼考核知識點語音參數(shù)編碼的基本概念聲碼器的基本結(jié)構(gòu)相位聲碼器和通道聲碼器同態(tài)聲碼器線性預料聲碼器混合聲碼器各種語音編碼方法的比較語音編碼的性能指標和質(zhì)量評價考核要求語音參數(shù)編碼的基本概念識記:(1)語音參數(shù)編碼通過對語音信號的參數(shù)進行提取及編碼,力圖使重建語音信號具有盡可能高的可懂度,即保持原語音的語意。這類編碼的優(yōu)點是編碼率低,可低至2.4kbit/s以下。(2)參數(shù)編碼的基礎是語音產(chǎn)生的數(shù)學模型。實現(xiàn)參數(shù)編碼的器件稱為聲碼器,主要用于窄帶信道的語音通信。(3)為了充分發(fā)揮聲碼器的性能而必需的三個重要因素,聲碼器的基本結(jié)構(gòu)識記:(1)聲碼器的基本結(jié)構(gòu)及實現(xiàn)過程。(2)聲碼器的局限性。相位聲碼器和通道聲碼器識記:(1)相位聲碼器的基本工作原理。(2)通道聲碼器的基本工作原理。(3)常用的三種聲碼器同態(tài)聲碼器識記:(1)基于倒譜的分析與合成的基本原理。(2)同態(tài)聲碼器的優(yōu)缺點。線性預料聲碼器識記:(1)線性預料聲碼器的基本實現(xiàn)框圖。(2)線性預料編碼參數(shù)的變換和量化,包括反射系數(shù),對數(shù)面積比和預料多項式的根?;旌暇幋a識記:(1)混合編碼是波形編碼和聲碼器兩種優(yōu)點的結(jié)合:既利用了語音生成模型,通過對模型中的參數(shù)進行編碼,削減了波形編碼中被編碼對象的動態(tài)范圍或數(shù)目;又使編碼的過程產(chǎn)生接近原始語音波形的合成語音,以保留說話人的各種自然特征,提高了合成語音質(zhì)量。(2)多脈沖線性預料聲碼器的基本概念。(3)CELP的基本概念。各種語音編碼方法的比較識記:波形編碼和聲碼器的優(yōu)缺點比較。語音編碼的性能指標和質(zhì)量評價識記:(1)語音編碼的基本性能指標,包括編碼速率和頑健性。(2)編碼器的質(zhì)量評價方法,包括主觀評價法和客觀評價法。(3)常用的幾種語音主觀評價標準。第十二章語音合成考核知識點語音合成概述語音合成原理共振峰合成線性預料合成考核要求語音合成概述識記:(1)語音合成技術的兩個關鍵性能:一是正確,一是自然。(2)用語音合成來傳遞語言的優(yōu)點。(3)語音合成的基本概念語音合成原理識記:(1)語音合成的三種基本方法:波形合成法,參數(shù)合成法和規(guī)則合成法的基本概念。(2)語音合成系統(tǒng)的特性,包括合成單元,合成參數(shù)與合成音質(zhì)的基本概念。共振峰合成識記:共振峰合成法的特點。線性預料合成識記:(1)線性預料分析合成系統(tǒng)的基本原理。(2)格型濾波器用于語音分析和合成的參數(shù)。第十三章語音識別考核知識點語音識別概述語音識別原理考核要求語音識別概述識記:(1)語音識別的基本概念(2)語音識別的7種分類方法(3)語音識別中存在的幾個主要問題(二)語音識別原理1.識記:(1)語音識別的兩個步驟(2)模板匹配法的三個基本單元2.領悟:(1)語音識別的原理框圖第十四章說話人識別(不做要求)第十五章語音增加(不做要求)第十六章人工神經(jīng)網(wǎng)絡的應用(不做要求)第十七章語音信號處理中的新興與前沿技術(不做要求)第二部分數(shù)字圖象處理緒論考核知識點圖像基本概念圖像工程簡介圖像處理系統(tǒng)考核要求圖像基本概念識記:(1)圖像和數(shù)字圖像的基本概念。(2)圖像的表達。圖像工程簡介識記:(1)圖像技術和圖像工程。(2)圖像工程的3個層次。(3)圖像工程相關學科和領域。(4)圖像工程的技術應用。圖像處理系統(tǒng)識記:(1)系統(tǒng)構(gòu)成框圖。(2)圖像采集。(3)圖像顯示打印。(4)圖像存儲及各種圖像文件格式。(5)圖像處理。圖像采集考核知識點視覺過程成像中的空間關系光度學和亮度視覺采樣和量化考核要求視覺過程識記:(1)視覺過程的構(gòu)成,包括光學過程,化學過程和神經(jīng)處理過程。成像中的空間關系識記:(1)成像幾何的投影變換,齊次坐標和逆投影變換等基本概念。(2)視察距離和角度。(3)景深。應用:各種成像幾何的變換關系和景深計算。光度學和亮度視覺識記:(1)光通量,發(fā)光強度和照度等光度學等基本概念。(2)圖像成像數(shù)學模型。(3)視覺系統(tǒng)對光的感知特點,包括亮度適應,主觀亮度影響和亮度變化的感知。領悟:(1)光通量,發(fā)光強度和照度之間的相互關系,計算方法。(2)馬赫帶效應。采樣和量化識記:(1)空間辨別率和幅度辨別率。(2)圖像質(zhì)量與采樣和量化。領悟:(1)空間辨別率和幅度辨別率對圖像質(zhì)量的影響。應用:(1)依據(jù)空間辨別率和幅度辨別率計算圖像存儲量。像素空間關系考核知識點像素間聯(lián)系基本坐標變換形態(tài)變換幾何失真校正考核要求像素間聯(lián)系識記:(1)像素鄰域的基本概念。(2)像素間的鄰接,連接和連通的概念及推斷方法。(3)像素間的距離。應用:(1)像素鄰域的確定和像素間距離的計算?;咀鴺俗儞Q識記:(1)常見的圖像坐標變換,包括平移變換,放縮變換和旋轉(zhuǎn)變換。(2)級連變換和反變換的概念。應用:(1)給定不同的變換矩陣,對空間點進行各種變換。形態(tài)變換識記:(1)形態(tài)變換的基本概念和分類。(2)一般仿射變換的概念和性質(zhì)。(3)相像變換,剛體變換,歐氏變換和等距變換等特殊仿射變換的概念。(4)不同變換的層次關系和變換不變量。領悟:(1)各種仿射變換的性質(zhì)和特點。幾何失真校正識記:(1)幾何失真和幾何失真校正的基本概念。(2)幾何失真校正的兩個基本步驟,包括空間變換和灰度插值。領悟:(1)幾何失真校正的原理和方法??沼蛟黾蛹夹g考核知識點空域技術分類圖像間運算直接灰度映射直方圖變換線性濾波非線性濾波局部增加考核要求空域技術分類識記:(1)空域增加技術的基本概念和分類。圖像間運算識記:(1)基本算術和邏輯運算。應用:(1)圖像間運算的應用,包括圖像間加法,減法,乘法和除法。直接灰度映射識記:(1)灰度映射基本概念。(2)各種典型灰度映射的定義,包括圖像求反,對比度增加,動態(tài)范圍壓縮和灰度切分等。領悟:(1)灰度映射基本實現(xiàn)原理。(2)各種典型灰度映射的特點。應用:(1)運用直接灰度映射變換進行圖像增加。直方圖變換識記:(1)直方圖均衡化基本概念。(2)直方圖規(guī)定化基本概念。領悟:(1)直方圖均衡化基本原理。(2)直方圖規(guī)定化基本原理。應用:(1)運用直方圖變換技術進行圖像增加。線性濾波識記:(1)線性濾波的基本概念,技術分類。(2)線性平滑濾波器,包括鄰域平均和加權(quán)平均。領悟:(1)線性平滑濾波器的模板卷積和實現(xiàn)原理。應用:(1)運用線性平滑濾波技術進行圖像增加。非線性濾波識記:(1)非線性平滑濾波器基本概念,包括各種中值濾波器序統(tǒng)計濾波器等。(2)非線性銳化濾波器基本概念和性質(zhì),差分模板和最大-最小銳化變換。領悟:(1)非線性平滑濾波器的模板卷積和實現(xiàn)原理。(2)非線性銳化濾波器的模板卷積和實現(xiàn)原理。應用:(1)運用中值濾波技術進行圖像增加。局部增加識記:(1)局部增加的基本概念?;緢D像變換考核知識點可分別和正交圖像變換傅里葉變換沃爾什/哈達瑪變換離散余弦變換Radon變換考核要求可分別和正交圖像變換識記:(1)可分別圖像變換的基本概念。(2)正交圖像變換的基本概念。領悟:(1)正交圖像變換的對應矩陣性質(zhì)。傅里葉變換識記:(1)2-D傅里葉變換的基本概念。(2)傅里葉變換基本定理。(3)快速傅里葉實現(xiàn)方法。領悟:(1)各種傅里葉變換基本定理表達的空域和頻域性質(zhì),包括平移定理,旋轉(zhuǎn)定理,尺度定理,剪切定理,組合剪切定理,仿射定理,卷積定理和相關定理。應用:(1)傅里葉變換的計算,基于傅里葉變換技術的圖像分析。沃爾什/哈達瑪變換識記:(1)沃爾什變換的基本概念。(2)哈達瑪變換的基本概念。領悟:(1)沃爾什和哈達瑪變換之間的聯(lián)系和區(qū)分。應用:(1)構(gòu)造沃爾什和哈達瑪變換核。離散余弦變換識記:(1)離散余弦變換的基本概念。領悟:(1)離散余弦變換和傅里葉變換之間的聯(lián)系和區(qū)分。應用:(1)離散余弦變換的計算。Radon變換識記:(1)Radon變換的基本定義。(2)Radon變換基本性質(zhì)(3)Radon反變換領悟:(1)Radon變換和傅里葉變換之間的聯(lián)系和區(qū)分。頻域圖像增加考核知識點頻域圖像增加原理低通濾波高通濾波帶通和帶阻濾波同態(tài)濾波頻域和空域技術考核要求頻域圖像增加原理識記:(1)頻域圖像增加基本原理。領悟:(1)頻域圖像增加主要步驟。低通濾波識記:(1)低通濾波器的基本概念。(2)各種低通濾波器的定義。領悟:(1)低通濾波器的圖像濾波效果。應用:(1)運用低通濾波技術進行圖像增加。高通濾波識記:(1)高通濾波器的基本概念。(2)各種高通濾波器的定義。領悟:(1)高通濾波器的圖像濾波效果。應用:(1)運用高通濾波技術進行圖像增加。帶通和帶阻濾波識記:(1)帶通和帶阻濾波器的基本概念。(2)各種帶通和帶阻濾波器的定義。領悟:(1)帶通和帶阻濾波器的圖像濾波效果。同態(tài)濾波識記:(1)同態(tài)濾波器的基本概念和基本步驟。領悟:(1)同態(tài)濾波器的圖像濾波效果。頻域和空域技術領悟:(1)圖像增加中頻域和空域兩種技術間的聯(lián)系,空域技術可以借助頻域概念進行分析,頻域技術也可在空域?qū)崿F(xiàn)。彩色圖像處理考核知識點彩色視覺和描述彩色模型偽彩色增加真彩色處理考核要求彩色視覺和描述識記:(1)彩色視覺基礎。(2)三基色和色匹配基本概念。(3)色度,色系數(shù)和色度圖基本概念。彩色模型識記:(1)面對硬設備的彩色模型,包括RGB,CMY和彩色電視顏色模型等。(2)面對視覺感知的彩色模型,包括HIS,HSV和HSB模型等。應用:(1)各種彩色模型之間的相互轉(zhuǎn)換。偽彩色增加識記:(1)偽彩色增加的基本概念。(2)偽彩色增加的各種空域和頻域方法,包括亮度切割,從灰度到彩色的變換和頻域濾波。真彩色處理識記:(1)真彩色處理的基本概念。(2)單重量變換增加技術。(3)全彩色增加技術。圖像復原考核知識點退化及噪聲退化模型和對角化關于復原的探討無約束復原有約束復原交互式復原考核要求退化及噪聲識記:(1)信噪比的定義。(2)幾種常見噪聲來源。領悟:(1)幾種噪聲概率密度函數(shù)的表示形式,包括高斯噪聲,勻稱噪聲和脈沖(椒鹽)噪聲。退化模型和對角化識記:(1)圖像退化模型的描述,線性系統(tǒng)的幾特性質(zhì)。領悟:(1)退化模型矩陣的特點。(2)輪換矩陣對角化的表示方法。(3)退化模型對角化的表示方法。應用:(1)利用退化模型復原原始圖像的詳細矩陣表示。(2)退化模型的計算。(2)輪換矩陣對角化的計算。關于復原的探討識記:(1)存在誤差(尤其是加性噪聲)時圖像的復原公式。(2)幾種實復原函數(shù)的確定。應用:(1)無約束和有約束復原的向量表示法。無約束復原識記:(1)逆濾波的定義與數(shù)學描述。領悟:(1)逆濾波的物理意義。應用:(1)采納逆濾波技術進行圖像復原。(2)依據(jù)已知條件消退勻速直線運動造成的模糊。有約束復原識記:(1)維納濾波的基本概念,它是一種最小均方誤差濾波器。(2)相關矩陣的特點。領悟:(1)逆濾波復原和維納濾波復原結(jié)果的對比。(2)維納濾波與有約束最小平方濾波結(jié)果的對比。應用:(1)滿意給定約束條件時最優(yōu)解的向量表示。(2)有約束最小平方復原過程的詳細運用。交互式復原識記:(1)消退圖像中正弦干擾的基本方法。2.領悟:(1)正交式復原消退正弦干擾的數(shù)學描述。圖像重建考核知識點投影重建概述傅里葉反變換重建逆投影重建級數(shù)綻開重建綜合重建方法離散周期重建考核要求投影重建概述識記:(1)投影重建的主要方式,包括透射斷層成象,放射斷層成象,反射斷層成象,磁共振成象等。領悟:(1)投影重建的基本原理。傅里葉反變換重建識記:(1)傅里葉反變換重建的基本步驟和定義。(2)傅里葉變換投影定理的數(shù)學描述。(3)傅里葉反變換重建公式。領悟:(1)傅里葉反變換重建的基本原理。逆投影重建識記:(1)卷積逆投影重建的主要方法,包括連續(xù)公式推導,離散計算和扇束投影重建。(2)其他逆投影重建,包括逆投影濾波,濾波逆投影。領悟:(1)逆投影重建的基本原理。應用:(1)卷積逆投影重建法的詳細應用。級數(shù)綻開重建識記:(1)級數(shù)綻開重建基本概念和特點。(2)無松弛的代數(shù)重建技術。(3)松弛的代數(shù)重建技術。綜合重建方法識記:(1)綜合重建方法的詳細應用,如迭代變換法,迭代重建投影,角諧函數(shù)法和正弦多項式綻開等。離散周期重建識記:(1)圖像離散形式。(2)離散周期Radon變換公式。(3)離散周期Radon反變換公式。典型圖像變換考核知識點Gabor變換哈爾變換霍特林變換考核要求Gabor變換識記:(1)短時傅里葉變換定義。(2)連續(xù)Gabor變換定義。(3)離散Gabor變換定義。領悟:(1)短時傅里葉變換和Gabor變換的特點。哈爾變換識記:(1)哈爾函數(shù)的定義。(2)哈爾變換的定義。應用:(1)哈爾函數(shù)的計算?;籼亓肿儞Q識記:(1)霍特林變換定義。應用:(1)霍特林變換中特征值的計算。圖像編碼基礎考核知識點圖像編碼基本概念圖像編碼基礎理論LZW編碼變長編碼位平面編碼考核要求圖像編碼基本概念識記:(1)數(shù)據(jù)冗余的概念,包括編碼冗余,像素間冗余和心理視覺冗余。(2)圖像保真度和圖像質(zhì)量,包括客觀保真度準則和主觀保真度準則。(3)圖像編碼模型,包括通用編碼系統(tǒng)模型,信源編解碼器和信道編解碼器。圖像編碼基礎理論識記:(1)信息論基礎,包括信息測量,信息量單位(熵),自信息,互信息,信道容量等概念。(2)無失真編碼定理。(3)有失真信源編碼定理。領悟:(1)信息量和互信息的含義。(2)兩種信源編碼定理的含義。應用:(1)信息量,互信息的計算。(2)率失真函數(shù)的計算。LZW編碼識記:(1)LZW編碼的基本思路和特點。應用:(1)采納LZW編碼方法進行信源編碼。變長編碼識記:(1)變長編碼或熵編碼的基本概念。(2)哈夫曼編碼方法,包括最優(yōu)哈夫曼編碼和亞最優(yōu)哈夫曼編碼。(3)香農(nóng)-法諾編碼方法。(4)算術編碼方法。(5)變長編碼的特性,包括即時碼,唯一碼。領悟:(1)哈夫曼編碼基本原理。(2)香農(nóng)-法諾編碼基本原理。(3)算術編碼基本原理。應用:(1)采納哈夫曼編碼方法進行信源編碼。(2)采納算術編碼方法進行信源編碼。位平面編碼識記:(1)位平面分解,包括二值分解和灰度碼分解。(2)位平面編碼,包括常數(shù)塊編碼,1-D游程編碼和2-D游程編碼。領悟:(1)各種位平面編碼方法和它們之間的差異。圖像編碼方法考核知識點預料編碼變換編碼考核要求預料編碼識記:(1)無損預料編碼的基本概念。(2)有損預料編碼的基本概念,包括編碼系統(tǒng)框圖,DM編碼,DPCM編碼,最優(yōu)預料和最優(yōu)量化等。領悟:(1)無損預料編碼的基本原理。(2)有損預料編碼的基本原理。(3)有損預料編碼中的最優(yōu)預料和最優(yōu)量化。應用:(1)采納DM編碼,DPCM編碼方法進行預料編碼。(2)有損預料編碼中的最優(yōu)預料系數(shù)和最優(yōu)量化電平的確定。變換編碼識記:(1)變換編碼系統(tǒng)基本原理和系統(tǒng)框圖。(2)變換編碼基本步驟,包括子圖像尺寸選擇,變換選擇和比特安排方法。(3)重建均方誤差。領悟:(1)變換編碼基本原理。(2)子圖像尺寸對編碼系統(tǒng)的影響。(2)常見變換在編碼中的特點,變換選擇對編碼系統(tǒng)的影響。應用:(1)采納DCT變換進行信源編碼。圖像國際標準考核知識點國際標準二值圖像壓縮國際標準靜止圖像壓縮國際標準運動圖像壓縮國際標準多媒體國際標準考核要求國際標準識記:(1)圖像壓縮編碼國際標準的基本分類。二值圖像壓縮國際標準識記:(1)二值圖像壓縮的常用標準介紹,包括G3和G4還有JBIG。靜止圖像壓縮國際標準識記:(1)靜止圖像壓縮標準介紹,包括JPEG和JPEG2000。領悟:(1)JPEG基本系統(tǒng)的組成與編碼器的實現(xiàn)原理。運動圖像壓縮國際標準識記:(1)運動圖像壓縮標準介紹,包括MotionJPEG,H.261,MPEG1,MPEG2,MPEG4和H.264/AVC等。領悟:(1)H.261基本系統(tǒng)的組成與編碼器的實現(xiàn)原理。多媒體國際標準識記:(1)多媒體國際標準介紹,包括MPEG7和MPEG21。Ⅲ有關說明和實施要求為了使本大綱的規(guī)定在個人自學,社會助學和考試命題中得到貫徹和落實,茲對有關問題說明如下。并進而提出實施要求。一,關于考核目標的說明為使考核內(nèi)容詳細化和考試要求標準化,本大綱在列出考試內(nèi)容的基礎,對各章規(guī)定了考核目標,使自學應考者能夠進一步明確考試內(nèi)容和要求,更有目的地系統(tǒng)學習教材.,使社會助學者能夠更全面地有針對性地分層次進行輔導,使考試命題能夠更加明確命題范圍,更精確地支配試題的知識實力層次的難易度。本大綱在考核目標中,依據(jù)識記,領悟,應用三個層次規(guī)定其應達到的實力層次要求。三個實力層次是遞進等級關系,各實力層次的含義是:識記:能知道有關的名詞,概念,知識的意義,并能正確認知和表述。領悟:在識記的基礎上,能全面地把握基本概念,基本規(guī)范,基本方法,能駕馭有關概念,規(guī)范,方法和區(qū)分與聯(lián)系,并內(nèi)化成自己實際工作的實力。應用:在識記和領悟的基礎上,能對問題進行正確的闡述和分析計算,能運用所學知識處理和解決實際問題。二,自學教材《語音信號處理》,胡航編著,哈爾濱工業(yè)大學出版社,2005年;《圖象工程(上冊)圖像處理》,章毓晉編著,清華大學出版社,2005年。三,自學方法指導1,在全面系統(tǒng)學習的基礎上駕馭基本概念,基本知識,基本方法和技巧。本課程內(nèi)容涉及語音信號處理和數(shù)字圖象處理兩大部分的各個方面。知識,范圍比較廣泛,自學者應首先全面系統(tǒng)地學習各章,深刻領悟語音和圖象信號處理的一般理論,其次,應當識記語音和圖象信號處理的基本概念,基本知識,詳細問題的基本分析方法和技巧,同時留意各部分內(nèi)容之間的聯(lián)系,然后,在全面系統(tǒng)的基礎上駕馭重點,有目的地深化學習重點章節(jié),但切忌在沒有了解全貌的狀況下孤立地去抓重點,押題目。2,要把學習語音和圖象信號處理的基本理論和分析詳細問題結(jié)合起來自學,自學應考者應當懂得,語音和圖象信號處理這門課是一門理論性與實踐性都很強的課程,在學習中切忌死記硬背,而應當把課程內(nèi)容與詳細問題聯(lián)系起來,力求能夠運用所學基本理論知識進行語音和圖象信號的實際分析與處理,以增加感性相識,更深刻地領悟教材內(nèi)容,將知識內(nèi)化為自身的素養(yǎng),和實力,以提高自己分析解決語音和圖象方面問題的實力。四,對社會助學的要求1,社會助學者應依據(jù)本大綱規(guī)定的??荚噧?nèi)容和考核目標,仔細鉆研指定教材,明確本課程與其他課程不同的特點和學習要求,對自學應考者進行切實有效的輔導,引導他們防止自學中的各種偏向,把握社會助學的正確方向。2,要正確處理基本知識的應用實力的關系,努力引導自學應考者將識記,須會同應用聯(lián)系起來,把基本知識轉(zhuǎn)化為實際工作實力,在輔導的基礎上,著重培育和提高自學應考者的素養(yǎng)和思想水平。3,要正確處理重點和一般的關系。課程內(nèi)容有重點與一般之分,但考試內(nèi)容是全面的,而且重點與一般是相互影響的,不是截然分開的.社會助學者應指導自學應考者全面系統(tǒng)地學習教材,駕馭全部考試內(nèi)容和考試知識點,在此基礎上再突出重點.總之,要把重點學習同兼顧一般結(jié)合起來,切勿孤立地抓重點,把自學應考者引向猜題押題。五,關子命題考試的若干要求1,本課程的命題考試,應依據(jù)本大綱所規(guī)定的考試內(nèi)容和考試目標來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論