工業(yè)機器視覺課程7圖像編碼_第1頁
工業(yè)機器視覺課程7圖像編碼_第2頁
工業(yè)機器視覺課程7圖像編碼_第3頁
工業(yè)機器視覺課程7圖像編碼_第4頁
工業(yè)機器視覺課程7圖像編碼_第5頁
已閱讀5頁,還剩139頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

工業(yè)機器視覺課程7圖像編碼第一頁,共144頁。圖像壓縮與編碼基本概念哈夫曼編碼香農(nóng)-行程編碼算術(shù)編碼變換編碼靜止圖像壓縮編碼標(biāo)準(zhǔn)-JPEG運動圖像壓縮編碼標(biāo)準(zhǔn)-MPEG第八章圖像編碼第二頁,共144頁。一.圖像壓縮與編碼基本概念

為什么要進行圖像壓縮

圖像數(shù)據(jù)壓縮的可能性

常見的數(shù)據(jù)冗余

圖像壓縮的目的

圖像數(shù)據(jù)壓縮技術(shù)的重要指標(biāo)

圖像編碼中的保真度準(zhǔn)則

常用的壓縮編碼方法圖像壓縮模型返回第三頁,共144頁。1.為什么要進行圖像壓縮?數(shù)字圖像通常要求很大的比特數(shù),這給圖像的傳輸和存儲帶來相當(dāng)大的困難。要占用很多的資源,花很高的費用。如一幅512x512的灰度圖象的比特數(shù)為512x512x8=256k

再如一部90分鐘的彩色電影,每秒放映24幀。把它數(shù)字化,每幀512x512象素,每象素的R、G、B三分量分別占8bit,總比特數(shù)為第四頁,共144頁。90x60x24x3x512x512x8bit=97,200M。如一張CD光盤可存600兆字節(jié)數(shù)據(jù),這部電影光圖像(還有聲音)就需要160張CD光盤用來存儲。

對圖像數(shù)據(jù)進行壓縮顯得非常必要。

返回第五頁,共144頁。2.圖像數(shù)據(jù)壓縮的可能性一般原始圖像中存在很大的冗余度。用戶通常允許圖像失真。當(dāng)信道的分辨率不及原始圖像的分辨率時,降低輸入的原始圖像的分辨率對輸出圖像分辨率影響不大。用戶對原始圖像的信號不全都感興趣,可用特征提取和圖像識別的方法,丟掉大量無用的信息。提取有用的信息,使必須傳輸和存儲的圖像數(shù)據(jù)大大減少。

返回第六頁,共144頁。3.常見的數(shù)據(jù)冗余(1)編碼冗余:

如果一個圖像的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖像包含了編碼冗余。例:如果用8位表示該圖像的像素,我們就說該圖像存在著編碼冗余,因為該圖像的像素只有兩個灰度,用一位即可表示。第七頁,共144頁。(2)像素冗余:

由于任何給定的像素值,原理上都可以通過它的鄰居預(yù)測到,單個像素攜帶的信息相對是小的。 對于一個圖像,很多單個像素對視覺的貢獻是冗余的。這是建立在對鄰居值預(yù)測的基礎(chǔ)上。原始圖像越有規(guī)則,各像素之間的相關(guān)性越強,它可能壓縮的數(shù)據(jù)就越多。第八頁,共144頁。(3)視覺心理冗余:

一些信息在一般視覺處理中比其它信息的相對重要程度要小,這種信息就被稱為視覺心理冗余。返回第九頁,共144頁。4.圖像壓縮的目的圖像數(shù)據(jù)壓縮的目的是在滿足一定圖像質(zhì)量條件下,用盡可能少的比特數(shù)來表示原始圖像,以提高圖像傳輸?shù)男屎蜏p少圖像存儲的容量。在信息論中稱為信源編碼。圖像從結(jié)構(gòu)上大體上可分為兩大類,一類是具有一定圖形特征的結(jié)構(gòu),另一類是具有一定概率統(tǒng)計特性的結(jié)構(gòu)?;诓煌膱D像結(jié)構(gòu)特性,應(yīng)采用不同的壓縮編碼方法。返回第十頁,共144頁。5.圖像數(shù)據(jù)壓縮技術(shù)的重要指標(biāo)(1)壓縮比:圖像壓縮前后所需的信息存儲量之比,壓縮比越大越好。(2)壓縮算法:利用不同的編碼方式,實現(xiàn)對圖像的數(shù)據(jù)壓縮。(3)失真性:壓縮前后圖像存在的誤差大小。第十一頁,共144頁。全面評價一種編碼方法的優(yōu)劣,除了看它的編碼效率、實時性和失真度以外,還要看它的設(shè)備復(fù)雜程度,是否經(jīng)濟與實用。常采用混合編碼的方案,以求在性能和經(jīng)濟上取得折衷。

隨著計算方法的發(fā)展,使許多高效而又比較復(fù)雜的編碼方法在工程上有實現(xiàn)的可能。返回第十二頁,共144頁。6.圖像編碼中的保真度準(zhǔn)則圖像信號在編碼和傳輸過程中會產(chǎn)生誤差,尤其是在有損壓縮編碼中,產(chǎn)生的誤差應(yīng)在允許的范圍之內(nèi)。在這種情況下,保真度準(zhǔn)則可以用來衡量編碼方法或系統(tǒng)質(zhì)量的優(yōu)劣。通常,這種衡量的尺度可分為客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。第十三頁,共144頁。(1)客觀保真度準(zhǔn)則通常使用的客觀保真度準(zhǔn)則有輸入圖像和輸出圖像的均方根誤差;輸入圖像和輸出圖像的均方根信噪比兩種。

均方根誤差:設(shè)輸入圖像是由N×N個像素組成,令其為f(x,y),其中x,y=0,1,2,…,N-1。這樣一幅圖像經(jīng)過壓縮編碼處理后,送至受信端,再經(jīng)譯碼處理,重建原來圖像,這里令重建圖像為g(x,y)。它同樣包含N×N個像素,并且x,y=0,1,2,…,N-1。第十四頁,共144頁。在0,1,2,…,N-1范圍內(nèi)x,y的任意值,輸入像素和對應(yīng)的輸出圖像之間的誤差可用下式表示:而包含N×N像素的圖像之均方誤差為:由式可得到均方根誤差為第十五頁,共144頁。

如果把輸入、輸出圖像間的誤差看作是噪聲,那么,重建圖像g(x,y)可由下式表示:在這種情況下,另一個客觀保真度準(zhǔn)則——重建圖像的均方信噪比如下式表示:第十六頁,共144頁。設(shè)一幅灰度級為K的圖像,圖像中第k級灰度出現(xiàn)的概率為pk,圖像大小為M×N,每個像素用d比特表示,每兩幀圖像間隔△t第十七頁,共144頁。數(shù)字圖像的熵H圖像的平均碼字長度R為:編碼效率η定義為:

第十八頁,共144頁。信息冗余度為:每秒鐘所需的傳輸比特數(shù)bps為:壓縮比r為:第十九頁,共144頁。均方根信噪比為:第二十頁,共144頁。(2)主觀保真度準(zhǔn)則圖像處理的結(jié)果,大多是給人觀看,由研究人員來解釋的,因此,圖像質(zhì)量的好壞,既與圖像本身的客觀質(zhì)量有關(guān),也與視覺系統(tǒng)的特性有關(guān)。有時候,客觀保真度完全一樣的兩幅圖像可能會有完全不相同的視覺質(zhì)量,所以又規(guī)定了主觀保真度準(zhǔn)則,這種方法是把圖像顯示給觀察者,然后把評價結(jié)果加以平均,以此來評價一幅圖像的主觀質(zhì)量。另外一種方法是規(guī)定一種絕對尺度,如:第二十一頁,共144頁。1)優(yōu)秀高質(zhì)量圖像;2)好的是可供觀賞的高質(zhì)量的圖像,干擾并不令人討厭;3)可通過的圖像質(zhì)量可以接受,干擾不討厭;4)邊緣的圖像質(zhì)量較低,希望能加以改善,干擾有些討厭;5)劣等的圖像質(zhì)量很差,尚能觀看,干擾顯著地令人討厭;6)不能用圖像質(zhì)量非常之差,無法觀看。第二十二頁,共144頁。圖像壓縮技術(shù)無損壓縮有損壓縮哈夫曼編碼行程編碼算術(shù)編碼有損預(yù)測編碼變換編碼其他編碼二.常用的壓縮編碼方法第二十三頁,共144頁?!鶡o損壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時能精確恢復(fù)原圖像,無損壓縮的壓縮比很少有能超過3:1的,常用于要求高的場合。第二十四頁,共144頁。※有損壓縮是通過犧牲圖像的準(zhǔn)確率以實現(xiàn)較大的壓縮率,如果容許解壓圖像有一定的誤差,則壓縮率可顯著提高。有損壓縮在壓縮比大于30:1時仍然可重構(gòu)圖像,而如果壓縮比為10:1到20:1,則重構(gòu)的圖像與原圖幾乎沒有差別返回第二十五頁,共144頁。圖像信息源圖像預(yù)處理圖像信源

編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源

解碼顯示圖像1.圖像的壓縮模型第二十六頁,共144頁。源數(shù)據(jù)編碼:完成原數(shù)據(jù)的壓縮。通道編碼:為了抗干擾,增加一些容錯、校驗位,實際上是增加冗余。通道:如Internet、廣播、通訊、可移動介質(zhì)源數(shù)據(jù)編碼通道編碼通道通道解碼源數(shù)據(jù)解碼第二十七頁,共144頁。源數(shù)據(jù)編碼與解碼的模型源數(shù)據(jù)編碼的模型源數(shù)據(jù)解碼的模型映射器量化器符號編碼器符號解碼器反向映射器第二十八頁,共144頁。源數(shù)據(jù)編碼與解碼的模型映射器:減少像素冗余,如使用RLE編碼。或進行圖像變換量化器:減少視覺心理冗余,僅用于有損壓縮符號編碼器:減少編碼冗余,如使用哈夫曼編碼第二十九頁,共144頁。2.哈夫曼編碼哈夫曼編碼是一種利用信息符號概率分布特性的變字長的編碼方法。對于出現(xiàn)概率大的信息符號編以短字長的碼,對于出現(xiàn)概率小的信息符號編以長字長的碼。

第三十頁,共144頁。方法:將信源符號按出現(xiàn)概率從大到小排成一列,然后把最末兩個符號的概率相加,合成一個概率。把這個符號的概率與其余符號的概率按從大到小排列,然后再把最末兩個符號的概率加起來,合成一個概率。重復(fù)上述做法,直到最后剩下兩個概率為止。從最后一步剩下的兩個概率開始逐步向前進行編碼。每步只需對兩個分支各賦予一個二進制碼,如對概率大的賦予碼0,對概率小的賦予碼1。第三十一頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第三十二頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第三十三頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三十四頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第三十五頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4第三十六頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101第三十七頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1第三十八頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00第三十九頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011第四十頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100第四十一頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010第四十二頁,共144頁。Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011第四十三頁,共144頁。編碼舉例cbafe7/225/224/222/2201f=11e=01a=00b=101c=1001d=1000d1/223/226/2222/2213/229/223/2210101010返回第四十四頁,共144頁。第四十五頁,共144頁。對不同概率分布的信源,哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論,對于二進制編碼,當(dāng)信源概率為2的負冪次方時,哈夫曼編碼的編碼效率可達100%,其平均碼字長度也很短.信源概率為均勻分布時,其編碼效果明顯降低。在上表中,顯然,第二種情況的概率分布也服從2的負冪次方,故其編碼效率η也可以達到100%,但由于它服從均勻分布,其熵最大,平均編碼長度很大,因此從其他指標(biāo)看(如,壓縮比r),其編碼效率最低。也就是說,在信源概率接近于均勻分布時,一般不使用哈夫曼編碼。第四十六頁,共144頁。作業(yè):1.有如下信源x,

X=u1u2u3u4u5u6u7u8P1P2P3P4P5P6P7P8其中:P1=0.21,P2=0.09,P3=0.11,P4=0.13,P5=0.07,P6=0.12,P7=0.08,P8=0.19。將該信源進行哈夫曼編碼。第四十七頁,共144頁。2.設(shè)一幅灰度級為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?,F(xiàn)對其進行哈夫曼編碼第四十八頁,共144頁。2.香農(nóng)—范諾編碼

香農(nóng)—范諾(Shannon-Fannon)編碼也是一種典型的可變字長編碼。與哈夫曼編碼相似,當(dāng)信源符號出現(xiàn)的概率正好為2的負冪次方時,香農(nóng)—范諾編碼的編碼效率可以達到100%。第四十九頁,共144頁。香農(nóng)—范諾編碼的理論基礎(chǔ)是符號的碼字長度Ni完全由該符號出現(xiàn)的概率來決定,對于二進制編碼即有:第五十頁,共144頁。編碼步驟(1)將信源符號按其出現(xiàn)的概率由大到小順序排列,若兩個符號的概率相等,則相等概率的字符順序可以任意排列;(2)根據(jù)式(8-11)計算出各概率符號所對應(yīng)的碼字長度Ni;(3)將各符號的概率累加,計算累加概率P,即:第五十一頁,共144頁。第五十二頁,共144頁。(4)把各個累加概率P由十進制轉(zhuǎn)換為二進制;(5)根據(jù)式(8-11)取二進制累加概率前Ni位的數(shù)字,并省去小數(shù)點前的“0.”字符,即為對應(yīng)信源符號的香農(nóng)—范諾編碼碼字。第五十三頁,共144頁。編碼舉例

例:設(shè)一幅灰度級為8的圖像中,各灰度級分別用S0、S1、S2、S3、S4、S5、S6、S7表示,對應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?,F(xiàn)對其進行編碼。編碼步驟如下第五十四頁,共144頁。(1)將信源符號按其出現(xiàn)概率由大到小順序排列,為0.40,0.18,0.10,0.10,0.07,0.06,0.05,0.04;(2)對于概率0.40對應(yīng)的符號S0,根據(jù)(8-11)計算N0=2,將累加概率0.00轉(zhuǎn)換位二進制小數(shù)為0.00,取前N0=2位,并去除小數(shù)點前的字符,即S0字符編碼為00;(3)對于概率0.18對應(yīng)的符號S1,根據(jù)(8-11)計算N1=3,將累加概率0.40轉(zhuǎn)換位二進制小數(shù)為0.0110,取前N1=3位,并去除小數(shù)點前的字符,即S1字符編碼為011;第五十五頁,共144頁。(4)對于概率0.10對應(yīng)的符號S2,根據(jù)(8-11)計算N2=4,將累加概率0.58轉(zhuǎn)換位二進制小數(shù)為0.10010,取前N2=4位,并去除小數(shù)點前的字符,即S2字符編碼為1001;(5)對于概率0.10對應(yīng)的符號S3,根據(jù)(8-111)計算N3=4,將累加概率0.68轉(zhuǎn)換位二進制小數(shù)為0.10100,取前N3=4位,并去除小數(shù)點前的字符,即S3字符編碼為1010;(6)對于概率0.07對應(yīng)的符號S4,根據(jù)(8-11)計算N4=4,將累加概率0.78轉(zhuǎn)換位二進制小數(shù)為0.11000,取前N4=4位,并去除小數(shù)點前的字符,即S4字符編碼為1100;第五十六頁,共144頁。(7)對于概率0.06對應(yīng)的符號S5,根據(jù)(8-11)計算N5=5,將累加概率0.85轉(zhuǎn)換位二進制小數(shù)為0.1101100,取前N5=5位,并去除小數(shù)點前的字符,即S5字符編碼為11011;(8)對于概率0.05對應(yīng)的符號S6,根據(jù)(8-11)計算N6=5,將累加概率0.91轉(zhuǎn)換位二進制小數(shù)為0.1110100,取前N6=5位,并去除小數(shù)點前的字符,即S6字符編碼為11101;(9)對于概率0.04對應(yīng)的符號S7,根據(jù)(8-11)計算N7=5,將累加概率0.68轉(zhuǎn)換位二進制小數(shù)為0.11110100,取前N7=5位,并去除小數(shù)點前的字符,即S7字符編碼為11110;第五十七頁,共144頁。香農(nóng)—范諾編碼效能

(1)圖像信息熵為(2)平均碼字長度為第五十八頁,共144頁。效率為:信息冗余度為第五十九頁,共144頁。3.行程編碼RLE編碼——RunLengthEncoding概念:行程:具有相同灰度值的像素序列。編碼思想:去除像素冗余。

用行程的灰度和行程的長度代替行程本身。例:設(shè)重復(fù)次數(shù)為iC,重復(fù)像素值為iP

編碼為:iCiPiCiPiCiP

編碼前:aaaaaaabbbbbbcccccccc

編碼后:7a6b8c第六十頁,共144頁。游程長度編碼RLE(RunLengthEncoding):

由于一幅圖像中有許多顏色相同的圖塊,用一整數(shù)對存儲一個像素的顏色值及相同顏色像素的數(shù)目(長度)。例如:(G,L)

長度顏色值編碼時采用從左到右,從上到下的排列,每當(dāng)遇到一串相同數(shù)據(jù)時就用該數(shù)據(jù)及重復(fù)次數(shù)代替原來的數(shù)據(jù)串。3333333222222222226666666111111111111111111888888888888888888555555555555553333222222222222222222(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(5,12)(8,18)(5,14)(3,4)(2,18)18*7的像素顏色僅用11對數(shù)據(jù)第六十一頁,共144頁。RLE編碼——RunLengthEncoding分析:對于有大面積色塊的圖像,壓縮效果很好直觀,經(jīng)濟,是一種無損壓縮對于紛雜的圖像,壓縮效果不好,最壞情況下,會加倍圖像第六十二頁,共144頁。適合行程編碼的圖第六十三頁,共144頁。第六十四頁,共144頁。第六十五頁,共144頁。適合行程編碼的圖第六十六頁,共144頁。1)圖像數(shù)據(jù)以字節(jié)為單位進行編碼2)按行進行壓縮3)長度在前,灰度值在后4)以最高兩位作為判斷是重復(fù)數(shù)還是原像素,最高兩位為1,說明是重復(fù)數(shù),否則,說明是原像素值PCX的RLE壓縮算法第六十七頁,共144頁。5)重復(fù)像素長度iC最大值為63,如果遇到iC大于63的情況,則分為小于63的幾段,分別處理。6)如果遇到不重復(fù)的單個像素P: 如果P<0xC0(192)直接存入該像素值,否則先存入0xC1,再存入像素值(192-255之間的單像素圖像不減反增)PCX的RLE壓縮算法返回第六十八頁,共144頁。PCX的RLE壓縮算法0x150x150x15……0x5A0x35…….0x350xD711個80個0xD90xCB0x150x5A0xFF0x350xD10x350xC10xD70xC10xD9第六十九頁,共144頁。4.算術(shù)編碼

從理論上分析,采用哈夫曼編碼可以獲得最佳信源字符編碼效果;實際應(yīng)用中,由于信源字符出現(xiàn)的概率并非滿足2的負冪次方,因此往往無法達到理論上的編碼效率和信息壓縮比;第七十頁,共144頁。以信源字符序列{x,y}為例設(shè)字符序列{x,y}對應(yīng)的概率為{1/3,2/3},Nx和Ny分別表示字符x和y的最佳碼長,則根據(jù)信息論有:第七十一頁,共144頁。字符x、y的最佳碼長分別為1.58bit和0.588bi;這表明,要獲得最佳編碼效果,需要采用小數(shù)碼字長度,這是不可能實現(xiàn)的;即采用哈夫曼方法對{x,y}的碼字分別為0和1,也就是兩個符號信息的編碼長度都為1。對于出現(xiàn)概率大的字符y并未能賦予較短的碼字;實際編碼效果往往不能達到理論效率;為提高編碼效率,Elias等人提出了算術(shù)編碼算法。第七十二頁,共144頁。算術(shù)編碼的特點

算術(shù)編碼是信息保持型編碼,它不像哈夫曼編碼,無需為一個符號設(shè)定一個碼字;算術(shù)編碼分為固定方式和自適應(yīng)方式兩種編碼;選擇不同的編碼方式,將直接影響到編碼效率;自適應(yīng)算術(shù)編碼的方式,無需先定義概率模型,適合于無法知道信源字符概率分布的情況;當(dāng)信源字符出現(xiàn)的概率比較接近時,算術(shù)編碼效率高于哈夫曼編碼的效率,在圖像通信中常用它來取代哈夫曼編碼;實現(xiàn)算術(shù)編碼算法的硬件比哈夫曼編碼復(fù)雜。第七十三頁,共144頁。編碼原理算術(shù)編碼方法是將被編碼的信源消息表示成0~1之間的一個間隔,即小數(shù)區(qū)間,消息越長,編碼表示它的間隔就越小;以小數(shù)表示間隔,表示的間隔越小所需的二進制位數(shù)就越多,碼字就越長。反之,間隔越大,編碼所需的二進制位數(shù)就少,碼字就短。算術(shù)編碼將被編碼的圖像數(shù)據(jù)看作是由多個符號組成的字符序列,對該序列遞歸地進行算術(shù)運算后,成為一個二進制分數(shù);接收端解碼過程也是算術(shù)運算,由二進制分數(shù)重建圖像符號序列。第七十四頁,共144頁。編碼舉例設(shè)圖像信源編碼可用a、b、c、d這4個符號來表示,若圖像信源字符集為{dacba},信源字符出現(xiàn)的概率分別如下表所示,采用算術(shù)編碼對圖像字符集編碼。信源字符abcd出現(xiàn)概率0.40.20.20.2第七十五頁,共144頁。算術(shù)編碼的基本步驟(1)根據(jù)已知條件和數(shù)據(jù)可知,信源各字符在區(qū)間[0,1]內(nèi)的子區(qū)間間隔分別如下:a=[0.0,0.4)b=[0.4,0.6)c=[0.6,0.8)d=[0.8,1.0)(2)計算中按如下公式產(chǎn)生新的子區(qū)間:第七十六頁,共144頁。(3)第1個被壓縮的字符為“d”,其初始子區(qū)間為[0.8,1.0)(4)第2個被壓縮的字符為“a”,由于其前面的字符取值區(qū)間為[0.8,1.0)范圍,因此,字符“a”應(yīng)在前一字符區(qū)間間隔[0.8,1.0)的[0.0,0.4)子區(qū)間內(nèi),根據(jù)公式(8-15)可得:=0.8+0.0×(1.0-0.8)=0.8=0.8+0.4×(1.0-0.8)=0.88第七十七頁,共144頁。(5)第3個被壓縮的字符為“c”,由于其前面的字符取值區(qū)間為[0.8,0.88)范圍內(nèi),因此,字符“c”應(yīng)在前一字符區(qū)間間隔[0.8,0.88)的[0.6,0.8)子區(qū)間內(nèi),根據(jù)(8-15)可得:=0.8+0.6×(0.88-0.8)=0.848=0.8+0.8×(0.88-0.8)=0.864第七十八頁,共144頁。(6)第4個被壓縮的字符為“b”,由于其前面的字符取值區(qū)間為[0.848,0.864)范圍內(nèi),因此,字符“b”應(yīng)在前一字符區(qū)間間隔[0.848,0.864)的[0.4,0.6)子區(qū)間內(nèi),根據(jù)(8-15)可得:=0.848+0.4×(0.864-0.848)=0.8544=0.848+0.6×(0.864-0.848)=0.8576第七十九頁,共144頁。(7)第5個被壓縮的字符為“a”,由于其前面的字符取值區(qū)間為[0.8544,0.8)范圍內(nèi),因此,字符“a”應(yīng)在前一字符區(qū)間間隔[0.8544,0.8576)的[0.0,0.4)子區(qū)間內(nèi),根據(jù)(8-15)可得:=0.8544+0.0×(0.8576-0.8544)=0.8544=0.8544+0.4×(0.8576-0.86544)=0.85568第八十頁,共144頁。經(jīng)過上述計算,字符集{dacba}被描述在實數(shù)[0.8544,0.85568)子區(qū)間內(nèi),即該區(qū)間內(nèi)的任一實數(shù)值都惟一對應(yīng)該符序列{dacba};因此,可以用[0.8544,0.85568)內(nèi)的一個實數(shù)表示字符集{dacba}。第八十一頁,共144頁。[0.8544,0.85568)子區(qū)間的二進制表示形式為:[0.11110,0.11101);在該區(qū)間內(nèi)的最短二進制代碼為0.11011011,去掉小數(shù)點及其前的字符,從而得到該字符序列的算術(shù)編碼為11011011。算術(shù)編碼可以通過硬件電路實現(xiàn),在上述乘法運算,可以通過右移來實現(xiàn),因此在算術(shù)編碼算法中只有加法和移位運算。第八十二頁,共144頁。算術(shù)編碼效能

根據(jù)上述運算結(jié)果,編碼11011011惟一代表字符序列{dacba},因此,平均碼字長度為:

bit/字符

第八十三頁,共144頁。變換編碼的基本原理是將空域中的圖像信號,變換到另外一些正交空間中去,用變換系數(shù)來表示原始圖像,并對變換系數(shù)進行編碼。一般來說在變換域里描述要比在空域簡單,因為圖像的相關(guān)性明顯下降。盡管變換本身并不帶來數(shù)據(jù)壓縮,但變換圖像的能量大部分只集中于少數(shù)幾個變換系數(shù)上,采用量化和熵編碼則可以有效地壓縮圖像的編碼比特率。三.變換編碼第八十四頁,共144頁。圖像信息經(jīng)過變換處理,相鄰像元之間的相關(guān)性明顯下降,有利于圖像的編碼壓縮。圖像頻譜中的變換系數(shù),表示圖像在不同空間頻率上的相對幅度,而且某一空間頻率所包含的信息來自整個圖像,頻譜能量主要集中在低頻部分,譜能量隨頻率的增加而迅速下降,再次,變換編碼受噪聲干擾的影響較小。圖象的變換編碼,隨著數(shù)字信號處理技術(shù)的發(fā)展,特別是快速變換的算法和大規(guī)模集成電路(LSI)的出現(xiàn),使它具有實際應(yīng)用的可能。

1.變換編碼的特點第八十五頁,共144頁。第八十六頁,共144頁。變換本身不能直接減少數(shù)碼率,只有通過適當(dāng)?shù)木幋a,才能利用變換來壓縮圖像數(shù)據(jù)。例,設(shè)一幅8x8的圖像信息如下圖并對其進行二維Walsh變換第八十七頁,共144頁。上面的例子說明,原始信號的能量分布是相當(dāng)分散的,經(jīng)過變換后卻相當(dāng)集中,而且主要集中在少數(shù)的頻率譜上。對極大部分區(qū)域來說,它的譜能量為零。為了達到數(shù)據(jù)的壓縮,即選出能量集中的區(qū)域進行編碼,而放棄不集中的區(qū)域。第八十八頁,共144頁。變換編碼的基本原理——舉例

原始圖像 相應(yīng)的DCT系數(shù)5255 6166 706164736359 6690 1098569726259 6811314410466736358 7112215410670696761 681041268868707965 6070 776858758571 6459 556165838779 6968 65767894-415-29-62 2555 -20-1 37-21-62 911 -7-6 6-46877-25-30 107 -5-501335-15-9 60 311-8-13-2-1 1-4 1-1013-3-1 02 -1-4-12-12 -31 -2-1-1-1-2-1 -10 -1第八十九頁,共144頁。變換編碼的基本步驟(1)圖像分塊,用一個可逆線性變換(如傅立葉變換)把圖像映射到變換系數(shù)集合。(2)對該系數(shù)集合進行量化和編碼。對于大多數(shù)圖像,重要系數(shù)的數(shù)量是比較少,且圖像失真較小。(3)在接收端對接收到的碼流進行解碼,分離出各變換系數(shù),且對舍去的系數(shù)用“0”來代替,然后求反變換,恢復(fù)各圖像子塊。第九十頁,共144頁。變換編碼的基本步驟編碼、解碼流程第九十一頁,共144頁。正交變換的物理意義圖像數(shù)據(jù)正交變換后不改變信源的熵值,變換前后圖像的信息量沒有損失,完全可以通過對應(yīng)的逆變換得到原來的圖像數(shù)據(jù)。

經(jīng)過正交變換后,數(shù)據(jù)的分布規(guī)律發(fā)生了很大的改變,像素之間的相關(guān)性下降,變換系數(shù)向新坐標(biāo)系中的少數(shù)坐標(biāo)集中,一般集中于少數(shù)的直流或低頻分量的坐標(biāo)點。變換編碼將統(tǒng)計上高度相關(guān)的像素所構(gòu)成的矩陣通過正交變換,變成統(tǒng)計上彼此較為獨立、甚至達到完全獨立的變換系數(shù)矩陣,以達到壓縮數(shù)據(jù)的目的。第九十二頁,共144頁。正交變換的幾何意義第九十三頁,共144頁。圖像變換應(yīng)將整幅圖像分成8×8或16×16的小塊,然后分別進行變換。子圖像在變換中可能出現(xiàn)“邊緣效應(yīng)”,影響圖像質(zhì)量。Fourier變換不僅在圖像的增強,復(fù)原,重構(gòu),描述和圖像序列分析中得到廣泛應(yīng)用,而且在圖像變換編碼中首先引起重視。

Fourier變換編碼會出現(xiàn)“邊緣效應(yīng)”,若用余弦變換代替,由于其偶對稱性,子圖像在變換域中將不存在“邊緣”效應(yīng)。DCT是一種接近最佳的正交變換,在圖像變換中具有重要的實用價值。JPEG標(biāo)準(zhǔn)也采用了它。第九十四頁,共144頁。構(gòu)造nxn的子圖NxNnxnnxnnxnnxnnxnnxn第九十五頁,共144頁。DCT變換編碼的基本步驟

DCT變換編碼方法:DCT變換DCT逆變換原圖像除以量化矩陣取整1)編碼過程:2)解碼過程:壓縮圖像取整壓縮圖像解壓圖像第九十六頁,共144頁。例:原圖像為:DCT變換除以量化矩陣,取整第九十七頁,共144頁。DCT變換編碼原圖解壓圖第九十八頁,共144頁。實現(xiàn)變換壓縮算法的主要問題變換的選擇子圖尺寸的選擇正向變換量化器符號編碼器構(gòu)造nxn的子圖輸入圖像NxN壓縮圖像第九十九頁,共144頁。主要問題一:變換的選擇

1、可以選擇的變換1)K-L變換(KLT)2)離散傅立葉變換(DFT)

3)離散余弦變換(DCT)

4)Walsh-Hadamard變換(WHT)5)小波變換第一百頁,共144頁。2、對變換的評價按信息封裝能力排序:KLT,DCT,DFT,WHT,HRT若輸入是廣義平穩(wěn)序列,則存在一種最佳的正交變換——卡洛變換。所謂最佳:1.變換系數(shù)互不相關(guān);2.數(shù)值較大的方差出現(xiàn)在少數(shù)系數(shù)中,即能量高度集中。這樣,可在允許的總的均方誤差一定的條件下,將數(shù)據(jù)減到最少。但KLT的基圖像是數(shù)據(jù)依賴的,所以一般沒有快速算法,因此只宜于作理論分析和試驗用。DFT的塊效應(yīng)嚴(yán)重。第一百零一頁,共144頁。1)基本沒有塊效應(yīng).2)信息封裝能力強,把最多的信息封裝在最少的系數(shù)中.常用的是DCT,已被國際標(biāo)準(zhǔn)采納,作成芯片。其優(yōu)點:第一百零二頁,共144頁。主要問題二:子圖尺寸的選擇子圖尺寸的選擇有兩個原則:1)如果n是子圖的維數(shù),n應(yīng)該是2的整數(shù)次方。為便于降低計算復(fù)雜度。2)n一般選為8x8或16x16。由實踐得到:隨著n的增加,塊效應(yīng)相應(yīng)減少。第一百零三頁,共144頁。一般來說,圖像變換的編碼壓縮按下列步驟進行:(1)確定圖像矩陣的階數(shù)(2)確定變換矩陣(3)計算變換域(4)保留較大的那些系數(shù),構(gòu)成壓縮后的新矩陣(5)按新矩陣傳輸那些系數(shù)不為零的數(shù)值,并在接收端用反變換求得原始圖像的值。

第一百零四頁,共144頁。在確定圖像矩陣的階數(shù)后,選哪種變換矩陣,都必須從存貯量的大小,計算速度,變換圖像的質(zhì)量,硬件實施等因素來綜合考慮。由于圖像和客觀景物的千變?nèi)f化,為了達到較高的壓縮比,還可以把變換編碼同其它形式的編碼(如預(yù)測編碼)結(jié)合起來的編碼,稱為混合編碼。第一百零五頁,共144頁。圖像標(biāo)準(zhǔn)的制定:

ISO和CCITT(國際電報電話咨詢委員會)聯(lián)合制定標(biāo)準(zhǔn)的類型:連續(xù)圖像壓縮標(biāo)準(zhǔn):靜止幀黑白、彩色壓縮:(1)面向靜止的單幅圖像-JPEG)連續(xù)幀黑白、彩色壓縮:(2)面向連續(xù)的視頻影像-MPEG)四.靜止圖像壓縮編碼標(biāo)準(zhǔn)-JPEG第一百零六頁,共144頁。

JPEG標(biāo)準(zhǔn)簡述JPEG壓縮流程JPEG壓縮算法的實現(xiàn)JPEG壓縮舉例

靜止圖像壓縮編碼標(biāo)準(zhǔn)-JPEG第一百零七頁,共144頁。JPEG標(biāo)準(zhǔn)簡述由ISO/IEC與CCITT聯(lián)合發(fā)起的聯(lián)合圖像專家組,在過去十幾年圖像編碼研究成果的基礎(chǔ)上于20世紀(jì)90年代初制定了靜止圖像(包括8bit/像素的灰度圖像與24bit/像素的彩色圖像)的編碼標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)在較低的計算復(fù)雜度下,能提供較高的壓縮比與保真度。在視覺效果不受到嚴(yán)重損失的前提下,算法可以達到15到20的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點的話,可以達到40:1或更高的壓縮比。第一百零八頁,共144頁。

JPEG定義了一個基本系統(tǒng),一個符合JPEG標(biāo)準(zhǔn)的編解碼器至少要滿足基本系統(tǒng)的技術(shù)指標(biāo)。JPEG基本系統(tǒng)其核心屬于變換編碼。JPFG編碼時,對原始圖像的每一個分量首先分割成互不重疊的8×8像素塊,然后對每個像素塊的編碼過程可分為二維DCT變換。根據(jù)圖像信號的特點,對圖像塊進行二維DCT變換可以消除像素間的相關(guān)性。自然圖像的像素塊經(jīng)DCT變換后,圖像信號的能量主要集中到塊的左上角,即圖像的低頻成分中。DCT變換后得到的系數(shù)矩陣中包括左上角的一個直流(DC)系數(shù)與63個交流(AC)系數(shù),從左到右.水平頻率增高,從上到下堅直頻率增高。第一百零九頁,共144頁。JPEG編碼的總體框架第一百一十頁,共144頁。第一百一十一頁,共144頁。JPEG壓縮流程第一百一十二頁,共144頁。JPEG編碼方法可分為如下七個步驟第一百一十三頁,共144頁。1.顏色空間轉(zhuǎn)換

人眼對亮度更敏感,提取亮度特征,將RGB轉(zhuǎn)換為YCbCr模型,編碼時對亮度采用特殊編碼:

Y=0.299R+0.5870G+0.1140B Cb=–0.1787R–0.3313G+0.5000B+128 Cr=0.5000R–0.4187G–0.0813B+128顏色解碼:

R=Y+1.40200(Cr–128) G=Y–0.34414(Cb–128)–0.71414(Cr–128)B=Y+1.77200(Cb–128)第一百一十四頁,共144頁。2.數(shù)據(jù)分塊構(gòu)造子圖像 子圖像尺寸:8x83.DCT變換對于灰度級是2n的像素,通過減去2n-1,替換像素本身對于n=8,即將0~255的值域,通過減去128,轉(zhuǎn)換為值域在-128~127之間的值目的:使像素的絕對值出現(xiàn)3位10進制的概率大大減少第一百一十五頁,共144頁。 用8x8的JEPG基線標(biāo)準(zhǔn),壓縮并重構(gòu)下列子圖52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 94第一百一十六頁,共144頁。0偏置轉(zhuǎn)換后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34頻域變換頻域變換產(chǎn)生64個系數(shù),第一個系數(shù)稱為直流系數(shù)(DC系數(shù)),其余的63個系數(shù)稱為交流系數(shù)(AC系數(shù))。第一百一十七頁,共144頁。正向DCT變換(N=8)后變成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1第一百一十八頁,共144頁。4.系數(shù)量化1)正向量化:

Squv=round(Suv/Quv)其中:Suv是DCT系數(shù),Quv量化模板系數(shù)2)逆向量化:

Ruv=SquvQuv例:Sq(0,0)=round[-415/16] =round[-25.9]=-26 Ruv(0,0)=-26*16=-416第一百一十九頁,共144頁。對于亮度和顏色使用不同的量化閾值模板,并取整

亮度的量化模板系數(shù)1611 10 16 24 40 51 6112 12 14 19 26 58 60 5514 13 16 24 40 57 69 5614 17 22 29 51 87 80 6218 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99第一百二十頁,共144頁。

顏色的量化模板系數(shù)1718 24 47 99 99 99 9918 21 26 66 99 99 99 9924 26 56 99 99 99 99 9947 66 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 99第一百二十一頁,共144頁。量化變換后的數(shù)組,比例化并消去系數(shù)-26 -3 -6 2 2 0 0 01 -2 -4 0 0 0 0 0-3 1 5 -1 -1 0 0 0-4 1 2 -1 0 0 0 01 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0第一百二十二頁,共144頁。5.Z形掃描將量化后的系數(shù)按Z字形掃描第一百二十三頁,共144頁。DCT變換的64個系數(shù)經(jīng)量化后,其中F(0,0)為直流系數(shù)DC,其余的63個為交流系數(shù)AC,DC的大小反映了一個8×8數(shù)據(jù)塊的平均亮度。

8×8相鄰子塊之間DC系數(shù)有很強的相關(guān)性,所以JPEG對DC系數(shù)采用差分編碼.以前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當(dāng)前塊的預(yù)測值,再對當(dāng)前塊的實際值與預(yù)測值的差值進行哈夫曼編碼或算術(shù)編碼。6.DC編碼第一百二十四頁,共144頁。若DC系數(shù)的動態(tài)范圍為-1024~1024,則差值的動態(tài)范圍可達-2047~+2047;由于差分值范圍太大,JPEG沒有采用對每一個差分值賦予一個碼字,而是對碼表進行了簡化,采用“前綴碼(SSSS)+尾碼”表示;前綴碼指明了尾碼的有效位數(shù)B,可以根據(jù)差分值從表8-12中查出前綴碼對應(yīng)的哈夫曼編碼。尾碼的取值取決于DC系數(shù)的差值和前綴碼;如DC系數(shù)的差分值(D)大于等于0,則尾碼的碼字為差分值的原碼;否則,取差分值的B位反碼。

第一百二十五頁,共144頁。DC系數(shù)編碼步驟(1)對差分值進行判斷如果差分值大于0,將差分值轉(zhuǎn)換為二進制表示,并獲得差值所占的位數(shù)。如差值為5時,其二進制表示為101,差分值得位數(shù)為3;如果差分值小于0,則取絕對值后轉(zhuǎn)換為二進制碼表示,再獲得該編碼值的反碼。如差值為-5時,最后得反碼為010,差分值的位數(shù)為3。第一百二十六頁,共144頁。(2)根據(jù)“前綴碼(SSSS)+尾碼”的表示方法,以差分值所占的位數(shù)為索引值查表獲得該差分值的編碼。

表8-12為亮度系數(shù)(DC)的哈夫曼編碼表。查表可獲得差分值為5時編碼為100,結(jié)合前綴碼(SSSS)和尾碼,最終的編碼值為100101;差值為-5時的最終編碼為100010。

表8-12表明,DC系數(shù)差分值的最大位數(shù)為11位。第一百二十七頁,共144頁。JPEG基本系統(tǒng)對63個AC系數(shù)采用行程編碼,采用Z字形掃描是為了增加0的行程長度,從而更有利于壓縮數(shù)據(jù)。

AC系數(shù)編碼可采用哈夫曼編碼或算術(shù)編碼。JPEG在對AC系數(shù)進行Z行程編碼后,將一個非零AC系數(shù)及其前面的0行程長度稱為一個組合,記為[NNNN/SSSS],將每個組合以“[NNNN/SSSS]+尾碼”進行編碼表示,其中,NNNN為0行程的長度,SSSS表示尾碼的有效位數(shù);即當(dāng)前非0系數(shù)所占的比特數(shù),如果非零AC系數(shù)大于等于0,則尾碼的碼字為該系數(shù)的原碼,若AC系數(shù)小于0,則以該系數(shù)的反碼表示。7.AC編碼第一百二十八頁,共144頁。JPEG圖像壓縮算法JPEG是有損壓縮算法JPEG核心是離散余弦變換(DCT)第一百二十九頁,共144頁。DCT變換的輸入是8位的像素值(0~255,JPEG實現(xiàn)時將其減去128,范圍變成-128~127),量化即通過整除運算減少輸出值的存儲位數(shù)。使用量化矩陣(QuantizationMatrix)來實現(xiàn)量化。量化公式為:量化后的值(i,j)=ROUND(DCT(i,j)/量子(i,j))逆量化公式為:DCT(i,j)=量化后的值(i,j)*量子(i,j)量化是JPEG算法中損失圖像精度的根源,也是產(chǎn)生壓縮效果的源泉第一百三十頁,共144頁。量化表4710131619222571013161922252810131619222528311316192225283134161922252831343719222528313437402225283134374043252831343740434610192837465564731928374655647382283746

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論