基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望_第1頁
基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望_第2頁
基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望_第3頁
基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望_第4頁
基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于HVS的主客觀圖像質(zhì)量評價方法:原理、應(yīng)用與展望一、引言1.1研究背景與意義在數(shù)字媒體技術(shù)迅猛發(fā)展的當(dāng)下,圖像作為信息傳遞與表達的關(guān)鍵載體,在眾多領(lǐng)域得到了廣泛應(yīng)用,涵蓋了從日常的社交媒體分享、影視娛樂,到專業(yè)的醫(yī)學(xué)診斷、衛(wèi)星遙感監(jiān)測、工業(yè)檢測等多個方面。然而,圖像在獲取、壓縮、傳輸以及處理等過程中,不可避免地會受到各種因素的影響,導(dǎo)致圖像質(zhì)量下降,出現(xiàn)諸如噪聲干擾、模糊、失真等問題,進而影響到圖像所承載信息的準確傳遞與有效利用。圖像質(zhì)量評價在整個圖像處理流程中占據(jù)著核心地位,發(fā)揮著不可或缺的作用。在圖像壓縮領(lǐng)域,準確的質(zhì)量評價有助于在壓縮比和圖像質(zhì)量之間找到最佳平衡點,在保證圖像可接受質(zhì)量的前提下,盡可能減少數(shù)據(jù)量,以滿足存儲和傳輸?shù)男枨?,比如在JPEG圖像壓縮標準中,需要依據(jù)圖像質(zhì)量評價來確定合適的量化參數(shù),實現(xiàn)高效壓縮;在圖像傳輸過程中,通過實時評估圖像質(zhì)量,可以動態(tài)調(diào)整傳輸策略,如帶寬分配、編碼方式選擇等,以應(yīng)對網(wǎng)絡(luò)的不穩(wěn)定性,確保接收端能獲得高質(zhì)量的圖像,像在視頻會議、遠程監(jiān)控等應(yīng)用中,圖像質(zhì)量的實時評估與傳輸策略調(diào)整至關(guān)重要;對于圖像增強、去噪、復(fù)原等圖像處理算法的研發(fā)和優(yōu)化,圖像質(zhì)量評價是衡量算法性能優(yōu)劣的關(guān)鍵指標,能夠指導(dǎo)算法改進,提高處理后圖像的質(zhì)量,例如在醫(yī)學(xué)圖像增強中,通過圖像質(zhì)量評價判斷增強算法是否提升了圖像的診斷價值。傳統(tǒng)的圖像質(zhì)量客觀評價方法,如均方誤差(MSE)、峰值信噪比(PSNR)等,雖然計算簡單、易于實現(xiàn),能夠在一定程度上反映圖像的失真程度,但它們僅僅基于像素層面的簡單數(shù)學(xué)計算,嚴重忽略了人類視覺系統(tǒng)(HumanVisualSystem,HVS)復(fù)雜而精妙的感知特性。人類視覺系統(tǒng)是一個高度復(fù)雜的生理和心理系統(tǒng),其對圖像的感知受到多種因素的綜合影響,包括但不限于視覺敏感度、對比度敏感度、顏色感知、空間頻率特性、視覺掩蔽效應(yīng)以及視覺注意機制等。HVS對不同頻率成分的敏感度存在顯著差異,對低頻成分的亮度信息和高頻成分的邊緣、紋理細節(jié)信息的感知具有不同的特性,且在圖像中存在較強信號時,HVS對較弱信號的感知能力會受到抑制,即視覺掩蔽效應(yīng)。因此,單純依賴傳統(tǒng)客觀評價方法,往往無法準確預(yù)測人類對圖像質(zhì)量的主觀感受,導(dǎo)致評價結(jié)果與實際視覺體驗存在較大偏差?;贖VS的圖像質(zhì)量評價方法,旨在深入研究和模擬人類視覺系統(tǒng)對圖像的感知機制,將HVS的特性融入到評價模型中,從而使評價結(jié)果更貼合人類的主觀感知。這種方法能夠更準確地衡量圖像質(zhì)量,為圖像處理系統(tǒng)的優(yōu)化提供更具針對性和有效性的指導(dǎo)。在圖像壓縮算法的設(shè)計中,基于HVS的評價方法可以指導(dǎo)算法在壓縮過程中保留對人類視覺感知更為重要的信息,在不顯著影響視覺質(zhì)量的前提下提高壓縮比;在圖像傳輸系統(tǒng)中,利用基于HVS的質(zhì)量評價反饋,可以更合理地分配網(wǎng)絡(luò)資源,優(yōu)先保障對視覺感知關(guān)鍵的圖像部分的傳輸質(zhì)量,提升整體視覺體驗;對于圖像增強算法,基于HVS的評價能夠從人類視覺感知的角度評估增強效果,避免過度增強或增強不足等問題,使處理后的圖像更符合人眼的視覺需求。開展基于HVS的主客觀圖像質(zhì)量評價方法研究,對于提升圖像質(zhì)量評價的準確性、推動圖像處理技術(shù)的發(fā)展以及改善用戶在各種圖像應(yīng)用中的體驗,都具有重要的理論意義和實際應(yīng)用價值。1.2國內(nèi)外研究現(xiàn)狀在圖像質(zhì)量評價領(lǐng)域,對基于人類視覺系統(tǒng)(HVS)方法的研究一直是國內(nèi)外學(xué)者關(guān)注的焦點。國外在此方面的研究起步較早,取得了一系列具有影響力的成果。早在20世紀60年代,就有學(xué)者開始研究HVS的基本特性,如對比度敏感度函數(shù)(CSF),為后續(xù)基于HVS的圖像質(zhì)量評價方法奠定了理論基礎(chǔ)。隨著研究的深入,各類基于HVS特性的圖像質(zhì)量評價模型不斷涌現(xiàn)。在全參考圖像質(zhì)量評價方面,一些經(jīng)典的算法被提出。Wang等人提出的結(jié)構(gòu)相似性(SSIM)指數(shù),從圖像的亮度、對比度和結(jié)構(gòu)三個方面衡量圖像之間的相似性,模擬了人類視覺系統(tǒng)對結(jié)構(gòu)信息的感知,相較于傳統(tǒng)的均方誤差(MSE)等方法,在評價結(jié)果與主觀感知的一致性上有了顯著提升。之后,又進一步擴展為多尺度結(jié)構(gòu)相似性(MS-SSIM)指數(shù),在多個尺度上對圖像進行分析,更全面地考慮了人類視覺在不同分辨率下的感知特性,使其在復(fù)雜圖像失真情況下的評價性能得到增強。在醫(yī)學(xué)圖像領(lǐng)域,利用MS-SSIM評價不同圖像處理算法對醫(yī)學(xué)圖像質(zhì)量的影響,結(jié)果顯示其能更準確地反映圖像細節(jié)和結(jié)構(gòu)的變化,對醫(yī)學(xué)圖像的質(zhì)量評估具有重要參考價值。在半?yún)⒖紙D像質(zhì)量評價方面,國外學(xué)者也開展了深入研究。一些方法通過提取圖像的關(guān)鍵特征作為參考信息,結(jié)合HVS特性進行質(zhì)量評價。Charrier等人提出的基于特征統(tǒng)計的半?yún)⒖紙D像質(zhì)量評價方法,從原始圖像中提取如邊緣、紋理等特征,通過比較這些特征在失真圖像中的變化情況,利用HVS對不同特征的敏感度來評估圖像質(zhì)量,在圖像傳輸帶寬有限、無法獲取完整原始圖像的情況下,具有較高的應(yīng)用價值。無參考圖像質(zhì)量評價由于不需要原始圖像作為參考,在實際應(yīng)用中具有更大的靈活性和實用性,國外在此方向的研究也非常活躍。基于自然場景統(tǒng)計(NSS)模型的無參考圖像質(zhì)量評價方法得到了廣泛研究,此類方法利用自然圖像在統(tǒng)計上的規(guī)律性,通過分析失真圖像與自然圖像統(tǒng)計模型的偏離程度來評估圖像質(zhì)量。在圖像壓縮應(yīng)用中,基于NSS模型的無參考評價方法可以在無需原始圖像的情況下,快速評估壓縮后圖像的質(zhì)量,指導(dǎo)壓縮算法的參數(shù)調(diào)整,以在保證圖像質(zhì)量的前提下實現(xiàn)更高的壓縮比。隨著機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的無參考圖像質(zhì)量評價方法逐漸成為研究熱點。這些方法通過構(gòu)建深度神經(jīng)網(wǎng)絡(luò),自動學(xué)習(xí)圖像的特征表示,并將其映射到圖像質(zhì)量分數(shù),在大規(guī)模圖像數(shù)據(jù)集上進行訓(xùn)練后,能夠?qū)Ω鞣N類型的圖像失真進行有效的質(zhì)量評價。國內(nèi)學(xué)者在基于HVS的圖像質(zhì)量評價領(lǐng)域也做出了眾多有價值的貢獻。在理論研究方面,對HVS的特性進行了更深入的分析和建模。有學(xué)者研究了HVS的視覺掩蔽效應(yīng),提出了新的數(shù)學(xué)模型來描述這種效應(yīng),將其應(yīng)用于圖像質(zhì)量評價中,有效提高了評價模型對圖像局部失真的敏感度。在全參考圖像質(zhì)量評價方法研究中,國內(nèi)學(xué)者對現(xiàn)有的算法進行改進和創(chuàng)新。通過引入新的特征提取方法或優(yōu)化評價模型的參數(shù),提高了評價結(jié)果與主觀感知的一致性。有研究將圖像的顏色特征與結(jié)構(gòu)特征相結(jié)合,提出了一種新的全參考圖像質(zhì)量評價指標,實驗結(jié)果表明該指標在彩色圖像質(zhì)量評價中具有更好的性能。在半?yún)⒖己蜔o參考圖像質(zhì)量評價方面,國內(nèi)學(xué)者也取得了顯著進展。提出了基于深度學(xué)習(xí)和HVS特性融合的半?yún)⒖紙D像質(zhì)量評價方法,先利用深度學(xué)習(xí)網(wǎng)絡(luò)提取圖像的高層語義特征,再結(jié)合HVS對這些特征進行加權(quán)處理,實現(xiàn)對圖像質(zhì)量的準確評估。在無參考圖像質(zhì)量評價中,基于機器學(xué)習(xí)算法和HVS特征的方法得到了廣泛應(yīng)用。通過提取圖像的紋理、亮度等與HVS相關(guān)的特征,利用支持向量機、神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法進行訓(xùn)練和預(yù)測,取得了較好的評價效果。在遙感圖像質(zhì)量評價中,針對遙感圖像的特點,國內(nèi)學(xué)者提出了基于HVS和多特征融合的無參考評價方法,綜合考慮了遙感圖像的光譜、空間等多種特征,有效提高了對遙感圖像質(zhì)量評價的準確性。國內(nèi)外在基于HVS的圖像質(zhì)量評價領(lǐng)域都開展了大量研究,涵蓋了全參考、半?yún)⒖己蜔o參考等多種類型的評價方法。這些研究成果在圖像壓縮、傳輸、增強等多個領(lǐng)域得到了廣泛應(yīng)用,推動了圖像質(zhì)量評價技術(shù)的不斷發(fā)展和完善。然而,現(xiàn)有的方法仍存在一些不足之處,如對復(fù)雜場景和多種失真混合情況下的圖像質(zhì)量評價準確性有待提高,部分算法計算復(fù)雜度較高等問題,仍需要進一步的研究和改進。1.3研究內(nèi)容與創(chuàng)新點本研究聚焦于基于人類視覺系統(tǒng)(HVS)的主客觀圖像質(zhì)量評價方法,具體研究內(nèi)容涵蓋多個關(guān)鍵方面。在HVS特性分析與建模部分,深入剖析HVS的生理和心理特性,包括視覺敏感度、對比度敏感度、顏色感知、空間頻率特性、視覺掩蔽效應(yīng)以及視覺注意機制等。運用數(shù)學(xué)模型對這些特性進行精確描述,為后續(xù)的圖像質(zhì)量評價方法奠定堅實的理論基礎(chǔ)。在分析視覺掩蔽效應(yīng)時,構(gòu)建能夠準確刻畫其在不同圖像內(nèi)容和背景下作用的數(shù)學(xué)模型,量化掩蔽效應(yīng)的強度和范圍,從而更好地理解HVS對圖像中不同信號的感知方式。針對全參考圖像質(zhì)量評價方法展開研究,基于對HVS特性的深刻理解,提出創(chuàng)新的評價模型。該模型將圖像的結(jié)構(gòu)信息、紋理信息、顏色信息以及HVS的感知特性進行有機融合。通過引入新的特征提取算法,更精準地捕捉圖像中對人類視覺感知至關(guān)重要的信息,并利用這些信息設(shè)計合理的相似度度量方法,以更準確地衡量失真圖像與原始圖像之間的差異。可以基于HVS對不同頻率成分的敏感度,在頻域中提取圖像的高頻和低頻特征,結(jié)合結(jié)構(gòu)相似性和紋理相似性度量,構(gòu)建綜合的相似度評價指標,從而提高全參考圖像質(zhì)量評價的準確性和可靠性。對于半?yún)⒖己蜔o參考圖像質(zhì)量評價方法,同樣從HVS特性出發(fā),探索有效的特征提取和質(zhì)量評估策略。在半?yún)⒖紙D像質(zhì)量評價中,提出從原始圖像中提取關(guān)鍵特征的新方法,這些特征能夠充分反映圖像的重要結(jié)構(gòu)和視覺信息,并且對噪聲和失真具有較強的魯棒性。利用這些特征與HVS特性相結(jié)合,構(gòu)建半?yún)⒖紙D像質(zhì)量評價模型,實現(xiàn)對圖像質(zhì)量的準確評估。在無參考圖像質(zhì)量評價中,基于HVS對自然圖像統(tǒng)計特性的適應(yīng)性,提取與HVS感知相關(guān)的圖像特征,如紋理、亮度、對比度等特征的統(tǒng)計信息。運用機器學(xué)習(xí)和深度學(xué)習(xí)算法,建立從這些特征到圖像質(zhì)量分數(shù)的映射關(guān)系,從而實現(xiàn)無參考圖像質(zhì)量的有效評價??梢圆捎镁矸e神經(jīng)網(wǎng)絡(luò)(CNN)自動學(xué)習(xí)圖像特征與質(zhì)量分數(shù)之間的復(fù)雜關(guān)系,通過在大規(guī)模圖像數(shù)據(jù)集上進行訓(xùn)練,提高無參考圖像質(zhì)量評價的準確性和泛化能力。為了驗證所提出方法的有效性和優(yōu)越性,開展大量實驗研究。收集和整理包含多種類型失真和豐富圖像內(nèi)容的圖像數(shù)據(jù)庫,用于算法的訓(xùn)練和測試。采用主觀評價和客觀評價相結(jié)合的方式,對所提方法進行全面評估。主觀評價邀請大量觀察者按照標準的評價流程對圖像質(zhì)量進行評分,獲取真實的主觀感知數(shù)據(jù);客觀評價則使用常用的評價指標,如峰值信噪比(PSNR)、結(jié)構(gòu)相似性指數(shù)(SSIM)、斯皮爾曼等級相關(guān)系數(shù)(SROCC)等,與現(xiàn)有優(yōu)秀的圖像質(zhì)量評價方法進行對比分析。在圖像數(shù)據(jù)庫中,涵蓋高斯噪聲、JPEG壓縮、模糊等多種失真類型的圖像,通過實驗對比所提方法與傳統(tǒng)方法在不同失真類型和失真程度下的評價性能,驗證所提方法在準確性、魯棒性等方面的優(yōu)勢。本研究的創(chuàng)新點主要體現(xiàn)在以下幾個方面。在研究思路上,區(qū)別于傳統(tǒng)研究往往僅側(cè)重于單一HVS特性或簡單的圖像特征,本研究全面、系統(tǒng)地考慮HVS的多種特性,并將其深度融合到圖像質(zhì)量評價方法中,從多個維度對圖像質(zhì)量進行評估,使評價結(jié)果更貼合人類的主觀視覺感受。在特征提取方面,提出新的基于HVS特性的圖像特征提取方法,能夠更精準地捕捉對人類視覺感知具有重要意義的圖像信息,這些特征具有更強的代表性和區(qū)分度,為提高圖像質(zhì)量評價的準確性提供了有力支持。在模型構(gòu)建上,創(chuàng)新地運用機器學(xué)習(xí)和深度學(xué)習(xí)算法,結(jié)合HVS特性構(gòu)建圖像質(zhì)量評價模型,充分利用這些算法強大的學(xué)習(xí)能力和非線性映射能力,挖掘圖像特征與質(zhì)量分數(shù)之間的復(fù)雜關(guān)系,提升評價模型的性能和泛化能力。二、HVS基本理論2.1HVS的定義與結(jié)構(gòu)人類視覺系統(tǒng)(HumanVisualSystem,HVS)是人類獲取外界圖像信息、感知視覺世界的復(fù)雜生理和心理系統(tǒng),其工作機制涉及光學(xué)、色度學(xué)、視覺生理學(xué)、視覺心理學(xué)、解剖學(xué)、神經(jīng)科學(xué)和認知科學(xué)等多個科學(xué)領(lǐng)域。從結(jié)構(gòu)組成來看,HVS主要包括眼球、視網(wǎng)膜、神經(jīng)傳導(dǎo)通路和大腦視覺皮層等關(guān)鍵部分,各部分相互協(xié)作,共同完成視覺信息的獲取、傳輸與處理。眼球是HVS的重要光學(xué)部件,猶如一臺精密的生物相機,承擔(dān)著收集和聚焦光線的關(guān)鍵任務(wù)。它的結(jié)構(gòu)復(fù)雜且精妙,由角膜、瞳孔、晶狀體、玻璃體等部分組成。角膜作為眼球最外層的透明組織,具有較高的屈光力,能夠初步折射光線,使光線進入眼球內(nèi)部。瞳孔則像是相機的光圈,通過調(diào)節(jié)自身大小,控制進入眼球的光量,在光線較強時縮小,減少光的攝入;在光線較弱時擴大,增加光的進入,以適應(yīng)不同的光照環(huán)境。晶狀體是一個富有彈性的透明結(jié)構(gòu),它可以根據(jù)物體的遠近進行調(diào)節(jié),改變自身的曲率,從而實現(xiàn)對不同距離物體的清晰成像,當(dāng)看近處物體時,晶狀體變厚,屈光力增強;看遠處物體時,晶狀體變薄,屈光力減弱。玻璃體填充在眼球內(nèi)部,維持眼球的形狀,并協(xié)助光線的傳導(dǎo)。視網(wǎng)膜是眼球后部的一層重要組織,可視為圖像的“接收器”,在視覺信息獲取過程中發(fā)揮著關(guān)鍵作用。視網(wǎng)膜上分布著大量的感光細胞,主要包括視錐細胞和視桿細胞。視錐細胞主要集中在視網(wǎng)膜的中央凹區(qū)域,對強光和顏色敏感,能夠分辨細節(jié)和顏色,使我們能夠在明亮環(huán)境下看清物體的細節(jié)和豐富色彩。在白天觀察一幅色彩鮮艷的繪畫作品時,視錐細胞能夠準確感知畫面中的各種顏色和細膩紋理,讓我們欣賞到作品的藝術(shù)魅力。視桿細胞則主要分布在視網(wǎng)膜的周邊區(qū)域,對弱光敏感,主要負責(zé)在低光照條件下的視覺感知,雖然它對細節(jié)和顏色的分辨能力較弱,但能使我們在夜晚或暗處也能大致感知周圍環(huán)境。在夜晚行走時,視桿細胞能夠幫助我們辨別道路的大致方向和周圍物體的輪廓。此外,視網(wǎng)膜中還包含雙極細胞、神經(jīng)節(jié)細胞等,它們負責(zé)將感光細胞產(chǎn)生的神經(jīng)沖動進行傳遞和整合,通過復(fù)雜的神經(jīng)信號處理,將光信號轉(zhuǎn)換為神經(jīng)沖動,為后續(xù)的視覺信息傳輸?shù)於ɑA(chǔ)。神經(jīng)傳導(dǎo)通路是連接視網(wǎng)膜與大腦視覺皮層的信息傳輸通道,如同信息高速公路,確保視覺神經(jīng)沖動能夠快速、準確地從視網(wǎng)膜傳遞到大腦。它主要由視神經(jīng)、視交叉、視束、外側(cè)膝狀體和視放射等部分組成。視神經(jīng)由視網(wǎng)膜神經(jīng)節(jié)細胞的軸突組成,將視網(wǎng)膜產(chǎn)生的神經(jīng)沖動向大腦方向傳導(dǎo)。在視交叉處,來自兩眼視網(wǎng)膜鼻側(cè)半的纖維交叉,而來自顳側(cè)半的纖維不交叉,這樣的交叉方式使得兩側(cè)的視覺信息能夠在大腦中進行正確的整合和處理。視束是視神經(jīng)的延續(xù),它將經(jīng)過視交叉的神經(jīng)沖動繼續(xù)傳導(dǎo)至外側(cè)膝狀體。外側(cè)膝狀體作為視覺傳導(dǎo)通路中的重要中繼站,對傳入的神經(jīng)沖動進行進一步的處理和整合,然后通過視放射將神經(jīng)沖動投射到大腦視覺皮層。大腦視覺皮層是HVS的核心處理區(qū)域,是視覺信息處理和感知的“指揮中心”。它位于大腦的枕葉,包含多個功能不同的子區(qū)域,如初級視覺皮層(V1區(qū))、紋外皮層(V2-V5區(qū))等。初級視覺皮層(V1區(qū))是視覺信息進入大腦后的第一個處理站點,它對傳入的神經(jīng)沖動進行初步的分析和處理,能夠檢測圖像的邊緣、方向、空間頻率等基本特征。當(dāng)我們看到一條直線時,V1區(qū)的神經(jīng)元會對直線的方向、位置等信息進行編碼和處理。紋外皮層(V2-V5區(qū))則進一步對視覺信息進行高級處理,涉及物體識別、運動感知、顏色感知等更復(fù)雜的視覺功能。V4區(qū)主要參與顏色感知和物體形狀的識別,能夠?qū)Σ煌伾奈矬w進行區(qū)分和識別;V5區(qū)則主要負責(zé)運動感知,當(dāng)我們看到物體運動時,V5區(qū)的神經(jīng)元會被激活,使我們能夠感知到物體的運動方向和速度。大腦視覺皮層通過復(fù)雜的神經(jīng)網(wǎng)絡(luò)連接和信息交互,實現(xiàn)對視覺信息的全面分析和理解,最終產(chǎn)生我們所感知到的視覺圖像。2.2HVS的特性分析2.2.1視覺生理學(xué)特性從視覺生理學(xué)角度剖析,HVS在空間分辨率、對比度敏感度、顏色感知等方面呈現(xiàn)出獨特的生理特性,這些特性對圖像感知產(chǎn)生著關(guān)鍵影響。空間分辨率是指HVS能夠分辨圖像中相鄰細節(jié)的能力,它與視網(wǎng)膜上感光細胞的分布以及神經(jīng)傳導(dǎo)通路的處理能力密切相關(guān)。在視網(wǎng)膜的中央凹區(qū)域,視錐細胞高度密集,這使得該區(qū)域具有極高的空間分辨率,能夠清晰分辨圖像中的細微結(jié)構(gòu)和細節(jié)。當(dāng)我們專注觀察一幅高清風(fēng)景圖像時,中央凹區(qū)域能夠讓我們看清圖像中遠處山巒的輪廓、樹葉的紋理等細節(jié)。而在視網(wǎng)膜的周邊區(qū)域,視錐細胞分布稀疏,視桿細胞較多,空間分辨率相對較低,主要負責(zé)對圖像的整體感知和運動檢測。當(dāng)我們的余光掃到運動的物體時,周邊區(qū)域的視覺細胞能夠快速察覺物體的運動,但難以分辨物體的細節(jié)。HVS對不同方向的空間頻率敏感度也存在差異,對水平和垂直方向的空間頻率敏感度相對較高,而對斜向的敏感度較低。在觀察由不同方向線條組成的圖像時,我們更容易分辨出水平和垂直方向的線條細節(jié),而斜向線條的細節(jié)則相對較難分辨。對比度敏感度反映了HVS對圖像中不同亮度區(qū)域之間對比度的感知能力,它是衡量視覺系統(tǒng)對圖像細節(jié)分辨能力的重要指標。HVS對對比度的感知并非線性的,而是在一定范圍內(nèi)存在一個最佳敏感度。當(dāng)圖像的對比度較低時,HVS需要更大的對比度變化才能察覺到差異;而當(dāng)對比度過高時,HVS的敏感度又會下降。在低對比度的醫(yī)學(xué)圖像中,細微的病變可能難以被察覺,因為其對比度變化不足以引起HVS的明顯反應(yīng);而在對比度極高的圖像中,如強烈陽光下的雪景圖像,過亮和過暗區(qū)域的細節(jié)可能會丟失,因為HVS在這種高對比度下的分辨能力有限。對比度敏感度還與空間頻率有關(guān),HVS對中低頻空間頻率的對比度敏感度較高,對高頻空間頻率的對比度敏感度相對較低。在觀看一幅包含豐富紋理的圖像時,我們更容易感知到紋理中的中低頻成分所呈現(xiàn)的對比度變化,而高頻成分的對比度變化則相對不那么容易被察覺。顏色感知是HVS的重要特性之一,它依賴于視網(wǎng)膜上的視錐細胞對不同波長光的響應(yīng)。人類視網(wǎng)膜中存在三種類型的視錐細胞,分別對紅、綠、藍三種基本顏色敏感。這三種視錐細胞對不同波長光的吸收光譜存在差異,通過它們的協(xié)同作用,HVS能夠感知到豐富多樣的顏色。當(dāng)我們看到一朵紅色的花朵時,對紅色敏感的視錐細胞會產(chǎn)生強烈的響應(yīng),而對綠色和藍色敏感的視錐細胞響應(yīng)相對較弱,大腦通過綜合這些視錐細胞的信號,讓我們感知到花朵的紅色。HVS對顏色的感知還受到亮度、對比度等因素的影響。在低亮度環(huán)境下,顏色的飽和度和鮮艷度會降低,我們對顏色的分辨能力也會減弱。在夜晚觀察物體時,物體的顏色看起來會比白天暗淡且不那么鮮艷。此外,HVS對不同顏色之間的對比度也有不同的敏感度,例如,對紅-綠對比度的敏感度較高,而對藍-黃對比度的敏感度相對較低。在圖像識別中,利用紅-綠對比度較高的特點,可以更容易地突出某些目標物體,提高圖像的辨識度。2.2.2視覺心理學(xué)特性視覺心理學(xué)特性在人類對圖像質(zhì)量的主觀感受中扮演著重要角色,其中視覺掩蔽效應(yīng)和視覺注意機制是兩個關(guān)鍵方面。視覺掩蔽效應(yīng)是指在圖像中,一個信號(被掩蔽信號)的感知受到另一個信號(掩蔽信號)的抑制或干擾。這種效應(yīng)具有多種表現(xiàn)形式,包括亮度掩蔽、紋理掩蔽和頻率掩蔽等。亮度掩蔽是指在高亮度區(qū)域,HVS對低亮度信號的敏感度會降低。在一幅陽光強烈的戶外圖像中,明亮的天空區(qū)域可能會掩蓋掉一些暗部的細節(jié),使得我們難以察覺這些細節(jié)。紋理掩蔽則是當(dāng)圖像中存在復(fù)雜的紋理時,簡單的紋理或細節(jié)可能會被掩蓋。在一幅布滿復(fù)雜花紋的織物圖像中,織物上可能存在的細微瑕疵或小圖案可能會被復(fù)雜的花紋所掩蓋,不易被發(fā)現(xiàn)。頻率掩蔽是指高頻信號容易被低頻信號掩蔽。在圖像壓縮過程中,常常利用頻率掩蔽效應(yīng)丟棄一些高頻分量,因為這些高頻分量在低頻信號的掩蔽下,對人類視覺感知的影響相對較小,從而在不顯著影響視覺質(zhì)量的前提下實現(xiàn)數(shù)據(jù)壓縮。視覺掩蔽效應(yīng)的存在使得HVS在處理圖像時,能夠根據(jù)圖像的局部特性,有選擇性地關(guān)注和感知重要信息,忽略那些被掩蔽的次要信息。視覺注意機制是人類視覺系統(tǒng)的一種重要認知機制,它使HVS能夠在復(fù)雜的視覺場景中快速、自動地選擇和關(guān)注感興趣的區(qū)域(RegionofInterest,ROI)。視覺注意可以分為自底向上的注意和自頂向下的注意。自底向上的注意是基于圖像的底層特征,如顏色、亮度、對比度、邊緣、紋理等,這些特征的顯著差異會吸引HVS的注意。在一幅自然風(fēng)景圖像中,突然出現(xiàn)的鮮艷紅色花朵,由于其顏色與周圍環(huán)境形成強烈對比,會自動吸引我們的注意力。自頂向下的注意則受到觀察者的目標、任務(wù)、知識和經(jīng)驗等因素的影響。當(dāng)我們在一幅城市街道圖像中尋找特定的建筑物時,我們的知識和目標會引導(dǎo)我們將注意力集中在可能出現(xiàn)該建筑物的區(qū)域。視覺注意機制對圖像質(zhì)量的主觀感受有顯著影響,被注意到的區(qū)域的圖像質(zhì)量對整體主觀感受的影響更為突出。如果一幅圖像中關(guān)鍵的感興趣區(qū)域存在明顯的失真或模糊,即使其他區(qū)域質(zhì)量良好,也會顯著降低我們對整幅圖像質(zhì)量的評價。2.3HVS在圖像處理中的應(yīng)用基礎(chǔ)HVS的特性為圖像處理的各個關(guān)鍵環(huán)節(jié),包括圖像增強、壓縮、恢復(fù)等,提供了極為重要的理論依據(jù)和切實可行的指導(dǎo),在提升圖像處理效果和質(zhì)量方面發(fā)揮著不可或缺的作用。在圖像增強領(lǐng)域,HVS特性的應(yīng)用能夠顯著改善圖像的視覺效果,使其更符合人類的視覺感知需求?;贖VS對對比度敏感度的特性,在圖像增強算法中,可以通過調(diào)整圖像的對比度來突出圖像中的重要信息,提高圖像的清晰度和可讀性。對于低對比度的醫(yī)學(xué)圖像,利用HVS對中低頻空間頻率對比度敏感度較高的特點,采用直方圖均衡化等方法增強圖像的對比度,能夠使原本難以察覺的病變區(qū)域更加清晰地呈現(xiàn)出來,有助于醫(yī)生進行準確的診斷。根據(jù)HVS對顏色感知的特性,在彩色圖像增強中,可以對不同顏色通道進行有針對性的處理,調(diào)整顏色的飽和度和亮度,使圖像的色彩更加鮮艷、自然,提升圖像的視覺吸引力。在風(fēng)景圖像增強中,適當(dāng)增強綠色和藍色通道的飽和度,能夠使天空更湛藍,植被更翠綠,營造出更生動的視覺效果。圖像壓縮是圖像處理中的一個重要應(yīng)用方向,HVS特性在其中的應(yīng)用能夠在保證圖像視覺質(zhì)量的前提下,有效減少圖像的數(shù)據(jù)量,提高存儲和傳輸效率。由于HVS對高頻信息的敏感度相對較低,在圖像壓縮過程中,可以選擇性地丟棄部分高頻分量,以實現(xiàn)數(shù)據(jù)壓縮。在JPEG圖像壓縮標準中,利用離散余弦變換(DCT)將圖像從空間域轉(zhuǎn)換到頻域,然后根據(jù)HVS的頻率特性,對高頻系數(shù)進行量化處理,舍棄那些對視覺感知影響較小的高頻信息,從而在不顯著影響視覺質(zhì)量的情況下大幅減小圖像文件的大小。HVS的視覺掩蔽效應(yīng)也為圖像壓縮提供了指導(dǎo),在圖像中存在強信號的區(qū)域,利用視覺掩蔽效應(yīng)可以進一步降低對弱信號的編碼精度,減少數(shù)據(jù)量。在一幅包含大面積均勻背景的圖像中,背景區(qū)域的細節(jié)信息可以適當(dāng)壓縮,因為這些細節(jié)在背景的掩蔽下對人類視覺感知的影響較小。在圖像恢復(fù)方面,HVS特性有助于提高恢復(fù)圖像的質(zhì)量,使其更接近原始圖像的視覺效果。當(dāng)圖像受到噪聲干擾或模糊等失真影響時,基于HVS特性的圖像恢復(fù)算法能夠更好地去除噪聲、恢復(fù)圖像的細節(jié)。根據(jù)HVS對噪聲感知的特性,在圖像去噪算法中,可以根據(jù)圖像的局部特性和HVS的敏感度,自適應(yīng)地調(diào)整去噪強度。在圖像的平滑區(qū)域,由于HVS對噪聲相對敏感,可以采用較強的去噪算法;而在紋理豐富的區(qū)域,由于視覺掩蔽效應(yīng),噪聲對視覺感知的影響較小,可以適當(dāng)降低去噪強度,以保留圖像的紋理細節(jié)。對于模糊圖像的恢復(fù),利用HVS對邊緣信息的敏感性,在恢復(fù)算法中可以重點增強圖像的邊緣,使恢復(fù)后的圖像更清晰、自然。在對模糊的車牌圖像進行恢復(fù)時,通過增強邊緣信息,能夠更準確地識別車牌號碼。三、圖像質(zhì)量主觀評價方法3.1主觀評價方法概述圖像質(zhì)量主觀評價,是以人類觀察者作為評價主體,基于人眼對圖像的視覺感知,對圖像的優(yōu)劣進行定性評判的過程。這種評價方式能夠最直接地反映人類對圖像質(zhì)量的真實感受,因為它綜合考慮了人類視覺系統(tǒng)復(fù)雜的生理和心理特性,包括視覺敏感度、對比度敏感度、顏色感知、視覺掩蔽效應(yīng)、視覺注意機制等多方面因素。在觀看一幅經(jīng)過壓縮處理的圖像時,主觀評價能夠直觀地判斷圖像是否出現(xiàn)模糊、失真、色彩偏差等影響視覺感受的問題,以及這些問題對整體視覺體驗的影響程度。主觀評價在圖像質(zhì)量評價領(lǐng)域具有不可替代的重要作用。它是衡量圖像質(zhì)量的黃金標準,為客觀評價方法的研究和發(fā)展提供了重要的參考依據(jù)。通過主觀評價獲取的真實主觀感知數(shù)據(jù),可用于驗證和校準客觀評價模型,使客觀評價結(jié)果更接近人類的實際視覺體驗。在研發(fā)新的圖像壓縮算法時,需要通過主觀評價來確定壓縮后圖像在不同壓縮比下的視覺質(zhì)量,進而指導(dǎo)算法優(yōu)化,以在保證圖像可接受質(zhì)量的前提下提高壓縮比。主觀評價能夠反映出圖像在不同應(yīng)用場景下的適用性。對于醫(yī)學(xué)圖像,醫(yī)生需要通過主觀評價來判斷圖像是否能夠清晰呈現(xiàn)病變特征,以滿足診斷需求;對于藝術(shù)圖像,觀眾則從藝術(shù)欣賞的角度,通過主觀評價來判斷圖像是否能夠傳達出藝術(shù)家想要表達的情感和意境。主觀評價直接反映人對圖像質(zhì)量的感知,在圖像質(zhì)量評價體系中占據(jù)著核心地位,為圖像處理技術(shù)的發(fā)展和應(yīng)用提供了重要的支撐。3.2常用主觀評價方法3.2.1絕對評價法絕對評價法是一種讓觀察者依據(jù)自身知識和理解,按照特定評價性能對圖像的絕對好壞進行評價的方法。該方法通常采用5分制作為評分標準,國際上對這種評分尺度做出了明確規(guī)定,也稱為圖像評價的5分制“全優(yōu)度尺度”。在5分制中,5分代表圖像質(zhì)量極佳,幾乎無失真,視覺效果非常理想,圖像的細節(jié)清晰、色彩鮮艷、對比度適中,觀察者在觀看時不會察覺到任何明顯的質(zhì)量問題,能夠獲得非常好的視覺體驗。在評價一幅高分辨率、色彩還原準確的藝術(shù)攝影作品時,如果作品經(jīng)過嚴格的后期處理,沒有引入任何噪聲或失真,那么觀察者可能會給予其5分的評價。4分表示圖像質(zhì)量良好,存在極輕微的失真,但對整體視覺感受影響極小,這種失真可能只有在非常仔細觀察時才能被發(fā)現(xiàn),一般不會影響觀察者對圖像內(nèi)容的理解和欣賞。對于一幅經(jīng)過輕微壓縮的風(fēng)景圖像,壓縮導(dǎo)致圖像的高頻細節(jié)略有損失,但整體畫面仍然清晰,色彩和對比度保持較好,此時可能會得到4分的評價。3分意味著圖像質(zhì)量尚可,有一定程度的失真,但在可接受范圍內(nèi),雖然失真較為明顯,但不會妨礙對圖像主要內(nèi)容的識別和理解,圖像仍然具有一定的可用性。當(dāng)一幅圖像受到輕度的噪聲干擾或模糊處理時,圖像的清晰度下降,但關(guān)鍵信息仍然能夠被辨認,這種情況下圖像可能會被評為3分。2分表明圖像質(zhì)量較差,失真較為嚴重,對視覺感受有較大影響,圖像的細節(jié)和結(jié)構(gòu)變得模糊,顏色可能出現(xiàn)偏差,這會導(dǎo)致觀察者在理解圖像內(nèi)容時遇到困難。對于一幅經(jīng)過過度壓縮的圖像,出現(xiàn)了明顯的塊狀效應(yīng)、邊緣模糊和顏色失真,使得圖像的視覺質(zhì)量大幅下降,此時可能會被給予2分評價。1分則代表圖像質(zhì)量極差,嚴重失真,幾乎無法正常觀看,圖像可能出現(xiàn)了嚴重的噪聲、模糊、失真等問題,以至于無法從中獲取有價值的信息。如果一幅圖像在傳輸過程中出現(xiàn)嚴重錯誤,導(dǎo)致畫面破碎、信息丟失,那么它很可能只能得到1分的評價。在實際應(yīng)用中,絕對評價法操作相對簡單,觀察者直接根據(jù)自己的視覺感受對圖像進行打分。在圖像壓縮實驗中,研究人員可以將不同壓縮比下的圖像展示給觀察者,觀察者依據(jù)5分制標準對這些圖像的質(zhì)量進行評價,從而快速了解不同壓縮比下圖像質(zhì)量的變化情況,為優(yōu)化壓縮算法提供參考。3.2.2相對評價法相對評價法是在沒有原始圖像作為參考的情況下,由觀察者對一批待評價圖像進行相互比較,從而判斷出每個圖像的優(yōu)劣順序,并給出相應(yīng)評價值的方法。該方法的核心在于通過圖像之間的對比來確定它們的相對質(zhì)量。在相對評價中,觀察者需要對一組圖像進行仔細觀察和比較。當(dāng)評價一組經(jīng)過不同圖像處理算法處理的圖像時,觀察者需要逐一對比這些圖像,從清晰度、色彩還原度、噪聲水平、細節(jié)保留等多個方面進行考量。對于清晰度方面,觀察者會比較圖像中物體邊緣的銳利程度、文字的清晰可辨程度等;在色彩還原度上,會判斷圖像中各種顏色是否與實際物體或場景的顏色相符,色彩是否鮮艷、自然;對于噪聲水平,會關(guān)注圖像中是否存在明顯的噪點,噪點的多少和分布情況;在細節(jié)保留方面,會查看圖像中物體的紋理、微小結(jié)構(gòu)等細節(jié)是否被較好地保留下來。通過對這些方面的綜合比較,觀察者能夠判斷出每幅圖像相對于其他圖像的質(zhì)量高低,并對它們進行排序。如果有三幅圖像A、B、C,觀察者經(jīng)過比較后認為A的清晰度最高、色彩還原最好、噪聲最少,B次之,C最差,那么就會將A排在首位,B排在第二位,C排在最后。相對評價法通常采用單刺激連續(xù)質(zhì)量評價方法(SingleStimulusContinuousQualityEvaluation,SSCQE)。具體做法是,將一批待評價圖像按照一定的序列播放,此時觀察者在觀看圖像的同時給出待評圖像相應(yīng)的評價分值。在一個圖像質(zhì)量評價實驗中,將10幅不同的圖像依次展示給觀察者,觀察者在觀看每幅圖像后,立即根據(jù)自己的判斷給出一個0-100之間的分數(shù),其中100分表示質(zhì)量最好,0分表示質(zhì)量最差。通過這種方式,能夠快速獲取觀察者對不同圖像質(zhì)量的相對評價,為后續(xù)的分析和研究提供數(shù)據(jù)支持。3.2.3類別評價法類別評價法主要側(cè)重于讓觀察者對圖像的某些特定屬性進行評估,這些屬性通常包括清晰度、色彩飽和度、對比度、噪聲水平等,這些屬性對于圖像的視覺效果和信息傳達起著關(guān)鍵作用。清晰度是圖像的重要屬性之一,它直接影響觀察者對圖像內(nèi)容的識別和理解。在評價清晰度時,觀察者主要關(guān)注圖像中物體邊緣的銳利程度、細節(jié)的清晰可辨程度等。對于一幅人物肖像圖像,清晰的圖像能夠讓觀察者清楚地看到人物的面部特征、表情細節(jié)以及頭發(fā)的紋理等;而模糊的圖像則會使這些細節(jié)變得模糊不清,影響對圖像的欣賞和分析。觀察者可以根據(jù)自己的視覺感受,將圖像的清晰度分為清晰、較清晰、一般、較模糊、模糊等幾個等級。如果圖像中物體的邊緣清晰銳利,細節(jié)豐富,能夠輕松辨認,那么可以將其清晰度評為“清晰”;如果圖像存在一定程度的模糊,但不影響對主要內(nèi)容的識別,可評為“較清晰”;當(dāng)圖像的模糊程度已經(jīng)對部分細節(jié)的辨認造成困難,但仍能大致了解圖像內(nèi)容時,可評為“一般”;若圖像模糊較為明顯,許多細節(jié)丟失,對內(nèi)容的理解產(chǎn)生較大影響,則評為“較模糊”;而當(dāng)圖像幾乎完全模糊,無法分辨出具體內(nèi)容時,評為“模糊”。色彩飽和度也是類別評價法中常被關(guān)注的屬性,它反映了圖像中顏色的鮮艷程度。高飽和度的圖像色彩鮮艷、生動,能夠吸引觀察者的注意力;而低飽和度的圖像則顏色暗淡,可能會使圖像顯得缺乏活力。在評價色彩飽和度時,觀察者可以將圖像的色彩飽和度分為高、較高、適中、較低、低等幾個級別。一幅色彩鮮艷的花卉圖像,花朵的顏色濃郁、鮮艷,可將其色彩飽和度評為“高”;如果圖像的顏色比較鮮艷,但略遜于“高”飽和度的圖像,可評為“較高”;當(dāng)圖像的顏色鮮艷程度適中,看起來自然、舒適,不顯得過于鮮艷或暗淡時,評為“適中”;若圖像的顏色開始變得暗淡,失去了部分鮮艷度,可評為“較低”;而當(dāng)圖像的顏色非常暗淡,幾乎失去了色彩的鮮艷感時,評為“低”。對比度同樣是影響圖像視覺效果的重要因素,它指的是圖像中亮部與暗部之間的差異程度。合適的對比度能夠使圖像層次分明,突出圖像的重點內(nèi)容;而對比度不足會使圖像顯得平淡,對比度過度則可能導(dǎo)致圖像丟失部分亮部或暗部的細節(jié)。觀察者在評價對比度時,可以將其分為高對比度、較高對比度、適中對比度、較低對比度、低對比度等幾個類別。一幅具有強烈明暗對比的夜景圖像,明亮的燈光與黑暗的夜空形成鮮明對比,圖像層次豐富,可將其對比度評為“高對比度”;如果圖像的對比度較強,但沒有達到“高對比度”的程度,可評為“較高對比度”;當(dāng)圖像的亮部和暗部之間的差異適中,能夠清晰地顯示圖像的各個部分,且沒有丟失細節(jié)時,評為“適中對比度”;若圖像的對比度較弱,亮部和暗部之間的區(qū)別不明顯,圖像顯得較為平淡,可評為“較低對比度”;而當(dāng)圖像的對比度非常低,幾乎無法分辨亮部和暗部,圖像整體顯得灰暗時,評為“低對比度”。噪聲水平也是圖像質(zhì)量的重要考量因素,噪聲會影響圖像的清晰度和視覺效果。在評價噪聲水平時,觀察者主要觀察圖像中是否存在明顯的噪點,以及噪點的多少和分布情況。可以將噪聲水平分為無噪聲、極低噪聲、低噪聲、中等噪聲、高噪聲等幾個等級。如果圖像中完全沒有可見的噪點,畫面干凈、整潔,可評為“無噪聲”;若圖像中存在極少量的噪點,不仔細觀察幾乎難以察覺,可評為“極低噪聲”;當(dāng)圖像中有一定數(shù)量的噪點,但對圖像的整體質(zhì)量影響較小,可評為“低噪聲”;若噪點數(shù)量較多,已經(jīng)對圖像的清晰度和視覺效果產(chǎn)生一定影響,可評為“中等噪聲”;而當(dāng)圖像中充滿大量噪點,嚴重影響圖像的觀看和分析時,評為“高噪聲”。類別評價法能夠從多個特定屬性角度對圖像質(zhì)量進行細致評估,為圖像質(zhì)量的分析和改進提供更全面、具體的信息。3.3基于HVS的主觀評價模型構(gòu)建3.3.1模型設(shè)計思路本模型的構(gòu)建緊密圍繞人類視覺系統(tǒng)(HVS)的特性,從顏色、對比度、結(jié)構(gòu)和紋理等多個關(guān)鍵方面入手,旨在全面、準確地模擬人類對圖像質(zhì)量的主觀感知。在顏色感知方面,HVS通過視網(wǎng)膜上的視錐細胞對不同波長的光產(chǎn)生響應(yīng),從而感知顏色。我們考慮到HVS對不同顏色的敏感度差異,以及顏色對比度對視覺感知的影響。采用CIELAB顏色空間,該空間能夠更符合人類視覺對顏色的感知特性,通過計算圖像在CIELAB顏色空間中的顏色差異,來衡量顏色失真對圖像質(zhì)量的影響。對于一幅彩色圖像,若在處理過程中顏色發(fā)生偏移,導(dǎo)致在CIELAB顏色空間中與原始圖像的顏色差異增大,那么模型將據(jù)此判斷圖像質(zhì)量下降。同時,考慮顏色的飽和度和亮度對視覺感受的影響,飽和度較高的顏色更能吸引HVS的注意,而亮度的變化會影響顏色的可辨識度。在模型中,對飽和度和亮度的變化進行量化分析,綜合評估顏色因素對圖像質(zhì)量的影響。對比度是影響圖像視覺效果的重要因素,HVS對對比度的感知并非線性。模型充分考慮HVS的對比度敏感度特性,通過計算圖像不同區(qū)域的對比度,結(jié)合對比度敏感度函數(shù)(CSF)來評估對比度對圖像質(zhì)量的影響。CSF反映了HVS對不同空間頻率下對比度的敏感程度,對于中低頻空間頻率的對比度,HVS敏感度較高;而對于高頻空間頻率的對比度,敏感度相對較低。在模型中,根據(jù)CSF對不同頻率成分的對比度進行加權(quán)處理,突出對人類視覺感知更為重要的中低頻對比度信息。對于一幅低對比度的圖像,模型會根據(jù)CSF對其不同頻率成分的對比度進行分析,判斷其在中低頻區(qū)域的對比度是否滿足HVS的感知需求,從而評估圖像質(zhì)量。圖像的結(jié)構(gòu)信息對于人類理解圖像內(nèi)容至關(guān)重要,HVS能夠敏銳地感知圖像的結(jié)構(gòu)變化。模型基于結(jié)構(gòu)相似性(SSIM)的原理,從圖像的亮度、對比度和結(jié)構(gòu)三個方面來衡量圖像結(jié)構(gòu)的相似性。在亮度方面,計算失真圖像與原始圖像對應(yīng)區(qū)域的平均亮度差異;在對比度方面,考慮區(qū)域內(nèi)像素的標準差差異;在結(jié)構(gòu)方面,通過計算像素間的協(xié)方差來衡量結(jié)構(gòu)的相似程度。將這三個方面的相似性指標進行綜合,得到圖像的結(jié)構(gòu)相似性度量。對于一幅經(jīng)過縮放處理的圖像,模型會通過比較其與原始圖像在亮度、對比度和結(jié)構(gòu)上的相似性,判斷圖像結(jié)構(gòu)的失真程度,進而評估圖像質(zhì)量。紋理是圖像的重要特征之一,HVS對紋理的感知具有獨特的特性。模型采用基于小波變換的方法來提取圖像的紋理特征,小波變換能夠?qū)D像分解為不同頻率和方向的子帶,從而有效地提取圖像的紋理信息。通過分析不同子帶的小波系數(shù),來評估紋理的清晰度、復(fù)雜度等特征對圖像質(zhì)量的影響。對于一幅包含復(fù)雜紋理的圖像,若在處理過程中紋理細節(jié)丟失,模型會通過分析小波系數(shù)的變化,判斷紋理的失真情況,進而評估圖像質(zhì)量。模型還考慮了紋理的視覺掩蔽效應(yīng),即當(dāng)圖像中存在較強的紋理時,較弱的紋理可能會被掩蔽,對圖像質(zhì)量的影響相對較小。在模型中,根據(jù)視覺掩蔽效應(yīng)的原理,對不同強度的紋理進行加權(quán)處理,更準確地評估紋理對圖像質(zhì)量的影響。3.3.2模型實現(xiàn)與驗證為了實現(xiàn)基于HVS的主觀評價模型,我們精心設(shè)計并開展了一系列嚴謹?shù)膶嶒?,以收集全面且準確的主觀評分數(shù)據(jù),從而為模型的訓(xùn)練和驗證提供堅實的數(shù)據(jù)基礎(chǔ)。在實驗過程中,我們廣泛收集了包含豐富內(nèi)容和多種失真類型的圖像數(shù)據(jù)集。這個數(shù)據(jù)集涵蓋了自然風(fēng)景、人物肖像、建筑、工業(yè)產(chǎn)品等多種類型的圖像,并且包含了高斯噪聲、JPEG壓縮、模糊、幾何失真等常見的失真形式,每種失真類型又設(shè)置了不同的失真程度。通過這種多樣化的圖像數(shù)據(jù),能夠充分模擬實際應(yīng)用中圖像可能出現(xiàn)的各種質(zhì)量問題,使模型的訓(xùn)練和驗證更具代表性和可靠性。對于自然風(fēng)景圖像,我們設(shè)置了不同強度的高斯噪聲干擾,以模擬在低光照環(huán)境下拍攝或圖像傳輸過程中引入的噪聲;對于人物肖像圖像,進行了不同壓縮比的JPEG壓縮處理,以研究壓縮對圖像細節(jié)和視覺效果的影響。我們邀請了50名具有不同專業(yè)背景和視覺經(jīng)驗的觀察者參與主觀評價實驗。在實驗前,對觀察者進行了詳細的培訓(xùn),使其熟悉實驗流程和評分標準。實驗采用雙盲測試的方式,避免觀察者受到圖像來源和處理方式的影響。觀察者按照絕對評價法,采用5分制對圖像質(zhì)量進行評分,其中5分表示圖像質(zhì)量極佳,幾乎無失真;1分表示圖像質(zhì)量極差,嚴重失真。在評分過程中,為觀察者提供了統(tǒng)一的觀察環(huán)境,包括屏幕亮度、對比度、分辨率等參數(shù)的校準,以減少外部因素對評分結(jié)果的干擾。收集到主觀評分數(shù)據(jù)后,我們利用這些數(shù)據(jù)對模型進行訓(xùn)練。采用機器學(xué)習(xí)中的回歸算法,如支持向量回歸(SVR)、線性回歸等,將圖像的顏色、對比度、結(jié)構(gòu)和紋理等特征作為輸入,主觀評分作為輸出,訓(xùn)練模型學(xué)習(xí)這些特征與主觀評分之間的映射關(guān)系。在訓(xùn)練過程中,通過交叉驗證等方法調(diào)整模型的參數(shù),以提高模型的準確性和泛化能力。使用SVR算法時,通過調(diào)整核函數(shù)類型、懲罰參數(shù)等,使模型能夠更好地擬合數(shù)據(jù),準確地預(yù)測圖像的主觀質(zhì)量評分。為了驗證模型的性能,我們將數(shù)據(jù)集分為訓(xùn)練集和測試集。利用訓(xùn)練集對模型進行訓(xùn)練,然后在測試集上對模型進行測試。通過計算模型預(yù)測的圖像質(zhì)量評分與觀察者給出的主觀評分之間的相關(guān)性,來評估模型的準確性。采用斯皮爾曼等級相關(guān)系數(shù)(SROCC)、皮爾遜線性相關(guān)系數(shù)(PLCC)等指標來衡量相關(guān)性。若模型預(yù)測的評分與主觀評分之間的SROCC和PLCC值接近1,則說明模型的預(yù)測結(jié)果與主觀感知具有較高的一致性,模型性能良好。在測試過程中,我們發(fā)現(xiàn)對于高斯噪聲失真的圖像,模型預(yù)測評分與主觀評分的SROCC達到了0.85,表明模型能夠較好地預(yù)測這類失真圖像的質(zhì)量;而對于復(fù)雜的幾何失真圖像,SROCC為0.78,雖然相關(guān)性較高,但仍有進一步提升的空間。通過對不同類型失真圖像的測試分析,我們深入了解了模型在不同情況下的性能表現(xiàn),為模型的進一步優(yōu)化提供了方向。四、圖像質(zhì)量客觀評價方法4.1客觀評價方法概述圖像質(zhì)量客觀評價方法,是借助數(shù)學(xué)模型和算法,對圖像的質(zhì)量進行量化評估的方式。其核心目標是用計算機模擬人類視覺系統(tǒng)(HVS)對圖像的感知過程,從而實現(xiàn)對圖像質(zhì)量的自動、快速且準確的評價。在數(shù)字圖像處理領(lǐng)域,客觀評價方法起著至關(guān)重要的作用,它能夠為圖像的處理、傳輸、存儲等環(huán)節(jié)提供量化的質(zhì)量指標,幫助研究者和工程師優(yōu)化算法、提高系統(tǒng)性能。在圖像壓縮算法的研發(fā)中,客觀評價方法可以量化不同壓縮比下圖像的質(zhì)量損失,指導(dǎo)算法在保證一定圖像質(zhì)量的前提下提高壓縮效率;在圖像傳輸過程中,通過實時的客觀質(zhì)量評價,可以動態(tài)調(diào)整傳輸參數(shù),確保接收端接收到高質(zhì)量的圖像??陀^評價方法的發(fā)展歷程與圖像處理技術(shù)的進步緊密相連。早期的客觀評價方法主要基于簡單的數(shù)學(xué)統(tǒng)計,如均方誤差(MSE)和峰值信噪比(PSNR)等。MSE通過計算原始圖像與失真圖像對應(yīng)像素差值的平方和的平均值,來衡量圖像的失真程度,其數(shù)學(xué)表達式為MSE=\frac{1}{mn}\sum_{i=0}^{m-1}\sum_{j=0}^{n-1}[I(i,j)-K(i,j)]^2,其中I(i,j)和K(i,j)分別表示原始圖像和失真圖像在(i,j)位置的像素值,m和n分別為圖像的行數(shù)和列數(shù)。PSNR則是基于MSE的對數(shù)形式,用于衡量圖像的峰值信號與噪聲的比例,公式為PSNR=10\log_{10}(\frac{MAX_{I}^2}{MSE}),其中MAX_{I}表示圖像像素的最大取值。這些早期方法計算簡單、易于實現(xiàn),在一定程度上能夠反映圖像的失真情況,因此在圖像質(zhì)量評價的初期得到了廣泛應(yīng)用。然而,它們僅僅從像素層面進行簡單計算,完全忽略了HVS復(fù)雜的感知特性,導(dǎo)致評價結(jié)果與人類的主觀視覺感受存在較大偏差。在某些情況下,一幅圖像的MSE和PSNR值可能表現(xiàn)良好,但由于其丟失了對HVS至關(guān)重要的結(jié)構(gòu)信息或紋理細節(jié),人類觀察者會明顯感覺到圖像質(zhì)量的下降。隨著對HVS研究的不斷深入,研究者們逐漸認識到將HVS特性融入圖像質(zhì)量客觀評價方法的重要性,并開始致力于開發(fā)更符合人類視覺感知的評價模型。這些新型的客觀評價方法,充分考慮了HVS在空間分辨率、對比度敏感度、顏色感知、視覺掩蔽效應(yīng)、視覺注意機制等方面的特性。通過引入視覺敏感度函數(shù),對圖像不同頻率成分的敏感度進行量化,從而在評價過程中對不同頻率的信息給予不同的權(quán)重;利用視覺掩蔽效應(yīng),在圖像存在強信號的區(qū)域,適當(dāng)降低對弱信號的質(zhì)量評價權(quán)重,以更準確地反映HVS的感知特點。一些基于結(jié)構(gòu)相似性(SSIM)的評價方法,從圖像的亮度、對比度和結(jié)構(gòu)三個方面衡量圖像之間的相似性,模擬了HVS對結(jié)構(gòu)信息的感知,相較于傳統(tǒng)方法,在評價結(jié)果與主觀感知的一致性上有了顯著提升。4.2常用客觀評價指標與方法4.2.1基于誤差統(tǒng)計的方法基于誤差統(tǒng)計的圖像質(zhì)量客觀評價方法,以均方誤差(MeanSquaredError,MSE)和峰值信噪比(PeakSignaltoNoiseRatio,PSNR)為典型代表,在圖像質(zhì)量評價領(lǐng)域中具有重要地位,它們通過對原始圖像與失真圖像像素值差異的統(tǒng)計分析,來衡量圖像的質(zhì)量變化。均方誤差(MSE)的計算原理是基于像素層面的簡單數(shù)學(xué)運算,它通過計算原始圖像與失真圖像對應(yīng)像素差值的平方和的平均值,來量化圖像的失真程度。其數(shù)學(xué)表達式為MSE=\frac{1}{mn}\sum_{i=0}^{m-1}\sum_{j=0}^{n-1}[I(i,j)-K(i,j)]^2,其中I(i,j)和K(i,j)分別表示原始圖像和失真圖像在(i,j)位置的像素值,m和n分別為圖像的行數(shù)和列數(shù)。MSE值越小,表明原始圖像與失真圖像對應(yīng)像素之間的差異越小,圖像的失真程度越低,圖像質(zhì)量越高;反之,MSE值越大,則表示圖像的失真越嚴重,質(zhì)量越差。當(dāng)一幅圖像經(jīng)過輕微的噪聲干擾后,其MSE值會相對較小,說明圖像的失真程度較輕;而當(dāng)圖像經(jīng)過嚴重的壓縮或模糊處理時,MSE值會顯著增大,反映出圖像質(zhì)量的大幅下降。峰值信噪比(PSNR)是基于MSE的對數(shù)形式,用于衡量圖像的峰值信號與噪聲的比例,其公式為PSNR=10\log_{10}(\frac{MAX_{I}^2}{MSE}),其中MAX_{I}表示圖像像素的最大取值。在8位灰度圖像中,MAX_{I}通常為255。PSNR值越高,意味著圖像的峰值信號相對噪聲越大,圖像質(zhì)量越好;反之,PSNR值越低,表明圖像的噪聲相對較大,質(zhì)量較差。PSNR與MSE之間存在反比例關(guān)系,MSE值越小,PSNR值越高,圖像質(zhì)量越好。在圖像壓縮實驗中,隨著壓縮比的增加,圖像的MSE值逐漸增大,PSNR值逐漸降低,這表明圖像的失真程度逐漸加重,質(zhì)量逐漸下降。盡管MSE和PSNR在圖像質(zhì)量評價中具有計算簡單、易于實現(xiàn)的優(yōu)點,并且在一定程度上能夠反映圖像的失真情況,因此在早期的圖像質(zhì)量評價中得到了廣泛應(yīng)用。然而,它們存在著嚴重的局限性,主要體現(xiàn)在完全忽略了人類視覺系統(tǒng)(HVS)復(fù)雜的感知特性。HVS對圖像的感知不僅僅取決于像素值的差異,還受到視覺敏感度、對比度敏感度、顏色感知、空間頻率特性、視覺掩蔽效應(yīng)以及視覺注意機制等多種因素的綜合影響。在某些情況下,一幅圖像的MSE和PSNR值可能表現(xiàn)良好,但由于其丟失了對HVS至關(guān)重要的結(jié)構(gòu)信息或紋理細節(jié),人類觀察者會明顯感覺到圖像質(zhì)量的下降。當(dāng)一幅圖像經(jīng)過低通濾波處理后,雖然其MSE和PSNR值可能變化不大,但圖像的高頻細節(jié)被大量濾除,使得圖像變得模糊,人類視覺感知到的圖像質(zhì)量明顯降低。MSE和PSNR在評價圖像質(zhì)量時,無法準確反映人類對圖像質(zhì)量的主觀感受,導(dǎo)致評價結(jié)果與實際視覺體驗存在較大偏差。4.2.2基于結(jié)構(gòu)相似度的方法基于結(jié)構(gòu)相似度的圖像質(zhì)量評價方法,以結(jié)構(gòu)相似性(StructuralSimilarityIndex,SSIM)和多尺度結(jié)構(gòu)相似性(Multi-ScaleStructuralSimilarityIndex,MS-SSIM)為代表,充分考慮了人類視覺系統(tǒng)(HVS)對圖像結(jié)構(gòu)信息的高度敏感性,從亮度、對比度和結(jié)構(gòu)三個關(guān)鍵方面來衡量圖像之間的相似程度,相較于傳統(tǒng)的基于誤差統(tǒng)計的方法,在評價結(jié)果與主觀感知的一致性上有了顯著提升。結(jié)構(gòu)相似性(SSIM)指數(shù)的評價原理基于人類視覺系統(tǒng)對圖像結(jié)構(gòu)信息的重要感知。它將圖像的相似性分解為亮度、對比度和結(jié)構(gòu)三個方面進行度量。在亮度方面,通過計算圖像對應(yīng)區(qū)域的平均亮度來衡量亮度相似性,公式為l(X,Y)=\frac{2\mu_X\mu_Y+C_1}{\mu_X^2+\mu_Y^2+C_1},其中\(zhòng)mu_X和\mu_Y分別表示圖像X和Y對應(yīng)區(qū)域的平均亮度,C_1是一個很小的常數(shù),用于避免分母為零的情況。在對比度方面,通過計算圖像對應(yīng)區(qū)域像素的標準差來衡量對比度相似性,公式為c(X,Y)=\frac{2\sigma_X\sigma_Y+C_2}{\sigma_X^2+\sigma_Y^2+C_2},其中\(zhòng)sigma_X和\sigma_Y分別表示圖像X和Y對應(yīng)區(qū)域像素的標準差,C_2也是一個常數(shù)。在結(jié)構(gòu)方面,通過計算圖像對應(yīng)區(qū)域像素間的協(xié)方差來衡量結(jié)構(gòu)相似性,公式為s(X,Y)=\frac{\sigma_{XY}+C_3}{\sigma_X\sigma_Y+C_3},其中\(zhòng)sigma_{XY}表示圖像X和Y對應(yīng)區(qū)域像素間的協(xié)方差,C_3=C_2/2。最終的SSIM值是這三個方面相似性的乘積,即SSIM(X,Y)=l(X,Y)\cdotc(X,Y)\cdots(X,Y),其取值范圍在[-1,1]之間,值越接近1,表示兩幅圖像越相似,圖像質(zhì)量越高;值越接近-1,表示兩幅圖像差異越大,圖像質(zhì)量越低。在評價一幅經(jīng)過輕微壓縮的圖像時,若其SSIM值接近1,說明壓縮后的圖像在亮度、對比度和結(jié)構(gòu)上與原始圖像非常相似,圖像質(zhì)量損失較小。多尺度結(jié)構(gòu)相似性(MS-SSIM)指數(shù)是在SSIM的基礎(chǔ)上進一步發(fā)展而來,它考慮了人類視覺在不同分辨率下對圖像結(jié)構(gòu)信息的感知特性。MS-SSIM通過在多個尺度上對圖像進行分析,更全面地評估圖像的結(jié)構(gòu)相似性。在不同尺度下,圖像的結(jié)構(gòu)信息會以不同的形式呈現(xiàn),HVS對不同尺度下的結(jié)構(gòu)變化也有不同的敏感度。MS-SSIM首先將圖像進行多尺度分解,通常采用高斯金字塔等方法將圖像分解為不同分辨率的子圖像。然后在每個尺度上計算SSIM值,并根據(jù)不同尺度對人類視覺感知的重要性,為每個尺度的SSIM值分配不同的權(quán)重。將各個尺度的SSIM值進行加權(quán)融合,得到最終的MS-SSIM值。公式為MS-SSIM(X,Y)=\prod_{j=1}^{J}l_j(X,Y)^{\alpha_j}\prod_{i=1}^{I}c_i(X,Y)^{\beta_i}s_i(X,Y)^{\gamma_i},其中J和I分別表示亮度和對比度、結(jié)構(gòu)的尺度數(shù),\alpha_j、\beta_i和\gamma_i分別表示不同尺度下亮度、對比度和結(jié)構(gòu)的權(quán)重。MS-SSIM能夠更準確地反映圖像在不同分辨率下的結(jié)構(gòu)變化對人類視覺感知的影響,在復(fù)雜圖像失真情況下的評價性能得到了顯著增強。在評價一幅經(jīng)過縮放和模糊混合失真的圖像時,MS-SSIM能夠綜合考慮不同尺度下圖像結(jié)構(gòu)的變化,更準確地評估圖像質(zhì)量,而SSIM可能會因為只考慮單一尺度的結(jié)構(gòu)相似性而導(dǎo)致評價結(jié)果不準確?;诮Y(jié)構(gòu)相似度的方法在圖像壓縮、圖像傳輸、圖像增強等領(lǐng)域有著廣泛的應(yīng)用。在圖像壓縮中,利用SSIM和MS-SSIM作為優(yōu)化目標,可以指導(dǎo)壓縮算法在保證圖像結(jié)構(gòu)信息的前提下,實現(xiàn)更高的壓縮比。在圖像傳輸中,通過實時計算接收圖像與原始圖像的SSIM或MS-SSIM值,可以動態(tài)調(diào)整傳輸策略,確保接收圖像的質(zhì)量。在圖像增強中,以SSIM和MS-SSIM為評價指標,可以評估增強算法對圖像結(jié)構(gòu)信息的保留和改善效果,指導(dǎo)算法的優(yōu)化。在醫(yī)學(xué)圖像增強中,利用MS-SSIM評價不同增強算法對醫(yī)學(xué)圖像結(jié)構(gòu)信息的影響,能夠選擇出最適合醫(yī)學(xué)診斷的增強算法,提高圖像的診斷價值。4.2.3基于視覺感知的方法基于視覺感知的圖像質(zhì)量評價方法,充分考慮了人類視覺系統(tǒng)(HVS)復(fù)雜而精妙的感知特性,通過模擬HVS對圖像的感知過程,實現(xiàn)對圖像質(zhì)量的更準確評估。視覺信息保真度(VisualInformationFidelity,VIF)和基于小波的銳化特征(Wavelet-basedSharpness-relatedFeatures,WASH)等方法是此類方法的典型代表,它們在圖像質(zhì)量評價領(lǐng)域展現(xiàn)出獨特的優(yōu)勢。視覺信息保真度(VIF)方法基于自然場景統(tǒng)計模型(NaturalSceneStatistics,NSS)和人類視覺系統(tǒng)的失真感知來評估圖像質(zhì)量。該方法認為,人眼看到的圖像是圖像通過HVS過濾出來的信息,HVS本身就是一個失真通道,即人類視覺失真通道,而失真圖像只是比原始圖像在經(jīng)過HVS之前又多了一個圖像失真通道。因此,可以使用信息論的知識將人眼提取的信息與從原始圖像提取的信息進行比較,得出最終評測結(jié)果。VIF方法的具體實現(xiàn)過程如下:首先,對原始圖像和失真圖像進行多尺度小波分解,將圖像分解為不同頻率的子帶,以模擬HVS對不同頻率成分的敏感度。然后,根據(jù)自然場景統(tǒng)計模型,對每個子帶的小波系數(shù)進行建模,得到原始圖像和失真圖像在各個子帶的統(tǒng)計特征。利用這些統(tǒng)計特征,計算從原始圖像到失真圖像的信息損失,通過信息損失來衡量圖像的質(zhì)量。VIF值越大,表示從原始圖像到失真圖像的信息損失越小,圖像質(zhì)量越好;反之,VIF值越小,說明信息損失越大,圖像質(zhì)量越差。在評價一幅經(jīng)過JPEG壓縮的圖像時,VIF能夠準確地評估壓縮過程中圖像信息的丟失情況,從而判斷圖像質(zhì)量的下降程度。VIF方法的優(yōu)勢在于充分考慮了HVS的特性和自然圖像的統(tǒng)計規(guī)律,能夠更準確地反映圖像質(zhì)量與人類視覺感知之間的關(guān)系?;谛〔ǖ匿J化特征(WASH)方法利用小波變換的多尺度分解特性,提取反映圖像銳化程度的特征,并結(jié)合HVS的感知特性,構(gòu)建更符合人類視覺感知的圖像質(zhì)量評價模型。小波變換能夠?qū)D像分解成不同頻率的子帶,有效地捕捉圖像的細節(jié)信息,圖像中的邊緣、紋理等細節(jié)信息通常蘊含在高頻子帶中。WASH方法通過分析不同尺度下的小波系數(shù),能夠精確地捕捉圖像的銳化程度,例如邊緣的清晰度和紋理的豐富程度。該方法考慮了HVS對不同頻率成分的敏感度不同,對高頻成分(例如邊緣和紋理)更為敏感。通過對不同子帶的小波系數(shù)賦予不同的權(quán)重,模擬HVS的感知特性,從而提高評價結(jié)果的準確性。可以根據(jù)對比敏感度函數(shù)(CSF)來設(shè)計權(quán)重,賦予高頻子帶更高的權(quán)重,突出圖像的銳化程度對主觀質(zhì)量的影響。此外,HVS對對比度變化也比較敏感,WASH方法可以利用小波變換提取的對比度信息,更好地反映圖像的銳化效果。對于一幅經(jīng)過圖像增強處理的圖像,WASH能夠準確地評估圖像銳化程度的變化,判斷增強效果是否符合人類視覺感知的需求。WASH方法的優(yōu)點是能夠有效地處理不同類型的圖像失真,對多種失真類型,例如模糊、噪聲和壓縮等,都具有較好的適應(yīng)性。這是因為圖像失真通常會導(dǎo)致圖像細節(jié)信息的丟失或扭曲,從而影響圖像的銳化程度,WASH方法通過分析小波系數(shù)的變化,能夠有效地檢測這些變化,并將其轉(zhuǎn)化為圖像質(zhì)量的評價指標。4.3基于HVS的客觀評價模型構(gòu)建4.3.1特征提取與選擇在構(gòu)建基于人類視覺系統(tǒng)(HVS)的客觀評價模型時,特征提取與選擇是至關(guān)重要的環(huán)節(jié),它直接關(guān)系到模型對圖像質(zhì)量評估的準確性和有效性。離散余弦變換(DiscreteCosineTransform,DCT)是一種廣泛應(yīng)用于圖像處理領(lǐng)域的正交變換,在圖像特征提取中發(fā)揮著關(guān)鍵作用。DCT變換能夠?qū)D像從空間域轉(zhuǎn)換到頻率域,其低頻系數(shù)對應(yīng)圖像的整體信息和低頻細節(jié),高頻系數(shù)對應(yīng)圖像的細節(jié)紋理和邊緣信息。由于HVS對低頻分量比較敏感,而對高頻分量相對不敏感,因此在特征提取過程中,利用DCT變換可以有效地分離出圖像的不同頻率成分,為后續(xù)的特征選擇提供豐富的信息。在一幅自然風(fēng)景圖像中,通過DCT變換,能夠?qū)D像中的大面積天空、山巒等低頻信息和樹葉的紋理、樹枝的細節(jié)等高頻信息分離開來。對圖像進行DCT變換后,得到的DCT系數(shù)矩陣包含了圖像在不同頻率下的能量分布信息。我們可以根據(jù)HVS的特性,對DCT系數(shù)進行進一步處理和分析,提取出對圖像質(zhì)量評價有重要意義的特征??梢酝ㄟ^對低頻DCT系數(shù)的分析,獲取圖像的亮度、對比度等全局特征;對高頻DCT系數(shù)的分析,則有助于提取圖像的紋理、邊緣等細節(jié)特征。亮度特征是圖像的基本特征之一,它反映了圖像的整體明暗程度。在基于HVS的客觀評價模型中,亮度特征對圖像質(zhì)量的評估具有重要影響。我們可以通過計算圖像的平均亮度、亮度標準差等統(tǒng)計量來提取亮度特征。平均亮度能夠反映圖像的整體明亮程度,而亮度標準差則可以衡量圖像中亮度的變化程度。對于一幅曝光過度的圖像,其平均亮度會偏高,亮度標準差可能較??;而對于曝光不足的圖像,平均亮度偏低,亮度標準差也可能較小。通過分析這些亮度特征,能夠初步判斷圖像的質(zhì)量問題。還可以考慮HVS對亮度的非線性感知特性,采用符合HVS感知的亮度模型進行特征提取??梢詫D像從RGB顏色空間轉(zhuǎn)換到CIELAB顏色空間,在CIELAB顏色空間中,L通道表示亮度信息,其對亮度的描述更符合HVS的感知特點。通過對L通道的分析,能夠更準確地提取與HVS相關(guān)的亮度特征。紋理特征是圖像中局部模式的重復(fù),它有助于識別對象并感知其深度,在圖像質(zhì)量評價中起著重要作用?;贖VS的特性,我們可以采用多種方法提取紋理特征。小波變換是一種常用的紋理特征提取方法,它能夠?qū)D像分解成不同頻率和方向的子帶,有效地提取圖像的紋理信息。通過分析小波系數(shù)的分布和變化,能夠獲取圖像紋理的清晰度、復(fù)雜度等特征。在一幅包含復(fù)雜紋理的織物圖像中,通過小波變換可以將紋理的細節(jié)信息提取出來,分析不同子帶的小波系數(shù),可以判斷紋理的清晰程度和復(fù)雜程度。灰度共生矩陣(GrayLevelCo-occurrenceMatrix,GLCM)也是一種經(jīng)典的紋理特征提取方法,它通過統(tǒng)計圖像中灰度級的共生關(guān)系,獲取紋理的方向性、對比度、相關(guān)性等特征。對于一幅具有規(guī)則紋理的圖像,利用GLCM可以計算出紋理的方向性特征,從而判斷紋理的方向是否一致;通過計算對比度特征,可以評估紋理的清晰程度。在特征選擇過程中,結(jié)合HVS對紋理的感知特性,選擇對HVS敏感的紋理特征,能夠提高模型對圖像紋理質(zhì)量的評估準確性。邊緣特征是圖像中亮度或顏色快速變化的邊界,對人類視覺感知至關(guān)重要。在基于HVS的客觀評價模型中,準確提取邊緣特征能夠更好地評估圖像的質(zhì)量。Canny邊緣檢測算法是一種常用的邊緣檢測方法,它通過高斯濾波平滑圖像、計算梯度幅值和方向、非極大值抑制、雙閾值檢測和邊緣連接等步驟,能夠準確地檢測出圖像的邊緣。在一幅建筑圖像中,利用Canny算法可以清晰地檢測出建筑物的輪廓、門窗的邊緣等信息。Sobel算子也是一種簡單有效的邊緣檢測方法,它通過計算圖像在水平和垂直方向上的梯度,來檢測邊緣。在一些對實時性要求較高的場景中,Sobel算子由于計算簡單、速度快,能夠快速地提取圖像的邊緣特征。在特征選擇時,考慮HVS對邊緣的感知特點,如對不同方向邊緣的敏感度差異,選擇合適的邊緣特征,能夠提高模型對圖像邊緣質(zhì)量的評估能力。在提取了圖像的亮度、紋理、邊緣等多種特征后,需要結(jié)合HVS特性對這些特征進行選擇。HVS對不同類型的特征具有不同的敏感度,因此我們可以根據(jù)HVS的敏感度函數(shù),為不同的特征分配不同的權(quán)重。對于HVS敏感的特征,如低頻亮度特征、中高頻紋理特征和明顯的邊緣特征,賦予較高的權(quán)重;而對于HVS相對不敏感的特征,賦予較低的權(quán)重。還可以采用特征選擇算法,如主成分分析(PrincipalComponentAnalysis,PCA)、互信息等方法,對提取的特征進行篩選,去除冗余特征,保留對圖像質(zhì)量評價最有價值的特征。通過PCA算法,可以將高維的特征向量轉(zhuǎn)換為低維的主成分,這些主成分包含了原始特征的主要信息,能夠有效降低特征維度,提高模型的計算效率和準確性。4.3.2模型訓(xùn)練與優(yōu)化在完成基于人類視覺系統(tǒng)(HVS)的圖像特征提取與選擇后,接下來需要使用合適的機器學(xué)習(xí)算法對評價模型進行訓(xùn)練,并通過有效的方法對模型進行優(yōu)化,以提高模型的性能和準確性。支持向量機(SupportVectorMachine,SVM)是一種常用的機器學(xué)習(xí)算法,在基于HVS的圖像質(zhì)量客觀評價模型訓(xùn)練中具有重要應(yīng)用。SVM的基本原理是尋找一個最優(yōu)分類超平面,使得不同類別之間的間隔最大化。在圖像質(zhì)量評價中,我們可以將不同質(zhì)量等級的圖像看作不同的類別,通過SVM訓(xùn)練模型來學(xué)習(xí)圖像特征與質(zhì)量等級之間的映射關(guān)系。將提取的亮度、紋理、邊緣等特征作為SVM的輸入特征向量,將圖像的主觀質(zhì)量評分作為類別標簽,使用訓(xùn)練數(shù)據(jù)集對SVM進行訓(xùn)練。在訓(xùn)練過程中,SVM通過調(diào)整分類超平面的參數(shù),使得不同質(zhì)量等級的圖像能夠被準確地分類。對于高質(zhì)量圖像和低質(zhì)量圖像,SVM通過學(xué)習(xí)它們的特征差異,找到一個能夠?qū)烧哂行^(qū)分的超平面。SVM還可以通過核函數(shù)將低維空間中的數(shù)據(jù)映射到高維空間,從而解決線性不可分的問題。在圖像質(zhì)量評價中,圖像特征與質(zhì)量等級之間的關(guān)系可能是非線性的,使用核函數(shù)(如徑向基核函數(shù)、多項式核函數(shù)等)可以將特征向量映射到高維空間,使SVM能夠更好地學(xué)習(xí)這種非線性關(guān)系。除了SVM,人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)也是一種強大的機器學(xué)習(xí)算法,特別是在處理復(fù)雜的非線性關(guān)系方面具有獨特的優(yōu)勢。在基于HVS的圖像質(zhì)量評價模型中,多層感知器(Multi-LayerPerceptron,MLP)是一種常用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。MLP由輸入層、隱藏層和輸出層組成,各層之間通過權(quán)重連接。在訓(xùn)練過程中,輸入層接收圖像的特征向量,隱藏層通過非線性激活函數(shù)對輸入進行變換和處理,輸出層則輸出圖像的質(zhì)量評分。通過不斷調(diào)整各層之間的權(quán)重,使得模型的輸出與圖像的實際主觀質(zhì)量評分盡可能接近??梢允褂梅聪騻鞑ニ惴▉碛嬎阏`差,并根據(jù)誤差來調(diào)整權(quán)重,使模型不斷優(yōu)化。在訓(xùn)練MLP時,需要合理設(shè)置隱藏層的層數(shù)和神經(jīng)元數(shù)量,以避免過擬合或欠擬合問題。隱藏層層數(shù)過多或神經(jīng)元數(shù)量過多,可能會導(dǎo)致模型過擬合,對訓(xùn)練數(shù)據(jù)過度學(xué)習(xí),而對新數(shù)據(jù)的泛化能力下降;隱藏層層數(shù)過少或神經(jīng)元數(shù)量過少,則可能導(dǎo)致模型欠擬合,無法學(xué)習(xí)到圖像特征與質(zhì)量評分之間的復(fù)雜關(guān)系。在模型訓(xùn)練過程中,交叉驗證是一種重要的方法,用于評估模型的性能和優(yōu)化模型參數(shù)。常用的交叉驗證方法有K折交叉驗證。K折交叉驗證的基本步驟是將訓(xùn)練數(shù)據(jù)集分成K個互不相交的子集,每次選擇其中一個子集作為驗證集,其余K-1個子集作為訓(xùn)練集,進行K次訓(xùn)練和驗證。將K次驗證的結(jié)果進行平均,得到模型的性能指標,如準確率、均方誤差等。通過K折交叉驗證,可以更全面地評估模型在不同數(shù)據(jù)子集上的表現(xiàn),避免因數(shù)據(jù)集劃分不合理而導(dǎo)致的評估偏差。在使用SVM訓(xùn)練基于HVS的圖像質(zhì)量評價模型時,通過5折交叉驗證,可以對SVM的參數(shù)(如懲罰參數(shù)C、核函數(shù)參數(shù)等)進行調(diào)整和優(yōu)化。在每次交叉驗證中,嘗試不同的參數(shù)值,選擇使驗證集上性能指標最優(yōu)的參數(shù)組合作為最終的模型參數(shù)。除了交叉驗證,正則化也是一種常用的模型優(yōu)化方法,用于防止模型過擬合。L1正則化和L2正則化是兩種常見的正則化方法。L1正則化通過在損失函數(shù)中添加權(quán)重向量的L1范數(shù),使模型的某些權(quán)重變?yōu)?,從而實現(xiàn)特征選擇的目的,減少模型的復(fù)雜度。L2正則化則是在損失函數(shù)中添加權(quán)重向量的L2范數(shù),使權(quán)重向量的元素值變小,防止模型過擬合。在基于神經(jīng)網(wǎng)絡(luò)的圖像質(zhì)量評價模型中,使用L2正則化可以有效降低模型的過擬合風(fēng)險。在訓(xùn)練多層感知器時,在損失函數(shù)中添加L2正則化項,調(diào)整正則化系數(shù),使模型在訓(xùn)練集和驗證集上都能保持較好的性能。通過合理使用交叉驗證和正則化等方法,可以提高基于HVS的圖像質(zhì)量客觀評價模型的性能和泛化能力,使其能夠更準確地評估圖像質(zhì)量。五、基于HVS的主客觀圖像質(zhì)量評價方法對比與分析5.1主客觀評價方法的比較主觀評價方法以人類觀察者為核心,通過直接的視覺感知對圖像質(zhì)量進行評判,具有直觀性強的顯著優(yōu)勢。它能夠全面綜合人類視覺系統(tǒng)(HVS)復(fù)雜的生理和心理特性,如視覺敏感度、對比度敏感度、顏色感知、視覺掩蔽效應(yīng)、視覺注意機制等多方面因素。在觀看一幅經(jīng)過壓縮處理的圖像時,主觀評價能夠直觀地判斷圖像是否出現(xiàn)模糊、失真、色彩偏差等影響視覺感受的問題,以及這些問題對整體視覺體驗的影響程度。這種評價方式最直接地反映了人類對圖像質(zhì)量的真實感受,是衡量圖像質(zhì)量的黃金標準。然而,主觀評價方法也存在一些局限性。其評價結(jié)果容易受到實驗條件和觀察者個體差異的顯著影響。不同的觀察環(huán)境,如屏幕亮度、對比度、分辨率的差異,以及觀察者的視覺經(jīng)驗、文化背景、疲勞程度等個體因素,都可能導(dǎo)致對同一圖像的評價結(jié)果產(chǎn)生較大偏差。在不同亮度的環(huán)境下觀看同一幅圖像,由于人眼的適應(yīng)性不同,對圖像亮度和對比度的感知會有所變化,從而影響對圖像質(zhì)量的評價。主觀評價方法通常需要耗費大量的人力、物力和時間,組織大規(guī)模的主觀評價實驗難度較大,成本較高??陀^評價方法借助數(shù)學(xué)模型和算法,對圖像質(zhì)量進行量化評估,具有可重復(fù)性和可比較性的優(yōu)點。無論在何時何地,只要使用相同的評價算法和參數(shù),對同一圖像的評價結(jié)果都是一致的,這使得不同圖像之間的質(zhì)量比較更加客觀和準確。客觀評價方法能夠快速、自動地給出評價結(jié)果,適用于大規(guī)模圖像數(shù)據(jù)的處理和分析。在圖像搜索引擎中,可以利用客觀評價方法對大量圖像進行快速篩選和排序,提高搜索效率。然而,客觀評價方法與真實人眼感知之間仍存在一定差距。傳統(tǒng)的客觀評價方法,如均方誤差(MSE)和峰值信噪比(PSNR)等,僅僅從像素層面進行簡單計算,完全忽略了HVS復(fù)雜的感知特性,導(dǎo)致評價結(jié)果與人類的主觀視覺感受存在較大偏差。在某些情況下,一幅圖像的MSE和PSNR值可能表現(xiàn)良好,但由于其丟失了對HVS至關(guān)重要的結(jié)構(gòu)信息或紋理細節(jié),人類觀察者會明顯感覺到圖像質(zhì)量的下降。雖然基于HVS特性的客觀評價方法在一定程度上改善了這一問題,但由于對HVS機制的認識仍有待深入,以及模型的復(fù)雜性和局限性,目前還無法完全準確地模擬人類的視覺感知。主客觀評價方法在圖像質(zhì)量評價中各有優(yōu)劣,它們并非相互排斥,而是可以相互補充。主觀評價方法能夠提供最真實的人類視覺感受,為客觀評價方法的研究和發(fā)展提供重要的參考依據(jù);客觀評價方法則具有可重復(fù)性和可比較性的優(yōu)勢,能夠快速、自動地對圖像質(zhì)量進行量化評估。在實際應(yīng)用中,將主客觀評價方法結(jié)合使用,能夠更全面、準確地評估圖像質(zhì)量。在圖像壓縮算法的研發(fā)中,可以先利用客觀評價方法對不同壓縮比下的圖像質(zhì)量進行初步篩選和評估,快速找出性能較好的壓縮方案;然后通過主觀評價,邀請觀察者對這些方案下的圖像進行實際觀看和評價,從人類視覺感知的角度進一步優(yōu)化算法。在圖像傳輸過程中,利用客觀評價方法實時監(jiān)測圖像質(zhì)量,根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論