機器視覺技術(shù)及應用 課件全套 劉凱 項目1-7 機器視覺硬件系統(tǒng)- 3D視覺簡介_第1頁
機器視覺技術(shù)及應用 課件全套 劉凱 項目1-7 機器視覺硬件系統(tǒng)- 3D視覺簡介_第2頁
機器視覺技術(shù)及應用 課件全套 劉凱 項目1-7 機器視覺硬件系統(tǒng)- 3D視覺簡介_第3頁
機器視覺技術(shù)及應用 課件全套 劉凱 項目1-7 機器視覺硬件系統(tǒng)- 3D視覺簡介_第4頁
機器視覺技術(shù)及應用 課件全套 劉凱 項目1-7 機器視覺硬件系統(tǒng)- 3D視覺簡介_第5頁
已閱讀5頁,還剩409頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

任務1初識機器視覺系統(tǒng)1.1.1機器視覺系統(tǒng)結(jié)構(gòu)一個典型的機器視覺系統(tǒng)涉及多個領(lǐng)域的技術(shù)交叉與融合,包括光源照明技術(shù)、光學成像技術(shù)、傳感器技術(shù)數(shù)字、圖像處理技術(shù)、模擬與數(shù)字視頻技術(shù)、機械工程技術(shù)、控制技術(shù)、計算機軟硬件技術(shù)、人機接口技術(shù)等。機器視覺系統(tǒng)由獲取圖像信息的圖像測量子系統(tǒng)與決策分類或跟蹤對象的控制子系統(tǒng)兩部分組成。圖像測量系統(tǒng)又可分為圖像獲取和圖像處理兩大部分。圖像測量子系統(tǒng)包括相機、攝像系統(tǒng)和光源設備等。例如觀測微小細胞的顯微圖像攝像系統(tǒng),考察地球表面的衛(wèi)星多光譜掃描成像系統(tǒng),在工業(yè)生產(chǎn)流水線上的工業(yè)機器人監(jiān)控視覺系統(tǒng),醫(yī)學層析成像系統(tǒng)(CT)等。

目前市場上的機器視覺系統(tǒng)可以按結(jié)構(gòu)分為兩大類:基于PC的機器視覺系統(tǒng)和嵌入式機器視覺系統(tǒng)?;赑C的機器視覺系統(tǒng)是傳統(tǒng)的結(jié)構(gòu)類型,硬件包括相機、視覺采集卡和PC等,目前對工業(yè)環(huán)境的適應性較弱。嵌入式機器視覺系統(tǒng)將所需要的大部分硬件如CCD\CMOS、內(nèi)存、處理器以及通信接口等壓縮在一個“黑箱”式的模塊里,又稱為智能相機,其優(yōu)點是結(jié)構(gòu)緊湊、性價比高、使用方便、對環(huán)境的適應性強,是機器視覺系統(tǒng)的發(fā)展趨勢。典型的機器視覺系統(tǒng)硬件結(jié)構(gòu)嵌入式機器視覺系統(tǒng)在機器視覺系統(tǒng)中,光源與照明方案的好壞往往是整個系統(tǒng)成敗的關(guān)鍵。光源與照明方案的配合應盡可能地突出物體特征參量,在增加圖像對比度的同時,應保證足夠的整體亮度;物體位置的變化不應該影響成像的質(zhì)量。光源的選擇必須符合所需的幾何形狀、照明亮度、均勻度、發(fā)光的光譜特性等,同時還要考慮光源的發(fā)光效率和使用壽命。照明方案應充分考慮光源和光學鏡頭的相對位置、物體表面的紋理、物體的幾何形狀以及背景等要素。攝像機和圖像采集卡共同完成對目標圖像的采集與數(shù)字化,是整個系統(tǒng)成功與否的又一關(guān)鍵所在。高質(zhì)量的圖像信息是系統(tǒng)正確判斷和決策的原始依據(jù)。圖像處理系統(tǒng)是機器視覺系統(tǒng)的核心,它決定了如何對圖像進行處理和運算,是開發(fā)機器視覺系統(tǒng)的重點和難點。隨著計算機技術(shù)、微電子技術(shù)和大規(guī)模集成電路技術(shù)的快速發(fā)展,為了提高系統(tǒng)的實時性,可以借助DSP、專用圖像信號處理卡等硬件完成一些成熟的圖像處理算法,而軟件則主要完成那些復雜的、尚需不斷探索和改進的算法。機器視覺軟件作為機器視覺系統(tǒng)的重要組成部分,通過對圖像的分析和處理,實現(xiàn)對待測目標特定參數(shù)的檢測和識別。機器視覺軟件主要完成圖像增強、圖像分割、特征抽取、模式識別、圖像壓縮與傳輸?shù)人惴▋?nèi)容,有些還具有數(shù)據(jù)存儲和網(wǎng)絡通信功能。機器視覺系統(tǒng)可以根據(jù)圖像處理結(jié)果和一定的判決條件方便地實現(xiàn)產(chǎn)品自動化檢測與管理。根據(jù)軟件的規(guī)模和功能,現(xiàn)有的機器視覺系統(tǒng)軟件可以分為單任務的專用軟件和集成式通用軟件兩大類。專用軟件是專門針對某一測試任務研制開發(fā)的,其待測目標已知,測量算法不具有通用性,如投影電視會聚特性檢測調(diào)整系統(tǒng)和電子槍扭彎曲度智能檢測系統(tǒng)。集成式通用軟件是將眾多通用的圖像處理與模式識別算法編制成函數(shù)庫,并向用戶提供一個開放的通用平臺,用戶可以在這種平臺上選擇組合自己需要的函數(shù),快速靈活的通過組態(tài)實現(xiàn)一個具體的視覺檢測任務。1.1.2X-SIGHT軟件簡介X-SIGHT軟件具備相機采集、圖像處理、區(qū)域分析和檢測定位等功能,亳秒級的執(zhí)行速度,億萬次的穩(wěn)定運行,靈活的拖拽組合方式,強大的界面設計能力。其主要優(yōu)點:(1)可視化自由編程:幾百種指令,通過自由的拖拽組合操作,快捷高效地構(gòu)建專項視覺解決方案。(2)廣泛的硬件支持:支持國內(nèi)外主流工業(yè)相機、PLC、機械臂,支持串口、網(wǎng)絡等各式主流標準協(xié)議。(3)強大的人機交互:無需編程,設計員可以專注于界面設計之美。擺脫紛繁復雜的界面,從容設計。(4)急速的執(zhí)行效率:靈活高效的數(shù)據(jù)傳送模塊,算子GPU加速,強大的底層研發(fā)實力。相機的選型1.2.1CCD和CMOS1.工作原理CCD(ChargeCoupledDevice,電荷耦合器)是一種特殊的半導體成像器件。CCD圖像傳感器為電流驅(qū)動型裝置。它由大量獨立的光敏元件組成,這些光敏元件通常是按矩陣排列的。光線透過鏡頭照射到CCD圖像傳感器上,并被轉(zhuǎn)換成電荷,每個元件上的電荷量取決于它所受到的光照強度。當按動照相機快門,CCD將各個元件的信息傳送到模/數(shù)轉(zhuǎn)換器上,模擬電信號經(jīng)過模/數(shù)轉(zhuǎn)換器處理后變成數(shù)字信號,數(shù)字信號以一定格式壓縮后存入緩存內(nèi),就生成了一張數(shù)碼照片。然后可以根據(jù)不同的需要,以數(shù)字信號和視頻信號的方式輸出圖像數(shù)據(jù)。CMOS是一種互補金屬氧化物半導體成像器件。CMOS和CCD一樣都是可用來感受光線變化的半導體。CMOS主要是利用硅和鍺這兩種元素所做成的半導體,通過CMOS上帶負電和帶正電的晶體管來實現(xiàn)基本的功能。這兩個互補效應所產(chǎn)生的電流即可被處理芯片記錄和解讀成影像。CMOS傳感器為電壓驅(qū)動型裝置。CCD在工作時,上百萬個像素感光后會生成上百萬個電荷,所有的電荷全部經(jīng)過一個“放大器”進行電壓轉(zhuǎn)變,形成電子信號,因此,這個“放大器”就成為了一個制約圖像處理速度的“瓶頸”,所有電荷由單一通道輸出,就像千軍萬馬從一座橋上通過,當數(shù)據(jù)量大的時候就發(fā)生信號“擁堵”。而CMOS則不同,每個像素點都有一個單獨的放大器轉(zhuǎn)換輸出,因此CMOS沒有CCD的“瓶頸”問題,能夠在短時間內(nèi)處理大量數(shù)據(jù),輸出高清影像,因此也能都滿足高清影像的需求。2.兩者之間的比較

CCDCMOS圖像圖像質(zhì)量高、靈敏度高、對比度高,存在Blooming現(xiàn)象圖像質(zhì)量一般,靈敏度差,但是沒有Blooming現(xiàn)象

結(jié)構(gòu)低噪聲存在固定模式噪聲集成度較低高集成度串行處理并行處理,可直接訪問單個像素功耗一般功耗低電路結(jié)構(gòu)簡單電路結(jié)構(gòu)復雜1.2.2智能相機智能相機(SmartCamera)并不是一臺簡單的相機,而是一種高度集成化的微小型機器視覺系統(tǒng)。它將圖像的采集、處理與通信功能集成于單一相機內(nèi),從而提供具有多功能、模塊化、高可靠性、易于實現(xiàn)的機器視覺解決方案。同時,由于應用了新的DSP、FPGA及大容量存儲技術(shù),其智能化程度不斷提高,可滿足多種機器視覺的應用需求。智能相機一般由圖像采集單元、圖像處理單元、圖像處理軟件、網(wǎng)絡通信裝置等構(gòu)成,各部分的功能如下:(1)圖像采集單元。在智能相機中,圖像采集單元相當于普通意義上的CCD/CMOS相機和圖像采集卡。它將光學圖像轉(zhuǎn)換為模擬/數(shù)字圖像,并輸出至圖像處理單元。(2)圖像處理單元。圖像處理單元類似于圖像采集/處理卡。它可對圖像采集單元的圖像數(shù)據(jù)進行實時的存儲,并在圖像處理軟件的支持下進行圖像處理。(3)圖像處理軟件。圖像處理軟件主要在圖像處理單元硬件環(huán)境的支持下,完成圖像處理功能。如幾何邊緣的提取、Blob、灰度直方圖、OCV/OVR、簡單的定位和搜索等。在智能相機中,以上算法都封裝成固定的模塊,用戶可直接應用而無需編程。(4)網(wǎng)絡通信裝置。網(wǎng)絡通信裝置是智能相機的重要組成部分,主要完成控制信息、圖像數(shù)據(jù)的通信任務。智能相機一般均內(nèi)置以太網(wǎng)通信裝置,并支持多種標準網(wǎng)絡,從而使多臺智能相機構(gòu)成更大的機器視覺系統(tǒng)。智能相機一般具有以下特點:(1)結(jié)構(gòu)緊湊、集成度高、性能穩(wěn)定、故障率低,運算能力等同于計算機。(2)工作過程可完全脫離PC機,與生產(chǎn)線上其他設備連接方便。(3)能直接在顯示器或監(jiān)視器上輸出SVGA或SXGA的視頻圖像。(4)提供開源的圖像處理庫,能進行源碼級的二次開發(fā)。(5)增益可調(diào),可控電子快門,全局曝光,快門時間可軟件設置。(6)可對曝光時間以及曝光時刻進行準確同步控制。(7)支持外觸發(fā)和外部閃光燈接口。(8)自帶多路數(shù)字I/O、100MB以太網(wǎng)、RS232口接口。1.2.3相機基本參數(shù)

2.相機幀率相機的幀率決定著設備的測量效率,如相機的幀率是30f/s,則每秒最多拍攝30次。而如果相機的速度是120f/s,如果算法夠快,那么每秒最多檢測120個產(chǎn)品。通常來說,相機的分辨率越低,同樣的接口,幀率也會越高,而分辨率越高,幀率也會越低。分辨率一定時,幀率也是有其最大值的。所以,要求相機的分辨率高,又要求相機的幀率高,就需要帶寬更大的總線。3.相機曝光時間相機的最小曝光時間,可以決定目標的運動速度。或者反過來說,目標的運動速度,對相機的最小曝光時間提出了要求。通常來說,物體運動引起的模糊應該比要求的測量精度小一個數(shù)量級,這樣可以減少其對系統(tǒng)的影響,工業(yè)相機最短曝光時間一般可以達到幾十微秒。如此短的曝光時間,要求光能量比較大,因此需要選擇合適的光源與光源控制器。1.2.4全局曝光與卷簾曝光全局曝光和卷簾曝光是常見的曝光方式。一般來說,CCD工業(yè)相機是全局曝光,而CMOS工業(yè)相機既存在全局曝光又有卷簾曝光。全局曝光和卷簾曝光的區(qū)別如下:1.全局曝光工業(yè)相機全局曝光很容易理解,也就是說光圈打開后,整個芯片像元同時曝光。感光元件將所有像素點同時收集光線,同時曝光。即在曝光開始的時候,感光元件開始收集光線;在曝光結(jié)束的時候,光線收集電路被切斷。然后感光元件將值讀出即為一幅照片。因此,曝光時間與機械的開關(guān)速度有關(guān)。既然與機械運動相關(guān),全局曝光存在理論上的非常小曝光的時間。2.卷簾曝光卷簾曝光是CMOS開始曝光的時候,感光元件是從第一行、第二行、第三行這樣按照順序進行光線感測,一直到整片感光組件從上到下每一行都曝光完成為止,也就是不同行像元的曝光時間不同。此種曝光方式是當光圈打開后,還存在具有一定間隔的卷簾來控制傳感器的曝光時間。如圖所示,卷簾的方式是從左到右的,卷簾在運動時,其卷簾開口的傳感器來能接受光。因此,曝光時間的長短完全取決于卷簾的開口大小與卷簾的運動速度。也就是說,卷簾運動得越快,卷簾間距越小,其傳感器的曝光時間越小。因此,卷簾曝光方式能夠具有更短的曝光時間。但卷簾曝光整體曝光時間更長,另外就是在拍照的時候,假如左右工業(yè)相機有晃動,或者拍攝快速移動的物體,就會看到畫面上下曝光時間不同而導致的“果凍現(xiàn)象”。如果被拍攝物體相對于相機高速運動時。用全局曝光方式拍攝,如果曝光時間過長,照片會產(chǎn)生像糊現(xiàn)象。像糊現(xiàn)象出現(xiàn)與否取決于曝光時間的長短,假如曝光時間很短,類似于運動物體在瞬間被凍結(jié)了,則少有像糊。而用卷簾曝光方式拍攝,逐行掃描速度不夠,拍攝結(jié)果就可能出現(xiàn)“傾斜”、“搖擺不定”或“部分曝光”等任一種情況。這種卷簾曝光方式拍攝出現(xiàn)的現(xiàn)象,就定義為“果凍現(xiàn)象?!?.兩者的優(yōu)缺點工業(yè)相機全局曝光的優(yōu)點是所有的像素點同時曝光。其缺點是曝光時間存在局限,存在機械非常小的曝光時間。全局曝光時間更短,這樣不僅能提升效率,也能根除影像果凍現(xiàn)象的問題。工業(yè)相機卷簾曝光的優(yōu)點是具有更小的曝光時間。其缺點是由于逐行的是在不同時間進行曝光取像,如果圖像是運動的,則存在明顯的拖影。因此,卷簾曝光不適合拍攝運動的物體。1.2.5相機選型1.明確要求相機的選取是設計機器視覺系統(tǒng)關(guān)鍵的一步,首先需要明確要求。(1)要先確定檢測產(chǎn)品的精度要求。(2)要確定相機要看的視野大小。(3)要確定檢測物體的速度。(4)要確定是動態(tài)檢測還是靜態(tài)檢測。

(2)相機傳輸方式的確定。因為沒有一個標準的命名,所以工業(yè)相機按其信號種類又分為工業(yè)模擬相機、工業(yè)數(shù)字相機。其中,數(shù)字相機的接口又分為GigE千兆網(wǎng)、USB2.0、USB3.0、CameraLink、1394a\1394b等多種類型,其各有利弊。USB2.0接口具有傳輸速度快,支持熱插拔、攜帶方便、標準統(tǒng)一以及連接多個設備的特點。目前已經(jīng)在各類外部設備中廣泛的被采用,并且可以向下兼容USB1.1,但是是其傳輸速率較慢,理論速度只有480Mb(60MB),速度慢而且不穩(wěn)定。USB3.0接口是最新的USB規(guī)范,極大提高了帶寬可高達5Gbps,實現(xiàn)了更好的電源管理,能夠使主機為設備提供更多的功率輸出,且使主機更快地識別器件,新的協(xié)議使得數(shù)據(jù)處理的效率更高。USB3.0接口傳輸速度快但傳輸距離短,理論速度極限大約為500MB/s,但是其傳輸距離短,超過3米就要用質(zhì)量很高的線。1394a/1394b接口俗稱火線接口,現(xiàn)主要用于視頻采集,數(shù)據(jù)傳輸率可高達400Mb/s(1394a)和800Mb/s(1394b),其利用等時性傳輸來保證實時性,便于安裝,采用總線結(jié)構(gòu),支持熱插拔,即插即用。由于接口的普及率不高,已慢慢被市場淘汰。GigE是一種基于千以太網(wǎng)通信協(xié)議開發(fā)的相機接口標準,其特點是快捷的數(shù)據(jù)傳輸速率以及最遠可達100米的傳輸距離。在工業(yè)機器視覺產(chǎn)品的應用中,GigE允許用戶在很長距離上用標準線纜進行快速圖像傳輸。它還能在不同廠商的軟、硬件之間輕松實現(xiàn)互操作。CameraLink在Channellink技術(shù)基礎上增加了一些傳輸控制信號,并定義了一些相關(guān)傳輸標準。其抗干擾、且傳輸帶寬高達5.4Gb/s。傳輸速度是目前的工業(yè)相機中最快的一種總線類型。但是需要單獨的CameraLink接口,不便攜,成本過高,實際應用中比較少,一般用于高分辨率高速面陣相機,或者是線陣相機上。(3)相機的觸發(fā)方式選擇相機的觸發(fā)方式常見的有連續(xù)采集模式,軟件觸發(fā)模式和硬件觸發(fā)模式三類。對于靜態(tài)檢測和產(chǎn)品連續(xù)運動不能給觸發(fā)信號的情況,通常選擇連續(xù)采集模式;對于動態(tài)檢測和產(chǎn)品連續(xù)運動能給觸發(fā)信號的情況,通常選擇軟件觸發(fā)模式;對于高速動態(tài)檢測和產(chǎn)品連續(xù)高速運動能給觸發(fā)信號的情況,通常選擇硬件觸發(fā)模式。

鏡頭的選型1.3.1鏡頭分類1.百萬像素低畸變鏡頭低畸變鏡頭是工業(yè)鏡頭里最普通,種類最齊全,圖像畸變較小,價格比較低,應用也最為廣泛,幾乎適用于任何工業(yè)場合的一類鏡頭,如圖所示。2.微距鏡頭微距鏡頭一般是指成像比例為2:1~1:4的范圍內(nèi)的特殊設計的鏡頭,鏡頭外觀如圖所示。在對圖像質(zhì)量要求不是很高的情況下,一般可采用在鏡頭和攝像機之間加近攝接圈的方式或在鏡頭前加近拍鏡的方式達到放大成像的效果。3.廣角鏡頭廣角鏡頭焦距很短,視角較寬,而景深卻很深,圖形有畸變,介于魚眼鏡頭與普通鏡頭之間,鏡頭外觀如圖所示。主要用于對檢測視角要求較寬,對圖形畸變要求較低的檢測場合。4.魚眼鏡頭魚眼鏡頭的焦距范圍在6mm至16mm(標準鏡頭是50mm左右),魚眼鏡頭有著跟魚眼相似的形狀和作用,視場角等于或大于180°,有的甚至可達230°,圖像有桶形畸變,畫面景深特別大,可用于管道或容器的內(nèi)部檢測。鏡頭外觀如圖所示。5.遠心鏡頭遠心鏡頭主要是為糾正傳統(tǒng)鏡頭的視差而特殊設計的鏡頭,鏡頭外觀如圖所示。它可以在一定的物距范圍內(nèi),使得到的圖像放大倍率不會隨物距的變化而變化,在被測物不在同一物面上的情況下有著非常重要的應用。6.顯微鏡頭顯微鏡頭一般是成像比例大于10:1的拍攝系統(tǒng)所用的鏡頭,但由于現(xiàn)在的攝像機的像元尺寸已經(jīng)做到3微米以內(nèi),所以成像比例大于2:1時也有選用顯微鏡頭的例子。鏡頭外觀如圖所示。1.3.2鏡頭基本參數(shù)1.成像面成像面是指被測物及其背景通過鏡頭投影到二維圖像傳感器平面,一般是長寬比為4:3的矩形。2.焦距用f表示,是從鏡頭的中心點到膠平面上所形成的清晰影像之間的距離。焦距的大小決定著視角的大小,焦距數(shù)值小,視角大,所觀察的范圍也大;焦距數(shù)值大,視角小焦距,觀察范圍小。根據(jù)焦距能否調(diào)節(jié),可分為定焦鏡頭和變焦鏡頭兩大類。3.光圈用F表示,以鏡頭焦距f和通光孔徑D的比值來衡量,F(xiàn)=f/D。每個鏡頭上都標有最大F值,例如8mm/F1.4代表最大孔徑為5.7毫米。F值越小,光圈越大,F(xiàn)值越大,光圈越小。光圈是一個用來控制光線透過鏡頭,進入機身內(nèi)感光面的光量的裝置,它通常是在鏡頭內(nèi)。表達光圈大小是用F值。對于已經(jīng)制造好的鏡頭,不可能隨意改變鏡頭的直徑,但是可以通過在鏡頭內(nèi)部加入多邊形或者圓型,并且面積可變的孔狀光柵來達到控制鏡頭通光量,這個裝置就稱為光圈。光圈F=鏡頭的焦距/鏡頭口徑的直徑從以上的公式可知要達到相同的光圈F值,長焦距鏡頭的口徑要比短焦距鏡頭的口徑大。完整的光圈值系列如下:F1,F(xiàn)1.4,F(xiàn)2,F(xiàn)2.8,F(xiàn)4,F(xiàn)5.6,F(xiàn)8,F(xiàn)11,F(xiàn)16,F(xiàn)22,F(xiàn)32,F(xiàn)44,F(xiàn)64。光圈F值愈小,在同一單位時間內(nèi)的進光量便愈多,而且上一級的進光量剛是下一級的兩倍,例如光圈從F8調(diào)整到F5.6,進光量便多一倍,也說光圈開大了一級。4.傳感器尺寸(靶面)傳感器尺寸指的是鏡頭成像直徑可覆蓋的最大芯片尺寸。主要有1/2″、2/3″、1″和1″以上,需要注意的是這里的1″=16mm≠25.4mm,如圖所示。攝像機鏡頭規(guī)格應視傳感器尺寸而定,兩者應相對應。一般靶面大小為2/3″時,鏡頭應選2/3″;靶面大小為1/2″時,鏡頭應選1/2″;靶面大小為1/3″時,鏡頭應選1/3″。總之,鏡頭尺寸≧靶面尺寸。如果鏡頭尺寸比靶面尺寸大時,將使圖像視野比鏡頭視野小,即不能很好地利用鏡頭的視野;如果鏡頭尺寸比靶面尺寸小時,將發(fā)生“隧道效應”,即圖像有圓形的黑框,像在隧道里拍的一樣。5.接口接口指的是鏡頭與相機的連接方式。鏡頭和攝像機之間的接口有許多不同的類型,工業(yè)攝像機常用的包括C接口、CS接口、F接口、V接口、T2接口、徠卡接口、M42接口、M50接口等。接口類型的不同和鏡頭性能及質(zhì)量并無直接關(guān)系,只是接口方式的不同,一般可以也找到各種常用接口之間的轉(zhuǎn)接口。C接口和CS接口是工業(yè)攝像機最常見的國際標準接口,為1-32UN美制螺紋連接口,C型接口和CS型接口的螺紋連接是一樣的,區(qū)別在于C型接口的后截距為17.5mm,CS型接口的后截距為12.5mm。所以CS型接口的攝像機可以和C口及CS口的鏡頭連接使用,只是使用C口鏡頭時需要加一個5mm的接圈;C型接口的攝像機不能用CS口的鏡頭。注:美制統(tǒng)一螺紋,一般標法是1-32UN。24.77mm是內(nèi)螺紋的最小徑,25.4mm是外螺紋最大外徑。每英寸長度上32個牙,也就是螺距為25.4/32。F接口鏡頭是尼康鏡頭的接口標準,所以又稱尼康口,也是工業(yè)攝像機中常用的類型,一般攝像機靶面大于1英寸時需用F口的鏡頭。V接口鏡頭是著名的專業(yè)鏡頭品牌施奈德鏡頭所主要使用的標準,一般也用于攝像機靶面較大或特殊用途的鏡頭。6.景深景深是指在被攝物體聚焦清楚后,在物體前后一定距離內(nèi),其影像仍然清晰的范圍。景深隨鏡頭的光圈值、焦距、拍攝距離而變化。光圈越大,景深越??;光圈越小、景深越大。焦距越長,景深越??;焦距越短,景深越大。距離拍攝體越近時,景深越?。痪嚯x拍攝體越遠時,景深越大。實際上,即使是在景深內(nèi),圖像也有些模糊,但是這個模糊的大小如果在一定范圍內(nèi)(用圓的大小來定義,稱為容許彌散圓),那么即使肉眼觀察也不會發(fā)現(xiàn)模糊。一般而言,光圈的聚焦范圍較廣時稱為“景深較深”,較窄時稱為“景深較淺”。即使使用相同的透鏡,景深也并不是一直相同,如圖所示。7.分辨率分辨率代表鏡頭記錄物體細節(jié)的能力,以每毫米里面能夠分辨黑白對線的數(shù)量為計量單位:“線對/毫米”(lp/mm)。分辨率越高的鏡頭成像越清晰。8.工作距離工作距離是從鏡頭的物體側(cè)鏡筒前部到被拍照物體的距離,即鏡頭第一個工作面到被測物體的距離,如圖所示。9.視野范圍視野范圍為相機實際拍到區(qū)域的尺寸。10.光學放大倍數(shù)光學放大倍數(shù)=芯片尺寸/視野范圍。電子放大率是用相機拍照成像在成像芯片上的像呈現(xiàn)在顯示器的放大倍數(shù)。顯示器放大率是被拍物體通過鏡頭成像顯示在顯示器上的放大倍數(shù)。顯示器放大率=(光學放大率)×(電子放大率)例:光學放大率=0.2X,CCD大小1/2〃(對角線長8mm),顯示器14〃電子放大率=14×25.4/8=44.45(倍)顯示器放大率=0.2×44.45=8.89(倍)(1寸=25.4mm)視場的大小是:(芯片尺寸)/(光學放大率)。例:光學放大率=0.2X,CCD1/2〃(4.8mm長,6.4mm寬)視場大小:長=4.8/0.2=24(mm)·寬=6.4/0.2=32(mm)

1.3.3鏡頭選型

光源的選型1.4.1光源的類型1.按形狀分類光源按形狀分為以下幾類(1)環(huán)形光源環(huán)形光源是指LED燈珠排布成環(huán)形與圓心軸成一定夾角,如圖所示,提供不同照射角度、不同顏色組合,更能突出物體的三維信息,解決對角照射陰影問題,可選配漫射板導光,光線均勻擴散。常用于PCB基板檢測、IC元件檢測、顯微鏡照明、液晶校正、塑膠容器檢測、集成電路印字檢查等。(2)背光源背光源是指高密度LED燈珠排布成一個面(底面發(fā)光)或者從光源四周排布一圈(側(cè)面發(fā)光),如圖所示。能突出物體的外形輪廓特征,適用于大面積照射,背光一般放置于物體底部,需要考慮機構(gòu)是否適合安裝,在較高的檢測精度下可以加強出光平行性來提升檢測精度。常用于機械零件尺寸及邊緣缺陷的測量、電子元件IC的外型檢測、膠片污點檢測、透明物體劃痕檢測、飲料液位及雜質(zhì)檢測、手機屏漏光檢測、印刷海報缺陷檢測、塑料膜邊緣接縫檢測等。(3)條形光源條形光源是LED燈珠排布成長條形,如圖所示。條形光源多用于單邊或多邊以一定角度照射物體,突出物體的邊緣特征??筛鶕?jù)實際情況多條自由組合,照射角度有較好自由度。適用較大結(jié)構(gòu)被測物。常用于電子元件縫隙檢測,圓柱體表面缺陷檢測,包裝盒印刷檢測,藥水袋輪廓檢測、金屬表面檢查、圖像掃描、表面裂縫檢測、LCD面板檢測等。(4)同軸光源同軸光源是經(jīng)面光源采用分光鏡設計,如圖所示。適用于粗糙程度不同、反光強或不平整的表面區(qū)域,檢測雕刻圖案、裂縫、劃傷、低反光與高反光區(qū)域分離、消除陰影等。需要注意的是同軸光源經(jīng)過分光設計有一定的光損失需要考慮亮度,并且不適用于大面積照射。常用于反射度極高的物體表面劃傷檢測,如玻璃和塑料膜輪廓和定位檢測、IC字符及定位檢測、晶片表面雜質(zhì)和劃痕檢測、包裝條碼識別等。(5)球積分光源球積分光源是LED燈珠安裝在底部通過半球內(nèi)壁反射涂層漫反射均勻照射物體,如圖所示。圖像整體的照度十分均勻,適用于曲面,表面凹凸,弧面表面檢測金屬、玻璃表面反光較強的物體表面檢測。常用于儀表盤刻度檢測、金屬罐字符噴碼檢測、芯片金線檢測、電子元件印刷檢測等。(6)條形組合光源條形組合光源為四邊配置條形光,如圖所示,每邊照明獨立可控,可根據(jù)被測物要求調(diào)整所需照明角度,適用性廣。常用于PCB基板檢測、焊錫檢查、Mark點定位、顯微鏡照明、包裝條碼照明、IC元件檢測等。(7)點光源點光源如圖所示,一般為大功率LED,體積小,發(fā)光強度高,光纖鹵素燈的替代品,尤其適合作為鏡頭的同軸光源,高效散熱裝置,大大提高光源的使用壽命。此外多用在配合遠心鏡頭使用,一種非直接同軸光源,檢測視野較小。常用于手機內(nèi)屏隱形電路檢測,Mark點定位,玻璃表面劃痕檢測,液晶玻璃底基校正檢測等。(8)線形光源線光源為高亮LED排布,如圖所示,采用導光柱聚光,光線呈一條亮帶,通常用于線陣相機,采用側(cè)向照射或底部照射,線光源也可以不使用聚光透鏡讓光線發(fā)散,增加照射面積也可在前段添加分光鏡,轉(zhuǎn)變?yōu)橥S線光源,適用于各種流水線連續(xù)監(jiān)測場合。常用于液晶屏表面灰塵檢測,玻璃劃痕及內(nèi)部裂紋檢測,布匹紡織均勻檢測等。(9)RGB光源RGB光源為不同角度的三色光照明,如圖所示,照射凸顯焊錫三維信息,外加漫散射板導光,減少反光RIM不同角度組合。常專用于電路板焊錫檢測。2.按顏色分類光源按顏色分為以下幾類:(1)白色光源(W):白色光源通常用色溫來界定,色溫高的顏色偏藍色(冷色,色溫>5000K),色溫低的顏色偏紅(暖色,色溫<3300K),界于3300與5000K之間稱之為中間色,白色光源適用性廣,亮度高,特別是拍攝彩色圖像時使用更多。(2)藍色光源(B):藍色光源波光為430-480K之間,適用產(chǎn)品:銀色背景產(chǎn)品(如鈑金,車加工件等)、薄膜上金屬印刷品。(3)紅色光源(R):紅色光源的波長通常在600-720K之間,其波長比較長,可以透過一些比較暗的物體,例如底材黑色的透明軟板孔位定位、綠色線路板線路檢測,透光膜厚度檢測等,采用紅色光源更能提高對比度。(4)綠色光源(G):綠色光源波長510-530K,界于紅色與藍色之間,主要針對產(chǎn)品:紅色背景產(chǎn)品,銀色背景產(chǎn)品(如鈑金,車加工件等)。(5)紅外光(IR):紅外光的波長一般為780-1400K,紅外光屬于不可見光,其透過力強。一般LCD屏檢測、視頻監(jiān)控行業(yè)應用比較普遍。(6)紫外光(UV):紫外光的波長一般為190-400,其波長短,穿透力強,主要應用于證件檢測、觸摸屏ITO檢測、布料表面破損、點膠溢膠檢測等方面,金屬表面劃痕檢測等。1.4.2光源基本參數(shù)(1)光通量:光源單位時間內(nèi)發(fā)出的可見光量的總和,單位為:流明(lm)。(2)輻射通量:單位時間內(nèi)通過某一截面的輻射能,又稱輻射功率(Φ),單位為瓦特(W)。(3)光強:光源在單位立體角內(nèi)發(fā)出的光通量,也就是光源所發(fā)出的光通量在空間選定方向上分布的密度,單位為坎德拉(cd)。角度越大,光強越小。(4)照度:照度是表示照射到平面上的光的亮度指標。單位為勒克司(lux)。是指光源射向平面狀物體的光通量中,每單位面積的光通量。用于比較照明燈具照射到平面上的明亮程度。(5)亮度:亮度是指物體明暗的程度,定義是單位面積的發(fā)光強度。單位:尼特(nit)。(6)光效:光源發(fā)出的光通量除以光源的功率。它是衡量光源節(jié)能的重要指標。單位:每瓦流明(lm/W)。表示電能轉(zhuǎn)換為光能的效率。光源相關(guān)參數(shù)如圖所示。(7)波長:光的色彩強弱變化,是可以通過數(shù)據(jù)來描述,這種數(shù)據(jù)稱為波長,單位為納米(nm)。可見光的波長范圍為380~780nm。圖所示為不同色彩光的波長。(8)主波長:任何一個顏色都可以看作用某一個光譜色按一定比例與一個參照光源(如CIE標準光源A、B、C等,等能光源E,標準照明體D65等)相混合而匹配出來的顏色,這個光譜色就是顏色的主波長。(9)峰值波長:光譜輻射功率最大的波長。(10)黑體:是指能夠完全吸收由任何方向入射的任何波長的輻射的理想熱輻射體。顯然自然界不存在真正的黑體,但許多地物是較好的黑體近似(在某些波段上)。黑體輻射情況只與其溫度有關(guān),與組成材料無關(guān)。(11)色溫:光源發(fā)射光的顏色與黑體在某一溫度下輻射光色相同時,黑體的溫度稱為該光源的色溫,單位為開爾文(K)。色溫是描述光源發(fā)出的光線的顏色的一個值。色溫是以絕對溫度K表示的,是將一標準黑體(如鉑)加熱,溫度升高到某一程度時,顏色開始由深紅—淺紅—橙黃—白—藍白—青藍,這種顏色的變化與光源的顏色變化相同,因而將光源當時的絕對溫度稱為色溫。(12)顯色指數(shù):光源對物體呈現(xiàn)的程度,也就是顏色的逼真程度。通常稱為“顯色指數(shù)”,單位:Ra。顯色指數(shù)是表征在特定條件下,經(jīng)某光源照射的物體所產(chǎn)生的心理感官顏色與該物體在標準光源照射下的心理顏色相符合的程度的參數(shù)。國際照明委員會CIE把太陽的顯色指數(shù)定Ra=100。(13)色容差:色容差是光源和標準參照光源色坐標的修正偏差。IEC的標準中,標準參照光源顏色有P2700/F2700/F3000/F3500/F4000/F5000/F6500。(14)色純度:樣品顏色接近主波長光譜色的程度就表示該樣品顏色的純度。是以主波長描述顏色時的輔助表示,定義為待測樣品色度坐標與標準參照光源之色度坐標直線距離與標準參照光源至該待測件主波長之光譜軌跡色度坐標距離的百分比,純度愈高,代表待測樣品的色度坐標愈接近其該主波長的光譜色。(15)色偏差:一般指被測光源的顏色與標準色之間的偏差,色偏差越小其色純度越接近標準色。1.4.3照射方式光源是影響機器視覺圖像質(zhì)量的重要因素,照明對輸入數(shù)據(jù)的影響至少占到30%。好的打光方式可以準確捕捉物體特征,提高物體與背景的對比度。如何使光能在一定的程度上保持穩(wěn)定,是使用過程中急需要解決的問題。另一方面,環(huán)境光有可能影響圖像的質(zhì)量,可采用加防護屏的方法來減少環(huán)境光的影響,此外,不同的照射角度也會對圖像的識別產(chǎn)生很大影響,所以選擇合適的照射角度是特別重要的。(1)角度照射角度照射的特點是在一定工作距離下,光束集中、亮度高、均勻性好、照射面積相對較小。常用于液晶校正、塑膠容器檢查、工件螺孔定位、標簽檢查、管腳檢查、集成電路印字檢查等(30、45、60、75等角度環(huán)光)。角度照射方式及效果如圖所示。(2)垂直照射垂直照射對照射面積大、光照均勻性好、適用于較大面積照明??捎糜诨缀途€路板定位、晶片部件檢查等(0角度環(huán)光、面光源)。垂直照射方式及效果如圖所示。(3)低角度照射低角度照射對表面凹凸表現(xiàn)力強。適用于晶片或玻璃基片上的傷痕檢查(90度環(huán)光)。低角度照射方式及效果如圖所示。(4)背光照射背面照射的特點是發(fā)光面是一個漫射面,均勻性好??捎糜阽R面反射材料,如晶片或玻璃基底上的傷痕檢測;LCD檢測;微小電子元件尺寸、形狀,靶標測試。背光照射方式及效果如圖所示。(5)多角度照射多角度照射的特點為RGB三種不同顏色不同角度光照,可以實現(xiàn)焊點的三維信息的提取。適用于組裝機板的焊錫部份、球形或半圓形物體、其他奇怪形狀物體、接腳頭(AOI光源)檢測。多角度照射方式及效果如圖所示。(6)碗狀光照射碗狀光照射的特點為360度底部發(fā)光,通過碗狀內(nèi)壁發(fā)射,形成球形均勻光照。用于檢測曲面的金屬表面文字和缺陷(球積分光源,通常也稱為圓頂光)。碗狀光照射方式及效果如圖所示。(7)同軸光照明同軸光照明類似于平行光的應用,光源前面帶漫反射板,形成二次光源,光線主要趨于平行。用于半導體、PCB板、以及金屬零件的表面成像檢測,微小元件的外形、尺寸測量(同軸光源,平行同軸光源)。同軸光照射方式及效果如圖所示。1.4.4常見的輔助光學器件機器視覺系統(tǒng)是一門應用性很強的系統(tǒng)工程,不同的工廠,不同的生產(chǎn)線,不同的工作環(huán)境對光源亮度,工作距離,照射角度等的要求差別很大。有時受限于具體的應用環(huán)境,不能直接通過光源類型或照射角度的調(diào)整而獲取良好的視覺圖像,就常常需要借助于一些特殊的輔助光學器件。(1)反射鏡:反射鏡可以簡單方便的改變優(yōu)化光源的光路和角度,從而為光源的安裝提供了更大的選擇空間。(2)分光鏡:分光鏡通過特殊的鍍膜技術(shù),不同的鍍膜參數(shù)可以實現(xiàn)反射光和折射光比例的任意調(diào)節(jié)。機器視覺光源中的同軸光就是分光鏡的具體應用。(3)棱鏡:不同頻率的光在介質(zhì)中的折射率是不同的,根據(jù)光學的這一基本原理可以把不同顏色的復合光分開,從而得到頻率較為單一的光源。(4)偏振片:光線在非金屬表面的反射是偏振光,借助于偏振片可以有效的消除物體的表面反光。同時,偏振片在透明或半透明物體的應力檢測上也有很好的應用。(5)漫射片:漫射片是機器視覺光源中比較常見的一種光學器件,它可以使光照變得更均勻,減少不需要的反光。(6)光纖:光纖可以將光束聚集于光纖管中,使之像水流一樣便于光線的傳輸,為光源的安裝提供了很大的靈活性。1.4.5互補色互補色也稱為對比色,互補色在色環(huán)上相互對應。通過互補色增加對比度。兩種互補色等強度混合可以得到白色。如果希望更加鮮明地突出某些顏色,則選擇色環(huán)上相對應的互補顏色,這樣可以明顯地提高圖像的對比度。合理運用顏色可以過濾背景,其效果所示。(a)白色光源

(b)紅色光源1.4.6光源選型1.光源選型時打光方法技巧(1)光線太暗或太亮會影響視覺系統(tǒng)。(2)光線的主要功能是產(chǎn)生光學信號。(3)減少噪聲是照明要解決的主要問題之一。(4)只有來自目標并到達鏡頭的光線才是有效的光線。(5)進入鏡頭但非來自目標的光線為雜散光,它將降低圖像攝取裝置的成像質(zhì)量。(6)來自目標的任意光線都應填滿鏡頭的入瞳。2.光源選擇時其他注意事項:(1)鏡頭的工作距離。(2)現(xiàn)場的安裝障礙。(3)照明對象的現(xiàn)場實際情況。(4)照明對象特征是否存在特殊性。(5)圖像是否需要彩色。(6)安裝的便利性。3.在不同的光源選用時,也有不同的原則,下面將逐一進行描述。(1)條光選型要領(lǐng)條光照射寬度最好大于檢測的距離,否則可能會因照射距離遠造成亮度差,或者是距離近而幅射面積不夠。條光長度能夠照明所需打亮的位置即可,無須太長造成安裝不便,同時也增加成本,一般情況下,光源的安裝高度會影響所選用條光的長度,高度越高,光源長度要求越長,否則圖像兩側(cè)亮度會比中間暗。如果照明目標是高反光物體,最好加上漫射板,如果是黑色等暗色不反光產(chǎn)品,也可以拆掉漫射板以提高亮度。(2)環(huán)光選型要領(lǐng)了解光源安裝距離,過濾掉某些角度光源;例如要求光源安裝尺寸高,就可以過濾掉大角度光源,選擇用小角度光源,同樣,安裝高度越高,要求光源的直徑越大。目標面積小,且主要特性在表面中間,可選擇小尺寸0角度或小角度光源。目標需要表現(xiàn)的特征如果在邊緣,可選擇90度角環(huán)光,或大尺寸高角度環(huán)形光。檢測表面劃傷,可選擇90度角環(huán)光,盡量選擇波長短的光源。(3)條形組合光選型要領(lǐng)條形組合光在選擇時,不一定要按照資料上的型號來選型,因為被測的目標形狀、大小各不一樣,所以可以按照目標尺寸來選擇不同的條形光源進行組合。組合光在選擇時,一定要考慮光源的安裝高度,再根據(jù)四邊被測特征點的長度寬度選擇相對應的條形光進行組合。(4)背光源/平行背光源選型要領(lǐng)選擇背光源時,根據(jù)物體的大小選擇合適大小的背光源,以免增加成本造成浪費。背光源四周由于外殼遮擋,其亮度會低于中間部位,因此,選擇背光源時,盡量不要使目標正好位于背光源邊緣。背光源一般在檢測輪廓時,可以盡量使用波長短的光源,波長短的光源其衍射性弱,圖像邊緣不容易產(chǎn)生重影,對比度更高。背光源與目標之間的距離可以通過調(diào)整來達到最佳的效果,并非離得越近效果越好,也非越遠越好。檢測液位可以將背光源側(cè)立使用。圓軸類的產(chǎn)品,螺旋狀的產(chǎn)品盡量使用平行背光源。(5)同軸光選型要領(lǐng)選擇同軸光時主要看其發(fā)光面積,根據(jù)目標的大小來選擇合適發(fā)光面積的同軸光。同軸光的發(fā)光面積最好比目標尺寸大1.5~2倍,因為同軸光的光路設計是讓光路通過一片45度半反半透鏡改變,光源靠近燈板的地方會比遠離燈板的亮度高,因此,盡量選擇大一點的發(fā)光面避免光線左右不均勻。同軸光在安裝時盡量不要離目標太高,越高,要求選用的同軸光越大,才能保證才均勻性。(6)平行同軸光選型要領(lǐng)平行同軸光光路設計獨特,主要適用于檢測各種劃痕。平行同軸光與同軸光表現(xiàn)的特點不一樣,不能替代同軸光使用。平行同軸光檢測劃傷之類的產(chǎn)品,盡量不要選擇波長長的光源。(7)其他光源選型要領(lǐng)了解特征點面積大小,選擇合適尺寸的光源。了解產(chǎn)品特性,選擇不同類型的光源。了解產(chǎn)品的材質(zhì),選擇不同顏色的光源。了解安裝空間及其他可能會產(chǎn)生障礙的情況,選擇合適的光源。4.酒瓶蓋條碼識別光源選型案例如酒瓶蓋條碼識別,主要有條碼識別、條碼打標位置是否偏離,單個瓶蓋要求裝在包裝箱里檢測,如圖所示,現(xiàn)要求對其打光設計,滿足識別要求。(1)了解產(chǎn)品特性瓶蓋上面是黑色,另有紅黑交錯背景圖案,條碼為激光刻印顯灰色,為了顯現(xiàn)出條碼,應該將字符打亮,背景與字符分辨明顯;如果選用紅色光源的話,背景中的紅色會濾掉打白,會干擾同為白色的字符,所以,應該利用光源的互補原理,采用藍色光源,將紅色背景盡量打黑,如圖所示。

(a)白色光源效果

(b)藍色光源效果(2)了解產(chǎn)品形狀選擇合適光源瓶蓋為圓形,直徑為25mm,一般此情況可以選擇同軸光或者環(huán)形光比較合適。(3)了解產(chǎn)品材質(zhì)特性選擇合適光源瓶蓋為金屬材料,表面有印刷圖案,比較光滑,反光度很強,選用同軸光或帶角度的環(huán)形光比較合適。(4)模擬現(xiàn)場打光選擇能用的光源由于酒瓶必須裝在包裝紙箱里,瓶蓋離紙箱上頂部的距離有80mm,考慮需要留一定的空間,因此,瓶蓋離光源需要的距離為100mm或以上,如此高的距離,小同軸光跟小環(huán)光以及低角度光就不能滿足要求,必須選用大同軸光或者大環(huán)光。(5)打光試驗根據(jù)以上情況選擇大致的光源后,再進行性價比對比,選擇性價比高的光源進行實際打光測試(同軸光如果價格比較高,所以選擇環(huán)形光比較經(jīng)濟)。采用180mm、30度藍色環(huán)光在110mm高度打光,周邊亮帶反光強,不利于找中心位,如圖所示。180mm、30度藍色環(huán)光在110mm高度照射效果采用204mm、60度藍色環(huán)光在110mm高度不會將光源LED亮斑影投射到瓶蓋上,如圖所示。204mm、60度藍色環(huán)光在110mm高度照射效果(6)最終確定光源根據(jù)打光效果圖進行軟件處理,在得到可靠性及準確性的條件下選擇正確的光源。圖像表達及其性質(zhì)2.1.1像素與灰度圖像數(shù)字化主要是指空間位置的離散數(shù)字化和亮度電平值的離散數(shù)字化。圖像的數(shù)字化過程中關(guān)鍵的步驟就是采樣和量化。圖像采樣是對連續(xù)圖像在一個空間點陣上取樣,也就是空間位置上的數(shù)字化、離散化。原理如圖所示,其中M和N是點陣的列數(shù)和行數(shù),M、N的大小關(guān)系采樣后圖像質(zhì)量的高低,合適的M和N能使數(shù)字化的圖像損失最小。M和N的取值并不是隨意確定的,它首先要滿足奈奎斯特采樣定理,使得采樣的數(shù)據(jù)能不失真地反映原始圖像信息。通常所說的圖像空間分辨率表示的就是用多少個點來描述一張圖像,為了使采樣后的圖像保留更多的細節(jié)和更高的分辨率,人們希望使用更密集的空間像素點陣。也就是增加采樣頻率,即增加M和N,但采樣頻率越高圖像的數(shù)據(jù)量就越大,數(shù)字圖像的成本也隨之提高。一般說來,采樣間隔越大,所得圖像像素越少,圖像的空間分辨率低,可觀察到的原始圖像細節(jié)就越少,圖像質(zhì)量變差,嚴重時出現(xiàn)像素呈塊狀的棋盤效應;采樣間隔越小,所得圖像像素越多,則圖像就越細膩逼真,圖像空間分辨率就高,但數(shù)據(jù)量也隨之增大。如圖顯示的就是同一幅圖像在不同采樣頻率下的結(jié)果,從圖(a)到圖(f)是采樣間隔遞增獲得的圖像,在圖(b)中帽檐處已呈鋸齒狀,在圖(c)中這種現(xiàn)象更加明顯,頭發(fā)已變得不清晰,圖(e)已經(jīng)分不出人臉了,而圖(f)幾乎喪失了原圖像的所有信息??梢姴蓸娱g隔和圖像的光滑程度,質(zhì)量高低之間有密切關(guān)系。像素一般是指由圖像的小方格組成的,這些小方塊都有一個明確的位置和被分配的色彩數(shù)值,小方格顏色和位置就決定該圖像所呈現(xiàn)出來的樣子??梢詫⑾袼匾暈檎麄€圖像中不可分割的單位或者是元素。不可分割的意思是它不能夠再切割成更小單位或是元素,它是以一個單一顏色的小格存在。每一個點陣圖像包含了一定量的像素,這些像素決定圖像在屏幕上所呈現(xiàn)的大小。

如圖所示說明了減少圖像的量化級別(灰度級)所產(chǎn)生的效果。保持空間分辨率即采樣頻率不變,將灰度級較少為128,如圖(b)所示,肉眼很難看出有什么變化。如果進一步將灰度級減少為16,如圖(c)所示,此時在灰度緩變區(qū)會出現(xiàn)一些幾乎看不出來的非常細的山脊狀結(jié)構(gòu),這種效應稱為虛假輪廓,它是由于在數(shù)字圖像的灰度平滑區(qū)使用的灰度級不夠而造成的。圖(d)、(e)、(f)的灰度級逐漸減小為8、4、2,可以看到圖像的質(zhì)量越來越差??偟膩碚f,量化等級越多,所得圖像層次越豐富,灰度分辨率越好,質(zhì)量越好,但數(shù)據(jù)量比較大;量化等級少,圖像層次欠豐富,灰度分辨率差,但數(shù)據(jù)量小。2.1.2圖像1.圖像信號圖像按其亮度等級的不同,可以分成二值圖像(只有黑白兩種亮度等級)和灰度圖像(有多種亮度等級)兩種。按其色調(diào)不同.可分為無色調(diào)的灰度(黑白)圖像和有色調(diào)的彩色圖像兩種。按其內(nèi)容的變化性質(zhì)不同,有靜態(tài)圖像和活動圖像之分。而按其所占空間的維數(shù)不同,又可分為平面的二維圖像和立體的三維圖像等。2.模擬視頻信號根據(jù)三基色原理,利用R(紅)、G(綠)、B(藍)三色不同比例的混合可以表示各種色彩。攝像機在拍攝時,通過光敏器件(如CCD,電荷耦合器件),將光信號轉(zhuǎn)換為RGB三基色電信號。在電視機或監(jiān)視器內(nèi)部,最終也是使用RGB信號分別控制撞擊熒光屏的電子流,或液晶顯示屏的驅(qū)動電路使其發(fā)光產(chǎn)生影像。3.數(shù)字圖像的主要類型按數(shù)字圖像信息表示方式的不同,可以將數(shù)字圖像分為矢量圖(VectorBasedImage)和位圖(MappedImage)。矢量圖是用一系列計算指令來表示一幅圖,如畫點、畫線、畫曲線、畫矩形等。這種方式實際上是用一個數(shù)學表達式來描述一幅圖,然后通過編程來實現(xiàn)。矢量圖像文件數(shù)據(jù)量小,圖像進行縮小、放大時不會失真,目標圖像的移動、復制和旋轉(zhuǎn)都可以很容易做到。然而,對于構(gòu)造成分復雜的圖像,如自然風景等,就很難用數(shù)學表達式來表達了。位圖是指由一系列像素構(gòu)成的圖像,每個像素是由亮度、色度等參數(shù)數(shù)據(jù)來描述,位圖在數(shù)字圖像處理中得到廣泛應用。矢量圖和位圖最大的區(qū)別就是矢量圖處理的對象是由數(shù)學表達式描述的形狀,而位圖處理的對象是像素。按圖像攜帶的視覺信息類型不同,可以將數(shù)字圖像分為灰度圖像和彩色圖像?;叶葓D像只包含了亮度信息而沒有色彩信息。灰度圖像又可以根據(jù)灰度等級的數(shù)目劃分為單色圖和灰度圖:單色圖的每個像素只用1位表示,要么為1,要么為0,即圖像只有兩種顏色;灰度圖的每個像素用1個字節(jié)表示,灰度等級為28=256級。彩色圖像除了亮度信息之外還包括了色彩信息。根據(jù)顏色數(shù)目的不同,彩色圖可分為256色圖像和真彩色圖像,用真彩色表示的圖像文件很大,需要較大的存儲空間和傳輸空間。

5.數(shù)字圖像的主要研究內(nèi)容數(shù)字圖像處理所包括的內(nèi)容很廣泛,從研究目的來講大致可以分為圖像預處理和圖像分析兩大類。圖像預處理通常是為了改善圖像的質(zhì)量,使圖像中的某部分信息更加突出,以滿足某種應用的需要;圖像分析則是從圖像中提取有用信息,實現(xiàn)應用的過程,具體包括的內(nèi)容有以下幾個方面:(1)圖像變換圖像變換的方法包括傅里葉變換,沃爾什變換、離散余弦變換,小波變換等,圖像從空間域轉(zhuǎn)換到變換域后,不僅可以減少計算量,而且可以獲得更加有效的處理。例如小波變換在頻域具有良好的局部化特征,在圖像編碼、圖像融合中獲得了廣泛而有效的應用。(2)圖像增強由于成像系統(tǒng)是個高度復雜的系統(tǒng),圖像在產(chǎn)生和傳輸?shù)倪^程中總會受到各種干擾而產(chǎn)生畸變和噪聲,使得圖像質(zhì)量下降,而圖像增強正是為了提高圖像的質(zhì)量,如抑制噪聲,提高對比度,邊緣銳化等,以便于觀察、識別和進一步的分析處理。增強后的圖像與原圖像不再一致,也許會損失一些有用信息,但如果這些信息是人眼無法感知的,這樣的處理就是合理的。(3)圖像復原大氣湍流、攝像機與被攝物體之間的相對運動都會造成圖像的模糊,圖像復原是指把退化、模糊了的圖像盡可能的恢復到原圖像的模樣,它要求對圖像退化的原因有所了解,建立相應的“退化模型”,再采用某種濾波方法,恢復或重建原來的圖像。(4)圖像編碼與壓縮圖像編碼壓縮技術(shù)主要是利用圖像信號的統(tǒng)計特性和人類視覺的生理學及心理學特性,對圖像信號進行編碼,有效減少描述圖像的冗余數(shù)據(jù)量,以便于圖像傳輸、存儲和處理。壓縮技術(shù)在日常的生活中隨處可見,如許多視頻文件都采用了MPEG-4技術(shù)進行壓縮,在滿足一定保真度的前提下,大大減小了存儲空間,網(wǎng)絡上的JPEG文件也都采取了壓縮編碼技術(shù),減小了文件的字節(jié)數(shù)從而有利于在網(wǎng)絡上的傳輸。(5)圖像分割圖像分割是將感興趣的目標從背景中分離出來,便于提取出目標的特征和屬性,進行目標識別,為最終的決策提供依據(jù)。圖像自動分割是圖像處理領(lǐng)域中的難題,人類視覺系統(tǒng)能夠?qū)⑺^察的復雜場景中的對象一一分開,并識別出每個物體,但利用計算機進行分割往往還需要人工提供必需的信息才能實現(xiàn)。2.1.3色彩空間“色彩空間”一詞源于英文“ColorSpace”,又稱為“色域”。色彩學中,人們建立了多種色彩模型,以一維、二維、三維甚至四維空間坐標來表示某一色彩,這種坐標系統(tǒng)所能定義的色彩范圍即色彩空間。為了科學地定量描述和使用顏色,人們提出了各種顏色模型。最常見的是RGB模型,它主要面向諸如視頻監(jiān)視器、彩色攝像機或打印機之類的硬件設備;另一種常用模型是HSI模型,它主要面向以彩色處理為目的的應用,如動畫中的彩色圖形。另外,在印刷工業(yè)和電視信號傳輸中,經(jīng)常使用CMYK和YUV色彩系統(tǒng)。1.RGB顏色模型RGB顏色模型是由國際照明委員會(CIE)制定的。如圖所示,RGB顏色模型就是三維直角坐標顏色系統(tǒng)的一個單位正方體,原點為黑色,距離原點最遠的頂點(1,1,1)對應的顏色為白色,兩個點之間的連線是正方體的主對角線,從黑到白的灰度值分布在主對角線線上,該線稱為灰色線。正方體的其他六個角點分別為紅、黃、綠、青、藍和品紅。在三維空間的任一點都表示一種顏色,這個點有三個分量,分別對應了該點顏色的紅、綠、藍亮度值。RGB顏色模型稱為與設備相關(guān)的顏色模型,不同的掃描儀掃描同一幅圖像,會得到不同顏色的圖像數(shù)據(jù);不同型號的顯示器顯示同一幅圖像,也會有不同的顏色顯示結(jié)果。這是因為顯示器和掃描儀使用的RGB模型與CIERGB真實三原色表示系統(tǒng)空間是不同的,后者是與設備無關(guān)的顏色模型。2.HSI顏色模型HSI模型反映了人的視覺系統(tǒng)觀察彩色的方式,其中,H表示色調(diào)(Hue),S表示飽和度(Saturation),I表示明度(Intensity)。人的視覺系統(tǒng)經(jīng)常采用HSI模型,它比RGB顏色模型更符合人的視覺特性。HSI模型的三個屬性定義了一個三維柱形空間,如圖所示?;叶汝幱把刂S線從底部的黑變到頂部的白,具有最高亮度。最大飽和度的顏色位于圓柱上頂面的圓周上。HSI顏色模型和RGB模型只是同一種物理量的不同表示法,因此它們之間存在著轉(zhuǎn)換關(guān)系。對任何3個[0,1]范圍內(nèi)的R,G、B值都可以用下面的公式轉(zhuǎn)換為對應HSI模型中的I、S、H分量:由上式計算得到的H值應該是一個位于[0。,360。]之間的數(shù),若S=0時對應的是無色彩的中心點,此時H值沒有意義,定義為0。當I=0時,S也沒有意義。3.CMYK顏色模型彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機或打印機就只能用一些能夠吸收特定的光波來反射其他光波的油墨或顏料。油墨或顏料的三基色是青色(Cyan),品紅(Magenta)和黃色(Yellow),簡稱為CMY,這三基色能夠合成吸收所有顏色并產(chǎn)生黑色。實際上因為所有打印油墨都會包含一些雜質(zhì),這三種油墨混合實際上生成的是土灰色,必須與黑色油墨(Blackink)混合才能產(chǎn)生真正的黑色,所以這種顏色模型稱為CMYK。CMYK模型被稱為減色模型,是因為它減少了為視覺系統(tǒng)識別顏色所需要的反射光。CMYK空間正好與RGB空間互補,即用白色減去RGB空間中的某一顏色值就等于同樣顏色在CMYK空間中的值。4.YUV顏色模型在現(xiàn)代彩色電視系統(tǒng)中,通常采用彩色CCD攝像機,它把得到的彩色圖像信號,經(jīng)分色、分別放大校正得到RGB,再經(jīng)過矩陣變換電路得到亮度信號Y和兩個色差信號R-Y、B-Y,最后發(fā)送端將亮度和色差三個信號分別進行編碼,用同一信道發(fā)送出去,這就是常用的YUV顏色空間。采用YUV顏色模型的重要性是它的亮度信號Y和色度信號U、V是分離的。如果只有Y信號分量而沒有U、V分量,那么這樣表示的圖就是黑白灰度圖。彩色電視采用YUV空間正是為了用亮度信號Y解決彩色電視機和黑白電視機的兼容問題,使黑白電視機也能接收彩色信號。2.1.4圖像存儲

圖像存儲格式一般分為以下幾種。(1)BMP格式BMP圖像文件最早應用于微軟公司推出的MicrosoftWindows系統(tǒng),是一種MS-windows標準的位圖圖像文件格式。此格式由于在存儲過程中幾乎不進行壓縮,因此包含的圖像信息非常豐富。該文件格式支持RGB、索引顏色、灰度和位圖色彩模式,還支持l~32位的格式,其中對于4~8位的圖像使用RLE(行程長度編碼),這種壓縮方案不會損失數(shù)據(jù)。它最大的缺點就是要占用大量的存儲空間。(2)GIF格式GIF(GraphicInterchangeFormat圖形交換格式)是由CompuServer公司設計的。該格式是在因特網(wǎng)上應用最廣的圖像文件格式之一。GIF格式的最大特點是壓縮比高,文件占用存儲空間較小。該格式由于受到8位存儲格式的限制,因此要求圖像中顏色的數(shù)量減少到256或更少,這是縮小文件大小、減少占用存儲空間的一個主要因素。因為該格式存儲的圖像中顏色數(shù)量少。所以GIF格式通常用于沒有太多顏色過渡的圖像,只有索引色和灰度圖像可以保存為GIF格式。雖然該格式受到存儲格式的限制,但這種限制在傳輸速度至關(guān)重要的媒體中十分有利。(3)JPG/JPEG格式JPG/JPEG格式是由JointPhotographicExpertsGroup(聯(lián)合圖像專家組)開發(fā)的一種常見的圖像文件格式,是目前網(wǎng)絡可以支持的圖像文件格式之一。實際上JPG/JPEG并不是一種格式,確切地說是一種位圖圖像壓縮算法,其他一些文件格式如PICT格式和EPS格式,都使用了JPEG壓縮算法存放數(shù)據(jù)。JPG/JPEG可以驚人的壓縮位圖減小文件的大小,標準壓縮后的文件只有原文件大小的十分之一,壓縮率最高可達到100:1。JPBG采用了有損壓縮,被壓縮后的文件里丟失了原始圖像的一些不太引人注目的數(shù)據(jù),如果壓縮比設置為80左右,則幾乎不會影響到圖像的顯示品質(zhì)。但反復以JPEG格式保存圖像將會降低圖像的質(zhì)量并出現(xiàn)人工處理的痕跡,甚至使圖像明顯地分裂成碎塊,這一點要引起注意。由于該格式壓縮比較大,故這種格式的圖像文件不適合放大觀看和制成印刷品。雖然該格式壓縮比較大,但存儲文件較小,所以應用較廣。圖像預處理2.2.1像素亮度每個像素都有相應的亮度,這個亮度和色相是沒有關(guān)系的,同樣的亮度既可以是紅色也可以是綠色,就如同黑白(灰度)電視機中的圖像一樣,單憑一個灰度并不能確定是紅色還是綠色。像素的亮度和色相是無關(guān)的。不能說綠色比紅色亮,這是錯誤的說法。像素的亮度值在0至255之間,靠近255的像素亮度較高,靠近0的亮度較低,其余部分就屬于中間調(diào)。這種亮度的區(qū)分是一種絕對區(qū)分,即255附近的像素是高光,0附近的像素是暗調(diào),中間調(diào)在128左右。2.2.2圖像二值化圖像二值化(ImageBinarization)就是將圖像上的像素點的灰度值設置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果的過程。在數(shù)字圖像處理中,二值圖像占有非常重要的地位,圖像的二值化使圖像中數(shù)據(jù)量大為減少,從而能凸顯出目標的輪廓。將256個亮度等級的灰度圖像通過適當?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。在數(shù)字圖像處理中,二值圖像占有非常重要的地位。首先,圖像的二值化有利于圖像的進一步處理,使圖像變得簡單,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標的輪廓。其次,要進行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像。這樣子有利于在對圖像做進一步處理時,圖像的集合性質(zhì)只與像素值為0或255的點的位置有關(guān),不再涉及像素的多級值,使處理變得簡單,而且數(shù)據(jù)的處理和壓縮量小。為了得到理想的二值圖像,一般采用封閉、連通的邊界定義不交疊的區(qū)域。所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255表示,否則這些像素點被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域。如果某特定物體在內(nèi)部有均勻一致的灰度值,并且其處在一個具有其他等級灰度值的均勻背景下,使用閾值法就可以得到比較好的分割效果。如果物體同背景的差別表現(xiàn)不在灰度值上(比如紋理不同),可以將這個差別特征轉(zhuǎn)換為灰度的差別,然后利用閾值選取技術(shù)來分割該圖像。動態(tài)調(diào)節(jié)閾值實現(xiàn)圖像的二值化可動態(tài)觀察其分割圖像的具體結(jié)果。2.2.3圖像濾波圖像濾波,即在盡量保留圖像細節(jié)特征的條件下對目標圖像的噪聲進行抑制,是圖像預處理中不可缺少的操作,其處理效果的好壞將直接影響到后續(xù)圖像處理和分析的有效性和可靠性。由于成像系統(tǒng)、傳輸介質(zhì)和記錄設備等的不完善,數(shù)字圖像在其形成、傳輸記錄過程中往往會受到多種噪聲的污染。另外,在圖像處理的某些環(huán)節(jié),當輸入的對象并不如預想時,也會在結(jié)果圖像中引入噪聲。這些噪聲在圖像上常表現(xiàn)為易引起較強視覺效果的孤立像素點或像素塊。對于數(shù)字圖像信號,噪聲表現(xiàn)為或大或小的極值,這些極值通過加減作用于圖像像素的真實灰度值上,對圖像造成亮、暗點干擾,極大降低了圖像質(zhì)量,影響圖像復原、分割、特征提取、圖像識別等后繼工作的進行。要構(gòu)造一種有效抑制噪聲的濾波器必須考慮兩個基本問題,一是要能有效地去除目標和背景中的噪聲;同時,能很好地保護圖像目標的形狀、大小及特定的幾何和拓撲結(jié)構(gòu)特征。常用的濾波器有以下三種,分別為均值濾波器、中值濾波器、高斯濾波器。(1)均值濾波器均值濾波是典型的線性濾波算法,它是指在圖像上對目標像素給一個模板,該模板包括了其周圍的鄰近像素(以目標像素為中心的周圍8個像素,構(gòu)成一個濾波模板,即去掉目標像素本身),再用模板中的全體像素的平均值來代替原來像素值。均值濾波本身存在著固有的缺陷,即它不能很好地保護圖像細節(jié),在圖像去噪的同時也破壞了圖像的細節(jié)部分,使得圖像變得模糊,不能很好地去除噪聲點。均值濾波的算法簡單,但抗噪性能不好,這是由于它是對模板上的所有點進行處理。而當噪聲點與實際圖像的灰度差異過大時,也會對濾波后所得的結(jié)果造成較大影響,可以采用帶有閾值的均值濾波加以改善。(a)原圖(b)3*3(c)7*7(2)中值濾波器中值濾波是一種非線性平滑技術(shù),它將每一像素點的灰度值設置為該點某鄰域窗口內(nèi)的所有像素點灰度值的中值。中值濾波是基于排序統(tǒng)計理論的一種能有效抑制噪聲的非線性信號平滑處理技術(shù),它將每一像素點的灰度值設置為該點某鄰域窗口內(nèi)的所有像素點灰度值的中值。線性濾波平滑噪聲的同時,也損壞了非噪聲區(qū)域的信號,采用非線性濾波可以在保留信號的同時,濾除噪聲。中值濾波就是選擇一定形式的窗口,使其在圖像的各點上移動,用窗內(nèi)像素灰度值的中值代替窗中心點處的像素灰度值。它對于消除孤立點和線段的干擾十分有用,能減弱或消除傅立葉空間的高頻分量,但也影響低頻分量。高頻分量往往是圖像中區(qū)域邊緣灰度值急劇變化的部分,該濾波可將這些分量消除,從而使圖像得到平滑效果。因此中值濾波對脈沖噪聲有良好的濾除作用,特別是在濾除噪聲的同時,能夠保護信號的邊緣,使之不被模糊。這些優(yōu)良特性是線性濾波方法所不具有的。此外,中值濾波的算法比較簡單,也易于用硬件實現(xiàn)。所以,中值濾波方法一經(jīng)提出后,便在數(shù)字信號處理領(lǐng)域得到重要的應用。中值濾波對消除椒鹽噪聲非常有效,在光學測量條紋像素的相位分析處理方法中有特殊作用,但在條紋中心分析方法中作用不大。中值濾波在圖像處理中,常用于保護邊緣信息,是經(jīng)典的平滑噪聲的方法。(3)高斯濾波器高斯濾波(Gaussfilter)實質(zhì)上是一種信號的濾波器,其用途為信號的平滑處理。高斯平滑濾波器對于抑制服從正態(tài)分布的噪聲非常有效。圖像大多數(shù)噪聲均屬于高斯噪聲,因此高斯濾波器應用也較廣泛。高斯濾波是一種線性平滑濾波,適用于消除高斯噪聲,廣泛應用于圖像去噪。通俗的講,高斯濾波就是對整幅圖像進行加權(quán)平均的過程,每一個像素點的值,都由其本身和鄰域內(nèi)的其他像素值經(jīng)過加權(quán)平均后得到。高斯濾波的具體操作是:用一個模板(或稱卷積、掩模)掃描圖像中的每一個像素,用模板確定的鄰域內(nèi)像素的加權(quán)平均灰度值去替代模板中心像素點的值。可以簡單地理解為,高斯濾波去噪就是對整幅圖像像素值進行加權(quán)平均,針對每一個像素點的值,都由其本身值和鄰域內(nèi)的其他像素值經(jīng)過加權(quán)平均后得到。若使用理想濾波器,會在圖像中產(chǎn)生振鈴現(xiàn)象。采用高斯濾波器的話,系統(tǒng)函數(shù)是平滑的,避免了振鈴現(xiàn)象。高斯濾波(高斯平滑)是圖像處理,機器視覺里面最常見的操作。圖像操作與運算2.3.1數(shù)字圖像的度量與拓撲性質(zhì)1.相鄰像素位于坐標(x,y)的一個像素p有4個水平和垂直的相鄰像素,其坐標由下式給出:(x+1,y),(x-1,y),(x,y+1),(x,y-1)。這個像素集稱為p的4鄰域,用N4(p)表示。而8鄰域就是除了水平和垂直外,還加上了斜方向的四個像素點。每個像素距(x,y)一個單位距離,如果(x,y)位于圖像的邊界,則N4(p)和N8(p)中的某些點可能落入圖像外部。2.鄰接性,連通性,區(qū)域和邊界像素間的連通性是一個基本概念,它簡化了許多數(shù)字圖像概念的定義,如區(qū)域和邊界。為了確定兩個像素是否連通,必須確定它們是否相鄰以及其灰度值是否滿足特定的相似性準則(或者說,它們的灰度值是否相等)。例如,在具有0,1值的二值圖像中,兩個像素可能是4鄰接的,但是僅僅當它們具有同一灰度值時,才能說是連通的。

在認識這些之前,我們首先要認識4鄰域、8鄰域

4鄰域:

像素p的坐標是(x,y),那么他的4鄰域坐標N4是:(x+1,y)、(x-1,y),(x,y+1)、(x,y-1)8鄰域:

點p的對角像素坐標ND為:(x+1,y+1)、(x+1,y-1)、(x-1,y+1)、(x-1,y-1)。ND+N4=N8混合鄰接是8鄰接的改進?;旌相徑拥囊胧菫榱讼捎?鄰接常常發(fā)生的二義性。例如,考慮圖2-6(a)對于V={1}所示的像素位置安排,位于圖2-6(b)上部的三個像素顯示了多重(二義性)8鄰接,如虛線所示,這種二義性可以通過m鄰接消除,如圖2-6(c)所示。如果S1中某些像素與S2中的某些像素鄰接,則兩個圖像子集S1和S2是相鄰接的。在這里和下面的定義中,鄰接意味著4,8或者m鄰接。令S代表一幅圖像中像素的子集。如果在S中全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的,對于S中的任何像素p,S中連通到該像素的像素集稱為S的連通分量,如果S僅有一個連通分量,則集合S稱為連通集。令R是圖像中的像素子集,如果R是連通集,則稱R為一個區(qū)域。一個區(qū)域R的邊界(也稱為邊緣或輪廓)是區(qū)域中像素的集合,該區(qū)域有一個或多個不在R中的鄰點。如果R是整幅圖像(設這幅圖像是像素的方形集合),則邊界由圖像第一行、第一列和最后一行一列定義,這個附加定義是需要的,因為圖像除了邊緣沒有鄰點。正常情況下,當提到一個區(qū)域時,指的是一幅圖像的子集,并且區(qū)域邊界中的任何像素(與圖像邊緣吻合)都作為區(qū)域邊界部分全部包含于其中。邊緣的概念在涉及區(qū)域和邊界的討論中常常遇到。然而,這些概念中有一個關(guān)鍵區(qū)別:一個有限區(qū)域的邊界形成一條閉合通路,是一個“整體”概念;而邊緣是由某些具體導數(shù)值(超過預先設定的閾值)的像素組成。因此,邊緣的概念是基于在進行灰度級測量時不連續(xù)點的局部概念,把邊緣點連接成邊緣線段是可能的,并且有時以與邊界對應的方法連接線段,但并不總是這樣。邊緣和邊界吻合的一個例外就是二值圖像的情況。根據(jù)連通類型和所用的邊緣算子,從二值區(qū)域提取邊緣與提取區(qū)域邊界是一樣的,在概念上,把邊緣考慮為像素級別不連續(xù)的點和封閉通路的邊界是可行的。

在這種情況下,距(x,y)的D4距離小于或等于某一值r的像素形成一個中心在(x,y)的菱形。例如,距(x,y)的D4距離小于或等于2的像素形成下列固定距離的輪廓具有D4=1的像素是(x,y)的4鄰域。p和q間的D8距高(又稱棋盤距離)定義為D8(p,q)=max(|x-s|,|y-t|)

在這種情況下,距(x,y)的D8距離小于或等于某一值r的像素形成一個中心在(x,y)的方形。例如,距點(x,y)(中心點)的D8距離小于或等于2的像素形成下列固定距離的輪廓具有D8=1的像素點是關(guān)于(x,y)的8鄰域。注意,p和q之間的D4和D8距離與任何通路無關(guān),通路可能存在于各點之間,因為這些距離僅與點的坐標有關(guān)。然而,如果選擇考慮m鄰接,則兩點間的Dm距離用點間最短的通路定義。在這種情況下,兩像素間的距離將依賴于沿通路的像素值及其鄰點值。例如,考慮下列安排的像素并假設p、p2和p4的值為1,p1和p3的值為0或1。假設考慮值為1的像素鄰接(即V={1})。如果p1和p3是0,則p和p4間最短m通路的長度(Dm距離)是2。如果p1是1,則p2和p將不再是m鄰接(見m鄰接的定義),并且m通路的長度變?yōu)?(通路通過點p、p1、p2、p4)。類似地,如果p3是1(并且p1為0),則最短的通路距離也是3。最后,如果p1和p3都為1,則p和p4間的最短m通路長度為4,在這種情況下,通路通過點p、p1、p2、p3、p4。2.3.2圖像四則運算圖像運算指以圖像為單位進行的操作(該操作對圖像中的所有像素同時進行),運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論