




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、畢 業(yè) 設(shè) 計(jì)(論文)專 業(yè): 學(xué) 號(hào): 學(xué)生姓名: 所屬學(xué)院: 指導(dǎo)教師: 2021年 6月中國(guó)民航大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)機(jī)器人視覺(jué)伺服控制中的目標(biāo)識(shí)別Target identification of vision robot servo-control 專 業(yè):學(xué)生姓名: 學(xué) 號(hào):學(xué) 院:指導(dǎo)教師: 2021 年 6月創(chuàng)見(jiàn)性聲明本人聲明:所呈交的畢業(yè)論文是本人在指導(dǎo)教師的指導(dǎo)下進(jìn)行的工作和取得的成果,論文中所引用的他人已經(jīng)發(fā)表或撰寫過(guò)的研究成果,均加以特別標(biāo)注并在此表示致謝。與我一同工作的同志對(duì)本論文所做的任何奉獻(xiàn)也已在論文中作了明確的說(shuō)明并表示謝意。畢業(yè)論文作者簽名: 簽字日期: 年
2、 月 日本科畢業(yè)設(shè)計(jì)論文版權(quán)使用授權(quán)書本畢業(yè)設(shè)計(jì)論文作者完全了解中國(guó)民航大學(xué)有關(guān)保存、使用畢業(yè)設(shè)計(jì)論文的規(guī)定。特授權(quán)中國(guó)民航大學(xué)可以將畢業(yè)設(shè)計(jì)論文的全部或局部?jī)?nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,并采用影印、縮印或掃描等復(fù)制手段保存、匯編以供查閱和借閱。同意學(xué)校向國(guó)家有關(guān)部門或機(jī)構(gòu)送交畢業(yè)設(shè)計(jì)論文的復(fù)印件和磁盤。保密的畢業(yè)論文在解密后適用本授權(quán)說(shuō)明畢業(yè)論文作者簽名: 指導(dǎo)教師簽名:簽字日期: 年 月 日 簽字日期: 年 月 日摘 要為了實(shí)現(xiàn)四自由度機(jī)器人GRB-400機(jī)器人的準(zhǔn)確抓取控制,本文進(jìn)行基于視覺(jué)反響的機(jī)器人伺服控制系統(tǒng)研究。首先進(jìn)行了視覺(jué)圖像處理研究,由機(jī)器人平臺(tái)正上方的攝像頭捕獲圖像,采用中
3、值濾波的方法進(jìn)行圖像濾波,直方圖方法對(duì)圖像進(jìn)行增強(qiáng),canny法對(duì)圖像邊緣檢測(cè)和二值法圖像分割,完成圖像的預(yù)處理。其次對(duì)處理后的圖像進(jìn)行目標(biāo)識(shí)別,提取圖像特征,采用模板匹配的方法識(shí)別出目標(biāo)工件。最后識(shí)別出的工件進(jìn)行標(biāo)定,圖像中目標(biāo)工件的位置決定了它在空間的位置。而對(duì)于分割后的二值圖像,目標(biāo)工件的中心位置與目標(biāo)工件的質(zhì)心相同,根據(jù)坐標(biāo)計(jì)算公式求得質(zhì)心位置坐標(biāo)和角度值。由攝像頭的線性模型標(biāo)定目標(biāo)工件的三維位姿,將結(jié)果反響給執(zhí)行模塊,從而驅(qū)動(dòng)關(guān)節(jié)正確運(yùn)動(dòng),執(zhí)行抓取工件操作。實(shí)驗(yàn)結(jié)果說(shuō)明,所選擇的算法簡(jiǎn)單實(shí)用,到達(dá)了預(yù)期的效果。關(guān)鍵詞:工業(yè)機(jī)器人 圖像處理 目標(biāo)識(shí)別 攝像頭標(biāo)定ABSTRACT In
4、order to realize the accurate capture control of four degrees-of-freedom robot GRB-400 , this article carries on the servocontrol research of robot based on the visual feedback. First of all, the camera at the top of robot is used to capture images for the research of visual image processing,.With t
5、he method of median filtering, image filtering, image enhancement histogram method, canny edge detection method and the binary image segmentation,it complete the image preprocessing. Second, recognize the processed image ,find out image feature extraction. Use matching method to identify target work
6、piece. Finally ,distinguishde the work piece is carried on the demarcation,. The goal work piece positionin the image has decided it in the spatial position.But the division two value image, the goal work pieces central place and the goal work pieces center of mass are the same, obtains the center o
7、f mass position data and the angle value according to the coordinate formula.Through cameras linear model spotting work piece three dimensional pose, result feedback for executive module, thus actuates the joint correct movement, execution capture work piece operation. Experimental results show that
8、 the choice of algorithm is practical,getting the desired results. Key Words:industrial robot image processing target recognition servo control目 錄TOC o 1-3 h u HYPERLINK l _Toc264202197 第1章 緒論 PAGEREF _Toc264202197 h 1 HYPERLINK l _Toc264202198 課題開(kāi)展現(xiàn)狀 PAGEREF _Toc264202198 h 1 HYPERLINK l _Toc264202
9、199 課題目的 PAGEREF _Toc264202199 h 2 HYPERLINK l _Toc264202100 課題內(nèi)容 PAGEREF _Toc264202100 h 2 HYPERLINK l _Toc264202101 第2章 機(jī)器人視覺(jué)反響中的圖像處理 PAGEREF _Toc264202101 h 3 HYPERLINK l _Toc264202102 圖像增強(qiáng) PAGEREF _Toc264202102 h 3 HYPERLINK l _Toc264202103 直方圖增強(qiáng) PAGEREF _Toc264202103 h 3 HYPERLINK l _Toc2642021
10、04 2.1.2 直方圖均化 PAGEREF _Toc264202104 h 4 HYPERLINK l _Toc264202105 比照度增強(qiáng) PAGEREF _Toc264202105 h 4 HYPERLINK l _Toc264202106 圖像濾波 PAGEREF _Toc264202106 h 6 HYPERLINK l _Toc264202107 鄰域平均法原理 PAGEREF _Toc264202107 h 6 HYPERLINK l _Toc264202108 中值濾波 PAGEREF _Toc264202108 h 6 HYPERLINK l _Toc264202109 邊
11、緣檢測(cè) PAGEREF _Toc264202109 h 7 HYPERLINK l _Toc264202110 微分算子法 PAGEREF _Toc264202110 h 7 HYPERLINK l _Toc264202111 拉普拉斯高斯算子 PAGEREF _Toc264202111 h 8 HYPERLINK l _Toc264202112 2.3.3 canny法 PAGEREF _Toc264202112 h 9 HYPERLINK l _Toc264202113 圖像分割 PAGEREF _Toc264202113 h 10 HYPERLINK l _Toc264202114 灰度
12、門限法 PAGEREF _Toc264202114 h 11 HYPERLINK l _Toc264202115 圖像分割的方法 PAGEREF _Toc264202115 h 11 HYPERLINK l _Toc264202116 本實(shí)驗(yàn)中的圖像處理過(guò)程 PAGEREF _Toc264202116 h 12 HYPERLINK l _Toc264202117 本章小結(jié) PAGEREF _Toc264202117 h 13 HYPERLINK l _Toc264202118 第3章 圖像目標(biāo)識(shí)別 PAGEREF _Toc264202118 h 14 HYPERLINK l _Toc26420
13、2119 圖像目標(biāo)識(shí)別類型 PAGEREF _Toc264202119 h 14 HYPERLINK l _Toc264202120 圖像目標(biāo)識(shí)別的過(guò)程 PAGEREF _Toc264202120 h 14 HYPERLINK l _Toc264202121 圖像目標(biāo)識(shí)別的方法 PAGEREF _Toc264202121 h 15 HYPERLINK l _Toc264202122 圖像目標(biāo)識(shí)別的常用方法 PAGEREF _Toc264202122 h 15 HYPERLINK l _Toc264202123 圖像目標(biāo)識(shí)別的方法 PAGEREF _Toc264202123 h 15 HYPER
14、LINK l _Toc264202124 圖像的不變矩匹配 PAGEREF _Toc264202124 h 17 HYPERLINK l _Toc264202125 矩的概念 PAGEREF _Toc264202125 h 17 HYPERLINK l _Toc264202126 矩的有關(guān)變換 PAGEREF _Toc264202126 h 20 HYPERLINK l _Toc264202127 圖像的不變矩特征表示 PAGEREF _Toc264202127 h 22 HYPERLINK l _Toc264202128 目標(biāo)識(shí)別實(shí)驗(yàn) PAGEREF _Toc264202128 h 23 H
15、YPERLINK l _Toc264202129 本章小結(jié) PAGEREF _Toc264202129 h 24 HYPERLINK l _Toc264202130 第4章 基于圖像反響的機(jī)器人視覺(jué)定位 PAGEREF _Toc264202130 h 25 HYPERLINK l _Toc264202131 系統(tǒng)標(biāo)定概述 PAGEREF _Toc264202131 h 25 HYPERLINK l _Toc264202132 攝像機(jī)標(biāo)定 PAGEREF _Toc264202132 h 25 HYPERLINK l _Toc264202133 標(biāo)定的原理 PAGEREF _Toc26420213
16、3 h 26 HYPERLINK l _Toc264202134 4.3 GRB-400機(jī)器人運(yùn)動(dòng)學(xué)分析 PAGEREF _Toc264202134 h 27 HYPERLINK l _Toc264202135 坐標(biāo)空間定義 PAGEREF _Toc264202135 h 28 HYPERLINK l _Toc264202136 求解運(yùn)動(dòng)學(xué)逆解的方法 PAGEREF _Toc264202136 h 29 HYPERLINK l _Toc264202137 攝像機(jī)成像模型 PAGEREF _Toc264202137 h 34 HYPERLINK l _Toc264202138 視覺(jué)系統(tǒng)需標(biāo)定的參
17、數(shù)及方法 PAGEREF _Toc264202138 h 35 HYPERLINK l _Toc264202139 坐標(biāo)變換原理 PAGEREF _Toc264202139 h 35 HYPERLINK l _Toc264202140 4.5.2 機(jī)器人臂抓取 PAGEREF _Toc264202140 h 36 HYPERLINK l _Toc264202141 4.6 本章小結(jié) PAGEREF _Toc264202141 h 36 HYPERLINK l _Toc264202142 結(jié) 論 PAGEREF _Toc264202142 h 38 HYPERLINK l _Toc2642021
18、43 參考文獻(xiàn) PAGEREF _Toc264202143 h 39 HYPERLINK l _Toc264202144 致 謝 PAGEREF _Toc264202144 h 40 HYPERLINK l _Toc264202145 附錄A:程序清單 PAGEREF _Toc264202145 h 41 HYPERLINK l _Toc264202146 附錄B:外文翻譯資料 PAGEREF _Toc264202146 h 46第1章 緒論1.1 課題開(kāi)展現(xiàn)狀 智能機(jī)器人是工業(yè)機(jī)器人從無(wú)智能開(kāi)展到有智能,從低智能開(kāi)展到高智能的產(chǎn)物。它的智能特征就在于它具有與外部世界、對(duì)象、環(huán)境和人相互協(xié)調(diào)的
19、工作機(jī)能。在這方面,視覺(jué)、接機(jī)器人視覺(jué)是模擬人類視覺(jué)在機(jī)器人上的表達(dá),所以機(jī)器人視覺(jué)被認(rèn)為是機(jī)器人最重要的感覺(jué)能力。機(jī)器視覺(jué)一般定義為自動(dòng)獲取分析圖像得到描述一個(gè)景物或控制某種動(dòng)作的數(shù)據(jù),其本質(zhì)是使計(jì)算機(jī)具有從單幅或系列二維圖像陣列認(rèn)知周圍環(huán)境信息的能力,這種能力將不僅使機(jī)器能感知周圍物體的幾何信息,包括它的形狀、位置、姿態(tài)、運(yùn)動(dòng)等,而且能對(duì)它們進(jìn)行描述、識(shí)別與理解。它是一個(gè)綜合性學(xué)科,它涉及數(shù)學(xué)分析、圖像處理、圖像理解、模式識(shí)別以及計(jì)算機(jī)硬件知識(shí)等。視覺(jué)伺服(Visual Servoing)和一般意義上的機(jī)器視覺(jué)有所不同,它是利用視覺(jué)傳感器獲取的圖像作為反響信息構(gòu)造機(jī)器人的閉環(huán)反響控制。機(jī)器
20、人視覺(jué)伺服的實(shí)質(zhì)是利用機(jī)器視覺(jué)的原理,從直接得到的圖像反響信息中快速進(jìn)行圖像處理,在盡量短的時(shí)間內(nèi)給出反響信息,參與控制決策的產(chǎn)生,構(gòu)成機(jī)器人閉環(huán)控制系統(tǒng),帶有視覺(jué)的機(jī)器人對(duì)外部環(huán)境變化的適應(yīng)能力增強(qiáng),也使機(jī)器人的應(yīng)用領(lǐng)域得到擴(kuò)大。因而使用視覺(jué)來(lái)提高機(jī)器的智能水平,具有重要的現(xiàn)實(shí)意義和研究?jī)r(jià)值。近覺(jué)、觸覺(jué)和力覺(jué)具有重要作用,視覺(jué)是人類觀察世界和認(rèn)知世界的重要手段。視覺(jué)引導(dǎo)是機(jī)器人對(duì)物體識(shí)別與定位的應(yīng)用領(lǐng)域中一個(gè)重要問(wèn)題。對(duì)于工作在特殊環(huán)境下的機(jī)器人來(lái)說(shuō),為了完成對(duì)目標(biāo)物體的操作即“識(shí)別抓取放置動(dòng)作,對(duì)目標(biāo)物體定位信息的獲取是必要的。首先,機(jī)器人必須從背景中識(shí)別標(biāo)物體;其次,機(jī)器人必須知道目標(biāo)物
21、體的位姿,以保證機(jī)器人準(zhǔn)確地抓取;最后是必須知道物體被操作后的目標(biāo)位姿,以保證機(jī)器人準(zhǔn)確地完成任務(wù)。在傳統(tǒng)的工業(yè)機(jī)器人應(yīng)用場(chǎng)合,機(jī)器人只是按照固定的程序進(jìn)行操作,物體的初始位姿和終止位姿是事先規(guī)定的。當(dāng)機(jī)器人工作環(huán)境發(fā)生變化或者目標(biāo)物體發(fā)生變化甚至環(huán)境條件未知時(shí),帶有傳統(tǒng)傳感器的機(jī)器人控制系統(tǒng)就顯現(xiàn)許多局限性,甚至無(wú)法準(zhǔn)確完成預(yù)先給定的任務(wù),對(duì)機(jī)器人引入視覺(jué)裝置,一方面使得機(jī)器人可以模仿人類的視覺(jué)能力來(lái)感知外部環(huán)境,二是它能夠?qū)崿F(xiàn)無(wú)接觸位姿測(cè)量,第三它在一定程度上提高了機(jī)器人智能化和機(jī)器人自適應(yīng)、自學(xué)習(xí)的能力。對(duì)于機(jī)器人視覺(jué)技術(shù),我們的主要任務(wù)是為機(jī)器人建造視覺(jué)系統(tǒng)。如同人類視覺(jué)系統(tǒng)的作用一樣
22、,機(jī)器人視覺(jué)系統(tǒng)將賦予機(jī)器人一種高級(jí)感覺(jué)機(jī)構(gòu),使得機(jī)器人能以智能和靈活的方式去對(duì)周圍的環(huán)境做出反響。由于對(duì)機(jī)器人系統(tǒng)應(yīng)用領(lǐng)域不斷提出更高的要求,機(jī)器人視覺(jué)將越來(lái)越復(fù)雜??傊瑱C(jī)器人向智能化、類人化、多功能集成化開(kāi)展是當(dāng)前機(jī)器人開(kāi)展的一個(gè)重要趨勢(shì),而機(jī)器人視覺(jué)伺服控制是智能機(jī)器人的一項(xiàng)關(guān)鍵技術(shù)。1.2 課題目的本課題以工業(yè)機(jī)器人識(shí)別、抓取為應(yīng)用背景,利用單目視覺(jué)伺服系統(tǒng)來(lái)研究機(jī)器人的視覺(jué)伺服控制問(wèn)題。1.3 課題內(nèi)容主要針對(duì)機(jī)器人對(duì)目標(biāo)的識(shí)別和定位,通過(guò)攝像頭攝取圖像,經(jīng)過(guò)圖像處理和伺服控制,實(shí)現(xiàn)機(jī)器人通過(guò)視覺(jué)對(duì)目標(biāo)的識(shí)別和定位。主要內(nèi)容:在機(jī)器人視覺(jué)伺服系統(tǒng)中,圖像的實(shí)時(shí)采集與預(yù)處理。簡(jiǎn)單介紹
23、了成像的原理以及圖像預(yù)處理的方法和處理過(guò)程,針對(duì)具體目標(biāo)物體,較詳細(xì)地研究了圖像分割技術(shù)和各種圖像邊緣檢測(cè)方法,通過(guò)比擬研究和分析,選擇了適宜的邊緣檢測(cè)方法。攝像機(jī)標(biāo)定技術(shù)研究和視覺(jué)機(jī)器人視覺(jué)伺服控制系統(tǒng)。在對(duì)GBR-400機(jī)器人運(yùn)動(dòng)學(xué)、運(yùn)動(dòng)學(xué)反解、軌跡規(guī)劃等分析的根底上,利用視覺(jué)信息完成了機(jī)器人對(duì)單目標(biāo)物體的識(shí)別抓取實(shí)驗(yàn)研究以及對(duì)多目標(biāo)物體的識(shí)別、選擇和抓取。第2章 機(jī)器人視覺(jué)反響中的圖像處理 本章主要研究了機(jī)器人視覺(jué)伺服中圖像處理算法:圖像增強(qiáng)、圖像濾波、和邊緣檢測(cè)和圖像分割。其中在圖像增強(qiáng)過(guò)程中,對(duì)所得圖像的灰度進(jìn)行了調(diào)整。在圖像濾波研究中研究了根本圖像濾波算法,中值濾波算法的結(jié)果比擬讓
24、人滿意。在目標(biāo)識(shí)別中,主要研究了基于圖像矩的目標(biāo)檢測(cè)方法,應(yīng)用了邊緣檢測(cè)技術(shù),對(duì)各種邊緣檢測(cè)算法都進(jìn)行了比擬研究。本章為后面的目標(biāo)圖像特征提取與視覺(jué)信息反響計(jì)算奠定了根底。2.1 圖像增強(qiáng)像增強(qiáng)是數(shù)字圖像處理過(guò)程中經(jīng)常采用的一種方法。為了改善視覺(jué)效果或者便于人和機(jī)器對(duì)圖像的理解和分析,根據(jù)圖像的特點(diǎn)或存在的問(wèn)題采取的簡(jiǎn)單的改善方法或者加強(qiáng)特征的措施稱為圖像增強(qiáng)。獲取和傳輸圖像的過(guò)程往往會(huì)發(fā)生圖像失真,所得到圖像和原始圖像有某種程度的差異。這種差異如果太大,就會(huì)影響人和機(jī)器對(duì)圖像的理解。在許多情況下,人們不清楚引起圖像降質(zhì)的具體物理過(guò)程及其數(shù)學(xué)模型,但卻能根據(jù)經(jīng)驗(yàn)估計(jì)出使圖像降質(zhì)的一些可能原因,
25、針對(duì)這些原因采取簡(jiǎn)單有效的方法,改善圖像質(zhì)量。圖像信號(hào)變?nèi)鯐?huì)使人們無(wú)法看清圖像的細(xì)節(jié),而采用增強(qiáng)比照度的方法可以使圖像更清晰一些。2.1.1 直方圖增強(qiáng)圖像的直方圖是圖像的重要的統(tǒng)計(jì)特征,它可以認(rèn)為是圖像灰度密度函數(shù)的近似。按照隨機(jī)過(guò)程理論,圖像可以看作是一個(gè)隨機(jī)場(chǎng),因此具有相應(yīng)的統(tǒng)計(jì)特征,其中最重要的特征是灰度密度函數(shù)。通常圖像的灰度密度函數(shù)與象素所在的位置有關(guān),例如設(shè)圖像在點(diǎn)x,y處的灰度分布密度函數(shù)為p(z;x,y),那么圖像的灰度密度函數(shù)為:Pz= 2-1 其中D是圖像的定義域,S是區(qū)域D的面積。一般來(lái)講,要精確地得到圖像的灰度密度函數(shù)是比擬困難的,在實(shí)際中可以用數(shù)字圖像灰度直方圖來(lái)代
26、替?;叶戎狈綀D是一個(gè)離散函數(shù),它表示數(shù)字圖像每一灰度級(jí)與該灰度級(jí)出現(xiàn)頻率的對(duì)應(yīng)關(guān)系。假設(shè)一幅數(shù)字圖像的像素總數(shù)為N,有L個(gè)灰度級(jí),具有第K個(gè)灰度級(jí)的灰度rk的像素共有nk個(gè)灰度級(jí)或者說(shuō)rk出現(xiàn)的頻率為: hk= K=0,1,L-1 2-22.1.2 直方圖均化均勻量化的自然圖像的灰度直方圖通常在低值灰度區(qū)間上頻率較大,使得圖像中較暗區(qū)域中的細(xì)節(jié)常??床磺宄榱耸箞D像清晰,可將圖像的灰度范圍拉開(kāi),并且讓灰度頻率較小的灰度級(jí)變大,即讓灰度直方圖在較大的動(dòng)態(tài)范圍內(nèi)趨于一致。用圖像fx,y的直方圖代替灰度的分布密度函數(shù)Pff,那么直方圖均化的圖像g為:g=Tf= 2-3對(duì)于數(shù)字圖像,可以對(duì)上述公式做
27、離散近似。設(shè)原圖像的像素總是為N,灰度級(jí)的個(gè)數(shù)為L(zhǎng),第K個(gè)灰度級(jí)出現(xiàn)的頻數(shù)為nk。假設(shè)原圖像f(x,y)處的灰度為rk,那么直方圖均化后的圖像g(x,y)在處的灰度sk為:Sk=Trk= 2-42.1.3 比照度增強(qiáng)比照度增強(qiáng)是圖像增強(qiáng)技術(shù)中一種比擬簡(jiǎn)單但又十分重要的方法。這種方法是按一定的規(guī)那么修改輸入圖像每一個(gè)像素的灰度,從而改變圖像灰度的動(dòng)態(tài)范圍。它可以使灰度動(dòng)態(tài)范圍擴(kuò)展,也可以使其壓縮,或者是對(duì)灰度進(jìn)行分段處理,根據(jù)圖像特點(diǎn)和要求在某段區(qū)間中進(jìn)行壓縮而在另外區(qū)間中進(jìn)行擴(kuò)展。設(shè)輸入圖像為f(x,y),處理后的圖像為g(x,y),那么比照度增強(qiáng)可以表示為下面的數(shù)學(xué)變換式: 2-5其中T表示
28、輸入圖像和輸出圖像對(duì)應(yīng)點(diǎn)的灰度映射關(guān)系。實(shí)際中由于曝光缺乏或成像系統(tǒng)非線性的影響,通常照片或電子系統(tǒng)生成的圖像比照度不良,利用比照度增強(qiáng)變換可以有效地改善圖像的質(zhì)量。如果原圖像f(x,y)的灰度范圍是m,M,我們希望調(diào)整后的圖像g(x,y)的灰度范圍是n,N,那么下述變換:g(x,y)= 2-6)就可以實(shí)現(xiàn)這一要求。其變換曲線圖1-1如下:Gamma校正也是數(shù)字圖像處理中常用的圖像增強(qiáng)技術(shù)。Gamma因子的取值決定了輸入圖像到輸出圖像的灰度映射方式,即決定了增強(qiáng)低灰度還是增強(qiáng)高灰度。當(dāng)Gamma等于1時(shí),為線性變換。Gamma因子大于1和小于1的映射方式如以下圖1-2所示: 圖2-1灰度線性變
29、換曲線圖2-2Gamma校正曲線2.2 圖像濾波 直接由攝像機(jī)獲取的實(shí)際圖像中往往都含有各種噪聲和畸變,圖像質(zhì)量較差,使原本均勻和連續(xù)變化的灰度突然變大或減小,形成一些虛假的物體邊緣或輪廓,造成圖像模糊,甚至淹沒(méi)圖像特征,給圖像分析帶來(lái)困難,因此,有必要對(duì)其進(jìn)行圖像濾波。圖像濾波的作用主要有兩個(gè):抑制或消除圖像噪聲改善圖像質(zhì)量和抽取圖像的特征。由于圖像的噪聲種類復(fù)雜(如加性噪聲、乘性噪聲、量化噪聲等),所以圖像濾波的方法也多種多樣。在常用的空域法中有鄰域均值法、空域低通濾波法和中值濾波法等。2.2.1 鄰域平均法原理首先假設(shè)圖像是由許多灰度恒定的小塊組成,相鄰的象素之間具有很高的空間相關(guān)性。而
30、噪聲是統(tǒng)計(jì)獨(dú)立地疊加在圖像上的,其均值為O。因此,可以利用像素鄰域的各像素灰度值的平均值代替原來(lái)的灰度值,以實(shí)現(xiàn)圖像的平滑。假設(shè)某像素的灰度值為f(i,j以其為中心,鄰域像素組成的點(diǎn)集用S來(lái)表示,點(diǎn)集包含的像素個(gè)數(shù)為N。經(jīng)過(guò)鄰域平均法濾波后,像素f(i,j)的輸出為: (2-7)即利用鄰域像素的平均值取代了f(i,力原來(lái)的灰度值。鄰域平均法可以有力地抑制噪聲,但同時(shí)也引起圖像的模糊現(xiàn)象,模糊的程度與鄰域半徑成正比。為了盡可能減少模糊失真,可以采用“超限鄰域平均法,公式如下: (2-8) 其中,為設(shè)定閡值,即當(dāng)f(i,j)超過(guò)鄰域平均值一定值時(shí),才作為噪聲處理,否那么不變。2.2.2 中值濾波中
31、值濾波是抑制噪聲的非線性處理方法。對(duì)于給定的n個(gè)數(shù)值a1,a2,an,將它們按大小有序排列。當(dāng)n為奇數(shù)時(shí),位于中間位置的那個(gè)數(shù)值稱為這n個(gè)數(shù)值中值。當(dāng)n為偶數(shù)時(shí),位于中間位置的兩個(gè)數(shù)值的平均值稱為這n個(gè)數(shù)值的中值,記作med(a1,a2,an)。中值濾波就是這樣的一個(gè)變換,圖像中濾波后某像素的輸出等于該像素領(lǐng)域中各像素灰度的中值。中值濾波的方法運(yùn)算簡(jiǎn)單,易于實(shí)現(xiàn),而且能較好地保護(hù)邊界,但有時(shí)會(huì)失掉圖像中的細(xì)線和小塊的目標(biāo)區(qū)域。領(lǐng)域的大小決定在多少個(gè)數(shù)值中求中值,窗口的形狀決定什么樣的幾何空間中取元素計(jì)算中值。對(duì)二維圖像,窗口A的形狀可以是矩形、圓形及十字形等,它的中心一般位于被處理點(diǎn)上。窗口大
32、小及形狀有時(shí)對(duì)濾波效果影響很大。一維信號(hào)中值濾波具有如下重要性質(zhì):輸入是階躍信號(hào)或者斜坡信號(hào)時(shí),輸出信號(hào)和輸入信號(hào)相同;假設(shè)輸入是脈寬小于窗口一半的脈沖,那么該脈沖被濾除,否那么輸出和輸入相同;輸入是三角信號(hào)時(shí),輸出時(shí)其頂部被削平。二維信號(hào)的中值濾波的性質(zhì)與之相似。2.3 邊緣檢測(cè) 所謂邊緣是指其周圍像素灰度有階躍變化或屋頂變化的那些像素的集合。邊緣廣泛存在于目標(biāo)與背景之間、物體與物體之間、基元與基元之間。物體的邊緣是由灰度不連續(xù)性反映的,因此一般邊緣檢測(cè)方法是考察圖像的每個(gè)像素在某個(gè)領(lǐng)域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向?qū)?shù)變化規(guī)律來(lái)檢測(cè)邊緣。邊緣是圖像最根本的特征,一幅圖像主要信息是
33、由它的輪廓邊緣提供的。所以,邊緣提取與檢測(cè)在圖像處理中占有很重要的地位,其算法的優(yōu)劣將直接影響所研制系統(tǒng)的性能。 由于噪聲和模糊的存在,檢測(cè)到的邊界可能會(huì)變寬或在某些點(diǎn)處發(fā)生間斷,因此,邊界檢測(cè)包括兩個(gè)根本內(nèi)容:首先抽取反映灰度變化的邊緣點(diǎn),然后剔除某些邊界點(diǎn)或填補(bǔ)邊界間斷點(diǎn),并將這些邊緣連接成完整的線。最近的二十年里開(kāi)展了許多圖像邊緣檢測(cè)算法,并對(duì)圖像的邊緣檢測(cè)產(chǎn)生了很大的影響。2.3.1 微分算子法 導(dǎo)數(shù)算子具有突出灰度變化的作用,對(duì)圖像運(yùn)用導(dǎo)數(shù)算子,灰度變化較大的點(diǎn)處算子得的值較高,因此可將這些導(dǎo)數(shù)值作為相應(yīng)點(diǎn)的邊界強(qiáng)度,通過(guò)設(shè)置門限的方法,提取邊界點(diǎn)集。 一階導(dǎo)數(shù)與是最簡(jiǎn)單的導(dǎo)數(shù)算子,
34、它們分別求出了灰度在x和y方向上的變化率,而方向上的灰度變化可以用下面式子計(jì)算: (2-9)對(duì)于數(shù)字圖像,應(yīng)該采用差分運(yùn)算代替求導(dǎo),相對(duì)應(yīng)的一階差分為: xf(i,j)=f(i,j)-f(i-1,j) 2-10yf(i,j)=f(i,j)-f(i,j-1) 2-11方向差分為:f(i,j)= xf(i,j)cos+yf(i,j)sin (2-12)Roberts算子的表達(dá)式為:max(f(i,j)-f(i+1,j+1),f(i+1,j)-f(i,j+1) (2-13)Sobel算子的表達(dá)式為: 2-14 x方向算子 y方向算子 利用Roberts算子提取的邊緣的結(jié)果邊緣比擬粗,因此邊緣定位不是
35、很準(zhǔn)確,而Sobel 算子對(duì)邊緣的定位比擬準(zhǔn)確。2.3.2 拉普拉斯高斯算子拉普拉斯高斯算法是一種二階邊緣檢測(cè)方法。它通過(guò)尋找圖像灰度值中二階微分中的過(guò)零點(diǎn)來(lái)檢測(cè)邊緣點(diǎn)。其原理是,灰度緩變形成的邊緣經(jīng)過(guò)微分算子形成一個(gè)單峰函數(shù),峰值位置對(duì)應(yīng)邊緣點(diǎn);對(duì)單峰函數(shù)進(jìn)行微分,那么峰值處的微分值為0,峰值兩側(cè)符號(hào)相反,而原先的極值點(diǎn)對(duì)應(yīng)二階微分中的過(guò)零點(diǎn)。實(shí)際應(yīng)用中,為了去除噪聲影響,首先要用高斯函數(shù)對(duì)圖像進(jìn)行濾波,然后對(duì)濾波后的圖像求二階導(dǎo)數(shù),即按照下式計(jì)算: 2-15其中f(x,y)為圖像,G(x,y)為高斯函數(shù),上述兩個(gè)處理步驟可以合成一個(gè)算子,由卷積和微分可交換順序的性質(zhì)知: 2-16式中稱為拉
36、普拉斯高斯算子,經(jīng)過(guò)運(yùn)算可得: 2-17 是關(guān)于原點(diǎn)對(duì)稱的函數(shù),其主瓣寬度為: W=2 2-18在數(shù)字圖象中,拉普拉斯算子可借助各種模板來(lái)實(shí)現(xiàn)。這里對(duì)模板的根本要求是對(duì)應(yīng)中心像素的系數(shù)應(yīng)是負(fù)的,而對(duì)應(yīng)中心像素鄰近像素的系數(shù)應(yīng)是正的,且它們的和應(yīng)該為零。拉普拉斯算子的特點(diǎn)是:各向同性,線性和位移不變,對(duì)細(xì)線和孤立點(diǎn)檢測(cè)效果好但邊緣方向信息喪失,常產(chǎn)生雙像素的邊緣,對(duì)噪聲有雙倍加強(qiáng)作用。2.3.3 canny法 Canny邊緣檢測(cè)是一種比擬新的邊緣檢測(cè)算子,具有很好的邊緣檢測(cè)性能,得到了越來(lái)越廣泛的應(yīng)用。Canny邊緣檢測(cè)法利用高斯函數(shù)的一階微分,它能在噪聲抑制和邊緣檢測(cè)之間取得較好的平衡。具體步
37、驟如下:1用高斯濾波器來(lái)圖像濾波,可以去除圖像中的噪聲。2用高斯算子的一階微分圖像進(jìn)行濾波,得到每個(gè)像素梯度的大小|G|和方向。 2-19f為濾波后的圖像。對(duì)梯度進(jìn)行“非極大抑制。 梯度的方向可以被定義為屬于4個(gè)區(qū)之一,各個(gè)區(qū)用不同的領(lǐng)近像素用來(lái)進(jìn)行比擬,以決定局部最大值。對(duì)梯度取兩次閥值得到兩個(gè)閥值T1和T2,T1=0.4*T2。我們把梯度值小于T1的像素的灰度設(shè)為0,得到圖像1。然后把梯度小于T2的像素的灰度設(shè)為0,得到圖像2。由于圖像2的閥值較高,去除了大局部噪聲,但同時(shí)也損失了有用的邊緣信息。而圖像1的閥值較低,保存了較多的信息。我們可以以圖像2為根底,以圖像1為補(bǔ)充來(lái)連接圖像的邊緣。
38、連接邊緣的具體步驟如下: 對(duì)圖像2進(jìn)行掃描,當(dāng)遇到一個(gè)非零灰度的像素p時(shí),跟蹤以p為開(kāi)始的輪廓線,直到該輪廓線的終點(diǎn)Q。考慮圖像1中與圖像2中Q點(diǎn)位置對(duì)應(yīng)的點(diǎn)Q的8-鄰近區(qū)域。如果在Q點(diǎn)的8-鄰近區(qū)域中有非零像素R存在,那么將其包括到圖像2中,作為點(diǎn)R。從R開(kāi)始,重復(fù)第一步,直到我們?cè)趫D像1和圖像2中都無(wú)法繼續(xù)為止。當(dāng)完成對(duì)包含p的輪廓線的連接之后,將這條輪廓線標(biāo)記為已訪回?;氐降谝徊?,尋找下一條輪廓線。重復(fù)這三步,直到圖像2中找不到新輪廓線為止。2.4 圖像分割圖像分割是圖像處理與機(jī)器視覺(jué)的根本問(wèn)題之一,其任務(wù)是把圖像劃分成互不交迭區(qū)域的集合。這些區(qū)域的劃分是有實(shí)際意義的,他們或者代表不同的
39、物體,或者代表物體的不同局部。圖像分割的一個(gè)難點(diǎn)在于,在劃分之前,不一定能夠確定圖像區(qū)域的數(shù)目。 按照通用的分割定義,分割出的區(qū)域需同時(shí)滿足均勻性和連通性的條件。其中均勻性是指該區(qū)域中的所有像素點(diǎn)都滿足根本灰度、紋理、顏色等特征的某種相似準(zhǔn)那么,而連通性是指在該區(qū)域內(nèi)任意兩點(diǎn)存在相互連通的路徑。設(shè)F表示一幅圖像中所有像素的集合,P()是某個(gè)均勻性的假設(shè),分割就是把F劃分成假設(shè)干子集S1,S2,,Sn, 其中各子集構(gòu)成一個(gè)空間連通區(qū)域,且滿足以下條件: 2-20 2-21 完全符合上述定義的分割計(jì)算十分復(fù)雜,目前大局部研究都是針對(duì)某一類圖像或者某一具體應(yīng)用的分割,人們?nèi)栽趯?duì)圖像分割的通用方法和策
40、略進(jìn)行研究。通常情況下,利用目標(biāo)區(qū)域和背景區(qū)域在灰度方面的差異,可以實(shí)現(xiàn)對(duì)圖像的分割,即基于灰度的圖像分割。2.4.1 灰度門限法設(shè)圖像f(x,y)的灰度范圍屬于z1,z2,根據(jù)一定的經(jīng)驗(yàn)及知識(shí)確定一個(gè)灰度的門限,或者根據(jù)一定準(zhǔn)那么確定z1,z2的一個(gè)劃分Z1,Z2,其中Z1代表目標(biāo),Z2代表背景。根據(jù)像素的灰度屬于這個(gè)劃分的哪個(gè)局部來(lái)將其分類,稱為灰度門限法,即:如果f(x,y)屬于Z1,判斷x,y像素屬于目標(biāo)。如果f(x,y)屬于Z2,那么判斷(x,y)像素屬于背景。根據(jù)劃分方法的不同,可以將灰度門限法分為:直接門限法 、 間接門限法、多門限法2.4.2 圖像分割的方法 一般圖像閾值分割可
41、以分成以下三步:1確定閾值;2將閾值與圖像中所有像素比擬;3根據(jù)筆記結(jié)果,將像素歸類; 閾值分割是利用圖像中要提取的目標(biāo)物體與背景在灰度上的差異,把圖像分為具有不同灰度級(jí)的目標(biāo)區(qū)域和背景區(qū)域組合的方法,它的實(shí)質(zhì)是對(duì)圖像進(jìn)行二值化閾值分割的根本思想是確定一個(gè)閾值,然后將每個(gè)像素點(diǎn)的灰度值跟這個(gè)閾值相比擬,根據(jù)比擬的結(jié)果來(lái)確定該點(diǎn)是背景還是目標(biāo),然后將背景和目標(biāo)的像素點(diǎn)的灰度值分別置為255和0。最簡(jiǎn)單的是全局閾值分割,設(shè)原始圖像f(x,y),閾值為T,按上述方法分割后的圖像g(x,y)可由下式2-22表示: (2-22)還有一種方法將規(guī)定范圍內(nèi)像素值置為1,而范圍外像素值置為0,如(2-23)式
42、: 2-23 圖像分割流程如圖2-4所示: 圖2-4圖像分割流程圖2.5 本實(shí)驗(yàn)中的圖像處理過(guò)程 在Visual C+環(huán)境下開(kāi)發(fā)的系統(tǒng)集成軟件,能夠在固定窗口實(shí)時(shí)顯示視頻圖像和圖像處理結(jié)果,這樣在實(shí)驗(yàn)過(guò)程中,對(duì)采集圖像和處理結(jié)果的好壞會(huì)有一個(gè)直觀的認(rèn)識(shí),以便隨時(shí)調(diào)整。圖像處理軟件的主要任務(wù)就是讓攝像機(jī)執(zhí)行圖像捕捉、圖像處理、目標(biāo)識(shí)別、特征提取、調(diào)試信息與結(jié)果顯示等功能。圖像捕獲是指通過(guò)圖像采集卡,對(duì)攝像頭640*480像素的8bit灰度圖進(jìn)行高速采集;圖像處理主要應(yīng)用第二章中論述的原理,對(duì)采集的灰度圖進(jìn)行預(yù)處理、濾波去燥、二值化處理、邊緣檢測(cè)等操作;在圖像處理的根底上,應(yīng)用第三章中提出的單目標(biāo)
43、物體的匹配識(shí)別算法識(shí)別出目標(biāo)物體,對(duì)識(shí)別出的目標(biāo)物體的特征進(jìn)行提取,即獲得該目標(biāo)物體的質(zhì)心、角度等特征參數(shù)。圖5-2(a)為采用中值濾波算法對(duì)采集圖像的預(yù)處理結(jié)果。 a) (b)圖2-5中值濾涉及閾值分割結(jié)果 采用二值化方法對(duì)圖像進(jìn)行分割。最優(yōu)閾值的選取采用OTSU最大類間方差法,其思想主要是計(jì)算目標(biāo)圖像與背景圖像間的方差。在0-255間改變n,求使得式1取最大值的n值,此時(shí)的n即為OTSU自動(dòng)閾值分割算法的最正確閾值。圖5-2b是對(duì)經(jīng)過(guò)濾波處理后的圖像采用該分割算法處理后的結(jié)果,即:低于某一閾值n的灰度值屬于目標(biāo)物體,而高于這一閾值n的灰度值屬于背景圖像。2.6 本章小結(jié)本章主要描述了圖像的
44、獲取、圖像預(yù)處理、圖像分割和圖像的邊緣檢測(cè),首先分析了灰度線性變換和直方圖均衡化在圖像增強(qiáng)中的原理,然后應(yīng)用中值濾波濾除噪聲,其較好地保持了圖像的邊緣。在圖象分割中應(yīng)用直方圖和實(shí)驗(yàn)法相結(jié)合的方法,確定了閾值,完成了圖像的二值化處理,最后在邊緣檢測(cè)中,分析了各種檢測(cè)方法的優(yōu)缺點(diǎn),最終確定了本文使用Roberts外邊緣算子提取目標(biāo)物體的邊緣特征。第3章 圖像目標(biāo)識(shí)別 目標(biāo)識(shí)別技術(shù)的研究始于六十年代,其含義是用計(jì)算機(jī)對(duì)圖像進(jìn)行加工處理,以得到某些預(yù)期的效果,并從中提取有用信息,從而實(shí)現(xiàn)人對(duì)事物或現(xiàn)象的分析、描述、判斷和識(shí)別。它的主要目的是確定視野圖像中是否存在目標(biāo)。如果存在日標(biāo),給個(gè)合理的解釋,即判
45、斷出目標(biāo)是什么及確定它的位置。它屬于模式識(shí)別的范疇,也可以把模式識(shí)別狹義地理解為圖像目標(biāo)識(shí)別。 對(duì)目標(biāo)的識(shí)別并確定其位置信息是機(jī)器人視覺(jué)伺服控制系統(tǒng)首先要解決的問(wèn)題。通過(guò)前面章節(jié)介紹的圖像預(yù)處理和圖像分割及邊緣檢測(cè)等有效圖像處理后得到了物體的二值化圖像,該圖像由一個(gè)一個(gè)的目標(biāo)區(qū)域組成,本章的工作就是從這多個(gè)目標(biāo)區(qū)域中找到我們需要的目標(biāo)區(qū)域,即圖像的識(shí)別問(wèn)題。 圖像識(shí)別就是從圖像中找出與己知模板相似的目標(biāo)圖像,即識(shí)別出物體并確定出它在整幅圖像中的位置和方向,這是計(jì)算機(jī)視覺(jué)系統(tǒng)中的關(guān)鍵和難點(diǎn)。3.1 圖像目標(biāo)識(shí)別類型 目標(biāo)識(shí)別在概念上可以分為三種類型:物理模型、基于知識(shí)的方法和參數(shù)分類技術(shù): 物理
46、模型: 物理模型所采用的技術(shù)是根據(jù)物理模型直接計(jì)算實(shí)體的特征(時(shí)間域、信號(hào)、數(shù)據(jù)、頻域數(shù)據(jù)或圖像)。由傳感器觀測(cè)產(chǎn)生觀測(cè)特征或圖像,由身份判別過(guò)程把觀測(cè)數(shù)據(jù)與預(yù)先存儲(chǔ)的目標(biāo)特征(一個(gè)先驗(yàn)的目標(biāo)特征文件)或根據(jù)對(duì)觀測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè)的物理模型所得出的模擬特征進(jìn)行比擬。基于知識(shí)的方法:基于知識(shí)的方法有兩個(gè)方面的內(nèi)容:表示知識(shí)的技術(shù);處理信息以得出結(jié)論的推理方法。它們可以在原始傳感器數(shù)據(jù)或抽取的特征的根底上進(jìn)行。基丁知識(shí)的方法的成功與否在很大程度上依賴于建立一個(gè)先驗(yàn)知識(shí)庫(kù)。有效的知識(shí)庫(kù)是用知識(shí)工程技術(shù)來(lái)建立的。 參數(shù)分類技術(shù):參數(shù)分類技術(shù)包括統(tǒng)汁算法和應(yīng)用信息論技術(shù)的方法統(tǒng)計(jì)算法有經(jīng)典推理、Baycs方
47、法、D-S方法等。基于信息論技術(shù)的方法有參數(shù)模板、聚類分析、自適應(yīng)神經(jīng)網(wǎng)絡(luò)、表決法、熵法等,其中,聚類分析法對(duì)于探索新的數(shù)據(jù)關(guān)系提供一個(gè)有價(jià)值的工具。3.2 圖像目標(biāo)識(shí)別的過(guò)程從廣義上講,典型的圖像目標(biāo)識(shí)別技術(shù)過(guò)程由以下六局部組成:預(yù)處理、目標(biāo)探測(cè)、圖像分割、特征提取與選擇、目標(biāo)分類和目標(biāo)跟蹤。如圖3-1所示: 圖3-1目標(biāo)識(shí)別的過(guò)程3.3 圖像目標(biāo)識(shí)別的方法3.3.1 圖像目標(biāo)識(shí)別的常用方法 將圖像進(jìn)行合理的分割以后,下一個(gè)重要問(wèn)題就是圖像的識(shí)別。圖像識(shí)別的方法較多,大體上可以歸納為三大類:統(tǒng)計(jì)識(shí)別方法、結(jié)構(gòu)識(shí)別方法和模糊集識(shí)別方法。 統(tǒng)計(jì)識(shí)別方法 統(tǒng)計(jì)識(shí)別方法以數(shù)學(xué)上的決策理論為根底,根據(jù)
48、這種理論建立統(tǒng)計(jì)學(xué)識(shí)別模型,根本模型是對(duì)研究的圖像進(jìn)行大量的統(tǒng)計(jì)分析,找出規(guī)律性認(rèn)識(shí),抽出反映圖像本質(zhì)特點(diǎn)的特征進(jìn)行識(shí)別。在這種方法中,大量工作在于如何抽取圖像的特征或統(tǒng)計(jì)參數(shù)。 句法結(jié)構(gòu)識(shí)別方法 句法結(jié)構(gòu)識(shí)別方法立足于分析圖像的結(jié)構(gòu),主要利用了圖像結(jié)構(gòu)上的相互關(guān)系,一幅圖像可以模仿語(yǔ)言結(jié)構(gòu),用一些語(yǔ)句來(lái)表達(dá)。對(duì)于圖像識(shí)別來(lái)說(shuō),相當(dāng)于檢查圖像所代表的某一句型,是否符合事先規(guī)定的語(yǔ)法。假設(shè)語(yǔ)法正確,那么給出識(shí)別結(jié)果。 模糊集識(shí)別方法所謂模糊集識(shí)別,是在模式識(shí)別過(guò)程中引入了模糊集的概念,模糊集的概念可以在模式識(shí)別系統(tǒng)的運(yùn)用很廣。假設(shè)在特征提取或判別決策中引入,所求得的結(jié)果就是該模式特征與每一標(biāo)準(zhǔn)類
49、的隸屬度,進(jìn)而可求出隸屬度最大的標(biāo)準(zhǔn)類為被識(shí)類。3.3.2 圖像目標(biāo)識(shí)別的方法匹配技術(shù)是統(tǒng)計(jì)識(shí)別方法中非常重要的一種。匹配指用存儲(chǔ)在計(jì)算機(jī)中的模型去識(shí)別輸入的未知視覺(jué)模式,并最終建立對(duì)輸入的解釋,及計(jì)算機(jī)模型與外部世界的對(duì)應(yīng)性。對(duì)于每個(gè)具體的匹配,它都可以看作是對(duì)兩個(gè)已有的表達(dá)找其對(duì)應(yīng)性。當(dāng)兩個(gè)表達(dá)都代表了圖像中的目標(biāo)時(shí),就稱之為圖像目標(biāo)匹配。下面介紹一些常用的圖像目標(biāo)匹配方法。 (一)模板匹配 模板匹配是圖像匹配中最常用、最簡(jiǎn)明的方法,也稱子圖像匹配或窗匹配,也有人稱之為基于面積或鄰域的匹配。假設(shè)在被搜索圖S中有待尋的目標(biāo),且同模板圖像有一樣的尺寸和方向,匹配的主要工作是將模板T(設(shè)模板T的
50、大小為MXM)在搜索圖S(設(shè)搜索圖s的大小為NXN)上平移并進(jìn)行相關(guān)計(jì)算,相關(guān)值最大處即為匹配最好處。如果相關(guān)值大于給定的閾值,那么認(rèn)為在s上存在模板T所代表的圖像區(qū)域。由相關(guān)法求匹配的計(jì)算量很大,因?yàn)槟0逡?M+1)2個(gè)參數(shù)位置上做相關(guān)計(jì)算,除一點(diǎn)以外,其余都是在非匹配點(diǎn)上做無(wú)用功。而且,模板匹配法對(duì)于具有旋轉(zhuǎn)和尺度變化的圖像識(shí)別無(wú)能為力,故模板匹配法的應(yīng)用有較大的局限性。在實(shí)際應(yīng)用中常采用下面的特征內(nèi)容匹配法來(lái)進(jìn)行圖像識(shí)別。 (二)特征內(nèi)容匹配 在很多情況下,圖像的內(nèi)容比它的視覺(jué)質(zhì)量更為重要。根據(jù)圖像內(nèi)容對(duì)圖像進(jìn)行識(shí)別的研究主要借助于圖像的特征來(lái)進(jìn)行。下面分別對(duì)幾種常見(jiàn)的特征內(nèi)容匹配法進(jìn)
51、行簡(jiǎn)要的介紹。 顏色匹配 顏色是彩色圖像一個(gè)重要的特征。常用的顏色空間有RGB和HIS空間。用圖像顏色特征來(lái)描述圖像主要利用其顏色統(tǒng)計(jì)直方圖。在得到圖像特征的統(tǒng)計(jì)直方圖后,不同圖像問(wèn)的特征匹配借助計(jì)算機(jī)直方圖間的距離來(lái)進(jìn)行。 常見(jiàn)的幾種較簡(jiǎn)單的方法有: (1)直方圖相交法 (2)距離法 (3)中心距法 (4)參考顏色表法 形狀匹配 利用形狀進(jìn)行匹配有幾點(diǎn)需要注意: (1)首先,形狀常與目標(biāo)聯(lián)系在一起,所以形狀特,征可以看作是比顏色或紋理更高一層的特征。要獲得有關(guān)目標(biāo)的形狀參數(shù),通常需要對(duì)目標(biāo)進(jìn)行分割,因此形狀特征會(huì)受到圖像分割效果的影響。 (2)其次,至今還沒(méi)有找到形狀確實(shí)定數(shù)學(xué)定義使之能與人
52、的感覺(jué)相一致。人對(duì)形狀的感覺(jué)不僅是一個(gè)視網(wǎng)膜的生理反映結(jié)果,而且是視網(wǎng)膜感受與入關(guān)于現(xiàn)實(shí)世界的知識(shí)這兩者之間綜合的結(jié)果。 (3)最后,從不同視角獲取的圖像中目標(biāo)形狀可能會(huì)有很大差異,為準(zhǔn)確進(jìn)行匹配,需要解決平移、尺度、旋轉(zhuǎn)不變性的問(wèn)題。目前常用的形狀匹配法主要有幾何參數(shù)法,邊界方向直方圖法,小波重要系數(shù)法,小波輪廓表示法和不變矩法。本文將重點(diǎn)研究不變矩的形狀匹配方法。 3.4 圖像的不變矩匹配 計(jì)算機(jī)系統(tǒng)在識(shí)別圖像時(shí),應(yīng)具有的一個(gè)重要特性是對(duì)圖像的平移、旋轉(zhuǎn)及比例變換具有不變性。一個(gè)最直觀的方法是要求圖像特征本身具有“不變性,即盡可能尋求圖像本身的“不變性特征。因此,不變性特征的研究一直是感知
53、科學(xué)和計(jì)算機(jī)視覺(jué)的研究重點(diǎn)。不變矩算法就是一種通過(guò)提取具有平移、旋轉(zhuǎn)和比例不變性的數(shù)學(xué)特征,從而進(jìn)行圖像識(shí)別的方法。3.4.1 矩的概念 對(duì)于連續(xù)灰度函數(shù)f(x,y),它的(p+q)階二維原點(diǎn)矩Mpq的定義為: 3-1 假設(shè)廠f(x,y),為分段連續(xù)的有界函數(shù),并且在x,y平面上有限區(qū)域內(nèi)有非零值。根據(jù)唯一眭定理,它的各階矩存在且唯一地被f(x,y)確定,反過(guò)來(lái),f(x,y)也唯一地被它的各階矩確定。 此外,還可以定義f(x,y)的(p+q)階中心矩Upq為: Upq= 3-2矩的物理意義零階矩根據(jù)矩的定義,圖像f(x,y)的零階矩M00定義為: 3-3 可見(jiàn),如果廠f(x,y)為灰度圖像,那
54、么M00表示圖像狄度值的總和,或者,也可以看作為物體的質(zhì)量;當(dāng)f(x,y)為二值圖像時(shí),M00表示圖像的面積。2一階矩圖像f(x,y)的兩個(gè)一階矩M10和M01,用來(lái)確定圖像的灰度重心。其重心坐標(biāo)為: (3-4)根據(jù)中心矩的定義,很容易推出中心矩U10和U01均為0,即:U10=U01=0二階矩 圖像的二階矩有三個(gè):M10、M01和M11,也稱之為慣性矩,它們可以確定物體的幾個(gè)重要的特性,具體特性描述如下: 1 主軸 二階中心矩常用來(lái)確定目標(biāo)的主軸,目標(biāo)的主軸通常有一對(duì),長(zhǎng)軸和短軸,分別代表最大二階矩和最小二階矩的方向,根據(jù)矩理論,主軸方向角可按下述公式計(jì)算: 3-5 公式中為主軸與坐標(biāo)軸的夾
55、角,其范圍-/4,/4在。如表3-1所示 表3-1主軸方向確定表u11u20-u020-0+-/40+00+0/4000-+-/40-00-0 x2) x=x1; x1=x2; x2=x; if(y1y2) y=y1; y1=y2; y2=y; for(x=x1;x=x2;x+) y=y1; if(!m_Robot.InverseKinematics(x,y,&angle1,&angle2) return; m_Robot.joint_move_to(1,angle1); m_Robot.joint_move_to(2,angle2); m_Robot.joint_move_to(4,90-(
56、angle1+angle2); for(y=y1;y=x1;x-) y=y2; if(!m_Robot.InverseKinematics(x,y,&angle1,&angle2) return; m_Robot.joint_move_to(1,angle1); m_Robot.joint_move_to(2,angle2); m_Robot.joint_move_to(4,90-(angle1+angle2); for(y=y2;y=y1;y-) x=x1; if(!m_Robot.InverseKinematics(x,y,&angle1,&angle2) return; m_Robot.
57、joint_move_to(1,angle1); m_Robot.joint_move_to(2,angle2); m_Robot.joint_move_to(4,90-(angle1+angle2); 2.畫圓,其中也引用了類中的運(yùn)動(dòng)學(xué)反解函數(shù)和關(guān)節(jié)運(yùn)動(dòng)函數(shù)。 void CCtlDlg:OnButtonCircle() / TODO: Add your control notification handler code here double x1,y1,r; /圓心為(x,y),半徑為r double angle1,angle2; CString str; GetDlgItemText(I
58、DC_EDIT_CENTER_X,str); x1=atof(str); GetDlgItemText(IDC_EDIT_CENTER_Y,str); y1=atof(str); GetDlgItemText(IDC_EDIT_RADIUS,str); r=atof(str); int t; double x,y; for(t=0;tGet_Arm_angle(&angleone,&angletwo); m_nAngle1 = angleone+m_nAngle1; m_nAngle2 = angletwo+m_nAngle2-90; UpdateData(FALSE); void CRobo
59、tDemarcate:OnOK() UpdateData(); CString str; str.Format(%f,m_nAngle1); WritePrivateProfileString(Positioninf,機(jī)器人一關(guān)節(jié)角度,str,.位置標(biāo)定.ini); str.Format(%f,m_nAngle2); WritePrivateProfileString(Positioninf,機(jī)器人二關(guān)節(jié)角度,str,. CDialog:OnOK(); 附錄B:外文翻譯資料Precise Control of a Mobile Robot through the Visual Feedback
60、Abstract - This paper addresses the control problem of a mobile robot supporting a task robot which needs to be positioned precisely. The main difficulty residing in the precise control of a mobile robot supporting a task robot is providing an accurate and stable base for the task robot. That is, th
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 周末探險(xiǎn)話題作文13篇
- 2025安徽蕪湖經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)招聘中學(xué)非編教師55人模擬試卷及1套完整答案詳解
- 2025年寧波前灣新區(qū)衛(wèi)生系統(tǒng)事業(yè)單位招聘高層次人才11人模擬試卷及一套參考答案詳解
- 2025屆廣西港北區(qū)高三下學(xué)期綜合測(cè)試(一)英語(yǔ)試題(解析版)
- 心靈深處的秘密抒情故事8篇
- 2025年福建省福州市少年兒童圖書館招聘3人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解一套
- 內(nèi)蒙古西四旗2023-2024學(xué)年高一下學(xué)期期末地理試卷 (解析版)
- 傳統(tǒng)服裝設(shè)計(jì)及傳承承諾函8篇范文
- 2025湖北沙市區(qū)面向城市社區(qū)黨組織書記專項(xiàng)招聘事業(yè)崗位人員10人模擬試卷及答案詳解(歷年真題)
- 2025廣西河池市招聘緊缺學(xué)科教師118人考前自測(cè)高頻考點(diǎn)模擬試題及完整答案詳解1套
- 交通運(yùn)輸行政執(zhí)法知識(shí)試卷及答案解析
- 2025年大學(xué)英語(yǔ)四級(jí)考試題及答案
- 執(zhí)業(yè)藥師(藥學(xué))題庫(kù)答案分析2024
- 豬飼料培訓(xùn)課件
- 多耐病人的隔離措施及護(hù)理
- 亞健康管理培訓(xùn)
- 煤礦純水站管理制度
- 四肢癱瘓的康復(fù)護(hù)理講課件
- 超市各部門員工崗位職責(zé)
- JG/T 3064-1999鋼纖維混凝土
- 安徽省第十三屆全省水利行業(yè)職業(yè)技能大賽(水土保持治理工)備賽試題庫(kù)(含答案)
評(píng)論
0/150
提交評(píng)論