人工智能深度學(xué)習(xí)綜合實踐 課件 4.計算機視覺模型數(shù)據(jù)準(zhǔn)備-常見計算機視覺數(shù)據(jù)集及格式_第1頁
人工智能深度學(xué)習(xí)綜合實踐 課件 4.計算機視覺模型數(shù)據(jù)準(zhǔn)備-常見計算機視覺數(shù)據(jù)集及格式_第2頁
人工智能深度學(xué)習(xí)綜合實踐 課件 4.計算機視覺模型數(shù)據(jù)準(zhǔn)備-常見計算機視覺數(shù)據(jù)集及格式_第3頁
人工智能深度學(xué)習(xí)綜合實踐 課件 4.計算機視覺模型數(shù)據(jù)準(zhǔn)備-常見計算機視覺數(shù)據(jù)集及格式_第4頁
人工智能深度學(xué)習(xí)綜合實踐 課件 4.計算機視覺模型數(shù)據(jù)準(zhǔn)備-常見計算機視覺數(shù)據(jù)集及格式_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

計算機視覺模型數(shù)據(jù)準(zhǔn)備計算機視覺模型應(yīng)用項目目標(biāo)(1)了解常見的計算機視覺數(shù)據(jù)集及格式。(2)掌握圖像分類數(shù)據(jù)集加載的方法。(3)掌握圖像分類數(shù)據(jù)處理的方法。項目描述

本項目將介紹在人工智能交互式在線實訓(xùn)及算法校驗系統(tǒng)上使用垃圾分類數(shù)據(jù)集,查看數(shù)據(jù)集文件結(jié)構(gòu),并將數(shù)據(jù)集拆分為訓(xùn)練集和測試集。由于PaddleX的API極其適應(yīng)ImageNet格式的數(shù)據(jù)集,因此可以將數(shù)據(jù)集轉(zhuǎn)化為ImageNet格式,然后使用PaddleX定義數(shù)據(jù)預(yù)處理模塊,并使用PaddleX對數(shù)據(jù)集進行加載,用于后續(xù)模型的訓(xùn)練。準(zhǔn)備垃圾分類數(shù)據(jù)集的流程常見計算機視覺數(shù)據(jù)集及格式MNIST是機器學(xué)習(xí)入門的標(biāo)準(zhǔn)數(shù)據(jù)集,共10個類別,由來自250個不同人的0-9手寫數(shù)字構(gòu)成,測試集也是同樣比例的手寫數(shù)字?jǐn)?shù)據(jù)。包含了60,000張28x28的二值訓(xùn)練圖像,10,000張28x28的二值測試圖像。最早的深度卷積網(wǎng)絡(luò)LeNet便是針對MNIST數(shù)據(jù)集的,而且當(dāng)前主流深度學(xué)習(xí)框架幾乎無一例外將MNIST數(shù)據(jù)集的處理作為介紹及入門第一教程。1MNIST數(shù)據(jù)集▲MNIST數(shù)據(jù)集示例圖片?常見的計算機視覺數(shù)據(jù)集及格式CIFAR-10數(shù)據(jù)集的圖像具備以下特點。(2)圖像中有且只有一個主體目標(biāo)。(3)圖像中的主體目標(biāo)可能會被遮擋,但仍可被清晰辨識。(1)都是真實拍攝的圖像。常見計算機視覺數(shù)據(jù)集及格式ImageNet數(shù)據(jù)集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標(biāo)注和圖像中物體位置的標(biāo)注,具體信息及說明如下表:2ImageNet數(shù)據(jù)集信息說明數(shù)量Totalnumberofnon-emptysynsets數(shù)據(jù)集涵蓋類別21841Totalnumberofimages圖片的總數(shù)量14,197,122Numberofimageswithboundingboxannotations帶邊框批注的圖像數(shù)1,034,908NumberofsynsetswithSIFTfeatures具有SIFT(尺度不變性和光照不變性)特征的數(shù)據(jù)集數(shù)量1000NumberofimageswithSIFTfeatures具有SIFT(尺度不變性和光照不變性)特征的圖像數(shù)1,200,000常見計算機視覺數(shù)據(jù)集及格式ImageNet數(shù)據(jù)集目錄下包含多個文件夾,每個文件夾中的圖像均屬于同一個類別,文件夾的命名即為類別名。2ImageNet數(shù)據(jù)集▲ImageNet數(shù)據(jù)集示例圖片?文件描述train_list.txt訓(xùn)練集列表val_list.txt驗證集列表labels.txt類別標(biāo)簽列表常見計算機視覺數(shù)據(jù)集及格式COCO是一個大規(guī)模的對象識別、分割以及Captioning數(shù)據(jù)集。具有以下特點:3COCO數(shù)據(jù)集特點說明Objectsegmentation對象分割Recognitionincontext在上下文中可識別Superpixelstuffsegmentation超像素分割330Kimages(>200Klabeled)330K圖像(>200K標(biāo)記)1.5millionobjectinstances150萬個對象實例80objectcategories80個對象類別91stuffcategories91個類別5captionsperimage每張圖片5個字幕250,000peoplewithkeypoints有關(guān)鍵點的250,000人常見計算機視覺數(shù)據(jù)集及格式MSCOCO數(shù)據(jù)集將原圖片全部放在名為JPEGImages文件夾中,為了區(qū)分訓(xùn)練集和驗證集,使用不同的json表示數(shù)據(jù)的劃分,例如train.json和val.json。3COCO數(shù)據(jù)集▲COCO數(shù)據(jù)集示例圖片PASCAL人類動物鳥貓牛狗馬羊交通工具飛機自行車船公共汽車小轎車摩托車火車室內(nèi)瓶子椅子餐桌盆栽植物沙發(fā)電視常見計算機視覺數(shù)據(jù)集及格式PASCAL是一個用于模式分析和統(tǒng)計建模的數(shù)據(jù)集,包括圖像分類,目標(biāo)檢測,分割等任務(wù),是由PASCALVOC挑戰(zhàn)賽衍生出來的數(shù)據(jù)集。PASCALVOC2007之后的數(shù)據(jù)集包括以下20個類別。4PASCAL數(shù)據(jù)集常見計算機視覺數(shù)據(jù)集及格式數(shù)據(jù)集包括圖片的三種信息:原始圖片(JPEGImages文件夾),對象像素(SegmentationClass文件夾)和分類像素(SegmentationObject文件夾)。其中還有一個Annotations文件夾是圖片描述的xml文件。例如以下圖片,就會有相應(yīng)的xml文件描述該圖片,包括圖片的寬高、包含的Object的類別、坐標(biāo)等信息,同時還包括訓(xùn)練集列表train_list.txt,驗證集列表val_list.txt和類別標(biāo)簽列表labels.txt三個文件。▲PASCAL數(shù)據(jù)集示例圖片常見計算機視覺數(shù)據(jù)集及格式

PASCALVOC數(shù)據(jù)集的格式包括以下5個文件夾:注解(Annotation)圖像集(ImageSets)原始圖像(JPEGImages)分類像素(SegmentationObject)對象像素(SegmentationClass)常見計算機視覺數(shù)據(jù)集及格式(1)注解文件夾,用于存放XML格式的標(biāo)簽文件,每一個XML文件都對應(yīng)原始圖像文件夾中的一個圖像。(2)圖像集文件夾,用于存放分類和檢測的數(shù)據(jù)集分割文件。(3)原始圖像文件夾,用于存放原始圖像,主要用來進行訓(xùn)練和測試驗證。(4)分類像素文件夾,用于存放原始圖像實例分割的圖像。(5)對象像素文件夾,用于存放原始圖像語義分割的圖像。常見計算機視覺數(shù)據(jù)集及格式5CIFAR-10、CIFAR-100數(shù)據(jù)集MNIST數(shù)據(jù)集cifar-10數(shù)據(jù)集只是灰度圖像類別少,只是手寫數(shù)字并非真實數(shù)據(jù),沒有真實數(shù)據(jù)的局部統(tǒng)計特性都是真實圖片而不是手稿等圖中只有一個主體目標(biāo)可以有部分遮擋,但是必須可辨識常見計算機視覺數(shù)據(jù)集及格式cifar-100數(shù)據(jù)集包含100小類,每小類包含600個圖像,其中有500個訓(xùn)練圖像和100個測試圖像。與cifar-10不同的是,100類被分組為20個大類,而每一個大類,又可以細分為子類,所以每個圖像帶有1個小類的“fine”標(biāo)簽和1個大類“coarse”標(biāo)簽?!鳦IFAR-10數(shù)據(jù)集示例圖片?PaddleX介紹

PaddleX是PaddlePaddle深度學(xué)習(xí)全流程開發(fā)工具,集PaddlePaddle核心框架、模型庫、工具及組件等深度學(xué)習(xí)開發(fā)所需全部功能于一體,具備深度學(xué)習(xí)開發(fā)流程全打通、融合產(chǎn)業(yè)實踐、易用易集成三大特點。

PaddleX同時提供簡明易懂的PythonAPI,開發(fā)者可根據(jù)實際生產(chǎn)需求選擇相應(yīng)的開發(fā)方式,以獲得PaddlePaddle全流程開發(fā)的最佳體驗。PaddleX的圖像分類數(shù)據(jù)集的加載方法使用paddlex.datasets.ImageNet()函數(shù)加載數(shù)據(jù)集使用paddlex.datasets.VOCDetection()函數(shù)加載數(shù)據(jù)集使用paddlex.datasets.CocoDetection()函數(shù)加載數(shù)據(jù)集PaddleX的圖像分類數(shù)據(jù)處理函數(shù)RandomCrop()函數(shù)RandomHorizontalFlip()函數(shù)RandomDistort()函數(shù)Normalize()函數(shù)其他數(shù)據(jù)處理函數(shù)拆分和驗證垃圾分類數(shù)據(jù)集實施思路01查看數(shù)據(jù)集02拆分?jǐn)?shù)據(jù)集03驗證數(shù)據(jù)集04加載數(shù)據(jù)集實施步驟步驟1:查看數(shù)據(jù)集本項目采用的垃圾分類數(shù)據(jù)集位于人工智能交互式在線實訓(xùn)及算法校驗系統(tǒng)中的data目錄下,單擊進入該目錄下的“garbage”文件夾中即可找到對應(yīng)的數(shù)據(jù)集文件。垃圾分類數(shù)據(jù)集實施步驟查看完數(shù)據(jù)集后,可以通過代碼查看數(shù)據(jù)集圖像。顯示抽取的圖像實施步驟步驟2:拆分?jǐn)?shù)據(jù)集將數(shù)據(jù)集拆分為訓(xùn)練集和測試集,分別對應(yīng)寫入“train.txt”和“val.txt”兩個文檔,并創(chuàng)建“l(fā)abels.txt”文檔用來寫入標(biāo)簽。這個操作實質(zhì)上是將數(shù)據(jù)集轉(zhuǎn)化為ImageNet格式,方便后續(xù)使用PaddleX進行數(shù)據(jù)加載。步驟3:驗證數(shù)據(jù)集將數(shù)據(jù)集拆分為訓(xùn)練集和測試集后,需要驗證拆分后的數(shù)據(jù)集和原數(shù)據(jù)集數(shù)量是否一致。根據(jù)前面的計算可得到原數(shù)據(jù)集的數(shù)量,再計算拆分后訓(xùn)練集和測試集的數(shù)量,若數(shù)量一致,則拆分后的數(shù)據(jù)集與原數(shù)據(jù)集數(shù)量無誤。實施步驟步驟4:加載數(shù)據(jù)集在知識準(zhǔn)備部分已經(jīng)了解了如何使用PaddleX加載ImageNet格式的數(shù)據(jù)集,現(xiàn)在需要先定義數(shù)據(jù)預(yù)處理模塊。通過調(diào)用PaddleX中用于加載ImageNet格式的數(shù)據(jù)集的函數(shù)并配置相關(guān)參數(shù),來將拆分好的數(shù)據(jù)集加載到指定的變量中。知識拓展

PaddleX目前支持常見的計算機視覺數(shù)據(jù)集格式和EasyData數(shù)據(jù)標(biāo)注平臺的標(biāo)注數(shù)據(jù)格式,并支持Labe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論