【《機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的介紹概述》2000字】_第1頁(yè)
【《機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的介紹概述》2000字】_第2頁(yè)
【《機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的介紹概述》2000字】_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的介紹概述在過(guò)去的幾年里,智能算法[15]一直是研究的熱點(diǎn)課題。包括機(jī)器學(xué)習(xí)[16]、深度學(xué)習(xí)[17]在內(nèi)都涌現(xiàn)出了很多新的算法模型,出現(xiàn)在不計(jì)其數(shù)的科研論文里。智能算法的定義如下:努力將人類(lèi)完成的智力任務(wù)自動(dòng)化。因此,智能算法是一個(gè)綜合性的領(lǐng)域,不僅包括機(jī)器學(xué)習(xí)和深度學(xué)習(xí),也包括其它不涉及學(xué)習(xí)的方法。機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的關(guān)系如下圖1-1所示。機(jī)器學(xué)習(xí)只是智能算法的一個(gè)分支,而深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)的一個(gè)分支。圖1-1智能算法、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)智能算法誕生于20世紀(jì)50年代,早期的智能算法僅包含程序員編寫(xiě)的硬編碼規(guī)則,并不屬于機(jī)器學(xué)習(xí),這一方法被稱(chēng)為符號(hào)主義人工智能[18],流行于20世紀(jì)50年代至80年代末。雖然符號(hào)化的智能算法能解決定義明確的問(wèn)題如下棋等,但它不適用于解決更復(fù)雜、模糊的問(wèn)題比如語(yǔ)音識(shí)別、模型分類(lèi)等領(lǐng)域,于是出現(xiàn)了一種新的方法叫做機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)在20世紀(jì)90年代開(kāi)始蓬勃發(fā)展迅速成為智能算法中最受歡迎的領(lǐng)域。機(jī)器學(xué)習(xí)系統(tǒng)是訓(xùn)練出來(lái)的,而不是用程序編寫(xiě)出來(lái)的。將計(jì)算機(jī)從數(shù)據(jù)經(jīng)驗(yàn)中學(xué)習(xí)并形成規(guī)則的過(guò)程就稱(chēng)作機(jī)器學(xué)習(xí)。具體思想為:用數(shù)據(jù)點(diǎn)的形式向計(jì)算機(jī)提供知識(shí),數(shù)據(jù)點(diǎn)的屬性就是特征,將特征數(shù)據(jù)輸入到機(jī)器學(xué)習(xí)模型中,就能讓計(jì)算機(jī)通過(guò)學(xué)習(xí)到的規(guī)則實(shí)現(xiàn)某種功能。通俗的說(shuō),機(jī)器學(xué)習(xí)是一種根據(jù)經(jīng)驗(yàn)來(lái)進(jìn)行決策的一種智能算法,將輸入數(shù)據(jù)轉(zhuǎn)換成有意義的輸出。圖1-2機(jī)器學(xué)習(xí):一種新的編程方式機(jī)器學(xué)習(xí)的過(guò)程分為以下幾個(gè)部分:定義問(wèn)題、采集數(shù)據(jù)。數(shù)據(jù)分割:將采集到的數(shù)據(jù)進(jìn)行轉(zhuǎn)換或預(yù)處理作為特征數(shù)據(jù),并分割為訓(xùn)練集、驗(yàn)證集和測(cè)試集,使用訓(xùn)練集數(shù)據(jù)來(lái)訓(xùn)練模型,使用驗(yàn)證集來(lái)評(píng)估模型,一旦找到了最佳參數(shù)就可以通過(guò)測(cè)試集來(lái)使用模型進(jìn)行測(cè)試。見(jiàn)圖1-3。圖1-3數(shù)據(jù)分割算法選擇:算法選擇依賴(lài)于解決具體問(wèn)題需要,包括分類(lèi)、回歸。分類(lèi)算法包括:決策樹(shù)(DecisionTree,DT)[19]、支持向量機(jī)(SupportVectorMachine,SVM)[20]、聚類(lèi)算法(ClusteringAlgorithm,CA)[21]等?;貧w算法包括:主成分分析(PrincipalComponentAnalysis,PCA)[22]、線性回歸、核回歸等,也有既能解決分類(lèi)又能解決回歸的模型:BP神經(jīng)網(wǎng)絡(luò)[23]。算法訓(xùn)練:在訓(xùn)練集上訓(xùn)練,大多數(shù)算法的權(quán)值在訓(xùn)練開(kāi)始都是隨機(jī)分配的,并在每次迭代中加以改進(jìn)。算法訓(xùn)練過(guò)程中,在訓(xùn)練集數(shù)據(jù)上多次運(yùn)行以產(chǎn)生結(jié)果,最后生成模型。模型使用:使用測(cè)試集數(shù)據(jù)輸出預(yù)測(cè)結(jié)果,并完成模型評(píng)估。在機(jī)器學(xué)習(xí)中,任何模型想要獲得滿意的結(jié)果都需要良好的數(shù)據(jù)特征為基礎(chǔ)。特征對(duì)于提高模型的預(yù)測(cè)能力非常重要。由于特征可能會(huì)存在許多問(wèn)題,比如缺失值、離群值、錯(cuò)誤數(shù)據(jù)等,絕大多數(shù)情況下不能獲取到理想的特征數(shù)據(jù)。在訓(xùn)練模型之前,必須對(duì)數(shù)據(jù)進(jìn)行清理、變換并找到正確的特征集。特征提取是通過(guò)現(xiàn)有特征集進(jìn)行一些變換來(lái)選擇新特征以除去冗余的過(guò)程。在原始數(shù)據(jù)中可能會(huì)存在很多的特征。進(jìn)行特征提取的優(yōu)點(diǎn)在于減少了訓(xùn)練維數(shù)。機(jī)器學(xué)習(xí)能夠適應(yīng)各種數(shù)據(jù)量,特別是數(shù)據(jù)量比較小的場(chǎng)合,但對(duì)于大數(shù)據(jù)就效果不突出,并且近年來(lái)隨著硬件的提升、數(shù)據(jù)規(guī)模的急速增長(zhǎng)、算法的不斷改進(jìn),深度學(xué)習(xí)被提出。深度學(xué)習(xí)在2006年首次提出,在過(guò)去的十年里大放異彩,隨著matlab中DeepLearningToolbox框架的不斷完善、python語(yǔ)言中Theano和Tensorflow框架的開(kāi)發(fā)也使得深度學(xué)習(xí)的大眾化。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支領(lǐng)域,它是從數(shù)據(jù)中學(xué)習(xí)表示的一種新方法,強(qiáng)調(diào)從連續(xù)的層中進(jìn)行學(xué)習(xí)。深度學(xué)習(xí)中“深度”指的是一系列連續(xù)的表示層,模型中層的個(gè)數(shù)被稱(chēng)作模型的深度。深度學(xué)習(xí)的核心技巧是使用優(yōu)化器微調(diào)預(yù)測(cè)值與真實(shí)目標(biāo)值的誤差,從而調(diào)整權(quán)值,以降低當(dāng)前示例對(duì)應(yīng)的損失值,實(shí)現(xiàn)反向傳播算法。見(jiàn)圖1-4。圖1-4中的優(yōu)化器可以控制超參數(shù)例如學(xué)習(xí)率、迭代次數(shù)、批處理大小、訓(xùn)練算法、隱含層單元數(shù)、動(dòng)量、正則化項(xiàng),這些超參數(shù)控制了權(quán)值。對(duì)于深度學(xué)習(xí),是不需要特征工程的,因?yàn)樯疃壬窠?jīng)網(wǎng)絡(luò)能夠從原始數(shù)據(jù)自動(dòng)地提取特征,并且深度學(xué)習(xí)模型自主學(xué)習(xí)特征的能力依賴(lài)于大量的訓(xùn)練數(shù)據(jù),如果只有少量的樣本,學(xué)習(xí)特征的能力就會(huì)不足,導(dǎo)致模型不能正常使用。這個(gè)和機(jī)器學(xué)習(xí)截然相反,機(jī)器學(xué)習(xí)對(duì)樣本的數(shù)目不宜過(guò)多,否則會(huì)造成大量的特征數(shù)據(jù)計(jì)算的時(shí)間和內(nèi)存,從而訓(xùn)練模型變得緩慢。所以說(shuō),數(shù)據(jù)規(guī)模的急速增長(zhǎng)的同時(shí),也促進(jìn)了深度學(xué)習(xí)的發(fā)展。圖1-4深度學(xué)習(xí)工作原理深度學(xué)習(xí)相比較機(jī)器學(xué)習(xí)在很多問(wèn)題上都表現(xiàn)出更好的性能。它增加了模型的深度,還將特征提取完全自動(dòng)化,不需要人工手動(dòng)選擇特征指標(biāo)來(lái)提取特征。利用深度學(xué)習(xí)可以一次性學(xué)習(xí)完所有的特征,這極大的簡(jiǎn)化了機(jī)器學(xué)習(xí)的工作流程,將一個(gè)復(fù)雜的多階段的流程變成一個(gè)簡(jiǎn)單的、端到端的深度學(xué)習(xí)模型。深度學(xué)習(xí)的突破在于模型可以在同時(shí)間共同學(xué)習(xí)所有表示層,而不是逐層依次學(xué)習(xí),一旦內(nèi)部特征被修改,所有依賴(lài)于這個(gè)特征的其它特征都會(huì)自動(dòng)調(diào)節(jié)適應(yīng),不需要人工干預(yù),一切都由單一反饋信號(hào)來(lái)監(jiān)督。這比機(jī)器學(xué)習(xí)淺層模型更加強(qiáng)大,因?yàn)樗梢酝ㄟ^(guò)將復(fù)雜、抽象的表達(dá)拆解成很多個(gè)中間層來(lái)學(xué)習(xí)這些表達(dá),每個(gè)中間層僅僅是前一個(gè)空間的簡(jiǎn)單變換。常用的深度學(xué)習(xí)算法模型有深度信念網(wǎng)絡(luò)(DeepBe

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論