斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程.doc_第1頁(yè)
斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程.doc_第2頁(yè)
斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程.doc_第3頁(yè)
斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程.doc_第4頁(yè)
斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程.doc_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

斯坦福大學(xué)公開(kāi)課:機(jī)器學(xué)習(xí)課程 隨著“智能制造”概念的普及,人工智能技術(shù)的研究與應(yīng)用變的越來(lái)越被人們關(guān)注。人工智能在制造中的運(yùn)用已經(jīng)成為實(shí)現(xiàn)制造的知識(shí)化、自動(dòng)化、柔性化以實(shí)現(xiàn)對(duì)市場(chǎng)的快速響應(yīng)的關(guān)鍵。機(jī)器學(xué)習(xí)無(wú)疑是最有希望實(shí)現(xiàn)這個(gè)“智能”的研究方向之一。斯坦福大學(xué)的“StanfordEngineeringEverywhere”學(xué)校里最受歡迎的工科課程給全世界的學(xué)生和教育工作者。得益于這個(gè)項(xiàng)目,我們有機(jī)會(huì)和全世界站在同一個(gè)數(shù)量級(jí)的知識(shí)起跑線上。 課程共20集,網(wǎng)易公開(kāi)課已經(jīng)全部翻譯完成。講師:AndrewNg。 第1集機(jī)器學(xué)習(xí)的動(dòng)機(jī)與應(yīng)用 簡(jiǎn)介:機(jī)器學(xué)習(xí)的動(dòng)機(jī)與應(yīng)用、Logistic類、機(jī)器學(xué)習(xí)的定義、監(jiān)督學(xué)習(xí)概觀、學(xué)習(xí)理論概述、非監(jiān)督學(xué)習(xí)概述和強(qiáng)化學(xué)習(xí)概述。 第2集監(jiān)督學(xué)習(xí)應(yīng)用 簡(jiǎn)介:監(jiān)督學(xué)習(xí)應(yīng)用自主推導(dǎo),ALVINN系統(tǒng),線性回歸,梯度下降,組梯度下降,隨機(jī)梯度下降,標(biāo)準(zhǔn)方程推導(dǎo)。 第3集欠擬合與過(guò)擬合的概念 簡(jiǎn)介:欠擬合與過(guò)擬合的概念,參數(shù)化及非參數(shù)化算法概念,局部加權(quán)回歸,對(duì)于線性模型的概率解釋,Logistic回歸,感知器。 第4集牛頓方法 簡(jiǎn)介:介紹了牛頓方法,可以代替梯度上升算法用來(lái)計(jì)算函數(shù)的最大值;之后以高斯分布和伯努利分布為例介紹了指數(shù)分布函數(shù)族;最后以指數(shù)分布函數(shù)族為基礎(chǔ),引出了廣義線性模型,可以通過(guò)指定概率分布直接推導(dǎo)出模型。 第5集生成學(xué)習(xí)算法 簡(jiǎn)介:一類新的學(xué)習(xí)算法生成學(xué)習(xí)算法,并詳細(xì)地講解了該算法的一個(gè)例子:高斯判別分析;之后對(duì)生成學(xué)習(xí)算法與之前的判別學(xué)習(xí)算法進(jìn)行了對(duì)比;最后介紹了一個(gè)適合對(duì)文本進(jìn)行分類的算法樸素貝葉斯算法,并結(jié)合該算法講述了一種常用的平滑技術(shù)Laplace平滑。 第6集樸素貝葉斯算法 簡(jiǎn)介:先介紹了兩種樸素貝葉斯算法的事件模型;之后介紹了神經(jīng)網(wǎng)絡(luò)算法;在最后介紹了兩個(gè)重要的概念:函數(shù)間隔和幾何間隔?;谶@兩個(gè)概念提出了一個(gè)線性分類算法:最大間隔分類器算法。該算法用于引出一個(gè)非常重要的非線性分類算法:支持向量機(jī)。 第7集最優(yōu)間隔分類器問(wèn)題 簡(jiǎn)介:首先提出了原始的優(yōu)化問(wèn)題:最優(yōu)間隔分類器問(wèn)題;之后介紹了對(duì)偶問(wèn)題的概念和KKT條件;基于原始優(yōu)化問(wèn)題的對(duì)偶問(wèn)題的分析,介紹了SVM算法;最后對(duì)SVM算法進(jìn)行了評(píng)價(jià),以引出下節(jié)課對(duì)核方法的介紹。 第8集順序最小優(yōu)化算法 簡(jiǎn)介:核的概念它在SVM以及許多學(xué)習(xí)算法中都有重要的應(yīng)用;之后介紹了l1norm軟間隔SVM它是一種SVM的變化形式,可以處理非線性可分隔的數(shù)據(jù);最后介紹了SMO算法一種高效的可以解決SVM優(yōu)化問(wèn)題的算法。 第9集經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化 簡(jiǎn)介:主要介紹了模型選擇中的一種常見(jiàn)現(xiàn)象偏差方差權(quán)衡。為了解釋該概念,首先介紹了兩個(gè)重要的引理聯(lián)合界引理和Hoeffding不等式;之后定義了兩個(gè)重要的概念訓(xùn)練誤差和一般誤差,并提出了一種簡(jiǎn)化的機(jī)器學(xué)習(xí)算法模型經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(ERM);最后基于這些概念對(duì)ERM結(jié)果的理論上界進(jìn)行了證明,并基于上界分析對(duì)偏差方差權(quán)衡進(jìn)行了解釋。 第10集特征選擇 簡(jiǎn)介:VC維的概念該概念能夠?qū)㈥P(guān)于ERM一般誤差的界的結(jié)論推廣到無(wú)限假設(shè)類的情形;模型選擇問(wèn)題具體介紹了交叉驗(yàn)證方法以及幾種變形;特征選擇問(wèn)題具體介紹了兩類方法:封裝特征選擇和過(guò)濾特征選擇。 第11集貝葉斯統(tǒng)計(jì)正則化 簡(jiǎn)介:貝葉斯統(tǒng)計(jì)和規(guī)范化;簡(jiǎn)單介紹了在線學(xué)習(xí)的概念;機(jī)器學(xué)習(xí)算法設(shè)計(jì)中的問(wèn)題診斷技巧;兩種分析技巧:誤差分析與銷蝕分析;兩種應(yīng)用機(jī)器學(xué)習(xí)算法的方式與適用場(chǎng)景。 第12集K-means算法 簡(jiǎn)介:無(wú)監(jiān)督學(xué)習(xí)的內(nèi)容。首先介紹了k-means聚類算法;混合高斯模型,它是最大期望算法(EM)的一種特例;引入了Jesen不等式,利用Jesen不等式引出了EM算法的一般形式。 第13集高斯混合模型 簡(jiǎn)介:對(duì)混合高斯模型在EM算法下的結(jié)論進(jìn)行了推導(dǎo),并且介紹了EM算法在混合貝葉斯模型中的應(yīng)用。最后介紹了因子分析算法。該算法可以進(jìn)行高維數(shù)據(jù)下樣本數(shù)目較少的情況下的模型擬合。 第14集主成分分析法 簡(jiǎn)介:本講繼續(xù)上一講的內(nèi)容,詳細(xì)地講解了因子分析問(wèn)題對(duì)應(yīng)的EM算法的步驟推導(dǎo)過(guò)程,并重點(diǎn)提出了其中應(yīng)該注意的問(wèn)題。之后介紹了主成分分析(PCA)的算法原理和主要應(yīng)用。該算法是一種常用的降低數(shù)據(jù)維度的算法。 第15集奇異值分解 簡(jiǎn)介:主成分分析PCA,及舉出利用PCA找出相似文檔的例子;SVD(奇異值分析);無(wú)監(jiān)督算法和因子分析;ICA(獨(dú)立成分分析算法)和CDF(累積分布函數(shù)),并復(fù)習(xí)了高斯分布的知識(shí);最后舉了幾個(gè)應(yīng)用ICA的例子。 第16集馬爾可夫決策過(guò)程 簡(jiǎn)介:主要介紹了監(jiān)督學(xué)習(xí);然后引出強(qiáng)化學(xué)習(xí)的知識(shí),用“使直升機(jī)飛翔”的例子闡述強(qiáng)化學(xué)習(xí);介紹了馬氏決策過(guò)程(MDP),由此引出來(lái)的兩個(gè)解決最優(yōu)策略和最優(yōu)回報(bào)的算法;最后重點(diǎn)介紹了“值迭代”和“策略迭代算法”的實(shí)施,以及比較了它們的優(yōu)缺點(diǎn)。 第17集離散與維數(shù)災(zāi)難 簡(jiǎn)介:繼續(xù)馬氏決策過(guò)程(MDP),以及解決狀態(tài)MDP的算法,主要詳細(xì)介紹了擬合值迭代算法(fittedvalueiteration)和近似政策迭代(approximatepolicyiteration)這兩種算法,并通過(guò)具體的例子和求解的方式來(lái)說(shuō)明這兩種算法。 第18集線性二次型調(diào)節(jié)控制 簡(jiǎn)介:控制NVP算法,非線性動(dòng)力學(xué)系統(tǒng);在動(dòng)力系統(tǒng)的模型和線性二次型調(diào)節(jié)控制(linearquadraticregulationcontrol),導(dǎo)出一些處理情況的函數(shù);還包含線性模型的建立,非線性模型的線性化的知識(shí)。 第19集微分動(dòng)態(tài)規(guī)劃 簡(jiǎn)介:強(qiáng)化學(xué)習(xí)算法,引入調(diào)試強(qiáng)化學(xué)習(xí)算法,介紹Kalman濾波器微分動(dòng)態(tài)規(guī)劃,卡爾曼濾波與LQR控制結(jié)合的一種算法(LQG控制算法,線性二次高斯),并比較了高斯分布和卡爾曼濾波的效率問(wèn)題。 第20集策略搜索 簡(jiǎn)介:學(xué)習(xí)和復(fù)習(xí)了強(qiáng)化學(xué)習(xí)算法,講述了一些POMDPs(部分可觀察馬氏決策過(guò)程)的知識(shí),完全可觀察MDP的知識(shí);接下來(lái)介紹了策略搜索算法(其中包括兩種算法:Reinforced和Pegasus);最后,介紹了與這門課程相關(guān)的一些課程,并給學(xué)生提出一些希望。 名詞解釋 機(jī)器學(xué)習(xí)(MachineLearning,ML)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析和算法復(fù)雜度理論等多門學(xué)科。專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。 機(jī)器學(xué)習(xí)是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,主要使用歸納、綜合而不是演繹。 一、研究意義 顧名思義,機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類學(xué)習(xí)活動(dòng)的一門學(xué)科。更為嚴(yán)格的提法是:機(jī)器學(xué)習(xí)是一門研究機(jī)器獲取新知識(shí)和新技能,并識(shí)別現(xiàn)有知識(shí)的學(xué)問(wèn)。這里所說(shuō)的“機(jī)器”,指的就是計(jì)算機(jī),電子計(jì)算機(jī),中子計(jì)算機(jī)、光子計(jì)算機(jī)或神經(jīng)計(jì)算機(jī)等。 機(jī)器學(xué)習(xí)有下面幾種定義:“機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對(duì)象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能”?!皺C(jī)器學(xué)習(xí)是對(duì)能通過(guò)經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究”。“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。”一種經(jīng)常引用的英文定義是:AputerprogramissaidtolearnfromexperienceEwithrespecttosomeclassoftasksTandperformancemeasureP,ifitsperformanceattasksinT,asmeasuredbyP,improveswithexperienceE. 學(xué)習(xí)是人類具有的一種重要智能行為,但究竟什么是學(xué)習(xí),長(zhǎng)期以來(lái)卻眾說(shuō)紛紜。社會(huì)學(xué)家、邏輯學(xué)家和心理學(xué)家都各有其不同的看法。 機(jī)器能否像人類一樣能具有學(xué)習(xí)能力呢?1959年美國(guó)的塞繆爾(Samuel)設(shè)計(jì)了一個(gè)下棋程序,這個(gè)程序具有學(xué)習(xí)能力,它可以在不斷的對(duì)弈中改善自己的棋藝。4年后,這個(gè)程序戰(zhàn)勝了設(shè)計(jì)者本人。又過(guò)了3年,這個(gè)程序戰(zhàn)勝了美國(guó)一個(gè)保持8年之久的常勝不敗的冠軍。這個(gè)程序向人們展示了機(jī)器學(xué)習(xí)的能力,提出了許多令人深思的社會(huì)問(wèn)題與哲學(xué)問(wèn)題。 機(jī)器的能力是否能超過(guò)人的,很多持否定意見(jiàn)的人的一個(gè)主要論據(jù)是:機(jī)器是人造的,其性能和動(dòng)作完全是由設(shè)計(jì)者規(guī)定的,因此無(wú)論如何其能力也不會(huì)超過(guò)設(shè)計(jì)者本人。這種意見(jiàn)對(duì)不具備學(xué)習(xí)能力的機(jī)器來(lái)說(shuō)的確是對(duì)的,可是對(duì)具備學(xué)習(xí)能力的機(jī)器就值得考慮了,因?yàn)檫@種機(jī)器的能力在應(yīng)用中不斷地提高,過(guò)一段時(shí)間之后,設(shè)計(jì)者本人也不知它的能力到了何種水平。 二、主要策略 學(xué)習(xí)是一項(xiàng)復(fù)雜的智能活動(dòng),學(xué)習(xí)過(guò)程與推理過(guò)程是緊密相連的。按照學(xué)習(xí)中使用推理的多少,機(jī)器學(xué)習(xí)所采用的策略大體上可分為4

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論