




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
機(jī)器學(xué)習(xí)及其算法與應(yīng)用研究
夏天摘要:隨著智能化時(shí)代的到來,機(jī)器學(xué)習(xí)已成為一個(gè)熱門的研究領(lǐng)域。作為人工智能的核心技術(shù),機(jī)器學(xué)習(xí)涉及包括統(tǒng)計(jì)學(xué),概率論,算法復(fù)雜度等多個(gè)學(xué)科,以研究如何模仿和學(xué)習(xí)人類行為,通過機(jī)器的自我學(xué)習(xí)從而獲得整體的性能,甚至新知識(shí)、技能的自行優(yōu)化和探索。機(jī)器學(xué)習(xí)的本質(zhì)是模型的建立和算法的研究,能通過經(jīng)驗(yàn)和大量的學(xué)習(xí)樣本自動(dòng)優(yōu)化模型和算法標(biāo)準(zhǔn),不斷貼合實(shí)際發(fā)展,因此當(dāng)前主要應(yīng)用于智能機(jī)器人,數(shù)據(jù)挖掘,生物識(shí)別監(jiān)測(cè),推薦算法等領(lǐng)域關(guān)鍵詞:機(jī)器學(xué)習(xí)分類;算法相似性;應(yīng)用與發(fā)展1概述在經(jīng)典著作《機(jī)器學(xué)習(xí)》中對(duì)于該學(xué)科的認(rèn)知是"利用經(jīng)驗(yàn)改善系統(tǒng)自身的性能。"這種對(duì)經(jīng)驗(yàn)的運(yùn)用即人類的學(xué)習(xí)能力,通過工作的重復(fù)和疊加,形成系統(tǒng)性的模型,并在此基礎(chǔ)上持續(xù)優(yōu)化模型,使得后續(xù)工作執(zhí)行得更好。這種學(xué)習(xí)方式形成循環(huán)的反饋,促使系統(tǒng)獲得經(jīng)驗(yàn)并改進(jìn)性能。這樣的學(xué)習(xí)能力是否通過塑造模型和算法而搬遷至機(jī)器,也就是我們現(xiàn)在所說的計(jì)算機(jī)中?這便是機(jī)器學(xué)習(xí)的真正意義,而人工智能即是當(dāng)前研究的成果。機(jī)器學(xué)習(xí)的研究需要以神經(jīng)網(wǎng)絡(luò),統(tǒng)計(jì)分類等統(tǒng)計(jì)學(xué),生物學(xué)為基礎(chǔ),讓機(jī)器模擬人類學(xué)習(xí)過程。對(duì)此需要輸入巨量的數(shù)據(jù)和學(xué)習(xí)樣本以形成人類所知的“經(jīng)驗(yàn)",不斷重復(fù)拆分、回歸、聚合,最終得到元素間的關(guān)系并可依此形成類似經(jīng)歷的判斷和預(yù)測(cè)。因此也應(yīng)用于數(shù)據(jù)挖掘,大數(shù)據(jù)處理等基于海量數(shù)據(jù)的預(yù)測(cè)。機(jī)器學(xué)習(xí)的本質(zhì)在于數(shù)據(jù)的整合歸納,模型的建立和算法的改進(jìn)。在整個(gè)學(xué)習(xí)過程中,最基本的條件是持續(xù)的外界反饋,以某種方式形成的外界信息源,運(yùn)用算法將獲取的外部信息加工成為“經(jīng)驗(yàn)”,并儲(chǔ)備在內(nèi)在的數(shù)據(jù)庫里。數(shù)據(jù)庫根據(jù)建立的原則和規(guī)律提供執(zhí)行的行動(dòng),而行動(dòng)過程中獲得的外界信息又成為了新的反饋來源,對(duì)下一次的行為提供新的指導(dǎo)信息。2機(jī)器學(xué)習(xí)研究方法當(dāng)前機(jī)器學(xué)習(xí)主要研究的問題包括四類:分類、回歸、聚類和規(guī)則抽取。2.1分類分類在機(jī)器學(xué)習(xí)中是基礎(chǔ)且重要的一步,通過指導(dǎo)性的學(xué)習(xí),告知每個(gè)數(shù)據(jù)樣本是歸屬于哪種類型,在這樣的訓(xùn)練下,機(jī)器掌握不同的分類函數(shù)/模型,當(dāng)有新的數(shù)據(jù)樣本出現(xiàn)時(shí),能判斷其類別并映射至相應(yīng)的類別中。2.2回歸指的是數(shù)學(xué)里的一種分析方式,研究一組隨機(jī)變量和另一組隨機(jī)變量之間的關(guān)系。最簡(jiǎn)單的一種回歸分析即為一元線性關(guān)系。機(jī)器學(xué)習(xí)研究的是標(biāo)識(shí)好的數(shù)據(jù)和已有的模型/函數(shù)之間的關(guān)系,能將新輸入未識(shí)別的樣本歸納到相關(guān)的模型中,因此,回歸的結(jié)果也是分類的一種依據(jù)或先提條件。但回歸與分類的不同在于回歸里研究的是實(shí)數(shù),而分類研究的是離散值。2.3聚類聚類的對(duì)象是沒有被標(biāo)注的數(shù)據(jù),只是雜亂的樣本,通過聚類對(duì)這些樣本進(jìn)行分類,這種分類是利用樣本間的關(guān)系。聚類的結(jié)果與分類不同的是,分類前已有分好的類別模型,但聚類出來的類別事先沒有被識(shí)別標(biāo)注,可將聚類的結(jié)果再次研究,創(chuàng)建新的分別和標(biāo)注。2.4規(guī)則抽取規(guī)則抽取是除了能識(shí)別新樣本的類別外,還對(duì)分析樣本間屬性的關(guān)系進(jìn)行統(tǒng)計(jì)分析。3機(jī)器學(xué)習(xí)的算法機(jī)器學(xué)習(xí)本質(zhì)研究的是算法,如何解決問題取決于算法的選擇。基于學(xué)習(xí)方法的算法分類為:3.1監(jiān)督學(xué)習(xí)通常運(yùn)用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,監(jiān)督學(xué)習(xí)利用已進(jìn)行標(biāo)注或分類的數(shù)據(jù),訓(xùn)練對(duì)這些數(shù)據(jù)的理解和關(guān)系,輸出這些關(guān)系的模型,使得能做新輸入的未標(biāo)示樣本進(jìn)行預(yù)測(cè)。監(jiān)督學(xué)習(xí)強(qiáng)依賴于輸入的已分類信息,因?yàn)楹罄m(xù)的預(yù)判都是依據(jù)此分類信息學(xué)習(xí)得到的結(jié)果。監(jiān)督學(xué)習(xí)通常用于分類和歸回問題的研究,且常用的模型為決策樹分析模型。3.2非監(jiān)督學(xué)習(xí)非監(jiān)督學(xué)習(xí)利用未標(biāo)注或分類的數(shù)據(jù)進(jìn)行訓(xùn)練,研究樣本的結(jié)構(gòu),輸出分類模型。其主要解決的問題的聚類和規(guī)則學(xué)習(xí)。通常使用的算法包括Apriori算法和k-means算法。3.3半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)利用的是已標(biāo)注或分類的數(shù)據(jù)和未標(biāo)示數(shù)據(jù)的混合數(shù)據(jù),既要學(xué)習(xí)屬之間的結(jié)構(gòu)關(guān)系,也要輸出分類模型進(jìn)行預(yù)測(cè)?;貧w和分類問題是主要研究對(duì)象,因其在三種學(xué)習(xí)中更為高效,在實(shí)際運(yùn)用中更為普遍。4機(jī)器學(xué)習(xí)實(shí)際應(yīng)用機(jī)器學(xué)習(xí)當(dāng)前仍是較為新型的智能方面的科學(xué)技術(shù),在計(jì)算機(jī),互聯(lián)網(wǎng)領(lǐng)域應(yīng)用較為廣泛。主要應(yīng)用的領(lǐng)域和實(shí)際操作有:1)人臉識(shí)別:在照片庫里識(shí)別出所有包含某一人的照片。該識(shí)別在手機(jī)、電腦等數(shù)碼產(chǎn)品中被普遍使用,作為管理工作。2)語音識(shí)別:同樣是一個(gè)生物識(shí)別的實(shí)踐案例,識(shí)別用戶的話語和含義,明確用戶需求,比如蘋果自帶的Siri系統(tǒng)。3)垃圾郵件識(shí)別:區(qū)分郵箱里收到的正常郵件和垃圾郵件。4)推薦系統(tǒng):根據(jù)用戶過往的操作習(xí)慣,購買記錄等個(gè)人行為數(shù)據(jù),識(shí)別真正吸引用戶并愿意為此付費(fèi)的類型和事物,并從該類別中挑選類似的事物,促進(jìn)用戶查閱,點(diǎn)擊,付費(fèi)等行為。5)股票交易:根據(jù)某只股票的所有價(jià)格波動(dòng)等歷史數(shù)據(jù),預(yù)測(cè)對(duì)該股票當(dāng)前的操作行為,例如持倉,減倉,拋出等。以上是較為主流的機(jī)器學(xué)習(xí)的實(shí)際使用領(lǐng)域。除此在數(shù)據(jù)挖掘,人工智能,規(guī)劃和問題解決等領(lǐng)域也有不同程度的使用。5機(jī)器學(xué)習(xí)未來與發(fā)展5.1非監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)目前還未是一門成熟的學(xué)科,其研究的成本昂貴,在訓(xùn)練中所需的已標(biāo)識(shí)數(shù)據(jù)是經(jīng)人工處理而成,且需由專家進(jìn)行,因此要獲得大量的標(biāo)識(shí)樣不僅成本高,且難度大。也因此非監(jiān)督學(xué)習(xí),針對(duì)從無標(biāo)注的數(shù)據(jù)中學(xué)習(xí)將成為未來研究重點(diǎn)方向。5.2模型尺寸上的優(yōu)化當(dāng)前普遍使用的模型,尤其是自然語音處理的模型,大小均超過500M。如何能在小設(shè)備,比如移動(dòng)設(shè)備上的使用是一種挑戰(zhàn)。移動(dòng)設(shè)備一般對(duì)于存量、大小、功耗等都有一定限制,而模型的過大則成為了一大制約因素。若未來能將機(jī)器學(xué)習(xí)技術(shù)廣泛應(yīng)用于移動(dòng)端,需通過兩方面的優(yōu)化來改善該未來:使用壓縮技術(shù)進(jìn)行模型壓縮,抑或改變算法以改變大小。5.3智能化發(fā)展將深度學(xué)習(xí)與知識(shí),邏輯等人類思維模式結(jié)合,推進(jìn)人工智能的發(fā)展,獲得如人類一般的學(xué)習(xí)能力。將知識(shí)與數(shù)據(jù)整合,提高模型訓(xùn)練的速度和精度,使得人工智能更加貼近人的思維和決策方式。5.4博弈機(jī)器學(xué)習(xí)當(dāng)前深度學(xué)習(xí)的主要運(yùn)用集中于認(rèn)知類識(shí)別,如圖像識(shí)別,生物識(shí)別等,均為靜態(tài)決策,假若進(jìn)行更深一步的運(yùn)用,則是復(fù)雜和動(dòng)態(tài)決策。如股票預(yù)測(cè),需根據(jù)時(shí)間變化來不斷預(yù)測(cè)何時(shí)買入賣出,以及多種因素和變量會(huì)對(duì)決策產(chǎn)生影響。因此,未來的發(fā)展可延伸至研究復(fù)雜動(dòng)態(tài)性多因素之間的關(guān)系,根據(jù)觀察環(huán)境甚至周圍相似個(gè)體做出更為準(zhǔn)確的預(yù)測(cè)。6結(jié)論機(jī)器學(xué)習(xí)是基于神經(jīng)網(wǎng)絡(luò),研究人工智能的核心技術(shù),主要通過監(jiān)督學(xué)習(xí),來解決分類、回歸、聚類和規(guī)則抽取四類主要問題,目前主要應(yīng)用的領(lǐng)域有專家系統(tǒng),圖像,生物識(shí)別,通過模型,分類器的學(xué)習(xí),對(duì)新事物做出判斷。但目前機(jī)器學(xué)習(xí)主要解決的問題是認(rèn)知性問題,在實(shí)際生產(chǎn)中,因環(huán)境,動(dòng)態(tài)變化等制約,適用范
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水務(wù)行業(yè)面試題庫精 編:各類崗位實(shí)戰(zhàn)技巧與答案
- 天潤工業(yè)面試實(shí)戰(zhàn)題庫:制造業(yè)崗位職業(yè)技能提升
- 醫(yī)療圖像智能分析與診斷技術(shù)
- 2022年如何幫助缺乏學(xué)習(xí)動(dòng)力的孩子
- 知識(shí)題庫-電氣安全知識(shí)考試題目(附答案)
- 社團(tuán)活動(dòng)班會(huì)策劃與實(shí)施
- 網(wǎng)絡(luò)虛擬化與容器化
- 沙門氏菌醫(yī)院預(yù)防與控制
- 學(xué)校特色品牌匯報(bào)
- 行政效率與改革
- 2025至2030年中國互聯(lián)網(wǎng)數(shù)據(jù)中心應(yīng)用行業(yè)市場(chǎng)深度評(píng)估及投資戰(zhàn)略規(guī)劃報(bào)告
- 八師兵團(tuán)職工考試題庫及答案
- 2025臨時(shí)工合同協(xié)議書模板
- 2025年學(xué)習(xí)貫徹全國教育大會(huì)精神網(wǎng)絡(luò)培訓(xùn)考試答案
- 推拿學(xué)基礎(chǔ)題庫及答案
- 水利工程檔案驗(yàn)收項(xiàng)目法人自檢工作報(bào)告
- 工資管理課件
- 電商客服培訓(xùn) 課件
- 2025社區(qū)治理一表通應(yīng)用規(guī)范
- 中國古詩詞歌曲課件
- GB/T 26148-2025高壓水射流清洗作業(yè)安全規(guī)范
評(píng)論
0/150
提交評(píng)論