人工智能應(yīng)用 課件全套 黃源 項(xiàng)目1-9 認(rèn)識(shí)人工智能-人工智能的應(yīng)用_第1頁
人工智能應(yīng)用 課件全套 黃源 項(xiàng)目1-9 認(rèn)識(shí)人工智能-人工智能的應(yīng)用_第2頁
人工智能應(yīng)用 課件全套 黃源 項(xiàng)目1-9 認(rèn)識(shí)人工智能-人工智能的應(yīng)用_第3頁
人工智能應(yīng)用 課件全套 黃源 項(xiàng)目1-9 認(rèn)識(shí)人工智能-人工智能的應(yīng)用_第4頁
人工智能應(yīng)用 課件全套 黃源 項(xiàng)目1-9 認(rèn)識(shí)人工智能-人工智能的應(yīng)用_第5頁
已閱讀5頁,還剩218頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類項(xiàng)目1認(rèn)識(shí)人工智能通過對本項(xiàng)目的學(xué)習(xí),了解人工智能的概念,認(rèn)識(shí)人工智能的學(xué)派,理解人工智能的發(fā)展趨勢和倫理,熟悉Python程序的書寫。了解人工智能的概念理解人工智能的學(xué)派理解人工智能的發(fā)展趨勢理解人工智能的倫理熟悉Python程序的書寫人工智能是研究使計(jì)算機(jī)來模擬人的某些思維過程和智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃等)的學(xué)科,主要包括計(jì)算機(jī)實(shí)現(xiàn)智能的原理、制造類似于人腦智能的計(jì)算機(jī),使計(jì)算機(jī)能實(shí)現(xiàn)更高層次的應(yīng)用。1.1人工智能簡介人工智能可分為三類:弱人工智能、強(qiáng)人工智能與超人工智能。弱人工智能就是利用現(xiàn)有智能化技術(shù),來改善我們經(jīng)濟(jì)社會(huì)發(fā)展所需要的一些技術(shù)條件和發(fā)展功能,也指單一做一項(xiàng)任務(wù)的智能。人工智能分類強(qiáng)人工智能強(qiáng)人工智能則是綜合的,它是指在各方面都能和人類比肩的人工智能,人類能干的腦力活它都能干,例如能干很多事情的機(jī)器人。超人工智能哲學(xué)家、牛津大學(xué)人類未來研究院院長尼克·波斯特洛姆(NickBostrom)把超人工智能(ArtificialSuperIntelligence,ASI)定義為“在幾乎所有領(lǐng)域都大大超過人類認(rèn)知表現(xiàn)的任何智力”。現(xiàn)階段所實(shí)現(xiàn)的人工智能大部分指的是弱人工智能,并且已經(jīng)被廣泛應(yīng)用。一般而言,限于弱人工智能在功能上的局限性,人們更愿意將弱人工智能看成是人類的工具,而不會(huì)將弱人工智能視成威脅。人工智能的起源人工智能的概念在20世紀(jì)五六十年代時(shí)正式提出,1950年,一位名叫馬文·明斯基(后被人稱為“人工智能之父”)的大四學(xué)生與他的同學(xué)鄧恩·埃德蒙一起,建造了世界上第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)。這也被看作是人工智能的一個(gè)起點(diǎn)。同樣是在1950年,被稱為“計(jì)算機(jī)之父”的阿蘭·圖靈提出了一個(gè)舉世矚目的想法——圖靈測試。圖靈測試人工智能的歷史2.人工智能的發(fā)展從20世紀(jì)60年代到80年代,人工智能經(jīng)歷了快速發(fā)展的階段。在這個(gè)時(shí)期,人們開始研究機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù),使得人工智能的應(yīng)用范圍不斷擴(kuò)大。1985年,機(jī)器學(xué)習(xí)領(lǐng)域的神經(jīng)網(wǎng)絡(luò)算法被發(fā)明,這一算法在語音識(shí)別、圖像識(shí)別等領(lǐng)域得到廣泛應(yīng)用。3.人工智能的低谷在20世紀(jì)90年代初期,人工智能經(jīng)歷了一次低谷期。由于當(dāng)時(shí)計(jì)算機(jī)計(jì)算能力較弱,加之?dāng)?shù)據(jù)集和算法方面的限制,導(dǎo)致人工智能的應(yīng)用受到限制。但是,在這個(gè)時(shí)期,人們開始研究支持向量機(jī)、隨機(jī)森林等新的機(jī)器學(xué)習(xí)算法,并且計(jì)算機(jī)計(jì)算能力不斷提升,這些因素為人工智能的復(fù)興奠定了基礎(chǔ)。4.人工智能的復(fù)興21世紀(jì)初,隨著大數(shù)據(jù)和云計(jì)算等技術(shù)的出現(xiàn),人工智能再次進(jìn)入了快速發(fā)展的階段。人們開始研究深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺等技術(shù),使得人工智能的應(yīng)用范圍更加廣泛。目前,人工智能已經(jīng)應(yīng)用于醫(yī)療、金融、交通等多個(gè)領(lǐng)域,并且在未來還有很大的發(fā)展空間。

人工智能的研究內(nèi)容人工智能的研究是高度技術(shù)性和專業(yè)的,各分支領(lǐng)域都是深入且各不相通的,因而涉及范圍極廣。人工智能學(xué)科研究的主要內(nèi)容包括:知識(shí)表示、認(rèn)知、自動(dòng)推理和搜索方法、機(jī)器學(xué)習(xí)和知識(shí)獲取、知識(shí)處理系統(tǒng)、自然語言理解、計(jì)算機(jī)視覺、智能機(jī)器人、自動(dòng)程序設(shè)計(jì)等方面。我國的人工智能發(fā)展現(xiàn)狀伴隨著人工智能研究熱潮,我國人工智能產(chǎn)業(yè)化應(yīng)用也蓬勃發(fā)展。智能產(chǎn)品和應(yīng)用大量涌現(xiàn),人工智能產(chǎn)品在醫(yī)療、商業(yè)、通信、城市管理等方面得到快速應(yīng)用。2017年7月5日,百度首次發(fā)布人工智能開放平臺(tái)的整體戰(zhàn)略、技術(shù)和解決方案。這也是百度AI技術(shù)首次整體亮相。其中,對話式人工智能系統(tǒng),可讓用戶以自然語言對話的交互方式,實(shí)現(xiàn)諸多功能;Apollo自動(dòng)駕駛技術(shù)平臺(tái),可幫助汽車行業(yè)及自動(dòng)駕駛領(lǐng)域的合作伙伴快速搭建一套屬于自己的完整的自動(dòng)駕駛系統(tǒng),是全球領(lǐng)先的自動(dòng)駕駛生態(tài)。2017年8月3日,騰訊公司正式發(fā)布了人工智能醫(yī)學(xué)影像產(chǎn)品——騰訊覓影。同時(shí),還宣布發(fā)起成立了人工智能醫(yī)學(xué)影像聯(lián)合實(shí)驗(yàn)室。2017年10月11日,阿里巴巴首席技術(shù)官張建鋒宣布成立全球研究院——達(dá)摩院。達(dá)摩院的成立,代表著阿里巴巴正式邁入全球人工智能等前沿科技的競爭行列。

此外,科大訊飛在智能語音技術(shù)上處于國際領(lǐng)先水平;依圖科技搭建了全球首個(gè)十億級人像對比系統(tǒng),在2017年美國國家標(biāo)準(zhǔn)與技術(shù)研究院組織的人臉識(shí)別技術(shù)測試中,成為第一個(gè)獲得冠軍的中國團(tuán)隊(duì)。人工智能研究的主要學(xué)派符號(hào)主義(Symbolism)是一種基于邏輯推理的智能模擬方法,又稱為邏輯主義(Logicism)、心理學(xué)派(Psychlogism)或計(jì)算機(jī)學(xué)派(Computerism),其原理主要為物理符號(hào)系統(tǒng)假設(shè)和有限合理性原理,長期以來,符號(hào)主義一直在人工智能中處于主導(dǎo)地位。連接主義連接主義(Connectionism)又稱為仿生學(xué)派(Bionicsism)或生理學(xué)派(Physiologism)。是一種基于神經(jīng)網(wǎng)絡(luò)及網(wǎng)絡(luò)間的連接機(jī)制與學(xué)習(xí)算法的智能模擬方法。其原理主要為神經(jīng)網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)間的連接機(jī)制和學(xué)習(xí)算法。這一學(xué)派認(rèn)為人工智能源于仿生學(xué),特別是人腦模型的研究。行為主義行為主義又稱進(jìn)化主義(Evolutionism)或控制論學(xué)派(Cyberneticsism),是一種基于“感知——行動(dòng)”的行為智能模擬方法。

行為主義最早來源于20世紀(jì)初的一個(gè)心理學(xué)流派,認(rèn)為行為是有機(jī)體用以適應(yīng)環(huán)境變化的各種身體反應(yīng)的組合,它的理論目標(biāo)在于預(yù)見和控制行為。人工智能的發(fā)展趨勢總的來說,未來人工智能的發(fā)展趨勢可能包括以下幾個(gè)方面:多模態(tài)智能技術(shù):結(jié)合多種感知模態(tài)和認(rèn)知模型,實(shí)現(xiàn)更加全面和智能的識(shí)別和分析。深度學(xué)習(xí)技術(shù)的進(jìn)一步發(fā)展:深度學(xué)習(xí)是人工智能領(lǐng)域的重要技術(shù)之一,未來可能會(huì)向更加高效和復(fù)雜的應(yīng)用方向發(fā)展。自主決策和自主控制:人工智能將逐漸實(shí)現(xiàn)自主決策和自主控制,例如在自動(dòng)駕駛、機(jī)器人等領(lǐng)域中的應(yīng)用??珙I(lǐng)域應(yīng)用:人工智能將在更多的領(lǐng)域得到應(yīng)用,例如醫(yī)療健康、金融、教育等。數(shù)據(jù)安全和隱私保護(hù):隨著人工智能應(yīng)用的普及,數(shù)據(jù)安全和隱私保護(hù)將成為需要關(guān)注的重要問題。更加智能化和個(gè)性化的用戶體驗(yàn):隨著技術(shù)的不斷進(jìn)步,人工智能將能夠提供更加智能化和個(gè)性化的用戶體驗(yàn)。新的商業(yè)模式和創(chuàng)新機(jī)會(huì):人工智能將創(chuàng)造新的商業(yè)模式和創(chuàng)新機(jī)會(huì),例如智能家居、智能醫(yī)療健康等領(lǐng)域。人工智能的三大核心目前,人工智能發(fā)展的可謂如火如荼。人工智能是利用機(jī)器學(xué)習(xí)和數(shù)據(jù)分析,對人的意識(shí)和思維過程進(jìn)行模擬、延伸和拓展,賦予機(jī)器類人的能力。其實(shí),人工智能是有三大核心要素的,那就是算法、算力、數(shù)據(jù)。數(shù)據(jù)實(shí)現(xiàn)人工智能的首要因素是數(shù)據(jù),數(shù)據(jù)是一切智慧物體的學(xué)習(xí)資源,沒有了數(shù)據(jù),任何智慧體都很難學(xué)習(xí)到知識(shí)。在如今這個(gè)時(shí)代,無時(shí)無刻不在產(chǎn)生數(shù)據(jù)(包括語音、文本、影像等等),人工智能產(chǎn)業(yè)的飛速發(fā)展,也萌生了大量垂直領(lǐng)域的數(shù)據(jù)需求。算法算法是一組解決問題的規(guī)則,是計(jì)算機(jī)科學(xué)中的基礎(chǔ)概念。人工智能是指計(jì)算機(jī)系統(tǒng)能夠模仿人類智能的一種技術(shù),其核心是算法。人工智能算法是數(shù)據(jù)驅(qū)動(dòng)型算法,是人工智能背后的推動(dòng)力量。主流的算法主要分為傳統(tǒng)的機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,目前神經(jīng)網(wǎng)絡(luò)算法因?yàn)樯疃葘W(xué)習(xí)(源于人工神經(jīng)網(wǎng)絡(luò)的研究,特點(diǎn)是試圖模仿大腦的神經(jīng)元之間傳遞和處理信息的模式)的快速發(fā)展而達(dá)到了高潮。算力算力是指計(jì)算機(jī)或其他計(jì)算設(shè)備在一定時(shí)間內(nèi)可以處理的數(shù)據(jù)量或完成的計(jì)算任務(wù)的數(shù)量。算力通常被用來描述計(jì)算機(jī)或其他計(jì)算設(shè)備的性能,它是衡量一臺(tái)計(jì)算設(shè)備處理能力的重要指標(biāo)。人工智能倫理在人工智能應(yīng)用廣度和深度不斷拓展的過程中,也不斷暴露出一些風(fēng)險(xiǎn)隱患(如隱私泄露、偏見歧視、算法濫用、安全問題等等),引發(fā)了社會(huì)各界廣泛關(guān)注。面對人工智能發(fā)展應(yīng)用中的倫理風(fēng)險(xiǎn),全球各國紛紛展開倫理探討,尋求應(yīng)對人工智能倫理風(fēng)險(xiǎn)的路徑和規(guī)范,以保證人工智能的良性發(fā)展。因此,人工智能倫理(AIEthics)成為社會(huì)各界關(guān)注的議題,并成為一個(gè)備受關(guān)注的研究領(lǐng)域。人工智能倫理是探討人工智能帶來的倫理問題及風(fēng)險(xiǎn)、研究解決人工智能倫理問題、促進(jìn)人工智能向善、引領(lǐng)人工智能健康發(fā)展的一個(gè)多學(xué)科研究領(lǐng)域。人工智能倫理領(lǐng)域所涉及的內(nèi)容非常豐富,是一個(gè)哲學(xué)、計(jì)算機(jī)科學(xué)、法律、經(jīng)濟(jì)等學(xué)科交匯碰撞的領(lǐng)域。Python是一種計(jì)算機(jī)程序設(shè)計(jì)語言,是一種面向?qū)ο蟮膭?dòng)態(tài)類型語言。Python最早是由GuidovanRossum在八十年代末和九十年代初,在荷蘭國家數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究所設(shè)計(jì)出來的,目前由一個(gè)核心開發(fā)團(tuán)隊(duì)在維護(hù)。1.6人工智能常用語言人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目2人工智能的數(shù)學(xué)基礎(chǔ)通過對本章的學(xué)習(xí),了解微積分的概念,理解線性代數(shù),理解概率論與數(shù)理統(tǒng)計(jì),理解人工智能的最優(yōu)化理論,理解人工智能的形式邏輯。了解微積分的概念理解線性代數(shù)的概念理解概率論與數(shù)理統(tǒng)理解人工智能的最優(yōu)化理論熟悉人工智能的形式邏輯2.1微積分微積分又稱為“初等數(shù)學(xué)分析”,它是一門純粹的數(shù)學(xué)理論,也是現(xiàn)代數(shù)學(xué)的基礎(chǔ),在商學(xué)、科學(xué)和工程學(xué)領(lǐng)域有廣泛的應(yīng)用,主要用來解決那些僅依靠代數(shù)學(xué)和幾何學(xué)不能有效解決的問題。在人工智能的發(fā)展過程中,微積分是一種非常重要的數(shù)學(xué)工具,它可以幫助人們理解和優(yōu)化人工智能算法的性能。有了微積分,人類就能把握運(yùn)動(dòng)的過程。微積分成了人們描述世界、尋求問題答案的有力工具。微積分促進(jìn)了工業(yè)大革命,帶來了大工業(yè)生產(chǎn),許多現(xiàn)代化交通工具的產(chǎn)生都與微積分相關(guān)。微積分知識(shí)在人工智能算法中可以說無處不在。。2.2線性代數(shù)線性代數(shù)研究的是向量空間以及將一個(gè)向量空間映射到另一個(gè)向量空間的函數(shù)。在人工智能中線性代數(shù)是計(jì)算的根本,因?yàn)樗械臄?shù)據(jù)都是以矩陣的形式存在的,任何一步操作都是在進(jìn)行矩陣相乘、相加等等。線性方程組的一般形式為:線性方程組的解是一個(gè)n維向量(稱為解向量),它滿足:當(dāng)每個(gè)方程中的未知數(shù)

都用

替代時(shí)都成為等式。2.3概率論與數(shù)理統(tǒng)計(jì)概率論與數(shù)理統(tǒng)計(jì)是研究人工智能、機(jī)器學(xué)習(xí)領(lǐng)域的理論基礎(chǔ)。概率論是研究隨機(jī)現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支,是一門研究事情發(fā)生的可能性的學(xué)問。而數(shù)理統(tǒng)計(jì)則以概率論為基礎(chǔ),研究大量隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。概率與統(tǒng)計(jì)概率與統(tǒng)計(jì)由于其源于生活與生產(chǎn),又能有效地應(yīng)用于生活與生產(chǎn),且應(yīng)用面十分廣泛,因此除了可以應(yīng)用于解決人們生活中的各類問題外,在前沿的人工智能領(lǐng)域,同樣有著重大的作用。例如,機(jī)器學(xué)習(xí)除了處理不確定量,也需處理隨機(jī)量。而不確定性和隨機(jī)性可能來自多個(gè)方面,從而可以使用概率論來量化不確定性。又例如,在人工智能算法中無論是對于數(shù)據(jù)的處理還是分析,數(shù)據(jù)的擬合還是決策等,概率與統(tǒng)計(jì)都可以為其提供重要的支持。當(dāng)隨機(jī)試驗(yàn)次數(shù)

增大時(shí),事件

發(fā)生的頻率

將穩(wěn)定于某一常數(shù)

,則稱該常數(shù)

為事件

發(fā)生的概率。此定義稱為概率的統(tǒng)計(jì)定義,這個(gè)定義沒有具體給出求概率的方法,因此不能根據(jù)此定義確切求出事件的概率,但定義具有廣泛的應(yīng)用價(jià)值,它的重要性不容忽視,它給出了一種近似估算概率的方法,即通過大量的重復(fù)試驗(yàn)得到事件發(fā)生的頻率,然后將頻率作為概率的近似值,從而得到所要的概率。有時(shí)試驗(yàn)次數(shù)不是很大時(shí),也可以這樣使用。2.4最優(yōu)化理論最優(yōu)化理論是關(guān)于系統(tǒng)的最優(yōu)設(shè)計(jì)、最優(yōu)控制、最優(yōu)管理問題的理論與

方法。最優(yōu)化,就是在一定的約束條件下,使系統(tǒng)具有所期待的最優(yōu)功能的組織過程。是從眾多可能的選擇中做出最優(yōu)選擇,使系統(tǒng)的目標(biāo)函數(shù)在約束條件下達(dá)到最大或最小。最優(yōu)化是系統(tǒng)方法的基本目的。現(xiàn)代優(yōu)化理論及方法是在20世紀(jì)40年代發(fā)展起來的,其理論和方法愈來愈多,如線性規(guī)劃、非線性規(guī)劃、動(dòng)態(tài)規(guī)劃、排隊(duì)論、對策論、決策論、博弈論等。最優(yōu)化問題通常情況下,最優(yōu)化問題是在無約束情況下求解給定目標(biāo)函數(shù)的最小值;在線性搜索中,確定尋找最小值時(shí)的搜索方向需要使用目標(biāo)函數(shù)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù);置信域算法的思想是先確定搜索步長,再確定搜索方向;以人工神經(jīng)網(wǎng)絡(luò)為代表的啟發(fā)式算法是另外一類重要的優(yōu)化方法。凸函數(shù)凸函數(shù)是在人工智能的算法模型中經(jīng)常見到的一種形式。它擁有非常好的性質(zhì),在計(jì)算上擁有更多的便利。遺傳算法遺傳算法是模擬人類和生物的遺傳進(jìn)化機(jī)制,主要基于達(dá)爾文的生物進(jìn)化論“物競天擇”、“適者生存”和“優(yōu)勝劣汰”理論。具體實(shí)現(xiàn)流程是首先從初代群體里選出比較適應(yīng)環(huán)境且表現(xiàn)良好的個(gè)體;其次利用遺傳算子對篩選后的個(gè)體進(jìn)行組合交叉和變異,然后生成第二代群體;最后從第二代群體中選出環(huán)境適應(yīng)度良好的個(gè)體進(jìn)行組合交叉和變異形成第三代群體,如此不斷進(jìn)化,直至產(chǎn)生末代種群即問題的近似最優(yōu)解。遺傳算法的應(yīng)用遺傳算法通常應(yīng)用于路徑搜索問題,如迷宮尋路問題、8字碼問題等。遺傳算法提供了一種求解復(fù)雜系統(tǒng)問題的通用框架,它不依賴于問題的具體領(lǐng)域,對問題的種類有很強(qiáng)的魯棒性,所以廣泛應(yīng)用于很多學(xué)科,如工程結(jié)構(gòu)優(yōu)化、計(jì)算數(shù)學(xué)、制造系統(tǒng)、航空航天、交通、計(jì)算機(jī)科學(xué)、通信、電子學(xué)、材料科學(xué)等。蟻群算法蟻群算法是一種群智能算法,它是由一群無智能或有輕微智能的個(gè)體(Agent)通過相互協(xié)作而表現(xiàn)出智能行為,從而為求解復(fù)雜問題提供了一個(gè)新的可能性。“螞蟻系統(tǒng)”是基本的蟻群算法,為其他蟻群算法提供了基本框架,該基本框架主要由初始化、構(gòu)建解和信息素更新三部分組成蟻群算法2.5形式邏輯邏輯方法是人工智能研究中的主要形式化工具,邏輯學(xué)的研究成果不但為人工智能學(xué)科的誕生奠定了理論基礎(chǔ),而且它們還作為重要的成分被應(yīng)用于人工智能系統(tǒng)中。在人工智能的研究中,用形式邏輯實(shí)現(xiàn)知識(shí)表示是一種普遍的方法。形式邏輯可謂包羅萬象,其最簡單的實(shí)例就是由古希臘哲學(xué)家亞里士多德提出并流傳至今的三段論,它由兩個(gè)前提和一個(gè)結(jié)論構(gòu)成:每個(gè)三段論中,必須有一個(gè)前提是肯定的并且必須有一個(gè)前提是全稱命題。在每個(gè)三段論中,兩個(gè)前提中否命題的數(shù)目必須與結(jié)論中否命題的數(shù)目相同。每個(gè)證明都是且只能是通過三個(gè)詞項(xiàng)得到的。例如,人工智能三段論:科學(xué)是不斷發(fā)展的(大前提)人工智能是科學(xué)(小前提)所以,人工智能是不斷發(fā)展的(結(jié)論)亞里士多德的貢獻(xiàn)不僅在于證明了人工智能的不斷發(fā)展,更在于確定了在大前提和小前提的基礎(chǔ)上推導(dǎo)出一個(gè)結(jié)論的形式化過程,這個(gè)過程完全擺脫了內(nèi)容的限制。由此誕生的符號(hào)推理給數(shù)理邏輯的研究帶來了深遠(yuǎn)的影響。人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目3人工智能與大數(shù)據(jù)通過對本章的學(xué)習(xí),了解大數(shù)據(jù)的概念,理解數(shù)據(jù)采集,數(shù)據(jù)清洗,數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、數(shù)據(jù)分析與可視化、數(shù)據(jù)治理以及大數(shù)據(jù)安全,理解人工智能與大數(shù)據(jù)的關(guān)系。了解大數(shù)據(jù)的概念理解數(shù)據(jù)采集,數(shù)據(jù)清洗,數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算以及數(shù)據(jù)分析與可視化人工智能與大數(shù)據(jù)的關(guān)系當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)正快速發(fā)展成為新一代信息技術(shù)和服務(wù)業(yè)態(tài),即對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,并從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力。大數(shù)據(jù)概述大數(shù)據(jù)是信息技術(shù)發(fā)展的必然產(chǎn)物,更是信息化進(jìn)程的新階段,其發(fā)展推動(dòng)了數(shù)字經(jīng)濟(jì)的形成與繁榮。大數(shù)據(jù)與智能制造大數(shù)據(jù)智能制造能夠?qū)崿F(xiàn)產(chǎn)品故障診斷與預(yù)測,降低生產(chǎn)過程能耗,控制產(chǎn)品生命周期。典型企業(yè)有海爾集團(tuán),在其互聯(lián)工廠布置上萬個(gè)傳感器,每天產(chǎn)生數(shù)萬組數(shù)據(jù),不僅對整個(gè)工廠的運(yùn)行情況進(jìn)行實(shí)時(shí)監(jiān)控,實(shí)時(shí)報(bào)警;同時(shí)基于這些傳感器布置在設(shè)備之中,對自動(dòng)化設(shè)備可進(jìn)行實(shí)時(shí)預(yù)警,在設(shè)備發(fā)生故障之前,通過大數(shù)據(jù)預(yù)測的方式對設(shè)備進(jìn)行及時(shí)維護(hù)修復(fù)。數(shù)據(jù)采集作為大數(shù)據(jù)生命周期的第一個(gè)環(huán)節(jié),是指通過傳感器、攝像頭、RFID射頻數(shù)據(jù)以及互聯(lián)網(wǎng)等方式獲取的各種結(jié)構(gòu)化、半結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)。數(shù)據(jù)采集在大數(shù)據(jù)時(shí)代,數(shù)據(jù)清洗通常是指把“臟數(shù)據(jù)”徹底洗掉,所謂“臟數(shù)據(jù)”是指不完整、不規(guī)范、不準(zhǔn)確的數(shù)據(jù),只有通過數(shù)據(jù)清洗才能從根本上提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)清洗數(shù)據(jù)清洗的原理數(shù)據(jù)清洗的原理為:利用有關(guān)技術(shù),如統(tǒng)計(jì)方法、數(shù)據(jù)挖掘方法、模式規(guī)則方法等將臟數(shù)據(jù)轉(zhuǎn)換為滿足數(shù)據(jù)質(zhì)量要求的數(shù)據(jù)。數(shù)據(jù)清洗按照實(shí)現(xiàn)方式與范圍,可分為手工清洗和自動(dòng)清洗。在數(shù)據(jù)清洗中,原始數(shù)據(jù)源是數(shù)據(jù)清洗的基礎(chǔ),數(shù)據(jù)分析是數(shù)據(jù)清洗的前提,而定義數(shù)據(jù)清洗轉(zhuǎn)換規(guī)則是關(guān)鍵。在數(shù)據(jù)清洗中具體的數(shù)據(jù)清洗規(guī)則主要包括有:非空檢核、主鍵重復(fù)、非法代碼清洗、非法值清洗、數(shù)據(jù)格式檢核、記錄數(shù)檢核等。異常值檢測數(shù)據(jù)存儲(chǔ)如今大數(shù)據(jù)的火熱,帶來的第一道障礙就是關(guān)于大數(shù)據(jù)存儲(chǔ)的問題。大數(shù)據(jù)因?yàn)橐?guī)模大、類型多樣、新增速度快,所以在存儲(chǔ)和計(jì)算上,都需要技術(shù)支持,依靠傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和處理工具,已經(jīng)很難實(shí)現(xiàn)高效的處理了。目前常見的大數(shù)據(jù)存儲(chǔ)方式主要有分布式存儲(chǔ)、NoSQL數(shù)據(jù)庫和云數(shù)據(jù)庫三種。(1)分布式存儲(chǔ)分布式存儲(chǔ)最早是由谷歌提出的,其目的是通過廉價(jià)的服務(wù)器來提供使用與大規(guī)模,高并發(fā)場景下的Web訪問問題。(2)NoSQL數(shù)據(jù)庫NoSQL數(shù)據(jù)庫又叫做非關(guān)系數(shù)據(jù)庫,和數(shù)據(jù)庫管理系統(tǒng)(RDBMS)相比,NoSQL不使用SQL作為查詢語言,其存儲(chǔ)也可以不需要固定的表模式,用戶操作NoSQL時(shí)通常會(huì)避免使用RDBMS的JION操作。(3)云數(shù)據(jù)庫云數(shù)據(jù)庫是指被優(yōu)化或部署到一個(gè)虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫,是在云計(jì)算的大背景下發(fā)展起來的一種新興的共享基礎(chǔ)架構(gòu)的方法,它極大地增強(qiáng)了數(shù)據(jù)庫的存儲(chǔ)能力,消除了人員、硬件、軟件的重復(fù)配置,讓軟、硬件升級變得更加容易。因此,云數(shù)據(jù)庫具有高可擴(kuò)展性、高可用性、采用多租形式和支持資源有效分發(fā)等特點(diǎn),可以實(shí)現(xiàn)按需付費(fèi)和按需擴(kuò)展。數(shù)據(jù)計(jì)算面向大數(shù)據(jù)處理的數(shù)據(jù)查詢、統(tǒng)計(jì)、分析、挖掘等需求,促生了大數(shù)據(jù)計(jì)算的不同計(jì)算模式,整體上人們把大數(shù)據(jù)計(jì)算分為離線批處理計(jì)算、實(shí)時(shí)交互計(jì)算和流計(jì)算三種。(1)離線批處理計(jì)算隨著云計(jì)算技術(shù)到廣泛的應(yīng)用的發(fā)展,基于開源的Hadoop分布式存儲(chǔ)系統(tǒng)和MapReduce數(shù)據(jù)處理模式的分析系統(tǒng)也得到了廣泛的應(yīng)用。(2)實(shí)時(shí)交互計(jì)算當(dāng)今的實(shí)時(shí)計(jì)算一般都需要針對海量數(shù)據(jù)進(jìn)行,除了要滿足非實(shí)時(shí)計(jì)算的一些需求(如計(jì)算結(jié)果準(zhǔn)確)以外,實(shí)時(shí)計(jì)算最重要的一個(gè)需求是能夠?qū)崟r(shí)響應(yīng)計(jì)算結(jié)果,一般要求為秒級。實(shí)時(shí)和交互式計(jì)算技術(shù)中,Google的Dremel系統(tǒng)表現(xiàn)最為突出。Spark是由加州大學(xué)伯克利分校AMP實(shí)驗(yàn)室開發(fā)的實(shí)時(shí)數(shù)據(jù)分析系統(tǒng),采用一種與Hadoop相似的開源集群計(jì)算環(huán)境,但是Spark在任務(wù)調(diào)度、工作負(fù)載優(yōu)化方面設(shè)計(jì)和表現(xiàn)更加優(yōu)越。(3)流計(jì)算。傳統(tǒng)的流式計(jì)算系統(tǒng),一般是基于事件機(jī)制,所處理的數(shù)據(jù)量也不大。新型的流處理技術(shù),如Yahoo的S4主要解決的是高數(shù)據(jù)率和大數(shù)據(jù)量的流式處理。S4是一個(gè)通用的、分布式的、可擴(kuò)展的、部分容錯(cuò)的,可插拔的平臺(tái),開發(fā)者可以很容易的在其上開發(fā)面向無界不間斷流數(shù)據(jù)處理的應(yīng)用。數(shù)據(jù)分析與可視化數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析,未提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。數(shù)據(jù)可視化在大數(shù)據(jù)技術(shù)中也至關(guān)重要,因?yàn)閿?shù)據(jù)最終需要為人們所使用,為生產(chǎn)、運(yùn)營、規(guī)劃提供決策支持。選擇恰當(dāng)?shù)?、生?dòng)直觀的展示方式能夠幫助人們更好地理解數(shù)據(jù)及其內(nèi)涵和關(guān)聯(lián)關(guān)系,也能夠更有效地解釋和運(yùn)用數(shù)據(jù),發(fā)揮其價(jià)值。在展現(xiàn)方式上,除了傳統(tǒng)的報(bào)表、圖形之外,人們還可以結(jié)合現(xiàn)代化的可視化工具及人機(jī)交互手段,甚至增強(qiáng)現(xiàn)實(shí)技術(shù)等來實(shí)現(xiàn)數(shù)據(jù)與現(xiàn)實(shí)的無縫接口。數(shù)據(jù)治理數(shù)據(jù)治理是指對數(shù)據(jù)的收集、存儲(chǔ)、共享、分析和使用等過程進(jìn)行規(guī)范和管理,以保證數(shù)據(jù)的質(zhì)量、安全和合規(guī),促進(jìn)數(shù)據(jù)價(jià)值發(fā)揮。數(shù)據(jù)治理涉及數(shù)據(jù)擁有者、數(shù)據(jù)提供者、數(shù)據(jù)使用者和數(shù)據(jù)監(jiān)管者等多個(gè)利益相關(guān)方,包括政府、企業(yè)、公共組織、公眾等不同主體,涵蓋政府?dāng)?shù)據(jù)、公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、個(gè)人數(shù)據(jù)等。圖3-11顯示了國家標(biāo)準(zhǔn)GB/T34960的數(shù)據(jù)治理框架。該數(shù)據(jù)治理框架比較符合我國企業(yè)和政府的組織現(xiàn)狀,更加全面地和精煉地描述了數(shù)據(jù)治理的工作內(nèi)容,包含頂層設(shè)計(jì)、數(shù)據(jù)治理環(huán)境、數(shù)據(jù)治理域和數(shù)據(jù)治理過程。大數(shù)據(jù)安全數(shù)據(jù)是國家基礎(chǔ)性戰(zhàn)略資源,沒有數(shù)據(jù)安全就沒有國家安全。以數(shù)據(jù)為核心發(fā)展數(shù)字經(jīng)濟(jì)是實(shí)現(xiàn)新舊動(dòng)能轉(zhuǎn)換、培育新業(yè)態(tài)發(fā)展的重要路徑,數(shù)據(jù)作為一種新型生產(chǎn)要素,已成為推動(dòng)我國經(jīng)濟(jì)高質(zhì)量發(fā)展的重要資源。近年來,我國不斷推進(jìn)網(wǎng)絡(luò)強(qiáng)國、數(shù)字中國、智慧社會(huì)建設(shè),以數(shù)據(jù)為新生產(chǎn)要素的數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,數(shù)據(jù)的競爭已成為國際競爭的重要領(lǐng)域。大數(shù)據(jù)時(shí)代的數(shù)據(jù)安全問題主要包括數(shù)據(jù)被濫用、誤用和被竊取這幾種情況。(1)數(shù)據(jù)被濫用數(shù)據(jù)濫用指的是對數(shù)據(jù)的使用超出了其預(yù)先約定的場景或目的。例如員工在沒有工作場景支持的情況下訪問了客戶的個(gè)人敏感信息,這是大量內(nèi)鬼倒賣個(gè)人信息而組織卻不知道的主要原因之一。需要強(qiáng)調(diào)的是,在今天的大數(shù)據(jù)業(yè)務(wù)環(huán)境下,無法做到針對每一條個(gè)人信息、每一個(gè)員工在每一個(gè)工作場景的請求下,進(jìn)行單獨(dú)的數(shù)據(jù)訪問許可授權(quán)。(3)數(shù)據(jù)被誤用數(shù)據(jù)誤用指的是在正常范圍內(nèi)在對數(shù)據(jù)處理的過程中泄露個(gè)人敏感信息。這是在大數(shù)據(jù)時(shí)代變得更加突出的典型問題。大數(shù)據(jù)時(shí)代,是通過對數(shù)據(jù)的各種分析,帶來各種業(yè)務(wù)創(chuàng)新、保持業(yè)務(wù)價(jià)值的。但是,這個(gè)分析過程,是否泄露某個(gè)特定人的隱私,就屬于是否誤用的問題。企業(yè)如果知道用戶的喜好和需求,就可以給用戶發(fā)送更加精準(zhǔn)的廣告、提供更加適合的服務(wù),但是在這個(gè)過程中,用戶是不希望自己的一舉一動(dòng)都被企業(yè)了如指掌地看到,自己成了沒有隱私的透明人。如今,大家都在采集和分析數(shù)據(jù),但是很多企業(yè)還缺乏技術(shù)能力或者安全意識(shí),避免這些數(shù)據(jù)在分析處理的全過程,不會(huì)泄露用戶的隱私。(3)數(shù)據(jù)被竊取數(shù)據(jù)被竊取在本質(zhì)上和系統(tǒng)安全相關(guān)。外部或者內(nèi)部的網(wǎng)絡(luò)攻擊者,通過各種技術(shù)手段非法入侵系統(tǒng),目的可能是為了偷取數(shù)據(jù),這就變成數(shù)據(jù)安全問題。如今,大量網(wǎng)站或應(yīng)用的安全防護(hù)水平不高,導(dǎo)致黑灰產(chǎn)人員可以從中大量竊取數(shù)據(jù),最終令用戶防不勝防。另外,內(nèi)部人員入侵作案,偷取客戶數(shù)據(jù)或者公司商業(yè)秘密,數(shù)量往往比外部入侵的比例要大很多??墒牵芏嗥髽I(yè)依然只重視對外部入侵的防御而忽視了內(nèi)部入侵的防范,或者只重視了系統(tǒng)安全層面的防御能力,而沒有意識(shí)到數(shù)據(jù)安全層面的不同。鑒于大數(shù)據(jù)的戰(zhàn)略意義,我國高度重視大數(shù)據(jù)安全問題,近幾年發(fā)布了一系列大數(shù)據(jù)安全相關(guān)的法律法規(guī)和政策。3.2人工智能與大數(shù)據(jù)人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它模仿人類的一系列思考和做出決策的能力。在這些能力的幫助下,機(jī)器可以做出自動(dòng)化決策,解決復(fù)雜問題,以及更有利地應(yīng)用數(shù)據(jù)和信息。DIKW模型是一個(gè)關(guān)于數(shù)據(jù)(Data)、信息(Information)、知識(shí)(Knowledge)、智慧(Wisdom)的模型,該模型如圖3-13所示。大數(shù)據(jù)建模DIKW模型將數(shù)據(jù)、信息、知識(shí)、智慧納入到一種金字塔形的層次體系,展現(xiàn)了數(shù)據(jù)是如何一步步轉(zhuǎn)化為信息、知識(shí)、乃至智慧的方式。當(dāng)系統(tǒng)采集到原始的數(shù)據(jù)后,然后通過加工處理得到有邏輯的信息,再通過提煉信息之間的聯(lián)系獲得規(guī)則和知識(shí)、形成行動(dòng)的能力和完成任務(wù),最終使用對各種知識(shí)進(jìn)行歸納和綜合形成關(guān)注未來不確定性業(yè)務(wù)的預(yù)測能力,這樣系統(tǒng)才能真正做到感知、分析、推理、決策、控制功能。工業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)的建模要求用數(shù)理邏輯去嚴(yán)格的定義業(yè)務(wù)問題。由于工業(yè)生產(chǎn)過程中本身受到各種機(jī)理約束條件的限制,利用歷史過程數(shù)據(jù)定義問題邊界往往達(dá)不到工業(yè)的生產(chǎn)要求因此,人們往往需要采用數(shù)據(jù)驅(qū)動(dòng)+模型驅(qū)動(dòng)+場景部署的多輪驅(qū)動(dòng)方式,實(shí)現(xiàn)數(shù)據(jù)和機(jī)理的深度融合,去解決實(shí)際的工業(yè)問題。使用時(shí)序數(shù)據(jù)分析工業(yè)生產(chǎn)中的機(jī)器異常狀況數(shù)控車床壽命預(yù)測模型人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目4機(jī)器學(xué)習(xí)通過對本章的學(xué)習(xí),了解機(jī)器學(xué)習(xí)的概念,理解機(jī)器學(xué)習(xí)的算法了解機(jī)器學(xué)習(xí)的概念理解機(jī)器學(xué)習(xí)的算法機(jī)器學(xué)習(xí),通俗地講就是讓機(jī)器來實(shí)現(xiàn)學(xué)習(xí)的過程,讓機(jī)器擁有學(xué)習(xí)的能力,從而改善系統(tǒng)自身的性能。對于機(jī)器而言,這里的“學(xué)習(xí)”指的是從數(shù)據(jù)中學(xué)習(xí),從數(shù)據(jù)中產(chǎn)生“模型”的算法,即“學(xué)習(xí)算法”。4.1認(rèn)識(shí)機(jī)器學(xué)習(xí)在實(shí)際應(yīng)用中,機(jī)器學(xué)習(xí)將大量數(shù)據(jù)加載到計(jì)算機(jī)程序中并選擇一種模型“擬合”數(shù)據(jù),使得計(jì)算機(jī)(在無需幫助的情況下)得出預(yù)測。4.2機(jī)器學(xué)習(xí)的分類在機(jī)器學(xué)習(xí)中,根據(jù)學(xué)習(xí)方式的不同,可以將機(jī)器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)(SupervisedLearning)是機(jī)器學(xué)習(xí)中的一種方法,可以由訓(xùn)練數(shù)據(jù)中學(xué)到或建立一個(gè)學(xué)習(xí)模型(LearningModel),并依此模型推測新的實(shí)例,如圖4-3所示。4.2.1監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)(SupervisedLearning)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是帶標(biāo)記的,這些標(biāo)記可以包括數(shù)據(jù)類別、數(shù)據(jù)屬性及特征點(diǎn)位置等。常見的監(jiān)督學(xué)習(xí)有分類和回歸。分類(Classification)是將一些實(shí)例數(shù)據(jù)分到合適的類別中,分類的預(yù)測結(jié)果是離散的?;貧w(Regression)是將數(shù)據(jù)歸到一條“線”上,即為離散數(shù)據(jù)生產(chǎn)擬合曲線,因此其預(yù)測結(jié)果是連續(xù)的。圖4-7顯示了監(jiān)督學(xué)習(xí)的標(biāo)簽。例如,當(dāng)要訓(xùn)練機(jī)器識(shí)別“狗”的圖片時(shí),需要首先用大量狗的圖片進(jìn)行訓(xùn)練,最后再將預(yù)測結(jié)果與期望結(jié)果進(jìn)行比對,從而判斷該模型的好壞。4.2.2無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)的訓(xùn)練樣本的標(biāo)記信息是未知的,目標(biāo)是通過對無標(biāo)記訓(xùn)練樣本的學(xué)習(xí)來揭示數(shù)據(jù)的內(nèi)在性質(zhì)及規(guī)律。無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)表示機(jī)器從無標(biāo)記的數(shù)據(jù)中探索并推斷出潛在的聯(lián)系。常見的無監(jiān)督學(xué)習(xí)有聚類和降維。聚類技術(shù)是一種無監(jiān)督學(xué)習(xí),是研究樣本或指標(biāo)分類問題的一種統(tǒng)計(jì)分析方法。聚類與分類的區(qū)別是其要?jiǎng)澐值念愂俏粗?。常用的聚類分析方法有系統(tǒng)聚類法、有序樣品聚類法、動(dòng)態(tài)聚類法、模糊聚類法、圖論聚類法和聚類預(yù)報(bào)法等。降維(DimensionalityReduction)是將數(shù)據(jù)的維度降低,在實(shí)際應(yīng)用中,可以通過一系列的轉(zhuǎn)換將數(shù)據(jù)的維度降低,數(shù)據(jù)的降維過程如圖4-9所示。無監(jiān)督學(xué)習(xí)常常被用于數(shù)據(jù)挖掘,用于在大量無標(biāo)簽數(shù)據(jù)中發(fā)現(xiàn)些什么。它的訓(xùn)練數(shù)據(jù)是無標(biāo)簽的,訓(xùn)練目標(biāo)是能對觀察值進(jìn)行分類或者區(qū)分等。例如無監(jiān)督學(xué)習(xí)應(yīng)該能在不給任何額外提示的情況下,僅依據(jù)所有“貓”的圖片的特征,將“貓”的圖片從大量的各種各樣的圖片中將區(qū)分出來。“半監(jiān)督學(xué)習(xí)”術(shù)語第一次于1992年被正式提出,其思想可追溯于自訓(xùn)練算法。半監(jiān)督學(xué)習(xí)突破了傳統(tǒng)方法只考慮一種樣本類型的局限,綜合利用有標(biāo)簽與無標(biāo)簽樣本,是在監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的基礎(chǔ)上進(jìn)行的研究。半監(jiān)督學(xué)習(xí)包括半監(jiān)督聚類、半監(jiān)督分類、半監(jiān)督降維和半監(jiān)督回歸四種學(xué)習(xí)場景。常見的半監(jiān)督分類代表算法包括生成式方法、半監(jiān)督支持向量機(jī)、半監(jiān)督圖算法和基于分歧的半監(jiān)督方法這四種算法。4.2.3半監(jiān)督學(xué)習(xí)4.2.4強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)(ReinforcementLearning,RL),又稱再勵(lì)學(xué)習(xí)、評價(jià)學(xué)習(xí)或增強(qiáng)學(xué)習(xí),是機(jī)器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體在與環(huán)境的交互過程中通過學(xué)習(xí)策略以達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問題。強(qiáng)化學(xué)習(xí)主要包含智能體、環(huán)境狀態(tài)、獎(jiǎng)懲和動(dòng)作這四個(gè)元素以及一個(gè)狀態(tài),其中智能體存在于一個(gè)環(huán)境的內(nèi)部。強(qiáng)化學(xué)習(xí)通常被用在機(jī)器人技術(shù)上(例如機(jī)械狗),它接收機(jī)器人當(dāng)前狀態(tài),算法的目標(biāo)是訓(xùn)練機(jī)器來做出各種特定行為。工作流程一般是:機(jī)器被放置在一個(gè)特定環(huán)境中,在這個(gè)環(huán)境里機(jī)器可以持續(xù)性地進(jìn)行自我訓(xùn)練,而環(huán)境會(huì)給出或正或負(fù)的反饋。機(jī)器會(huì)從以往的行動(dòng)經(jīng)驗(yàn)中得到提升并最終找到最好的知識(shí)內(nèi)容來幫助它做出最有效的行為決策。K-Means算法也叫作K均值聚類算法,它是最著名的劃分聚類算法,由于簡潔和效率使得它成為所有聚類算法中最廣泛使用的。其步驟是隨機(jī)選取K個(gè)對象作為初始的聚類中心,然后計(jì)算每個(gè)對象與各個(gè)種子聚類中心之間的距離,把每個(gè)對象分配給距離它最近的聚類中心。4.3機(jī)器學(xué)習(xí)常見算法KNN算法也叫作K最近鄰算法,是數(shù)據(jù)挖掘分類技術(shù)中最簡單的方法之一。所謂K最近鄰,就是k個(gè)最近的鄰居的意思,說的是每個(gè)樣本都可以用它最接近的k個(gè)鄰居來代表。KNN算法的核心思想是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。4.3.3樸素貝葉斯算法貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉斯定理為基礎(chǔ),故統(tǒng)稱為貝葉斯分類。而樸素貝葉斯分類是貝葉斯分類中最簡單,也是常見的一種分類方法。貝葉斯算法與條件概率以及聯(lián)合概率密切相關(guān)。條件概率是一種生活中經(jīng)常用到的概率計(jì)算表達(dá)式。例如在今天下雨的情況下,明天下雨的概率是多少呢?這就是一個(gè)條件概率的問題。用比較規(guī)范的語言描述是在事件A發(fā)生的情況下,B發(fā)生的概率是多少?稱其為事件B的條件概率。4.3.4決策樹算法決策樹算法是一種能解決分類或回歸問題的機(jī)器學(xué)習(xí)算法,它是一種典型的分類方法。決策樹算法最早產(chǎn)生于上世紀(jì)60年代,該算法首先對數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進(jìn)行分析決策樹是一個(gè)預(yù)測模型,它表示對象屬性和對象值之間的一種映射,樹中的每一個(gè)節(jié)點(diǎn)表示對象屬性的判斷條件,其分支表示符合節(jié)點(diǎn)條件的對象。樹的葉子節(jié)點(diǎn)表示對象所屬的預(yù)測結(jié)果。

支持向量機(jī)(SVM,SupportVectorMachine)是一種支持線性分類和非線性分類的二元分類算法,目前被廣泛的應(yīng)用在回歸以及分類當(dāng)中。支持向量機(jī)要解決的問題可以用一個(gè)經(jīng)典的二分類問題加以描述。如圖4-18(a)所示,紅色和藍(lán)色的二維數(shù)據(jù)點(diǎn)顯然是可以被一條直線分開的,在模式識(shí)別領(lǐng)域稱為線性可分問題。然而將兩類數(shù)據(jù)點(diǎn)分開的直線顯然不止一條,圖4-18(b)和4-18(c)分別給出了A、B兩種不同的分類方案,其中黑色實(shí)線為分界線,術(shù)語稱為“決策面”。每個(gè)決策面對應(yīng)了一個(gè)線性分類器。4.3.5支持向量機(jī)算法支持向量機(jī)可以簡單地描述為對樣本數(shù)據(jù)進(jìn)行分類,真正是對決策函數(shù)進(jìn)行求解。首先,要找到分類問題中的最大分類間隔,然后確定最優(yōu)分類超平面,并將分類問題轉(zhuǎn)化為二次規(guī)劃問題進(jìn)行求解。隨機(jī)森林是最流行和最強(qiáng)大的機(jī)器學(xué)習(xí)算法之一,它是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法。隨機(jī)森林的基本單元是決策樹,而它的本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支——集成學(xué)習(xí)(EnsembleLearning)方法。4.3.56隨機(jī)森林算法4.4機(jī)器學(xué)習(xí)的應(yīng)用機(jī)器學(xué)習(xí)是席卷全球商業(yè)界的最新專業(yè)術(shù)語。它抓住了大眾的想象力,讓人聯(lián)想到未來自學(xué)人工智能和機(jī)器人的愿景。在工業(yè)領(lǐng)域,機(jī)器學(xué)習(xí)為前幾年不可能實(shí)現(xiàn)的技術(shù)和工具鋪平了道路。從預(yù)測引擎到在線電視直播,它為我們的現(xiàn)代生活方式提供突破性的創(chuàng)新力。人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目5深度學(xué)習(xí)通過對本章的學(xué)習(xí),了解深度學(xué)習(xí)的概念和特點(diǎn),理解人工神經(jīng)網(wǎng)絡(luò)的模型與研究內(nèi)容,理解深度學(xué)習(xí)的應(yīng)用與深度學(xué)習(xí)常見框架。了解深度學(xué)習(xí)的概念和特點(diǎn)理解人工神經(jīng)網(wǎng)絡(luò)的模型與研究內(nèi)容理解深度學(xué)習(xí)的應(yīng)用理解深度學(xué)習(xí)常見框架5.1認(rèn)識(shí)深度學(xué)習(xí)深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種實(shí)現(xiàn)技術(shù),在2006年被首次提出。深度學(xué)習(xí)遵循仿生學(xué),源自神經(jīng)元以及神經(jīng)網(wǎng)絡(luò)的研究,能夠模仿人類神經(jīng)網(wǎng)絡(luò)傳輸和接收信號(hào)的方式,進(jìn)而達(dá)到學(xué)習(xí)人類的思維方式的目的。深度學(xué)習(xí)以神經(jīng)網(wǎng)絡(luò)為主要模型,一開始用來解決機(jī)器學(xué)習(xí)中的表示學(xué)習(xí)問題,但是由于其強(qiáng)大的能力,深度學(xué)習(xí)越來越多地用來解決一些通用人工智能問題,比如推理、決策等。目前,深度學(xué)習(xí)技術(shù)在學(xué)術(shù)界和工業(yè)界取得了廣泛的成功,受到高度重視,并掀起新一輪的人工智能熱潮。圖5-1顯示了神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)主要由相互連接的神經(jīng)元(圖中的圓圈)組成。深度學(xué)習(xí)的發(fā)展離不開大數(shù)據(jù)、GPU及模型這3個(gè)因素。(1)大數(shù)據(jù)當(dāng)前大部分的深度學(xué)習(xí)模型是有監(jiān)督學(xué)習(xí),依賴于數(shù)據(jù)的有效標(biāo)注。例如,要做一個(gè)高性能的物體檢測模型,通常需要使用上萬甚至是幾十萬的標(biāo)注數(shù)據(jù)。(2)GPU當(dāng)前深度學(xué)習(xí)如此火熱的一個(gè)很重要的原因就是硬件的發(fā)展,尤其是GPU為深度學(xué)習(xí)模型的快速訓(xùn)練提供了可能。深度學(xué)習(xí)模型通常有數(shù)以千萬計(jì)的參數(shù),存在大規(guī)模的并行計(jì)算,傳統(tǒng)的以邏輯運(yùn)算能力著稱的CPU面對這種并行計(jì)算會(huì)異常緩慢,GPU以及CUDA計(jì)算庫專注于數(shù)據(jù)的并行計(jì)算,為模型訓(xùn)練提供了強(qiáng)有力的工具。(3)模型在大數(shù)據(jù)與GPU的強(qiáng)有力支撐下,無數(shù)研究學(xué)者的奇思妙想,催生出了一系列優(yōu)秀的深度學(xué)習(xí)模型,并且在學(xué)習(xí)任務(wù)的精度、速度等指標(biāo)上取得了顯著的進(jìn)步。5.2人工神經(jīng)網(wǎng)絡(luò)5.2.1感知機(jī)感知機(jī)被稱為深度學(xué)習(xí)領(lǐng)域最為基礎(chǔ)的模型。雖然感知機(jī)是最為基礎(chǔ)的模型,但是它在深度學(xué)習(xí)的領(lǐng)域中有著舉足輕重的地位,它是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)學(xué)習(xí)的基礎(chǔ)圖5-2顯示了感知機(jī)模型,感知器是一種數(shù)學(xué)的模型,它可以看作是在模仿生物的神經(jīng)元,有多個(gè)輸入,一個(gè)激活函數(shù)和一個(gè)輸出。一個(gè)感知器的輸出可以連接到其它感知器的輸入上,這樣就實(shí)現(xiàn)了最基礎(chǔ)的人工神經(jīng)網(wǎng)絡(luò)。感知器激活函數(shù)設(shè)計(jì)的初衷,也是在模仿神經(jīng)元的激活狀態(tài)。(2)感知機(jī)原理感知機(jī)接收多個(gè)輸入信號(hào),輸出一個(gè)信號(hào)。這里所說的“信號(hào)”可以想象成電流或河流那樣具備“流動(dòng)性”的東西。像電流流過導(dǎo)線,向前方輸送電子一樣,感知機(jī)的信號(hào)也會(huì)形成流,向前方輸送信息。但是,和實(shí)際的電流不同的是,感知機(jī)的信號(hào)只有“流/不流”(1/0)兩種取值,一般人們認(rèn)為0對應(yīng)“不傳遞信號(hào)”,1對應(yīng)“傳遞信號(hào)”。圖5-3是一個(gè)接收兩個(gè)輸入信號(hào)的感知機(jī),x1、x2是輸入信號(hào),y是輸出信號(hào),w1、w2是權(quán)重(w是weight的首字母)。圖中的矩形框稱為“神經(jīng)元”或者“節(jié)點(diǎn)”。輸入信號(hào)被送往神經(jīng)元時(shí),會(huì)被分別乘以固定的權(quán)重(w1x1、w2x2),感知器的每一個(gè)輸入都和權(quán)重相乘,然后再把所有乘完后的結(jié)果加在一起,也就是相乘后再求和,求和的結(jié)果會(huì)作為激活函數(shù)的輸入,而這個(gè)激活函數(shù)的輸出會(huì)作為整個(gè)感知器的輸出。最后神經(jīng)元會(huì)計(jì)算傳送過來的信號(hào)的總和,只有當(dāng)這個(gè)總和超過了某個(gè)界限值時(shí),才會(huì)輸出1,這也稱為“神經(jīng)元被激活”。這里將這個(gè)界限值稱為閾值,用符號(hào)θ表示。5.2.2神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)(NeuralNetwork,NN)亦稱為人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN),是由大量神經(jīng)元(Neurons)廣泛互連而成的網(wǎng)絡(luò),是對人腦的抽象、簡化和模擬,應(yīng)用了一些人腦的基本特性。神經(jīng)網(wǎng)絡(luò)與人腦的相似之處可概括為兩方面,一是通過學(xué)習(xí)過程利用神經(jīng)網(wǎng)絡(luò)從外部環(huán)境中獲取知識(shí),二是內(nèi)部神經(jīng)元用來存儲(chǔ)獲取的知識(shí)信息。從最簡單的單個(gè)神經(jīng)元來講述神經(jīng)網(wǎng)絡(luò)模型的架構(gòu),如圖5-7所示是一個(gè)最簡單的單個(gè)神經(jīng)元的網(wǎng)絡(luò)模型,它只包含一個(gè)神經(jīng)元。人工神經(jīng)網(wǎng)絡(luò)中最小也是最重要的單元叫神經(jīng)元。(3)前饋神經(jīng)網(wǎng)絡(luò)前饋神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中最基本的網(wǎng)絡(luò)結(jié)構(gòu),它通常由3部分組成,包括input(輸入層)、hidden(隱藏層)和output(輸出層)。前饋神經(jīng)網(wǎng)絡(luò)最左邊一層稱為輸入層,最右邊的一層稱為輸出層,中間一層稱為隱藏層。輸入層從外部世界獲取輸入信息,在輸入節(jié)點(diǎn)中不進(jìn)行任何的計(jì)算,僅向隱藏節(jié)點(diǎn)傳遞信息。隱藏層中的節(jié)點(diǎn)對輸入信息進(jìn)行處理,并將信息傳遞到輸出層中,隱藏層是由處于中間位置的所有神經(jīng)節(jié)點(diǎn)組成,因?yàn)椴荒茉谏窠?jīng)網(wǎng)絡(luò)訓(xùn)練過程中直接觀測到它們的值而得名。輸出層負(fù)責(zé)計(jì)算輸出值,并將輸出值傳遞到外部世界。前饋神經(jīng)網(wǎng)絡(luò)模型如圖5-8所示。(4)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)也稱為訓(xùn)練,指的是通過神經(jīng)網(wǎng)絡(luò)所在環(huán)境的刺激作用調(diào)整神經(jīng)網(wǎng)絡(luò)的自由參數(shù),使神經(jīng)網(wǎng)絡(luò)以一種新的方式對外部環(huán)境做出反應(yīng)的一個(gè)過程。神經(jīng)網(wǎng)絡(luò)最大的特點(diǎn)是能夠從環(huán)境中學(xué)習(xí),以及在學(xué)習(xí)中提高自身性能。經(jīng)過反復(fù)學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)對其環(huán)境會(huì)越來越了解。(5)激活函數(shù)激活函數(shù)(ActivationFunctions)對于人工神經(jīng)網(wǎng)絡(luò)模型以及卷積神經(jīng)網(wǎng)絡(luò)模型去學(xué)習(xí)理解非常復(fù)雜和非線性的函數(shù)來說具有十分重要的作用。神經(jīng)網(wǎng)絡(luò)的輸出是上一層輸入的加權(quán)和,所以網(wǎng)絡(luò)線性關(guān)系過于顯著,屬于線性模型,對于復(fù)雜問題的解決存在難度;但是當(dāng)每個(gè)神經(jīng)元都經(jīng)過一個(gè)非線性函數(shù),那么輸出就不再是線性的了,整個(gè)網(wǎng)絡(luò)模型也就是非線性模型,如此一來,網(wǎng)絡(luò)就能夠解決比較復(fù)雜的問題,激活函數(shù)就是這個(gè)非線性函數(shù)。Sigmoid激活函數(shù)示意圖如圖5-9所示。6)損失函數(shù)損失函數(shù)是模型對數(shù)據(jù)擬合程度的反映,擬合得越差、損失函數(shù)的值就越大。與此同時(shí),當(dāng)損失函數(shù)比較大時(shí),其對應(yīng)的梯度也會(huì)隨之增大,這樣就可以加快變量的更新速度。卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)顧名思義是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了卷積運(yùn)算(卷積是測量兩個(gè)函數(shù)重疊程度的積分,卷積是對兩個(gè)函數(shù)

f()

g()

生成第三個(gè)函數(shù)的一種數(shù)學(xué)算子,本質(zhì)上就是先將一個(gè)函數(shù)翻轉(zhuǎn),然后進(jìn)行滑動(dòng)疊加),通過卷積核(卷積核是一個(gè)二維矩陣,它與原始數(shù)據(jù)進(jìn)行逐個(gè)元素的乘積運(yùn)算,并將結(jié)果相加得到一個(gè)新的數(shù)值。5.2.3卷積神經(jīng)網(wǎng)絡(luò)多個(gè)卷積核卷積神經(jīng)網(wǎng)絡(luò)作為一個(gè)深度學(xué)習(xí)架構(gòu)被提出時(shí),它的最初訴求是降低對圖像數(shù)據(jù)預(yù)處理的要求,以避免煩瑣的特征工程。CNN由輸入層、輸出層以及多個(gè)隱藏層組成,隱藏層可分為卷積層、池化層、ReLU層和全連接層,其中卷積層與池化層相配合可組成多個(gè)卷積組,逐層提取特征。卷積神經(jīng)網(wǎng)絡(luò)的要點(diǎn)是它們在單個(gè)圖像上通過了許多濾波器,每個(gè)濾波器都會(huì)拾取不同的信號(hào)。卷積網(wǎng)絡(luò)采用這些濾波器,圖像特征空間的切片,并逐個(gè)映射它們。也就是說,他們會(huì)創(chuàng)建一張地圖,顯示每個(gè)特征出現(xiàn)的地方。通過學(xué)習(xí)特征空間的不同部分,卷積網(wǎng)絡(luò)允許輕松擴(kuò)展和健壯的特征工程特性。卷積神經(jīng)網(wǎng)絡(luò)可以對輸入的圖像輸出其圖像特征,實(shí)現(xiàn)過程如圖5-17所示。5.2.4循環(huán)神經(jīng)網(wǎng)絡(luò)循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)是深度學(xué)習(xí)領(lǐng)域中一類特殊的內(nèi)部存在自連接的神經(jīng)網(wǎng)絡(luò),可以學(xué)習(xí)復(fù)雜的矢量到矢量的映射。循環(huán)神經(jīng)網(wǎng)絡(luò)的來源是為了刻畫一個(gè)序列當(dāng)前的輸出與之前信息的關(guān)系。從網(wǎng)絡(luò)結(jié)構(gòu)上看循環(huán)神經(jīng)網(wǎng)絡(luò)會(huì)記憶之前的信息,并利用之前的信息影響后面結(jié)點(diǎn)的輸出。圖5-18為循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。RNN層級結(jié)構(gòu)較之于CNN來說比較簡單,它主要有輸入層,隱藏層和輸出層組成。并且會(huì)發(fā)現(xiàn)在隱藏層有一個(gè)箭頭表示數(shù)據(jù)的循環(huán)更新,這個(gè)就是實(shí)現(xiàn)時(shí)間記憶功能的方法,即閉合回路。圖5-21為經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡(luò),在圖中輸入是x1,x2,...,xn,輸出為y1,y2,...,yn,也就是說輸入序列和輸出序列必須是等長的,由于這個(gè)限制,經(jīng)典RNN的適用范圍比較小,但也有一些問題上適用,比如計(jì)算視頻中每一幀的分類標(biāo)簽。因?yàn)橐獙γ恳粠M(jìn)行計(jì)算,因此輸入和輸出序列等長。即輸入為字符,輸出為下一個(gè)字符的概率。5.2.5生成對抗網(wǎng)絡(luò)生成對抗網(wǎng)絡(luò)(GenerativeAdversarialNetworks,GAN)獨(dú)特的對抗性思想使得它在眾多生成網(wǎng)絡(luò)模型中脫穎而出,被廣泛應(yīng)用于計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和語音處理等領(lǐng)域。生成對抗網(wǎng)絡(luò)模型如圖5-22所示,該模型主要包含一個(gè)生成模型和一個(gè)判別模型。生成對抗網(wǎng)絡(luò)主要解決的問題是如何從訓(xùn)練樣本中學(xué)習(xí)出新樣本,其中判別模型用于判斷輸入樣本是真實(shí)數(shù)據(jù)還是訓(xùn)練生成的樣本數(shù)據(jù)。近年來,深度學(xué)習(xí)已經(jīng)徹底改變了許多機(jī)器學(xué)習(xí)任務(wù),從圖像分類和視頻處理,到語音識(shí)別和自然語言理解,這些任務(wù)中的數(shù)據(jù)通常表示在歐幾里得空間中。然而,在越來越多的應(yīng)用程序中,數(shù)據(jù)是從非歐幾里得域生成的,并表示為具有復(fù)雜關(guān)系和對象之間相互依賴的圖形。圖數(shù)據(jù)的復(fù)雜性給現(xiàn)有的機(jī)器學(xué)習(xí)算法帶來了巨大的挑戰(zhàn)。圖5-24左為圖像(歐幾里得空間),右為圖(非歐幾里得空間)。5.2.6圖神經(jīng)網(wǎng)絡(luò)5.3深度學(xué)習(xí)架構(gòu)5.3.1注意力機(jī)制注意力機(jī)制從字面意思來看和人類的注意力機(jī)制類似。人類通過快速掃描全局文本,獲得需要重點(diǎn)關(guān)注的區(qū)域,也就是一般所說的注意力焦點(diǎn),而后對這一區(qū)域投入更多注意力資源,以獲取更多所需要關(guān)注目標(biāo)的細(xì)節(jié)信息,而抑制其他無用信息。圖5-25顯示了帶注意力機(jī)制的自編碼模型,該模型其本質(zhì)都是通過一個(gè)Encoder(編碼)和一個(gè)Decoder(解碼)實(shí)現(xiàn)機(jī)器翻譯、文本轉(zhuǎn)換、機(jī)器問答等功能。所謂編碼,就是將輸入序列轉(zhuǎn)化成一個(gè)固定長度的向量;解碼,就是將之前生成的固定向量再轉(zhuǎn)化成輸出序列。Transformer由6個(gè)結(jié)構(gòu)相同的Encoder串聯(lián)構(gòu)成編碼層,用6個(gè)結(jié)構(gòu)相同的Decoder串聯(lián)構(gòu)成解碼層。Transformer模型的核心思想是完全拋棄傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN),而是引入了自注意力機(jī)制。5.4.1自動(dòng)駕駛在過去的十年里,自動(dòng)駕駛汽車技術(shù)取得了越來越快的進(jìn)步,主要得益于深度學(xué)習(xí)和人工智能領(lǐng)域的進(jìn)步。5.4深度學(xué)習(xí)的應(yīng)用5.4.2產(chǎn)品質(zhì)量檢測隨著人工智能、邊緣計(jì)算等新興技術(shù)的高速發(fā)展,人們同樣賦予了機(jī)器“認(rèn)識(shí)”和“改造”世界的能力,從而替代人眼對外部環(huán)境進(jìn)行測量、識(shí)別與判斷,在無接觸的情況下完成既定的任務(wù)。當(dāng)前制造業(yè)產(chǎn)品外表檢查主要有人工質(zhì)檢和機(jī)器視覺質(zhì)檢兩種方式,不過人工質(zhì)檢成本高、誤操作多、生產(chǎn)數(shù)據(jù)無法有效留存。例如在軸承生產(chǎn)中,通常情況下質(zhì)檢員是采用人工肉眼觀察、手指轉(zhuǎn)動(dòng)軸承等質(zhì)檢方式挑出表面有油污、劃痕、磨削燒傷等不良缺陷,效率較低。而隨著工業(yè)自動(dòng)化的不斷發(fā)展,機(jī)器視覺技術(shù)已在工業(yè)中得到越來越廣泛的應(yīng)用,并越來越受到企業(yè)的認(rèn)可和青睞。機(jī)器視覺檢測就是用機(jī)器代替人眼來做測量和判斷。作為神經(jīng)網(wǎng)絡(luò)的高階發(fā)展產(chǎn)物,深度學(xué)習(xí)通過大腦仿生使得計(jì)算機(jī)從經(jīng)驗(yàn)中學(xué)習(xí)知識(shí),根據(jù)層次化概念體系理解環(huán)境,進(jìn)而去人化地解決難以形式化描述的任務(wù)。深度學(xué)習(xí)的常用模型主要包括循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和稀疏編碼等,主要應(yīng)用于圖像處理、數(shù)據(jù)分析、語音識(shí)別等領(lǐng)域?;谏疃葘W(xué)習(xí)的產(chǎn)品缺陷視覺檢測是一種快速、高效、準(zhǔn)確率高的缺陷自動(dòng)識(shí)別方法,借助特征可視化手段對深度學(xué)習(xí)模型提取到的特征進(jìn)行可視化分析來檢測產(chǎn)品瑕疵,進(jìn)而精準(zhǔn)打標(biāo),提升分級模型訓(xùn)練的準(zhǔn)確度,實(shí)現(xiàn)產(chǎn)品缺陷的高效準(zhǔn)確分級,解決注塑工業(yè)中外觀檢測的痛點(diǎn)和難點(diǎn)。5.5深度學(xué)習(xí)框架深度學(xué)習(xí)框架的實(shí)現(xiàn)非常復(fù)雜,并且通常包含諸如圖片處理、視頻處理和科學(xué)計(jì)算庫等第三方軟件包。每個(gè)深度學(xué)習(xí)框架的實(shí)現(xiàn)都不同,但深度學(xué)習(xí)框架通常可以抽象為三層,頂層包括程序邏輯、模型和訓(xùn)練數(shù)據(jù),中間層是深度學(xué)習(xí)框架的實(shí)現(xiàn),包括張量數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)方法、各種過濾器和神經(jīng)網(wǎng)絡(luò)層的實(shí)現(xiàn)。前兩層的實(shí)現(xiàn)通??梢赃x擇C++(Caffe)、Python(Tensorflow)、Lua(Torch)等語言。底層是框架使用的基礎(chǔ)構(gòu)建塊,通常包括音視頻處理和模型表示的組件,構(gòu)建塊的選擇取決于框架的設(shè)計(jì)方案。(1)TensorflowTensorFlow是一個(gè)由GoogleBrain團(tuán)隊(duì)開發(fā)的開源深度學(xué)習(xí)框架。它允許開發(fā)者創(chuàng)建多種機(jī)器學(xué)習(xí)模型,包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)等。(2)PyTorch

PyTorch是一個(gè)由Facebook開源的深度學(xué)習(xí)框架,是目前市場上最流行的深度學(xué)習(xí)框架之一。它基于Python語言,提供了強(qiáng)大的GPU加速功能和動(dòng)態(tài)計(jì)算圖的支持。(3)CaffeCaffe的全稱是ConvolutionalArchitectureforFastFeatureEmbedding,意為“用于特征提取的卷積架構(gòu)”,它是一個(gè)清晰、高效的深度學(xué)習(xí)框架,核心語言是C++。人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目6計(jì)算機(jī)視覺通過對本章的學(xué)習(xí),了解計(jì)算機(jī)視覺的概念,理解圖像預(yù)處理技術(shù),理解圖像分類、目標(biāo)檢測、圖像分割、行為識(shí)別、圖像增強(qiáng)與視覺問答,理解計(jì)算機(jī)視覺的應(yīng)用。計(jì)算機(jī)視覺的概念理解圖像預(yù)處理技術(shù)理解圖像分類理解目標(biāo)檢測理解圖像分割理解行為識(shí)別理解圖像增強(qiáng)理解視覺問答熟悉計(jì)算機(jī)視覺的應(yīng)用計(jì)算機(jī)視覺是研究如何讓機(jī)器“看”的科學(xué),其可以模擬、擴(kuò)展或者延伸人類智能,從而幫助人類解決大規(guī)模復(fù)雜的問題,如圖6-1所示。6.1認(rèn)識(shí)計(jì)算機(jī)視覺計(jì)算機(jī)視覺技術(shù)經(jīng)過幾十年的發(fā)展,已經(jīng)在交通(車牌識(shí)別、道路違章抓拍)、安防(人臉閘機(jī)、小區(qū)監(jiān)控)、金融(刷臉支付、柜臺(tái)的自動(dòng)票據(jù)識(shí)別)、醫(yī)療(醫(yī)療影像診斷)、工業(yè)生產(chǎn)(產(chǎn)品缺陷自動(dòng)檢測)等多個(gè)領(lǐng)域應(yīng)用,影響或正在改變?nèi)藗兊娜粘I詈凸I(yè)生產(chǎn)方式。6.2圖像預(yù)處理技術(shù)由于攝像機(jī)攝取圖像會(huì)受到如光照變化、噪聲干擾、攝像機(jī)畸變等因素的影響,景物在不同視點(diǎn)下的圖像會(huì)有很大不同,要在這些干擾因素下準(zhǔn)確的表征圖像特征數(shù)據(jù)信息,需要對圖像冗余環(huán)境背景信息進(jìn)行預(yù)處理,來降低圖像背景復(fù)雜度。圖像預(yù)處理技術(shù)主要包括圖像灰度化、灰度圖像二值化、圖像增強(qiáng)、圖像濾波、圖像形態(tài)學(xué)處理等。彩色圖像灰度化6.2.1圖像分類圖像分類利用計(jì)算機(jī)對圖像進(jìn)行定量分析,把圖像或圖像中的區(qū)域劃分為若干個(gè)類別,以代替人的視覺判斷。圖像分類系統(tǒng)的目標(biāo)是根據(jù)輸入圖像,從類別集中分配一個(gè)類別,在此為cat類別。分類系統(tǒng)也可以根據(jù)概率給圖像分配多個(gè)標(biāo)簽,如cat:92%,dog:7%,eagle:1%。6.3計(jì)算機(jī)視覺主要內(nèi)容圖像分類算法圖像分類算法通過手工特征或者特征學(xué)習(xí)方法對整個(gè)圖像進(jìn)行全局描述,然后使用分類器判斷是否在某類物體。應(yīng)用比較廣泛的圖像特征有SIFT,HOG,SURF等。由于深度學(xué)習(xí)算法在圖像分類中的大面積應(yīng)用,涌現(xiàn)出了一大批優(yōu)秀的適用于圖像分類的深度學(xué)習(xí)模型框架,如下所述介紹常用的3類深度學(xué)習(xí)模型。(1)VGG模型VGG模型相比以往模型進(jìn)一步加寬和加深了網(wǎng)絡(luò)結(jié)構(gòu),它的核心是五組卷積操作,每兩組之間做最大池化的空間降維。(2)GoogLeNet模型GoogLeNet模型由多組Inception模塊組成,該模型的設(shè)計(jì)借鑒了NIN(NetworkinNetwork)的一些思想。(3)ResNet模型殘差網(wǎng)絡(luò)(ResidualNetwork,ResNet)是用于圖像分類、圖像物體定位和圖像物體檢測的深度學(xué)習(xí)模型。6.2.2目標(biāo)檢測目標(biāo)檢測的任務(wù)是找出圖像中所有感興趣的目標(biāo)(物體),確定它們的類別和位置。例子確定某張給定圖像中是否存在給定類別(比如人、車、自行車、狗和貓)的目標(biāo)實(shí)例;如果存在,就返回每個(gè)目標(biāo)實(shí)例的空間位置和覆蓋范圍?,F(xiàn)在流行的目標(biāo)檢測方法是通過不同寬高比的窗口在圖像上滑動(dòng)(滑窗法),得到很多個(gè)區(qū)域框,如圖6-10所示。深度學(xué)習(xí)是具有隱藏層數(shù)更多的深度神經(jīng)網(wǎng)絡(luò),它可以學(xué)習(xí)到機(jī)器學(xué)習(xí)等算法不能學(xué)習(xí)到的更加深層次的數(shù)據(jù)特征,能夠更加抽象并且準(zhǔn)確地表達(dá)數(shù)據(jù)。因此基于深度學(xué)習(xí)的各類算法被廣泛的應(yīng)用于目標(biāo)檢測中。(1)R-CNNR-CNN采用的是SelectiveSearch,使用聚類的方法對圖像進(jìn)行分組,得到多個(gè)候選框的層次組。(2)SPP-NETSPP-NET是在R-CNN的基礎(chǔ)上提出來的(3)FastR-CNN由于R-CNN在候選區(qū)域上進(jìn)行特征提取時(shí)存在大量重復(fù)性計(jì)算,為了解決這個(gè)問題提出了FastR-CNN,F(xiàn)astR-CNN借鑒SPPNet對R-CNN進(jìn)行了改進(jìn),檢測性能獲得提升。3.運(yùn)動(dòng)檢測由于運(yùn)動(dòng)檢測處于視頻運(yùn)動(dòng)分析的最底層,廣泛的應(yīng)用場合使運(yùn)動(dòng)檢測算法應(yīng)該可以處理各種復(fù)雜的情況,但很難有一種算法能夠適合所有的應(yīng)用場合,所以對運(yùn)動(dòng)檢測方法的研究一直是國內(nèi)外研究的重點(diǎn)。就國內(nèi)外發(fā)表的文獻(xiàn)來看,現(xiàn)在普遍采用的運(yùn)動(dòng)檢測方法有:(1)幀間差分法(FramesDifference)(2)背景差分法(BackgroundDifference)(3)光流法(OpticalFlow)圖像分割是利用圖像的灰度、顏色、紋理、形狀等特征,把圖像分成若干個(gè)互不重疊的區(qū)域,并使這些特征在同一區(qū)域內(nèi)呈現(xiàn)相似性,在不同的區(qū)域之間存在明顯的差異性。然后就可以將分割的圖像中具有獨(dú)特性質(zhì)的區(qū)域提取出來用于不同的研究。6.2.3圖像分割目前圖像分割方法數(shù)量已經(jīng)達(dá)到上千種。隨著對圖像分割的更深層次研究和其他科學(xué)領(lǐng)域的發(fā)展,陸續(xù)出現(xiàn)了許多使用新理論的圖像分割算法,各種圖像分割算法都有其不同理論基礎(chǔ),下面介紹4種常見的圖像分割算法。(1)基于閾值的圖像分割算法(2)基于邊緣檢測的圖像分割算法(3)基于區(qū)域的圖像分割算法(4)基于神經(jīng)網(wǎng)絡(luò)技術(shù)的圖像分割算法行為識(shí)別研究的是視頻中目標(biāo)的動(dòng)作,比如判斷一個(gè)人是在走路,跳躍還是揮手。在視頻監(jiān)督,視頻推薦和人機(jī)交互中有重要的應(yīng)用。圖6-16為基于骨骼關(guān)鍵點(diǎn)檢測的深度神經(jīng)網(wǎng)絡(luò)算法,可自動(dòng)識(shí)別人體姿勢,如關(guān)節(jié),五官等,通過關(guān)鍵點(diǎn)描述人體骨骼信息,以此來判別動(dòng)作類型。6.2.4行為識(shí)別圖像增強(qiáng)是指對低質(zhì)量圖像做變換修改,得到質(zhì)量更高的圖像。圖像增強(qiáng)的意義是通過對訓(xùn)練圖像做一系列隨機(jī)改變,來產(chǎn)生相似但又不同的訓(xùn)練樣本,從而擴(kuò)大訓(xùn)練數(shù)據(jù)集的規(guī)模,而且隨機(jī)改變訓(xùn)練樣本可以降低模型對某些屬性的依賴,從而提高模型的泛化能力。根據(jù)低質(zhì)量圖像的種類不同,圖像增強(qiáng)應(yīng)用可以包括圖像去噪、圖像超分辨率、圖像去模糊以及亮度提升等。6.2.5圖像增強(qiáng)視覺問答是計(jì)算機(jī)視覺領(lǐng)域和自然語言處理領(lǐng)域的交叉方向,近年來受到了廣泛關(guān)注。一個(gè)視覺問答系統(tǒng)以一張圖片和一個(gè)關(guān)于這張圖片形式自由、開放式的自然語言問題作為輸入,以生成一條自然語言答案作為輸出。簡單來說,視覺問答就是給定的圖片進(jìn)行問答。6.2.6視覺問答6.4計(jì)算機(jī)視覺的應(yīng)用6.4.1智慧醫(yī)療隨著近幾年來計(jì)算機(jī)視覺技術(shù)的進(jìn)步,智慧醫(yī)療領(lǐng)域受到了學(xué)術(shù)界和產(chǎn)業(yè)界的持續(xù)關(guān)注,其應(yīng)用也越來越廣泛和深入。面向智慧醫(yī)療,人工智能技術(shù)從三個(gè)層面將產(chǎn)生深刻的影響:第一層面對于臨床醫(yī)生,計(jì)算機(jī)視覺技術(shù)能幫助其更快速、更準(zhǔn)確地進(jìn)行圖像分析工作;第二層面對于衛(wèi)生系統(tǒng),其能通過人工智能的方式改善工作流程、減少醫(yī)療差錯(cuò);第三層面對于患者,通過增強(qiáng)的云存儲(chǔ)能力,他們可以處理自己的數(shù)據(jù),以促進(jìn)自我健康。目前,在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲(chǔ)、傳輸和自動(dòng)/輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段。與計(jì)算機(jī)視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來,地圖繪制是一件耗費(fèi)人力、物力和時(shí)間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復(fù)三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時(shí),通用物體三維形狀分析與識(shí)別一直是計(jì)算機(jī)視覺的重要研究目標(biāo),并在景物的特征提取、表示、知識(shí)的存儲(chǔ)、檢索以及匹配識(shí)別等方面都取得了一定的進(jìn)展,構(gòu)成了一些用于三維景物分析的系統(tǒng)。6.5計(jì)算機(jī)視覺面臨的問題未來計(jì)算機(jī)視覺任務(wù)發(fā)展面臨的挑戰(zhàn)主要來自3個(gè)方面:(1)數(shù)據(jù)集(2)有標(biāo)注的圖像和視頻數(shù)據(jù)較少,機(jī)器在模擬人類智能進(jìn)行認(rèn)知或者感知的過程中,需要大量有標(biāo)注的圖像或者視頻數(shù)據(jù)指導(dǎo)機(jī)器學(xué)習(xí)其中一般的模式。當(dāng)前,主要依賴人工標(biāo)注海量的圖像視頻數(shù)據(jù),不僅費(fèi)時(shí)費(fèi)力而且沒有統(tǒng)一的標(biāo)準(zhǔn),可用的有標(biāo)注的數(shù)據(jù)有限,這使機(jī)器的學(xué)習(xí)能力受限。(3)計(jì)算機(jī)視覺技術(shù)的精度有待提高,如在物體檢測任務(wù)中,當(dāng)前最好的檢測正確率為66%,這樣的結(jié)果只能應(yīng)用于對正確率要求不是很高的場景下。(4)提高計(jì)算機(jī)視覺任務(wù)處理的速度迫在眉睫,圖像和視頻信息需要借助高維度的數(shù)據(jù)進(jìn)行表示,這是讓機(jī)器看懂圖像或視頻的基礎(chǔ),這就對機(jī)器的計(jì)算能力和算法的效率提出很高的要求。人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目7自然語言處理通過本章的學(xué)習(xí),了解NLP的定義、發(fā)展歷程及開發(fā)環(huán)境等,理解并掌握NLP的文本處理、機(jī)器翻譯以及語音識(shí)別相關(guān)知識(shí),了解NLP的常見應(yīng)用場景。了解NLP的發(fā)展歷史、編程工具、庫以及開發(fā)環(huán)境理解NLP的基本概念掌握NLP的文本處理、機(jī)器翻譯、語音識(shí)別了解NLP的應(yīng)用7.1自然語言處理概述自然語言處理(NaturalLanguageProcessing,NLP)是指利用計(jì)算機(jī)對自然語言的形、音、義等信息進(jìn)行處理,即對字、詞、句、篇章的輸人、輸出、識(shí)別、分析、理解、生成等進(jìn)行操作和加工的過程。NLP機(jī)制涉及兩個(gè)流程:自然語言理解和自然語言生成。自然語言理解研究的是計(jì)算機(jī)如何理解自然語言文本中包含的意義,自然語言生成研究的是計(jì)算機(jī)如何生成自然語言文本表達(dá)給定的意圖、思想等。關(guān)于NLP的研究始于20世紀(jì)50年代,在1946年世界上第一臺(tái)通用電子計(jì)算機(jī)誕生時(shí),英國人布思和美國人韋弗就提出了利用計(jì)算機(jī)進(jìn)行機(jī)器翻譯。從這個(gè)時(shí)間點(diǎn)開始NLP技術(shù)已經(jīng)歷70多年的發(fā)展歷程。歸納起來可分為“萌芽期”“發(fā)展期”“繁榮期”3個(gè)階段。如果想要使用計(jì)算機(jī)處理文本,那么我們首先要做的就是讓計(jì)算機(jī)認(rèn)識(shí)我們的文本信息。為此,我們通常會(huì)對文本信息進(jìn)行預(yù)處理、分詞、特征化等操作從而將文本信息轉(zhuǎn)化為計(jì)算機(jī)能夠識(shí)別的0和1代碼,然后再進(jìn)行機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等對計(jì)算機(jī)識(shí)別出的文本進(jìn)行處理。7.2文本處理分詞根據(jù)語境,將句子以字詞為單位劃分的過程稱之為分詞。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。我們知道,在英文的行文中,單詞之間是以空格作為分界符的,而中文只是字、句和段能通過明顯的分界符(逗號(hào)、句號(hào)等)來簡單劃界,唯獨(dú)詞沒有一個(gè)形式上的分界符,分詞過程就是找到這樣的分界符的過程。當(dāng)前中文分詞研究主要面臨的問題和困難體現(xiàn)在三個(gè)方面:分詞的規(guī)范、歧義詞的切分和未登錄詞識(shí)別。(1)分詞的規(guī)范。

中文因其自身語言特性的局限,單字詞與詞素之間、詞與短語(詞組)之間劃界均沒有一個(gè)公認(rèn)的、權(quán)威的標(biāo)準(zhǔn)。所以,從計(jì)算的嚴(yán)格意義上說,中文分詞是一個(gè)沒有明確定義的問題

。(2)歧義切分問題(3)未登錄詞問題常用的中文分詞方法(1)基于詞典的分詞法基于詞典的方法是從大規(guī)模的訓(xùn)練語料中提取分詞詞庫,并同時(shí)將詞語的詞頻統(tǒng)計(jì)出來,然后通過逆向最大匹配、N-最短路徑等分詞方法對句子進(jìn)行切分。2、基于字的分詞法與基于詞典的分詞方法不同,該方法需要依賴于一個(gè)事先編制好的詞典,通過查詞典的方式作出最后的切分決策。(3)基于統(tǒng)計(jì)的分詞法基于統(tǒng)計(jì)的分詞方法是利用大量的語料庫進(jìn)行統(tǒng)計(jì)分析,通過計(jì)算每個(gè)詞語在語料庫中出現(xiàn)的頻率和概率,來確定每個(gè)詞語的邊界。具體來說,該方法分為兩個(gè)步驟:訓(xùn)練和分詞。分詞技術(shù)分詞技術(shù)目前已經(jīng)非常成熟,目前主要分三種:(1)最大匹配分詞算法最大匹配是指以詞典為依據(jù),取詞典中最長單詞為第一次取字?jǐn)?shù)量的掃描串,在詞典中進(jìn)行掃描(為提升掃描效率,還可以跟據(jù)字?jǐn)?shù)多少設(shè)計(jì)多個(gè)字典,然后根據(jù)字?jǐn)?shù)分別從不同字典中進(jìn)行掃描)。例如:詞典中最長詞為“中華人民共和國”共7個(gè)漢字,則最大匹配起始字?jǐn)?shù)為7個(gè)漢字。然后逐字遞減,在對應(yīng)的詞典中進(jìn)行查找。(2)詞義分詞法該方法是一種機(jī)器語音判斷的分詞方法。很簡單,進(jìn)行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象來分詞,這種分詞方法目前還不成熟,處在測試階段。(3)統(tǒng)計(jì)分詞法根據(jù)詞組的統(tǒng)計(jì),就會(huì)發(fā)現(xiàn)兩個(gè)相鄰的字出現(xiàn)的頻率最多,那么這個(gè)詞就很重要。就可以作為用戶提供字符串中的分隔符來分詞。比如,“我的,你的,許多的,這里,這一,那里”等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開來。7.3機(jī)器翻譯機(jī)器翻譯是一種利用計(jì)算機(jī)技術(shù)將一種語言翻譯成另一種語言的技術(shù)。NLP技術(shù)是機(jī)器翻譯的核心技術(shù)之一,它可以幫助機(jī)器翻譯更加準(zhǔn)確和流暢。

機(jī)器翻譯的研究歷史最早可以追溯到20世紀(jì)30年代。1933年,法國科學(xué)家G.B.阿爾楚尼提出了用機(jī)器來進(jìn)行翻譯的想法。機(jī)器翻譯的流程機(jī)器翻譯的流程可以概括為以下幾個(gè)步驟:(1)詞法分析:將源語言的詞匯分解為詞語和詞素,并對它們進(jìn)行分類和識(shí)別。(2)語法分析:將源語言的句子結(jié)構(gòu)分解為詞序和語法規(guī)則,并對它們進(jìn)行分類和識(shí)別。(3)翻譯規(guī)則:根據(jù)語言之間的語法和語義關(guān)系,制定翻譯規(guī)則,例如詞序規(guī)則、語態(tài)規(guī)則、時(shí)態(tài)規(guī)則等。(4)神經(jīng)網(wǎng)絡(luò):利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行翻譯,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)源語言和目標(biāo)語言之間的語言結(jié)構(gòu)和語義關(guān)系,從而實(shí)現(xiàn)翻譯的自動(dòng)化。(5)統(tǒng)計(jì)機(jī)器翻譯:利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行翻譯,通過對大量的翻譯數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,可以自動(dòng)識(shí)別翻譯規(guī)則和模式,從而實(shí)現(xiàn)更準(zhǔn)確的翻譯。機(jī)器翻譯算法與案例機(jī)器翻譯是人工智能的終極目標(biāo)之一,它的流程和算法非常復(fù)雜。簡單來說,機(jī)器翻譯就是把一種語言翻譯成另外一種語言。機(jī)器翻譯面臨如下國際公認(rèn)的挑戰(zhàn):譯文選擇、詞語順序的調(diào)整和數(shù)據(jù)稀疏。目前,機(jī)器翻譯技術(shù)主要分為基于規(guī)則、基于統(tǒng)計(jì)和基于神經(jīng)網(wǎng)絡(luò)三種方法。基于規(guī)則的機(jī)器翻譯方法(Rule-BasedMachineTranslation,RBMT)RBMT是一種早期的機(jī)器翻譯方法,它依賴于語言學(xué)專家編寫的翻譯規(guī)則。這些規(guī)則通常包括詞匯、語法和語義等方面的知識(shí),用于將源語言文本轉(zhuǎn)換為目標(biāo)語言文本。通常,一個(gè)典型的基于轉(zhuǎn)換規(guī)則的機(jī)器翻譯過程可以描述為“獨(dú)立分析-獨(dú)立生成-相關(guān)轉(zhuǎn)換”的方法,整個(gè)完整的機(jī)器翻譯過程可以分成六個(gè)步驟:源語詞法分析、源語句法分析、源語-目標(biāo)語詞匯轉(zhuǎn)換、源語-目標(biāo)語結(jié)構(gòu)轉(zhuǎn)換、目標(biāo)語句法生成、目標(biāo)語詞法生成。每一個(gè)步驟都是通過相應(yīng)的翻譯規(guī)則來完成.2.基于統(tǒng)計(jì)的機(jī)器翻譯(StatisticalMachineTranslation,SMT)SMT是一種利用大量雙語語料庫進(jìn)行訓(xùn)練,通過統(tǒng)計(jì)學(xué)習(xí)方法來建立翻譯模型的機(jī)器翻譯方法。3.基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法(NeuralMachineTranslation,NMT)NMT是一種利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器翻譯的方法。它通常采用編碼器-解碼器(Encoder-Decoder)結(jié)構(gòu),將源語言文本編碼成一個(gè)固定長度的向量,然后再通過解碼器將該向量解碼成目標(biāo)語言文本。語音識(shí)別語音識(shí)別也稱為自動(dòng)語音識(shí)別(ASR)、計(jì)算機(jī)語音識(shí)別或語音轉(zhuǎn)文本,它是以語音為研究對象,通過信號(hào)處理和識(shí)別技術(shù)讓機(jī)器自動(dòng)識(shí)別和理解人類口述的語言后,將語音信號(hào)轉(zhuǎn)換為相應(yīng)的文本或命令的一門技術(shù)。語音識(shí)別的本質(zhì)是一種基于語音特征參數(shù)的模式識(shí)別,即通過學(xué)習(xí),系統(tǒng)能夠把輸入的語音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。目前,模式匹配原理已經(jīng)被應(yīng)用于大多數(shù)語音識(shí)別系統(tǒng)中。如圖1是基于模式匹配原理的語音識(shí)別系統(tǒng)框圖。語音識(shí)別的應(yīng)用場景溝通

語音在信息表達(dá)方面呈現(xiàn)表達(dá)快速但是讀取較慢的問題,特別是一大段語音發(fā)過來會(huì)讓人失去聽的興趣;所以可以通過ASR來轉(zhuǎn)化為文字,提高雙方的用戶體驗(yàn)

2、會(huì)議記錄

一些會(huì)議上可以用來作為會(huì)議記錄,幫助與會(huì)者提高會(huì)議效率。

3、智能硬件/語音搜索/智能客服產(chǎn)品的頭部流程

智能音箱等產(chǎn)品人機(jī)交互的第一步就是先進(jìn)行語音轉(zhuǎn)文字的過程。

4、教育測評

聲學(xué)系統(tǒng)與語言模型拎出來稍微加以修改可以作為評分系統(tǒng)應(yīng)用于教育行業(yè);幫助教師實(shí)施教育標(biāo)準(zhǔn)

5、客服記錄

客服是和用戶最近的人群,將語音通話過程轉(zhuǎn)為文字記錄下來,有助于客服部門評估業(yè)務(wù)服務(wù)水平,更有利于業(yè)務(wù)部門通過用戶溝通的原始信息分析并理解用戶需求自然語言處理的應(yīng)用1.自動(dòng)處理日常任務(wù)基于NLP的聊天機(jī)器人可以代替人工座席來處理大量日常任務(wù),讓員工騰出時(shí)間來處理更具挑戰(zhàn)性和更有趣的任務(wù)。例如,聊天機(jī)器人和數(shù)字助手可以識(shí)別各種用戶請求,然后從企業(yè)數(shù)據(jù)庫中找到相匹配的條目并有針對性地為用戶創(chuàng)建響應(yīng)。2.優(yōu)化搜索對于文檔和FAQ檢索,NLP可以優(yōu)化關(guān)鍵字匹配搜索,包括基于上下文消除歧義(例如“carrier”在生物醫(yī)學(xué)和工業(yè)領(lǐng)域分別表示不同的含義);匹配同義詞(例如在用戶搜索“automobile”時(shí)檢索提及“car”的文檔);考慮形態(tài)變化(這對非英語查詢非常重要)。利用基于NLP的學(xué)術(shù)搜索系統(tǒng),醫(yī)生、律師以及其他領(lǐng)域的專家能夠更加輕松、便捷地獲取高度相關(guān)的前沿研究信息。3.搜索引擎優(yōu)化NLP可幫助企業(yè)通過搜索分析來優(yōu)化內(nèi)容,提升自家組織在線上搜索中的展示排名。如今搜索引擎一般使用NLP技術(shù)來對結(jié)果進(jìn)行排序,如果企業(yè)了解如何有效利用NLP技術(shù),就能獲得相比競爭對手更加靠前的排名,進(jìn)而提高可見度。4.分析和組織大型文檔集合文檔聚類和主題建模等NLP技術(shù)有助于您輕松了解大型文檔集合(例如企業(yè)報(bào)告、新聞文章或科學(xué)文檔)中內(nèi)容的多樣性。這些技術(shù)通常被用于法律取證目的。5.社交媒體分析NLP可以分析客戶評論和社交媒體評論,幫助企業(yè)更有效地理解大量信息。例如,情緒分析可以識(shí)別社交媒體評論流中的正面和負(fù)面評論,直接、實(shí)時(shí)衡量客戶情緒。這可以為企業(yè)提供巨大的回報(bào),例如提高客戶滿意度和收入。6.市場洞察企業(yè)可以使用NLP來分析客戶的語言,進(jìn)而更有效地滿足客戶需求,了解如何更好地與客戶溝通。例如,面向方面(Aspect-oriented)的情緒分析可以檢測社交媒體中關(guān)于特定方面或產(chǎn)品的情緒(例如“鍵盤很好,但屏幕太暗”),從而為產(chǎn)品設(shè)計(jì)和營銷提供切實(shí)可行的洞察。7.審核內(nèi)容如果您的企業(yè)吸引了大量用戶或客戶評論,NLP可以幫助您審核這些內(nèi)容,通過分析評論的用詞、語氣和意圖來確保實(shí)現(xiàn)高素質(zhì)和良好禮儀。人工智能應(yīng)用新編21世紀(jì)高等職業(yè)教育精品教材·電子與信息類主編黃源楊鑒余法紅項(xiàng)目8知識(shí)圖譜通過本章的學(xué)習(xí),了解知識(shí)圖譜的起源、發(fā)展歷程及應(yīng)用,理解知識(shí)圖譜的基本概念與實(shí)現(xiàn),掌握知識(shí)圖譜的實(shí)現(xiàn)方式。了解知識(shí)圖譜的起源與發(fā)展歷史理解知識(shí)圖譜的基本概念掌握知識(shí)圖譜的實(shí)現(xiàn)了解知識(shí)圖譜的應(yīng)用8.1知識(shí)圖譜概述知識(shí)圖譜(KnowledgeGraph)最早由Google公司提出。2012年11月Google公司開始了知識(shí)圖譜項(xiàng)目,該項(xiàng)目的關(guān)鍵在于從互聯(lián)網(wǎng)的海量資源、信息中提取實(shí)體、屬性、實(shí)體關(guān)系等,并利用這些信息構(gòu)建知識(shí)圖譜,用來解決并優(yōu)化個(gè)性化推薦、信息檢素、智能問答這三個(gè)方面出現(xiàn)的問題。知識(shí)圖譜的本質(zhì)是語義網(wǎng)絡(luò)(SemanticNetwork)的知識(shí)庫,也可理解為多關(guān)系圖(Multi-relationalGraph)。語義網(wǎng)絡(luò)是由Quillian于上世紀(jì)60年代提出的知識(shí)表達(dá)模式,采用相互連接的節(jié)點(diǎn)和邊來表示知識(shí),節(jié)點(diǎn)表示對象、概念,邊表示節(jié)點(diǎn)之間的關(guān)系。上圖是一個(gè)語義網(wǎng)絡(luò)的示例,它的中間是哺乳動(dòng)物,貓是一種哺乳動(dòng)物,貓有毛;熊是哺乳動(dòng)物,熊也有毛;鯨是一種哺乳動(dòng)物,鯨在水里面生活;魚也在水里面生活,也是一種動(dòng)物;哺乳動(dòng)物也是動(dòng)物的一種。語義網(wǎng)絡(luò)的優(yōu)點(diǎn)是簡單直白,缺點(diǎn)是缺乏標(biāo)準(zhǔn),完全靠用戶自定義。知識(shí)圖譜的基本概念1.本體(Ontology)圖譜本體(Ontology)的設(shè)計(jì)和構(gòu)建是知識(shí)圖譜構(gòu)建的第一步。本體是圖譜的模型,是對構(gòu)成圖譜的數(shù)據(jù)的一種模式約束。本體通過對于概念(concept)、術(shù)語(termino

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論