人工智能通識(微課版)課件 項(xiàng)目4 理解智能體與智能體AI_第1頁
人工智能通識(微課版)課件 項(xiàng)目4 理解智能體與智能體AI_第2頁
人工智能通識(微課版)課件 項(xiàng)目4 理解智能體與智能體AI_第3頁
人工智能通識(微課版)課件 項(xiàng)目4 理解智能體與智能體AI_第4頁
人工智能通識(微課版)課件 項(xiàng)目4 理解智能體與智能體AI_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

高等職業(yè)教育本科新形態(tài)系列教材(第1版·微課版)人工智能通識項(xiàng)目4周蘇教授QQ:81505050理解智能體與智能體AI項(xiàng)目4理解智能體與智能體人工智能學(xué)習(xí)目標(biāo)本項(xiàng)目的目標(biāo)和難點(diǎn)涵蓋了課程的核心內(nèi)容,旨在幫助學(xué)生全面掌握智能體技術(shù)的基本原理和應(yīng)用方法。·理解智能體與智能體人工智能的基本概念,包括智能體定義、特性及其與環(huán)境交互方式?!ふ莆罩悄荏w的性能度量方法,學(xué)會如何根據(jù)任務(wù)環(huán)境設(shè)計(jì)合理的性能度量標(biāo)準(zhǔn)。項(xiàng)目4理解智能體與智能體人工智能·熟悉智能體的任務(wù)環(huán)境分類,能夠根據(jù)任務(wù)環(huán)境的屬性選擇合適的智能體設(shè)計(jì)策略?!ち私庵悄荏w的結(jié)構(gòu)與程序設(shè)計(jì),掌握不同類型智能體程序的特點(diǎn)和應(yīng)用場景?!ふ莆諏W(xué)習(xí)型智能體的基本原理,理解其在未知環(huán)境中的適應(yīng)能力和學(xué)習(xí)機(jī)制?!だ斫庵悄艽淼亩x和工作過程,并熟悉其在不同領(lǐng)域的典型應(yīng)用?!づ囵B(yǎng)智能體設(shè)計(jì)與分析能力,通過實(shí)踐項(xiàng)目提升對智能體技術(shù)的應(yīng)用和創(chuàng)新能力。項(xiàng)目4理解智能體與智能體人工智能知識目標(biāo)(1)智能體的基本概念?!だ斫庵悄荏w的定義、特性(自主性、理性、學(xué)習(xí)能力等)。·掌握智能體與環(huán)境的交互模型(傳感器、執(zhí)行器、感知序列等)?!だ斫庵悄荏w函數(shù)與智能體程序的區(qū)別。項(xiàng)目4理解智能體與智能體人工智能(2)智能體的性能度量。·學(xué)會設(shè)計(jì)性能度量標(biāo)準(zhǔn),理解其對智能體行為的影響?!ふ莆绽硇灾悄荏w的概念及其決策依據(jù)。(3)任務(wù)環(huán)境的分類與屬性。·掌握任務(wù)環(huán)境的PEAS(性能、環(huán)境、執(zhí)行器、傳感器)描述方法。·理解任務(wù)環(huán)境的屬性分類(如完全可觀測與部分可觀測、確定性與非確定性、單智能體與多智能體等)。項(xiàng)目4理解智能體與智能體人工智能(4)智能體的結(jié)構(gòu)與程序設(shè)計(jì)?!ふ莆詹煌愋椭悄荏w程序(簡單反射型、基于模型的反射型、基于目標(biāo)的、基于效用的)的特點(diǎn)和適用場景?!だ斫鈱W(xué)習(xí)型智能體的組件(性能元素、學(xué)習(xí)元素、評估者、問題生成器)及其作用。項(xiàng)目4理解智能體與智能體人工智能(5)智能代理的定義與應(yīng)用?!だ斫庵悄艽淼亩x、工作過程及其與智能體的關(guān)系?!ふ莆罩悄艽淼湫蛻?yīng)用領(lǐng)域(股票交易、醫(yī)療診斷、搜索引擎、實(shí)體機(jī)器人等)。(6)智能體技術(shù)的未來趨勢與挑戰(zhàn):·了解智能體技術(shù)關(guān)鍵發(fā)展趨勢(如增強(qiáng)學(xué)習(xí)、多智能體系統(tǒng)、自然語言處理等)?!だ斫庵悄荏w技術(shù)面臨的倫理、法律和技術(shù)挑戰(zhàn)。項(xiàng)目4理解智能體與智能體人工智能教學(xué)難點(diǎn)(1)智能體性能度量的設(shè)計(jì).·如何根據(jù)任務(wù)環(huán)境設(shè)計(jì)合理的性能度量標(biāo)準(zhǔn),避免出現(xiàn)不合理的行為(如真空吸塵器智能體的“反復(fù)清理”問題)?!だ斫庑阅芏攘颗c智能體行為之間的關(guān)系。項(xiàng)目4理解智能體與智能體人工智能(2)任務(wù)環(huán)境的分類與理解?!ふ莆杖蝿?wù)環(huán)境的多維度分類(如完全可觀測與部分可觀測、確定性與非確定性等),并能夠根據(jù)具體場景進(jìn)行分類?!だ斫獠煌蝿?wù)環(huán)境屬性對智能體設(shè)計(jì)的影響。項(xiàng)目4理解智能體與智能體人工智能(3)智能體程序的設(shè)計(jì)與實(shí)現(xiàn)?!だ斫獠煌愋椭悄荏w程序(如基于模型反射型、基于目標(biāo)、基于效用)實(shí)現(xiàn)機(jī)制?!ふ莆杖绾瓮ㄟ^智能體程序?qū)崿F(xiàn)理性行為。(4)學(xué)習(xí)型智能體的學(xué)習(xí)機(jī)制。·理解學(xué)習(xí)型智能體的組件(性能元素、學(xué)習(xí)元素、評估者、問題生成器)及其相互作用。·掌握學(xué)習(xí)型智能體在未知環(huán)境中的適應(yīng)能力和學(xué)習(xí)策略。項(xiàng)目4理解智能體與智能體人工智能(5)智能代理的協(xié)同合作與系統(tǒng)設(shè)計(jì)。·理解多個(gè)智能代理在復(fù)雜系統(tǒng)中的協(xié)同工作原理?!ふ莆杖绾卧O(shè)計(jì)智能代理系統(tǒng)以實(shí)現(xiàn)高效的任務(wù)執(zhí)行和信息共享。(6)智能體技術(shù)的倫理與法律問題。·理解智能體技術(shù)在倫理和法律方面可能帶來的問題(如自主決策的后果、數(shù)據(jù)隱私等)?!ぬ接懭绾卧诩夹g(shù)應(yīng)用中平衡創(chuàng)新與倫理、法律的約束。項(xiàng)目4

理解智能體與智能體人工智能任務(wù)4.1理解智能體和環(huán)境任務(wù)4.2熟悉智能代理與智能體人工智能智能體(Agents)是人工智能領(lǐng)域中一個(gè)很重要的概念,它本質(zhì)上是一個(gè)能自主活動的軟件或者硬件實(shí)體,任何獨(dú)立的能夠思考并可以同環(huán)境交互的實(shí)體都可以抽象為智能體。由此,人工智能可以進(jìn)一步被定義為“對從環(huán)境中接受感知并執(zhí)行行動的智能體的研究”。智能體概念既能概括為以機(jī)器為載體的人工智能,也能概括以有機(jī)體為載體的生物智能——生物就是感知環(huán)境并適應(yīng)環(huán)境的有機(jī)智能體。更一般地,“智能是系統(tǒng)通過獲取和加工信息而獲得的一種能力,從而實(shí)現(xiàn)從簡單到復(fù)雜的演化”,這也同時(shí)涵蓋了生物智能和機(jī)器智能。任務(wù)4.1理解智能體和環(huán)境01智能體的定義02智能體的性能度量03智能體的任務(wù)環(huán)境04智能體的結(jié)構(gòu)與程序目錄/CONTENTS05學(xué)習(xí)型智能體PART01智能體的定義任何通過傳感器感知環(huán)境并通過執(zhí)行器作用于該環(huán)境的事物都可以被視為智能體。我們從檢查智能體、環(huán)境以及它們之間的耦合,觀察到某些智能體比其他智能體表現(xiàn)得更好,由此可以引出理性智能體的概念,即行為盡可能好。智能體的行為取決于環(huán)境的性質(zhì)。

圖4-1智能體通過傳感器和執(zhí)行器與環(huán)境交互4.1.1智能體的定義一個(gè)人類智能體以眼睛、耳朵和其他器官作為傳感器,以手、腿、聲道等作為執(zhí)行器。機(jī)器人智能體可能以攝像頭和紅外測距儀作為傳感器,各種電動機(jī)作為執(zhí)行器。軟件智能體接收文件內(nèi)容、網(wǎng)絡(luò)數(shù)據(jù)包和人工輸入(鍵盤/鼠標(biāo)/觸摸屏/語音)作為傳感輸入,并通過寫入文件、發(fā)送網(wǎng)絡(luò)數(shù)據(jù)包、顯示信息或生成聲音對環(huán)境進(jìn)行操作。環(huán)境可以是一切,甚至是整個(gè)宇宙。實(shí)際上,我們在設(shè)計(jì)智能體時(shí)關(guān)心的只是宇宙中某一部分的狀態(tài),即影響智能體感知以及受智能體動作影響的部分。4.1.1智能體的定義我們使用術(shù)語感知來表示智能體的傳感器知覺的內(nèi)容。一般而言,一個(gè)智能體在任何給定時(shí)刻的動作選擇,可能取決于其內(nèi)置知識和迄今為止觀察到的整個(gè)感知序列。為每個(gè)可能的感知序列指定智能體的動作選擇,智能體的行為由智能體函數(shù)描述,該函數(shù)將任意給定的感知序列映射到一個(gè)動作。4.1.1智能體的定義可以想象將任何給定智能體的智能體函數(shù)制成表格,對大多數(shù)智能體來說,這將是一個(gè)非常大的表,事實(shí)上是無限的(除非限制所考慮的感知序列的長度)。給定一個(gè)要進(jìn)行實(shí)驗(yàn)的智能體,原則上,可以通過嘗試所有可能的感知序列并記錄智能體響應(yīng)的動作來構(gòu)建此表。除了這些外部特征,在內(nèi)部,智能體的智能體函數(shù)將由智能體程序來實(shí)現(xiàn),智能體函數(shù)是一種抽象的數(shù)學(xué)描述,而智能體程序是一個(gè)具體的實(shí)現(xiàn),可以在某些物理系統(tǒng)中運(yùn)行。智能體概念主要用作為分析系統(tǒng)的工具,而不是將世界劃分為智能體和非智能體的絕對表征。4.1.1智能體的定義例如一個(gè)簡單例子——真空吸塵器。在一個(gè)由方格組成的世界中有一個(gè)機(jī)器人真空吸塵器智能體,其中的方格可能是臟的,也可能是干凈的。考慮只有兩個(gè)方格的情況——方格A和方格B。真空吸塵器智能體可以感知它在哪個(gè)方格中以及方格中是否干凈。智能體從方格A開始,可選的操作包括向右移動、向左移動、吸塵或什么都不做(真正的機(jī)器人是采用“向前旋轉(zhuǎn)輪子”和“向后旋轉(zhuǎn)輪子”這樣的動作)。一個(gè)簡單智能體函數(shù)如下:如果當(dāng)前方格是臟的,就吸塵;否則,移動到另一個(gè)方格。4.1.1智能體的定義PART02智能體的性能度量理性智能體是做正確事情的事物。人工智能通常通過結(jié)果來評估智能體的行為。當(dāng)智能體進(jìn)入環(huán)境時(shí),它會根據(jù)接受的感知產(chǎn)生一個(gè)動作序列,這會導(dǎo)致環(huán)境經(jīng)歷一系列的狀態(tài)。如果序列是理想的,則智能體表現(xiàn)良好,這個(gè)概念由性能度量描述,評估任何給定環(huán)境狀態(tài)的序列。4.1.2智能體的性能度量人類有適用于自身的理性概念,它與成功選擇產(chǎn)生環(huán)境狀態(tài)序列的行動有關(guān),這些環(huán)境狀態(tài)序列從人類的角度來看是可取的。但是機(jī)器沒有自己的欲望和偏好,至少在最初,性能度量是在機(jī)器設(shè)計(jì)者的頭腦中或者是在機(jī)器受眾的頭腦中。一些智能體設(shè)計(jì)具有性能度量的顯式表示,而在其他設(shè)計(jì)中,性能度量完全是隱式的,智能體可能會做正確的事情,但它不知道為什么。4.1.2智能體的性能度量應(yīng)該確?!笆┮詸C(jī)器的目的是我們真正想要的目的”,但是正確地制定性能度量可能非常困難。例如考慮真空吸塵器智能體,可能會建議用單個(gè)8小時(shí)班次中清理的灰塵量來度量性能。然而,一個(gè)理性的智能體可以通過清理灰塵,然后將其全部傾倒在地板上,然后再次清理,如此反復(fù),從而最大化這一性能度量值。更合適的性能度量是獎勵擁有干凈地板的智能體。例如在每個(gè)時(shí)間步中,每個(gè)干凈方格可以獲得1分(可能會對耗電和產(chǎn)生的噪聲進(jìn)行懲罰)??梢姡鳛橐话阋?guī)則,更好的做法是根據(jù)一個(gè)人在環(huán)境中真正想要實(shí)現(xiàn)的目標(biāo),而不是根據(jù)一個(gè)人認(rèn)為智能體應(yīng)該如何表現(xiàn)來設(shè)計(jì)性能度量。4.1.2智能體的性能度量4.1.2.1理性在任何時(shí)候,理性取決于以下4方面:(1)定義成功標(biāo)準(zhǔn)的性能度量;(2)智能體對環(huán)境的先驗(yàn)知識;(3)智能體可以執(zhí)行的動作;(4)智能體到目前為止的感知序列。4.1.2智能體的性能度量于是,對理性智能體的定義是:對于每個(gè)可能的感知序列,給定感知序列提供的證據(jù)和智能體所擁有的任何先驗(yàn)知識,理性智能體應(yīng)該選擇一個(gè)期望最大化其性能度量的動作。以一個(gè)簡單真空吸塵器智能體為例,首先需要說明性能度量是什么,對環(huán)境了解多少,以及智能體具有哪些傳感器和執(zhí)行器。4.1.2智能體的性能度量4.1.2.2全知、學(xué)習(xí)和自主我們需要區(qū)分理性和全知。全知的智能體能預(yù)知其行動的實(shí)際結(jié)果,并據(jù)此采取行動,但在現(xiàn)實(shí)中,全知是不可能的,理性不等同于完美。理性使期望性能最大化,而完美使實(shí)際性能最大化。對理性的定義并不需要全知,因?yàn)槔硇詻Q策只取決于迄今為止的感知序列。4.1.2智能體的性能度量首先,考慮到缺乏信息的感知序列是不理性的:例如過馬路,不觀察路況就過馬路發(fā)生事故的風(fēng)險(xiǎn)太大。其次,理性智能體在上街之前應(yīng)該選擇“觀察”動作,因?yàn)橛^察有助于最大化期望性能。采取行動來改變未來的感知,有時(shí)被稱為信息收集,這是理性的一個(gè)重要組成部分。4.1.2智能體的性能度量理性智能體不僅要收集信息,還要盡可能多地從它所感知到的東西中學(xué)習(xí)。智能體的初始配置可以反映對環(huán)境的一些先驗(yàn)知識,但隨著智能體獲得經(jīng)驗(yàn),這可能會被修改和增強(qiáng)。在一些極端情況下,環(huán)境完全是先驗(yàn)已知的和完全可預(yù)測的,這種情況下智能體不需要感知或?qū)W習(xí),只需正確地運(yùn)行。當(dāng)然,這樣的智能體是脆弱的。4.1.2智能體的性能度量如果在某種程度上,智能體依賴于其設(shè)計(jì)者的先驗(yàn)知識,而不是其自身的感知和學(xué)習(xí)過程,就說該智能體缺乏自主性。一個(gè)理性的智能體應(yīng)該是自主的,它應(yīng)該學(xué)習(xí)如何彌補(bǔ)部分或不正確的先驗(yàn)知識,例如學(xué)習(xí)預(yù)測何時(shí)何地會出現(xiàn)額外灰塵的真空吸塵器就比不能學(xué)習(xí)預(yù)測的要好。4.1.2智能體的性能度量實(shí)際上,很少從一開始就要求智能體完全自主:除非設(shè)計(jì)者提供一些幫助,否則當(dāng)智能體幾乎沒有經(jīng)驗(yàn)時(shí),它將不得不隨機(jī)行動。為人工智能體提供一些初始知識和學(xué)習(xí)能力是合理的。在充分體驗(yàn)相應(yīng)環(huán)境后,理性智能體的行為可以有效地獨(dú)立于其先驗(yàn)知識。因此,結(jié)合學(xué)習(xí)能夠讓我們設(shè)計(jì)單個(gè)理性智能體,它能在各種各樣的環(huán)境中取得成功。4.1.2智能體的性能度量PART03智能體的任務(wù)環(huán)境有了理性的定義,構(gòu)建理性智能體還必須考慮任務(wù)環(huán)境,它本質(zhì)上是“問題”,理性智能體是“解決方案”。首先是指定任務(wù)環(huán)境,然后展示任務(wù)環(huán)境的多種形式。任務(wù)環(huán)境的性質(zhì)直接影響到智能體程序的恰當(dāng)設(shè)計(jì)。4.1.3智能體的任務(wù)環(huán)境4.1.3.1指定任務(wù)環(huán)境討論簡單真空吸塵器智能體的理性時(shí),必須為其指定性能度量、環(huán)境以及智能體的執(zhí)行器和傳感器,這些都?xì)w于任務(wù)環(huán)境的范疇,稱為PEAS(Performance性能,Environment環(huán)境,Actuator執(zhí)行器,Sensor傳感器)描述。在設(shè)計(jì)智能體時(shí),第一步始終是盡可能完整地指定任務(wù)環(huán)境。我們來考慮一個(gè)更復(fù)雜的問題:自動駕駛出租車的任務(wù)環(huán)境PEAS描述(見表4-1)。4.1.3智能體的任務(wù)環(huán)境表4-1自動駕駛出租車司機(jī)任務(wù)環(huán)境的PEAS描述4.1.3智能體的任務(wù)環(huán)境首先,對于自動駕駛追求的性能度量,理想的標(biāo)準(zhǔn)包括到達(dá)正確的目的地,盡量減少油耗和磨損,盡量減少行程時(shí)間或成本,盡量減少違反交通法規(guī)和對其他駕駛員的干擾,最大限度地提高安全性和乘客舒適度,最大化利潤。顯然,其中有一些目標(biāo)是相互沖突的,需要權(quán)衡。接下來,出租車將面臨什么樣的駕駛環(huán)境?任何出租車司機(jī)都必須能夠在各種道路上行駛,道路上有其他交通工具、行人、流浪動物、道路工程、警車、水坑和坑洼。出租車還必須與潛在以及實(shí)際的乘客互動。另外,還有一些可選項(xiàng),例如很少下雪的南方或者經(jīng)常下雪的北方。顯然,環(huán)境越受限,設(shè)計(jì)問題就越容易解決。4.1.3智能體的任務(wù)環(huán)境自動駕駛出租車的執(zhí)行器包括可供人類駕駛員使用的器件,例如通過加速器控制發(fā)動機(jī)以及控制轉(zhuǎn)向和制動。此外,它還需要輸出到顯示屏或語音合成器,以便與乘客進(jìn)行對話,或許還需要某種方式與其他車輛進(jìn)行禮貌的或其他方式的溝通。4.1.3智能體的任務(wù)環(huán)境出租車的基本傳感器將包括一個(gè)或多個(gè)攝像頭以便觀察,以及激光雷達(dá)和超聲波傳感器以便檢測其他車輛和障礙物的距離。為了避免超速罰單,出租車應(yīng)該有一個(gè)速度表,而為了正確控制車輛(特別是在彎道上),它應(yīng)該有一個(gè)加速度表。要確定車輛的機(jī)械狀態(tài),需要發(fā)動機(jī)、燃油和電氣系統(tǒng)的傳感器常規(guī)陣列。像許多人類駕駛者一樣,它可能需要獲取北斗導(dǎo)航信號,這樣就不會迷路。最后,乘客需要觸摸屏或語音輸入才能說明目的地。4.1.3智能體的任務(wù)環(huán)境4.1.3.2任務(wù)環(huán)境的屬性人工智能中可能出現(xiàn)的任務(wù)環(huán)境范圍非常廣泛。然而,我們可以確定少量的維度,并根據(jù)這些維度對任務(wù)環(huán)境進(jìn)行分類。這些維度在很大程度上決定了恰當(dāng)?shù)闹悄荏w設(shè)計(jì)以及智能體實(shí)現(xiàn)的主要技術(shù)系列的適用性。4.1.3智能體的任務(wù)環(huán)境(1)完全可觀測與部分可觀測:如果智能體的傳感器能讓它在每個(gè)時(shí)間點(diǎn)都能訪問環(huán)境的完整狀態(tài),那么我們說任務(wù)環(huán)境是完全可觀測的。如果傳感器檢測到與動作選擇相關(guān)的所有方面,那么任務(wù)環(huán)境就是有效的完全可觀測的,而所謂的相關(guān)又取決于性能度量標(biāo)準(zhǔn)。完全可觀測的環(huán)境很容易處理,因?yàn)橹悄荏w不需要維護(hù)任何內(nèi)部狀態(tài)來追蹤世界。由于傳感器噪聲大且不準(zhǔn)確,或者由于傳感器數(shù)據(jù)中缺少部分狀態(tài),環(huán)境可能部分可觀測。4.1.3智能體的任務(wù)環(huán)境例如,自動駕駛出租車無法感知其他司機(jī)的想法。如果智能體根本沒有傳感器,那么環(huán)境是不可觀測的。在這種情況下,有人可能會認(rèn)為智能體的困境是無解的,但是,智能體的目標(biāo)可能仍然可以實(shí)現(xiàn)。4.1.3智能體的任務(wù)環(huán)境(2)單智能體與多智能體:單智能體和多智能體環(huán)境之間的區(qū)別似乎足夠簡單。例如,下國際象棋的智能體就處于二智能體環(huán)境中。然而,這里也有一些微妙的問題。例如智能體A(出租車司機(jī))是否必須將對象B(另一輛車)視為智能體,還是可以僅將其視為根據(jù)物理定律運(yùn)行的對象。關(guān)鍵在于B的行為是否描述為一個(gè)性能度量,而這一性能度景的值取決于智能體A的行為。在出租車駕駛環(huán)境中,出租車就處在一個(gè)部分合作的多智能體環(huán)境中。多智能體環(huán)境中的智能體設(shè)計(jì)問題通常與單智能體環(huán)境下有較大差異。4.1.3智能體的任務(wù)環(huán)境(3)確定性與非確定性:如果環(huán)境的下一個(gè)狀態(tài)完全由當(dāng)前狀態(tài)和智能體執(zhí)行的動作決定,那么就說環(huán)境是確定性的,否則是非確定性的。原則上,在完全可觀測的確定性環(huán)境中,智能體不需要擔(dān)心不確定性。然而,如果環(huán)境是部分可觀測的,那么它可能是非確定性的。大多數(shù)真實(shí)情況非常復(fù)雜,以至于不可能追蹤所有未觀測到的方面;出于實(shí)際目的,必須將其視為非確定性的。從這個(gè)意義上講,出租車駕駛顯然是非確定性的,因?yàn)槿藗冇肋h(yuǎn)無法準(zhǔn)確地預(yù)測交通行為。此外,輪胎可能會意外爆胎,發(fā)動機(jī)可能會突然失靈。4.1.3智能體的任務(wù)環(huán)境最后注意,如果環(huán)境模型顯式地處理概率(如“明天的降雨可能性為25%”),那么它是隨機(jī)的;如果可能性沒有被量化,那么它是“非確定性的”(如“明天有可能下雨”)。4.1.3智能體的任務(wù)環(huán)境(4)回合式與序貫:在回合式任務(wù)環(huán)境中,智能體的經(jīng)驗(yàn)被劃分為原子式的回合,每接收一個(gè)感知,然后執(zhí)行單個(gè)動作。重要的是,下一回合并不依賴于前幾回合采取的動作。許多分類任務(wù)是回合式的。例如在裝配流水線上檢測缺陷零件的智能體需要根據(jù)當(dāng)前零件做出每個(gè)決策,而無須考慮以前的決策,且當(dāng)前決策不影響下一個(gè)零件是否有缺陷。但是,在序貫環(huán)境中,當(dāng)前決策可能會影響未來所有決策,如國際象棋和出租車駕駛就是序貫的。在回合式環(huán)境下智能體不需要提前思考,所以要比序貫環(huán)境簡單很多。4.1.3智能體的任務(wù)環(huán)境(5)靜態(tài)與動態(tài):如果環(huán)境在智能體思考時(shí)發(fā)生了變化,就說該智能體的環(huán)境是動態(tài)的,否則是靜態(tài)的。靜態(tài)環(huán)境容易處理,但是動態(tài)環(huán)境會不斷地詢問智能體想要采取什么行動,如果它還沒有決定,那就等同于什么都不做。如果環(huán)境本身不會隨著時(shí)間的推移而改變,但智能體的性能分?jǐn)?shù)會改變,我們就說環(huán)境是半動態(tài)的。駕駛出租車顯然是動態(tài)的,因?yàn)轳{駛算法在計(jì)劃下一步該做什么時(shí),其他車輛和出租車本身在不斷移動。在用時(shí)鐘計(jì)時(shí)的情況下國際象棋是半動態(tài)的,填字游戲是靜態(tài)的。4.1.3智能體的任務(wù)環(huán)境(6)離散與連續(xù):這之間的區(qū)別適用于環(huán)境的狀態(tài)、處理時(shí)間的方式以及智能體的感知和動作。例如國際象棋有一組離散的感知和動作,駕駛出租車是一個(gè)連續(xù)狀態(tài)和連續(xù)時(shí)間的問題。4.1.3智能體的任務(wù)環(huán)境(7)已知與未知:這種區(qū)別是指智能體(或設(shè)計(jì)者)對環(huán)境“物理定律”的認(rèn)知狀態(tài)。在已知環(huán)境中,所有行動的結(jié)果(如果環(huán)境是非確定性的,則對應(yīng)結(jié)果的概率)都是既定的。顯然,如果環(huán)境未知,智能體將不得不了解它是如何工作的,才能做出正確的決策。最困難的情況是部分可觀測、多智能體、非確定性、序貫、動態(tài)、連續(xù)且未知的。4.1.3智能體的任務(wù)環(huán)境PART04智能體的結(jié)構(gòu)與程序下面我們來討論智能體內(nèi)部是如何工作的。人工智能的工作是設(shè)計(jì)一個(gè)智能體程序,實(shí)現(xiàn)智能體函數(shù),即從感知到動作的映射。假設(shè)該程序?qū)⑦\(yùn)行在某種具有物理傳感器和執(zhí)行器的計(jì)算設(shè)備上,稱之為智能體架構(gòu),公式如下。智能體=架構(gòu)+程序4.1.4智能體的結(jié)構(gòu)與程序顯然,我們選擇的程序必須是適合相應(yīng)架構(gòu)的程序。如果程序打算推薦步行這樣的動作,那么對應(yīng)的架構(gòu)最好有腿。架構(gòu)可能只是一臺普通PC,也可能是一輛帶有多臺車載計(jì)算機(jī)、攝像頭和其他傳感器的機(jī)器人汽車。通常,架構(gòu)使程序可以使用來自傳感器的感知,然后運(yùn)行程序,并將程序生成的動作選擇反饋給執(zhí)行器。我們考慮的智能體程序都有相同的框架:它們將當(dāng)前感知作為傳感器的輸入,并將動作返回給執(zhí)行器。智能體程序框架可以還有其他選擇。4.1.4智能體的結(jié)構(gòu)與程序注意智能體程序(將當(dāng)前感知作為輸入)和智能體函數(shù)(可能依賴整個(gè)感知?dú)v史)之間的差異。因?yàn)榄h(huán)境中沒有其他可用信息,所以智能體程序別無選擇,只能將當(dāng)前感知作為輸入。如果智能體的動作需要依賴于整個(gè)感知序列,那么智能體必須記住歷史感知。人工智能面臨的關(guān)鍵挑戰(zhàn)是找出編寫程序的方法,盡可能從一個(gè)小程序而不是從一個(gè)大表中產(chǎn)生理性行為。有4種基本的智能體程序,它們體現(xiàn)了幾乎所有智能系統(tǒng)的基本原理,每種智能體程序以特定的方式組合特定的組件來產(chǎn)生動作。4.1.4智能體的結(jié)構(gòu)與程序(1)簡單反射型智能體。這是最簡單的智能體,它們根據(jù)當(dāng)前感知選擇動作,忽略感知?dú)v史的其余部分。4.1.4智能體的結(jié)構(gòu)與程序(2)基于模型的反射型智能體。處理部分可觀測性的最有效方法是讓智能體追蹤它現(xiàn)在觀測不到的部分世界。也就是說,智能體應(yīng)該維護(hù)某種依賴于感知?dú)v史的內(nèi)部狀態(tài),從而反映當(dāng)前狀態(tài)的一些未觀測到的方面。對于剎車問題,內(nèi)部狀態(tài)范圍不僅限于攝像頭拍攝圖像的前一幀,要讓智能體能夠檢測車輛邊緣的兩個(gè)紅燈何時(shí)同時(shí)亮起或熄滅。對于其他駕駛?cè)蝿?wù),如變道,如果智能體無法同時(shí)看到其他車輛,則需要追蹤它們的位置。4.1.4智能體的結(jié)構(gòu)與程序轉(zhuǎn)移模型和傳感器模型結(jié)合在一起讓智能體能夠在傳感器受限的情況下盡可能地跟蹤世界的狀態(tài)。使用此類模型的智能體稱為基于模型的智能體。4.1.4智能體的結(jié)構(gòu)與程序(3)基于目標(biāo)的智能體。即使了解了環(huán)境的現(xiàn)狀,也并不總是能決定做什么。例如,在一個(gè)路口,出租車可以左轉(zhuǎn)、右轉(zhuǎn)或直行。正確的決定還取決于出租車要去哪里。換句話說,除了當(dāng)前狀態(tài)的描述之外,智能體還需要某種描述理想情況的目標(biāo)信息,例如設(shè)定特定的目的地。智能體程序可以將其與模型相結(jié)合,并選擇實(shí)現(xiàn)目標(biāo)的動作。4.1.4智能體的結(jié)構(gòu)與程序(4)基于效用的智能體。在大多數(shù)環(huán)境中,僅靠目標(biāo)并不足以產(chǎn)生高質(zhì)量的行為。例如,許多動作序列都能使出租車到達(dá)目的地,但有些動作序列比其他動作序列更快、更安全、更可靠或者更便宜。這個(gè)時(shí)候,目標(biāo)只是在“快樂”和“不快樂”狀態(tài)之間提供了一個(gè)粗略的二元區(qū)別。更一般的性能度量應(yīng)該允許根據(jù)不同世界狀態(tài)的“快樂”程度來對智能體進(jìn)行比較。經(jīng)濟(jì)學(xué)家和計(jì)算機(jī)科學(xué)家通常用效用這個(gè)詞來代替“快樂”,因?yàn)椤翱鞓贰甭犉饋聿皇呛芸茖W(xué)。4.1.4智能體的結(jié)構(gòu)與程序我們已經(jīng)看到,性能度量會給任何給定的環(huán)境狀態(tài)序列打分。智能體的效用函數(shù)本質(zhì)上是性能度量的內(nèi)部化。如果內(nèi)部效用函數(shù)和外部性能度量一致,那么根據(jù)外部性能度量選擇動作,以使其效用最大化的智能體是理性的。4.1.4智能體的結(jié)構(gòu)與程序PART05學(xué)習(xí)型智能體在圖靈早期的著名論文中,曾經(jīng)考慮了手動編程實(shí)現(xiàn)智能機(jī)器的想法。他估計(jì)了這可能需要多少工作量,并得出結(jié)論,“似乎需要一些更快捷的方法”。他提出的方法是構(gòu)造學(xué)習(xí)型機(jī)器,然后教它們。在人工智能的許多領(lǐng)域,這是目前創(chuàng)建最先進(jìn)系統(tǒng)的首選方法。任何類型的智能體(基于模型、基于目標(biāo)、基于效用等)都可以構(gòu)建(或不構(gòu)建)成學(xué)習(xí)型智能體。4.1.5學(xué)習(xí)型智能體學(xué)習(xí)還有另一個(gè)優(yōu)勢:它讓智能體能夠在最初未知的環(huán)境中運(yùn)作,并變得比其最初的能力更強(qiáng)。學(xué)習(xí)型智能體可分為4個(gè)概念組件,其中,“性能元素”框表示我們之前認(rèn)為的整個(gè)智能體程序,“學(xué)習(xí)元素”框可以修改該程序以提升其性能。

圖4-2通用學(xué)習(xí)型智能體4.1.5學(xué)習(xí)型智能體最重要的區(qū)別在于負(fù)責(zé)提升的學(xué)習(xí)元素和負(fù)責(zé)選擇外部行動的性能元素。性能元素是我們之前認(rèn)為的整個(gè)智能體:它接受感知并決定動作。學(xué)習(xí)元素使用來自評估者對智能體表現(xiàn)的反饋,并以此確定應(yīng)該如何修改性能元素以在未來做得更好。4.1.5學(xué)習(xí)型智能體學(xué)習(xí)元素的設(shè)計(jì)在很大程度上取決于性能元素的設(shè)計(jì)。當(dāng)設(shè)計(jì)者試圖設(shè)計(jì)一個(gè)學(xué)習(xí)某種能力的智能體時(shí),第一個(gè)問題是“一旦智能體學(xué)會了如何做,它將使用什么樣的性能元素?”給定性能元素的設(shè)計(jì),可以構(gòu)造學(xué)習(xí)機(jī)制來改進(jìn)智能體的每個(gè)部分。4.1.5學(xué)習(xí)型智能體評估者告訴學(xué)習(xí)元素:智能體在固定性能標(biāo)準(zhǔn)方面的表現(xiàn)如何。評估者是必要的,因?yàn)楦兄旧聿⒉粫甘局悄荏w是否成功。例如,國際象棋程序可能會收到一個(gè)感知,提示它已將死對手,但它需要一個(gè)性能標(biāo)準(zhǔn)來知道這是一件好事。確定性能標(biāo)準(zhǔn)很重要。從概念上講,應(yīng)該把它看作完全在智能體之外,智能體不能修改性能標(biāo)準(zhǔn)以適應(yīng)自己的行為。4.1.5學(xué)習(xí)型智能體學(xué)習(xí)型智能體的最后一個(gè)組件是問題生成器。它負(fù)責(zé)建議動作,這些動作將獲得全新和信息豐富的經(jīng)驗(yàn)。如果性能元素完全根據(jù)自己的方式,它會繼續(xù)選擇已知最好的動作。但如果智能體愿意進(jìn)行一些探索,并在短期內(nèi)做一些可能不太理想的動作,那么從長遠(yuǎn)來看,它可能會發(fā)現(xiàn)更好的動作。問題生成器的工作是建議這些探索性行動。這就是科學(xué)家在進(jìn)行實(shí)驗(yàn)時(shí)所做的。伽利略并不認(rèn)為從比薩斜塔頂端扔石頭本身有價(jià)值。他并不是想要打碎石頭或改造不幸行人的大腦。他的目的是通過確定更好的物體運(yùn)動理論來改造自己的大腦。4.1.5學(xué)習(xí)型智能體學(xué)習(xí)元素可以對智能體圖中顯示的任何“知識”組件進(jìn)行更改。最簡單的情況是直接從感知序列學(xué)習(xí)。觀察成對相繼的環(huán)境狀態(tài)可以讓智能體了解“我的動作做了什么”以及“世界如何演變”以響應(yīng)其動作。例如,如果自動駕駛出租車在濕滑路面上行駛時(shí)進(jìn)行一定程度的剎車,那么它很快就會發(fā)現(xiàn)實(shí)際減速多少,以及它是否滑出路面。問題生成器可能會識別出模型中需要改進(jìn)的某些部分,并建議進(jìn)行實(shí)驗(yàn),例如在不同條件下的不同路面上嘗試剎車。4.1.5學(xué)習(xí)型智能體無論外部性能標(biāo)準(zhǔn)如何,改進(jìn)基于模型的智能體的組件,使其更好地符合現(xiàn)實(shí)幾乎總是一個(gè)好主意。(從計(jì)算的角度來看,在某些情況下簡單但稍微不準(zhǔn)確的模型比完美但極其復(fù)雜的模型更好。)當(dāng)智能體試圖學(xué)習(xí)反射組件或效用函數(shù)時(shí),需要外部標(biāo)準(zhǔn)的信息。從某種意義上說,性能標(biāo)準(zhǔn)將傳入感知的一部分區(qū)分為獎勵或懲罰,以提供對智能體行為質(zhì)量的直接反饋。4.1.5學(xué)習(xí)型智能體更一般地說,人類的選擇可以提供有關(guān)人類偏好的信息。例如,假設(shè)出租車不知道人們通常不喜歡噪聲,于是決定不停地按喇叭以確保行人知道它即將到來。隨之而來的人類行為,如蓋住耳朵、說臟話甚至可能剪斷喇叭上的電線,將為智能體提供更新其效用函數(shù)的證據(jù)。總之,智能體有各種各樣的組件,智能體中的學(xué)習(xí)可以概括為對其各個(gè)組件進(jìn)行修改的過程,使各組件與可用的反饋信息更接近,從而提升智能體的整體性能。4.1.5學(xué)習(xí)型智能體項(xiàng)目4

理解智能體與智能體人工智能任務(wù)4.1理解智能體和環(huán)境任務(wù)4.2熟悉智能代理與智能體人工智能在社會科學(xué)中,智能代理是指一個(gè)理性并且自主的人或其他系統(tǒng),它根據(jù)感知世界得到的信息來做出動作以影響這個(gè)世界。這一定義在計(jì)算機(jī)智能代理中同樣適用。代理必須理性,根據(jù)可得的信息做出正確的決定;代理也必須自主,它與世界的關(guān)系包括感知世界的過程,它做出的決定源于對世界的感知及自身經(jīng)歷。智能代理的一部分任務(wù)就是理解周邊環(huán)境,隨后做出反應(yīng)。它的行為將改變環(huán)境,隨即改變其感知,但它仍舊需要在已經(jīng)改變的世界中繼續(xù)運(yùn)作。任務(wù)4.2熟悉智能代理與智能體人工智能大部分人工智能應(yīng)用都是一個(gè)獨(dú)立和龐大的程序系統(tǒng),通常系統(tǒng)在前期的實(shí)驗(yàn)性操作取得成功之后,卻無法按比例放大至所需要的規(guī)模,因?yàn)橄到y(tǒng)將變得太過龐大而運(yùn)作太慢。當(dāng)然,也可以利用其他途徑來擴(kuò)大規(guī)模,但常常又伴隨著難以理解甚至無法理解作為代價(jià)。因此,人們開發(fā)了智能代理來解決這些問題。智能代理的復(fù)雜性源于不同簡單程序間的相互作用。由于程序本身很小,行動范圍有限,所以系統(tǒng)是能夠被理解的。任務(wù)4.2熟悉智能代理與智能體人工智能01智能代理的定義02智能代理典型工作過程03智能代理系統(tǒng)內(nèi)的協(xié)同合作04智能代理的典型應(yīng)用目錄/CONTENTS05下一個(gè)風(fēng)口:智能體06智能體AI時(shí)代PART01智能代理的定義智能代理是定期地收集信息或執(zhí)行服務(wù)的程序,它不需要人工干預(yù),具有高度智能性和自主學(xué)習(xí)性,可以根據(jù)用戶定義的準(zhǔn)則,主動通過智能化代理為用戶搜集信息,然后利用通信協(xié)議把加工過的信息按時(shí)推送給用戶,它能推測用戶意圖,自主制訂、調(diào)整和執(zhí)行工作計(jì)劃。4.2.1智能代理的定義通常,廣義的智能代理包括人類、物理世界中的移動機(jī)器人和信息世界中軟件機(jī)器人,而狹義的智能代理則專指信息世界中的軟件機(jī)器人,它是代表用戶或其他程序,以主動服務(wù)的方式完成的一組操作的機(jī)動計(jì)算實(shí)體,主動服務(wù)包括主動適應(yīng)性和主動代理??傊悄艽硎侵甘占畔⒒蛱峁┢渌嚓P(guān)服務(wù)的程序,它不需要人的即時(shí)干預(yù)即可定時(shí)完成所需功能,它可以看作是利用傳感器感知環(huán)境,并使用效應(yīng)器作用于環(huán)境的任何實(shí)體。4.2.1智能代理的定義在因特網(wǎng)中,智能代理程序可以根據(jù)所提供的參數(shù),按一定周期,搜索整個(gè)因特網(wǎng)或它的一部分,收集你感興趣的信息。有些代理還可以基于注冊信息和用法分析在網(wǎng)站上將信息私人化。其他類型的代理包括定點(diǎn)監(jiān)測,然后等網(wǎng)站進(jìn)行更新或者尋找到其他的事情以后告知你,分析代理不僅收集信息,還為你整理和提供信息。代理把信息交給你的方法通常稱之為推技術(shù)。斯坦福大學(xué)的海爾斯·羅斯認(rèn)為“智能代理持續(xù)地執(zhí)行3項(xiàng)功能:感知環(huán)境中的動態(tài)條件,執(zhí)行動作影響環(huán)境,進(jìn)行推理以解釋感知信息、求解問題、產(chǎn)生推理和決定動作?!彼J(rèn)為,代理應(yīng)在動作選擇過程中進(jìn)行推理和規(guī)劃。4.2.1智能代理的定義PART02智能代理典型工作過程智能代理是一套輔助人和充當(dāng)他們代表的軟件,例如人們可以借助于智能代理進(jìn)行網(wǎng)上交易。智能代理的典型工作過程如圖所示。

圖4-3智能代理的典型工作過程4.2.2智能代理典型工作過程第一步:智能代理通過感知器收集外部環(huán)境信息;第二步:智能代理根據(jù)環(huán)境做出決策;第三步:智能代理通過執(zhí)行器影響外部環(huán)境。智能代理會不斷重復(fù)這一過程直到目標(biāo)達(dá)成,這一過程被稱之為“感知執(zhí)行循環(huán)”。4.2.2智能代理典型工作過程智能代理是可以進(jìn)行高級、復(fù)雜的自動處理的代理軟件。它在用戶沒有明確的具體要求的情況下,根據(jù)用戶需要,代替用戶進(jìn)行各種復(fù)雜的工作,如信息查詢、數(shù)據(jù)篩選及管理,并能推測用戶的意圖,自主制訂、調(diào)整和執(zhí)行工作計(jì)劃。智能代理可應(yīng)用于廣泛的領(lǐng)域,是信息檢索領(lǐng)域開發(fā)智能化、個(gè)性化信息檢索的重要技術(shù)之一。4.2.2智能代理典型工作過程一般地,智能代理的特點(diǎn)包括:(1)智能性。是指代理的推理和學(xué)習(xí)能力,它描述了智能代理接受用戶目標(biāo)指令并代表用戶完成任務(wù)的能力,如理解用戶用自然語言表達(dá)的對信息資源和計(jì)算資源的需求,幫助用戶在一定程度上克服信息內(nèi)容的語言障礙,捕捉用戶的偏好和興趣,推測用戶的意圖并為其代勞等。它能處理復(fù)雜的、難度高的任務(wù),自動拒絕一些不合理或可能給用戶帶來危害的要求,而且具有從經(jīng)驗(yàn)中不斷學(xué)習(xí)的能力。它可以適當(dāng)?shù)剡M(jìn)行自我調(diào)節(jié),提高處理問題的能力。4.2.2智能代理典型工作過程(2)代理性。主要是指智能代理的自主與協(xié)調(diào)工作能力。在功能上是用戶的某種代理,它可以代替用戶完成一些任務(wù),并將結(jié)果主動反饋給用戶。其表現(xiàn)為智能代理從事行為的自動化程度,即操作行為可以離開人或代理程序的干預(yù),但代理在其系統(tǒng)中必須通過操作行為加以控制,當(dāng)其他代理提出請求時(shí),只有代理自己才能決定是接受還是拒絕這種請求。4.2.2智能代理典型工作過程(3)移動性。是指智能代理在網(wǎng)絡(luò)之間的遷移能力。它可以在網(wǎng)絡(luò)上漫游到任何目標(biāo)主機(jī),并在目標(biāo)主機(jī)上進(jìn)行信息處理操作,最后將結(jié)果集中返回到起點(diǎn),而且能隨計(jì)算機(jī)用戶的移動而移動。必要時(shí),智能代理能夠同其他代理和人進(jìn)行交流,并且都可以從事自己的操作以及幫助其他代理和人。(4)主動性。能根據(jù)用戶的需求和環(huán)境的變化主動向用戶報(bào)告并提供服務(wù)。4.2.2智能代理典型工作過程(5)協(xié)作性。能通過各種通信協(xié)議和其他智能體進(jìn)行信息交流,并可以相互協(xié)調(diào),共同完成復(fù)雜的任務(wù)。(6)個(gè)性化。通過個(gè)性化的渲染和設(shè)置,用戶會在瀏覽商品的過程中,逐步提高購買欲。如果將智能代理技術(shù)應(yīng)用到電子商務(wù)系統(tǒng)中,可以為用戶提供一個(gè)不受時(shí)空限制的交易場所。4.2.2智能代理典型工作過程智能代理還有一個(gè)特點(diǎn),那就是學(xué)習(xí)的能力。因?yàn)樗鼈兩硖幀F(xiàn)實(shí)世界,并接收行為效果的反饋,這可以讓它們根據(jù)之前的決策成功與否來調(diào)整自身行為。負(fù)責(zé)行走的代理可以學(xué)習(xí)在地毯或木地板上不同的行走模式;負(fù)責(zé)預(yù)測未來股票走勢的代理可以根據(jù)股價(jià)實(shí)際上漲或下跌的情況來修改其計(jì)算方法。4.2.2智能代理典型工作過程PART03智能代理系統(tǒng)內(nèi)的協(xié)同合作智能代理技術(shù)通常會在適當(dāng)?shù)臅r(shí)候幫助人們完成迫切需要完成的任務(wù)。在智能代理程序中設(shè)置的一些獨(dú)立模塊甚至可以在不同計(jì)算機(jī)上運(yùn)行,但依然遵循所設(shè)計(jì)的層次協(xié)同合作原理。通過離散各個(gè)部分,智能代理的復(fù)雜度降低,使程序編寫和維護(hù)都更加簡單。雖然整個(gè)程序很復(fù)雜,但通過系統(tǒng)內(nèi)的協(xié)同合作,完全可以修改某些模塊而不影響任何其他模塊。4.2.3智能代理系統(tǒng)內(nèi)的協(xié)同合作例如,手機(jī)制造企業(yè)通常由好幾個(gè)不同的部門組成。如研發(fā)部門設(shè)計(jì)新手機(jī),生產(chǎn)部門制作手機(jī),銷售團(tuán)隊(duì)進(jìn)行銷售。營銷人員需要宣傳推廣新手機(jī),執(zhí)行主管則要保證他們不出差錯。如果企業(yè)想要獲得成功,則所有各個(gè)部門都要密切溝通交流。4.2.3智能代理系統(tǒng)內(nèi)的協(xié)同合作為了設(shè)計(jì)出人們樂于購買的產(chǎn)品,研發(fā)部門需要市場營銷方面的信息;只有與生產(chǎn)部門溝通,研發(fā)團(tuán)隊(duì)才能保證其設(shè)計(jì)是可以付諸實(shí)踐的;想要在銷售中獲利,銷售團(tuán)隊(duì)就必須從生產(chǎn)部門了解產(chǎn)品生產(chǎn)成本;銷售團(tuán)隊(duì)需要與市場部門溝通,了解產(chǎn)品用戶的承受能力與期望;任何時(shí)候都會有許多不同的產(chǎn)品設(shè)計(jì)在同時(shí)進(jìn)行,生產(chǎn)部門也會同時(shí)制造好幾種不同型號的產(chǎn)品;執(zhí)行主管需要決定重點(diǎn)推廣哪一種設(shè)計(jì)以及需要制作多少不同型號的產(chǎn)品。4.2.3智能代理系統(tǒng)內(nèi)的協(xié)同合作在人工智能領(lǐng)域中,多個(gè)智能代理在一個(gè)系統(tǒng)中協(xié)同作業(yè),每個(gè)智能代理負(fù)責(zé)自己最擅長的工作。為了執(zhí)行任務(wù),它們需要與其他做不同工作的智能代理溝通。每個(gè)智能代理都對環(huán)境進(jìn)行感知,它們的環(huán)境由任務(wù)所決定。4.2.3智能代理系統(tǒng)內(nèi)的協(xié)同合作PART04智能代理的典型應(yīng)用智能代理可分為四種類型:信息代理、檢測和監(jiān)視代理、數(shù)據(jù)挖掘代理、用戶或個(gè)人代理。(1)股票/債券/期貨交易。智能代理系統(tǒng)的一個(gè)適用場景是股票市場。代理被用于分析市場行情,生成買賣指令建議,甚至直接買入和賣出股票。某些獨(dú)立代理還會監(jiān)控股票市場并生成統(tǒng)計(jì)數(shù)據(jù),監(jiān)測異常價(jià)格變動,找尋適合買入或賣出的股票,管理用戶投資組合所代表的整體風(fēng)險(xiǎn)并與用戶互動。4.2.4智能代理的典型應(yīng)用交易智能代理根據(jù)獲取的新聞資訊和其他環(huán)境數(shù)據(jù)做出交易決策,并執(zhí)行交易過程。這一細(xì)分領(lǐng)域就是量化交易研究的內(nèi)容。

圖4-4交易智能代理過程4.2.4智能代理的典型應(yīng)用(2)醫(yī)療診斷。醫(yī)療診斷的智能代理以病人的檢查結(jié)果——血壓、心率、體溫等等作為輸入推測病情,推測的診斷結(jié)果將告知醫(yī)生,并由醫(yī)生根據(jù)診斷結(jié)果給予病人恰當(dāng)?shù)闹委?。這一場景中、病人和醫(yī)生同時(shí)作為外部環(huán)境,只能代理的輸入和輸出不同。

圖4-5醫(yī)療診斷過程4.2.4智能代理的典型應(yīng)用(3)搜索引擎。搜索引擎智能代理的輸入包括網(wǎng)頁和搜索用戶,它一方面以網(wǎng)絡(luò)爬蟲抓取的網(wǎng)頁作為輸入存入數(shù)據(jù)庫,在用戶搜索時(shí)從數(shù)據(jù)庫中檢索匹配最合適的網(wǎng)頁返回給用戶。

圖4-6搜索引擎過程4.2.4智能代理的典型應(yīng)用(4)實(shí)體機(jī)器人。實(shí)體機(jī)器人的智能代理與環(huán)境的交互過程與也相似。不同的是,它獲知環(huán)境是通過攝像頭、麥克風(fēng)、觸覺傳感器等物理外設(shè)實(shí)現(xiàn),執(zhí)行決策也是輪子、機(jī)器臂、揚(yáng)聲器、腿等物理外設(shè)完成,因?yàn)閷?shí)體使用物理外設(shè)與周圍環(huán)境交互,所以與其他單純的人工智能應(yīng)用場景稍有區(qū)別。

圖4-7實(shí)體機(jī)器人與環(huán)境的交互過程4.2.4智能代理的典型應(yīng)用(5)電腦游戲。游戲代理有兩種:一種用于與人類玩家實(shí)現(xiàn)對戰(zhàn),比如你玩棋牌游戲,那么對于智能代理而言,你就是環(huán)境,智能代理將以你的操作作為輸入,以戰(zhàn)勝你為目標(biāo)來做出決策并執(zhí)行決策。另一種則充當(dāng)了游戲中的其他角色,智能代理的目的是讓游戲更加真實(shí),更富可玩性。4.2.4智能代理的典型應(yīng)用PART05下一個(gè)風(fēng)口:智能體智能體作為人工智能領(lǐng)域的一個(gè)重要分支,正在逐漸成為未來科技發(fā)展的重要方向之一。作為下一代信息技術(shù)的關(guān)鍵驅(qū)動力,智能體將在多個(gè)行業(yè)引發(fā)變革。盡管面臨諸多挑戰(zhàn),但憑借其強(qiáng)大的自適應(yīng)能力和廣泛的應(yīng)用前景,智能體無疑將成為未來的“風(fēng)口”之一。企業(yè)和研究機(jī)構(gòu)應(yīng)積極布局,探索智能體在各自領(lǐng)域的創(chuàng)新應(yīng)用,抓住這一發(fā)展機(jī)遇。同時(shí),社會各界也需共同努力,解決相關(guān)的倫理、法律和技術(shù)難題,確保智能體技術(shù)的健康發(fā)展。智能體未來發(fā)展的一些關(guān)鍵趨勢和潛在應(yīng)用領(lǐng)域主要如下。4.2.5下一個(gè)風(fēng)口:智能體4.2.5.1關(guān)鍵趨勢(1)增強(qiáng)學(xué)習(xí)與自適應(yīng)能力。·強(qiáng)化學(xué)習(xí):通過不斷試錯來優(yōu)化行為策略,使得智能體能夠在復(fù)雜環(huán)境中做出最優(yōu)決策?!ぷ赃m應(yīng)性:智能體能夠根據(jù)環(huán)境變化自動調(diào)整其行為模式,以應(yīng)對新的挑戰(zhàn)。4.2.5下一個(gè)風(fēng)口:智能體(2)多智能體系統(tǒng)?!f(xié)同工作:多個(gè)智能體可以共同協(xié)作完成任務(wù),例如在物流、交通管理和災(zāi)害響應(yīng)中?!し植际接?jì)算:利用云計(jì)算和邊緣計(jì)算資源,實(shí)現(xiàn)大規(guī)模智能體系統(tǒng)的高效運(yùn)行。4.2.5下一個(gè)風(fēng)口:智能體(3)自然語言處理與情感識別。·對話管理:智能客服和虛擬助手將更加智能化,能夠理解用戶意圖并提供個(gè)性化服務(wù)?!で楦蟹治觯褐悄荏w不僅能理解文字內(nèi)容,還能感知用戶情緒,提供更貼心的服務(wù)體驗(yàn)。4.2.5下一個(gè)風(fēng)口:智能體(4)物聯(lián)網(wǎng)與智能體的融合?!ぶ悄芗揖樱褐悄荏w可以集成到家居設(shè)備中,實(shí)現(xiàn)自動化控制和個(gè)性化服務(wù)。·智慧城市:通過智能體管理城市基礎(chǔ)設(shè)施,如交通流量優(yōu)化、能源管理等。4.2.5下一個(gè)風(fēng)口:智能體(5)安全與隱私保護(hù)?!?shù)據(jù)加密與匿名化:確保智能體在處理個(gè)人數(shù)據(jù)時(shí)的安全性和隱私保護(hù)?!构舴烙洪_發(fā)算法和技術(shù)來抵御惡意攻擊,保障智能體系統(tǒng)的穩(wěn)定性和可靠性。4.2.5下一個(gè)風(fēng)口:智能體4.2.5.2潛在應(yīng)用領(lǐng)域(1)醫(yī)療健康?!€(gè)性化治療方案:基于患者數(shù)據(jù)生成個(gè)性化的治療計(jì)劃。·遠(yuǎn)程監(jiān)控與診斷:智能體可以通過穿戴設(shè)備實(shí)時(shí)監(jiān)測患者的健康狀況,并提供及時(shí)反饋。4.2.5下一個(gè)風(fēng)口:智能體(2)金融服務(wù)。·自動化交易:智能體可以根據(jù)市場動態(tài)進(jìn)行高頻交易,提高投資回報(bào)率?!わL(fēng)險(xiǎn)評估與管理:利用大數(shù)據(jù)分析預(yù)測市場風(fēng)險(xiǎn),幫助金融機(jī)構(gòu)制定風(fēng)險(xiǎn)管理策略。4.2.5下一個(gè)風(fēng)口:智能體(3)教育與培訓(xùn)。·個(gè)性化學(xué)習(xí)助手:根據(jù)學(xué)生的學(xué)習(xí)進(jìn)度和偏好提供定制化的學(xué)習(xí)建議?!ぬ摂M導(dǎo)師:通過互動式教學(xué)方法提升學(xué)習(xí)效果,特別是在在線教育場景中。(4)制造業(yè)與工業(yè)自動化?!ぶ悄苤圃欤和ㄟ^智能體優(yōu)化生產(chǎn)流程,提高效率和質(zhì)量?!ゎA(yù)測性維護(hù):提前檢測設(shè)備故障,減少停機(jī)時(shí)間,延長設(shè)備使用壽命。4.2.5下一個(gè)風(fēng)口:智能體(5)農(nóng)業(yè)與環(huán)境監(jiān)測。·精準(zhǔn)農(nóng)業(yè):利用傳感器和無人機(jī)收集農(nóng)田數(shù)據(jù),指導(dǎo)灌溉、施肥和病蟲害防治?!きh(huán)境保護(hù):通過智能體監(jiān)測空氣質(zhì)量、水質(zhì)等環(huán)境指標(biāo),及時(shí)發(fā)現(xiàn)污染源并采取措施。4.2.5下一個(gè)風(fēng)口:智能體4.2.5.3面臨的挑戰(zhàn)(1)倫理與法律問題?!ご_保智能體的行為符合道德規(guī)范和社會價(jià)值觀?!ぶ贫ㄏ嚓P(guān)法律法規(guī),明確智能體的責(zé)任歸屬和使用界限。(2)技術(shù)瓶頸。·提高智能體的學(xué)習(xí)效率和泛化能力,避免過擬合等問題?!そ鉀Q大規(guī)模智能體系統(tǒng)的協(xié)調(diào)和通信難題。4.2.5下一個(gè)風(fēng)口:智能體(3)公眾接受度?!ぴ鰪?qiáng)公眾對智能體的信任感,消除對新技術(shù)的恐懼和誤解。·通過透明化設(shè)計(jì)和可解釋性模型,讓智能體的決策過程更加清晰易懂。4.2.5下一個(gè)風(fēng)口:智能體PART06智能體AI時(shí)代隨著人工智能技術(shù)的不斷進(jìn)步,有研究認(rèn)為,我們正在從生成式AI(GenerativeAI)逐步邁向更

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論