人工智能安全:原理與實(shí)踐 課件 第6章 貝葉斯和SVM分類算法的安全應(yīng)用_第1頁(yè)
人工智能安全:原理與實(shí)踐 課件 第6章 貝葉斯和SVM分類算法的安全應(yīng)用_第2頁(yè)
人工智能安全:原理與實(shí)踐 課件 第6章 貝葉斯和SVM分類算法的安全應(yīng)用_第3頁(yè)
人工智能安全:原理與實(shí)踐 課件 第6章 貝葉斯和SVM分類算法的安全應(yīng)用_第4頁(yè)
人工智能安全:原理與實(shí)踐 課件 第6章 貝葉斯和SVM分類算法的安全應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章貝葉斯和SVM分類算法的安全應(yīng)用6.1貝葉斯和SVM分類算法原理簡(jiǎn)介本章介紹本章主要講述機(jī)器學(xué)習(xí)里兩個(gè)經(jīng)典的分類算法:貝葉斯分類算法和SVM分類算法,以及他們?cè)诰W(wǎng)絡(luò)空間安全領(lǐng)域的應(yīng)用。在實(shí)踐部分,主要講述基于貝葉斯和SVM分類算法的垃圾郵件過(guò)濾系統(tǒng)。1.貝葉斯分類算法(1)樸素貝葉斯分類器樸素貝葉斯分類器(NaiveBayesClassifier)是一種基于貝葉斯定理的分類算法。它是一種簡(jiǎn)單而高效的分類方法,在文本分類等領(lǐng)域廣泛應(yīng)用。樸素貝葉斯分類器假設(shè)特征之間相互獨(dú)立,這是一個(gè)“樸素”的假設(shè),因此稱為樸素貝葉斯。貝葉斯分類算法的基本步驟如圖所示:1.貝葉斯分類算法貝葉斯分類算法的優(yōu)點(diǎn)是:簡(jiǎn)單、高效,對(duì)于大規(guī)模數(shù)據(jù)集和高維特征空間也有良好的適應(yīng)性。貝葉斯分類算法的缺點(diǎn)是:樸素貝葉斯分類器對(duì)于特征之間的依賴關(guān)系較為敏感,對(duì)于存在相關(guān)性較強(qiáng)的特征可能表現(xiàn)不佳。2.SVM分類算法支持向量機(jī)(SupportVectorMachine,簡(jiǎn)稱SVM)是一種常用的監(jiān)督學(xué)習(xí)算法,用于解決二分類和多分類問題。SVM算法是一種用于分類和回歸問題的機(jī)器學(xué)習(xí)算法,其基本思想是在特征空間中找到一個(gè)最優(yōu)的超平面,將不同類別的樣本實(shí)例分隔開。支持向量機(jī)訓(xùn)練基本步驟如圖所示。2.SVM分類算法SVM的適用場(chǎng)景:SVM在許多領(lǐng)域都有廣泛的應(yīng)用,包括文本分類、圖像識(shí)別、生物信息學(xué)、金融風(fēng)險(xiǎn)分析等,其強(qiáng)大的泛化能力和對(duì)高維數(shù)據(jù)的處理能力使得它成為機(jī)器學(xué)習(xí)中常用的分類算法之一。小結(jié)本小節(jié)主要簡(jiǎn)單講述機(jī)器學(xué)習(xí)里兩個(gè)經(jīng)典的分類算法:貝葉斯分類算法和SVM分類算法。祝同學(xué)們學(xué)習(xí)進(jìn)步!致謝李劍博士,教授,博士生導(dǎo)師網(wǎng)絡(luò)空間安全學(xué)院lijian@January23,2025第6章貝葉斯和SVM分類算法的安全應(yīng)用實(shí)踐6-1基于貝葉斯和SVM分類算法的垃圾郵件過(guò)濾本實(shí)踐介紹本實(shí)踐內(nèi)容主要是分別采用機(jī)器學(xué)習(xí)里面兩個(gè)經(jīng)典算法即貝葉斯和SVM分類算法實(shí)現(xiàn)對(duì)垃圾郵件的過(guò)濾功能。1.實(shí)踐目的本實(shí)踐的目的如下:(1)熟悉垃圾郵件過(guò)濾的一般性流程,理解分類器的基本原理。(2)設(shè)計(jì)簡(jiǎn)易的垃圾郵件分類器,完成程序設(shè)計(jì)。(3)采用不同的分類器,對(duì)性能結(jié)果進(jìn)行比較。1.實(shí)踐目的垃圾郵件過(guò)濾是一種用于檢測(cè)和過(guò)濾無(wú)用郵件的技術(shù),同時(shí)也是文檔分類技術(shù)的一個(gè)典型應(yīng)用。隨著電子郵件的普及,垃圾郵件成為了一個(gè)嚴(yán)重的問題,給用戶帶來(lái)了許多不便和安全風(fēng)險(xiǎn)。如圖所示為電子郵箱中的垃圾郵件。1.實(shí)踐目的甚至有些垃圾郵件里包含著一些很明顯的詐騙信息,如圖所示。1.實(shí)踐目的常見方法:1.關(guān)鍵詞過(guò)濾:2.黑名單過(guò)濾3.白名單過(guò)濾4.基于規(guī)則的過(guò)濾5.機(jī)器學(xué)習(xí)過(guò)濾2.實(shí)驗(yàn)流程(1)數(shù)據(jù)準(zhǔn)備(2)構(gòu)建字典(3)將郵件文本提取成特征矩陣(4)對(duì)樸素貝葉斯分類器和支持向量機(jī)進(jìn)行訓(xùn)練(5)使用測(cè)試集得到預(yù)測(cè)結(jié)果(6)對(duì)模型性能進(jìn)行對(duì)比評(píng)估3.實(shí)踐步驟第1步:導(dǎo)入第三方庫(kù)。首先導(dǎo)入了Python中處理數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)相關(guān)的幾個(gè)重要庫(kù)和模塊。下面將按照導(dǎo)入第三方庫(kù)的順序進(jìn)行詳細(xì)介紹:3.實(shí)踐步驟第2步:定義構(gòu)建字典函數(shù)。定義了一個(gè)名為create_word_dictionary的函數(shù),該函數(shù)接收一個(gè)參數(shù)train_directory,該參數(shù)是一個(gè)包含電子郵件文件的目錄的路徑。函數(shù)的目的是從這個(gè)目錄中的所有電子郵件文件中提取單詞,創(chuàng)建一個(gè)單詞字典,該字典包含最常見的3000個(gè)非數(shù)字、非單字母的單詞及其出現(xiàn)次數(shù)。3.實(shí)踐步驟第3步:定義提取特征函數(shù)。函數(shù)的目的是從指定目錄中的每個(gè)郵件文件中提取特征,并將這些特征表示為一個(gè)特征矩陣,其中每行代表一個(gè)郵件文件的特征向量,每列代表一個(gè)單詞在單詞字典中的索引,矩陣中的值表示該單詞在郵件文件中出現(xiàn)的次數(shù)。3.實(shí)踐步驟第4步:指定訓(xùn)練集目錄并創(chuàng)建單詞字典。第5步:定義訓(xùn)練標(biāo)簽。第6步:提取訓(xùn)練集特征。第7步:初始化線性支持向量機(jī)模型。第8步:初始化樸素貝葉斯模型。第9步:訓(xùn)練支持向量機(jī)模型。第10步:訓(xùn)練樸素貝葉斯模型。第11步:指定測(cè)試集。第12步:定義測(cè)試集標(biāo)簽。第13步:使用SVM模型進(jìn)行預(yù)測(cè)。第14步:使用樸素貝葉斯模型進(jìn)行預(yù)測(cè)。第15步:打印混淆矩陣。4.實(shí)踐效果結(jié)果:上面是SVM,下面的樸素貝葉斯。4.實(shí)踐效果兩個(gè)模型在性能展現(xiàn)上各有千秋:(1)SVM在捕捉目標(biāo)類別(如垃圾郵件)方面表現(xiàn)優(yōu)異。(2)樸素貝葉斯則在減少非目標(biāo)類別被錯(cuò)誤分類為目標(biāo)的情況上更為出色。(3)因此,選擇哪個(gè)模型應(yīng)根據(jù)實(shí)際應(yīng)用場(chǎng)景的需求來(lái)定:若強(qiáng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論