




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
[32]。運用新的網絡結構對數字、字母混合驗證碼進行破解實驗,新模型破解準確率理論計算約在81.45%左右,雖然比之以往模型準確率有所下降,但這一準確率在真實驗證碼的檢測上可信度更高。為此,我們重新利用新的模型對已生成的數據集進行全面檢測,準確率穩(wěn)定在80.59%左右,各字符識別破解準確率分別約為98.61%、93.65%、91.97%、94.29%、98.79%,符合相關預期,且較之以往模型均有不同程度的提高,我們對2.3中其他數據集應用圖4-6改進后的全字符識別卷積神經網絡進行破解訓練與測試,結果總結如表4-1所示。表4-1全字符切割識別驗證碼破解系統(tǒng)破解準確率統(tǒng)計數據集名稱數據集示例降噪效果示例綜合破解準確率Python-Captcha工具包生成數據集-數字88.7%Python-Captcha工具包生成數據集-混合80.59%Kaggle-captcha-version-2-images92.47%Kaggle-captcha2-caixa62.38%Kaggle-captcha2-nfe3-sjppr99.99%Kaggle-captcha2-cadesp96.85%ReallySimpleCaptcha99.82%Kaggle-captcha2-letters99.62%我們發(fā)現破解識別錯誤經常發(fā)生在字符“2”與“z”、“m”與“n”之間,同單字符切割識別驗證碼破解系統(tǒng)一樣,我們沒有很好地在僅有小寫字母標簽地條件下對包含大小寫字母的Kaggle-captcha2-caixa數據集進行很好的破解,但第三章中因降噪處理等因素而無法進行切割識別的數據集,可以應用全字符識別驗證碼破解系統(tǒng)進行破解嘗試,并取得了令人滿意的破解準確率。4.4對比分析總結與安全性建議通過上述七個數據集得破解實驗我們可以發(fā)現本文設計的兩種破解方法在針對不同數據集進行識別破解時各有優(yōu)劣。在數據集樣本充分大,模型不單一或驗證碼圖片噪聲較簡單得情況下,我們可以嘗試不使用任何降噪算法,直接使用系統(tǒng)進行破解嘗試;兩種降噪算法的參數需要根據數據集的不同通過實驗進行適當調整,以求得最佳降噪效果,同時需兼顧輪廓檢測算法對于降噪后驗證碼圖片的要求,即不可因為降噪而導致文本內容字符內部出現分離的現象。對于系統(tǒng)的選擇上,綜合七個實驗我們可以發(fā)現,兩種算法各有優(yōu)劣,全字符識別卷積神經網絡對原驗證碼圖片要求較低,對降噪后圖片純凈度要求較低。部分無法使用單字符切割識別驗證碼系統(tǒng)的數據集可以使用全字符識別驗證碼破解系統(tǒng)進行破解。但后者在破解性能表現優(yōu)異的同時,其訓練開銷及模型調優(yōu)方面的要求更高,結合圖3-6、圖4-5對比我們不難發(fā)現,全字符識別卷積神經網絡結構的空間開銷約是單字符識別卷積神經網絡的數倍,且實驗中訓練耗時較長。因此具體選擇哪一種破解方法,研究人員可在綜合考慮破解準確率、模型訓練開銷等因素的基礎上,選擇最佳的系統(tǒng)方案。實驗中我們注意到,在基于現有模型條件下,對于某些數據集我們難以實現較高的破解準確率,與破解準確率較高的數據集相比我們發(fā)現,其區(qū)別主要在于驗證碼文本內容是否有重疊與扭曲。驗證碼文本內容重疊會大大增加使用輪廓檢測算法進行字符切割的難度,而字符扭曲既增加了單字符識別的難度,也對全字符卷積神經網絡的特征提取提出了更高的要求。同時各字符位置的隨機擺放也是對神經網絡能否降低特征位置對分類結果的一項考驗。而通常意義上的隨機點狀、線條狀噪聲及背景色干擾難以對我們的破解系統(tǒng)造成較大的困擾。由此為提高驗證碼的安全性,在設計驗證碼的時候不妨重點考慮以上幾點內容。4.5演示平臺展示為方便查看驗證碼圖片破解的實際效果,我們設計開發(fā)了了如圖4-8所示的演示系統(tǒng)。圖4-8驗證碼圖片破解演示系統(tǒng)該演示系統(tǒng)為Windows桌面程序,使用者可手動選擇待檢測圖片(支持png與jpg文件的檢測),并手動選擇已訓練好的數據集,及檢測模式(單張檢測/多張檢測),系統(tǒng)將調用降噪算法及訓練好的模型對驗證碼進行破解并展示。單張驗證碼破解識別展示圖片及破解識別結果;多張驗證碼破解識別將以列表形式展示文件名及破解結果,使用者可通過雙擊列表中的條目的方式查看驗證碼圖片。
第五章總結與展望5.1本題總結5.1.1工作回顧本題目主要對基于深度學習的驗證碼破解方法進行了研究,并嘗試完成了測試演示系統(tǒng)。為此,首先在第一章中分析了驗證碼的相關特性及樣式,及本研究之于網絡安全等方面的重要意義;其次在第二章中介紹了目前在該領域取得一定成果的相關研究及介紹了本文所用到的數據集,為后面系統(tǒng)方案的設計與實現提供了參考,為后續(xù)的實驗做以充足的準備;在第三章中我們重點介紹了單字符切割識別驗證碼破解系統(tǒng),介紹了以灰度化處理算法、二值化閾值處理算法、8階k鄰域降噪算法為代表的圖像處理算法,并以輪廓檢測算法作為切割工具對原始驗證碼圖片進行處理,對基于卷積神經網絡的單字符識別模型進行訓練與測試,取得較好的效果。針對部分數據集無法進行切割識別的問題,我們又創(chuàng)造性地設計并根據實際情況改進了全字符檢測卷積神經網絡,并使用數據集進行了訓練與測試,取得了更好的破解效果。最后基于上述訓練與測試,我們通過對比分析給出了關于驗證碼生成中安全項設計地若干建議。5.1.2本題局限性1.本研究需要收集大量真實驗證碼圖片作為數據集對模型進行訓練,這一工作需要耗費大量人力,對數據集進行標注,且在短時間內難以完成。2.本研究中模型的建立是針對某一特定數據集的,在不同數據集間攻擊的遷移性能較差,因此難以實現更加簡易的系統(tǒng)。3.實驗中有的數據集中驗證碼圖片包含大寫、小寫英文字母,標簽統(tǒng)一為小寫字母,該數據集破解識別準確率較低,即前文介紹的破解識別方法沒有很好地對大小寫字母進行細致處理。4.本研究中對于某些數據集中驗證碼的破解較為依賴通過卷積神經網絡前的降噪預處理,而預處理中簡單的圖像處理操作難以對復雜噪聲做到完美降噪處理,因此導致如輪廓檢測算法等無法實現應有的效果;同時,全字符卷積神經網絡對包含字符扭曲、字符重疊的驗證碼識別效果較差,易混淆相近字符。5.2研究展望本文主要研究并基于深度學習設計了對于文本驗證碼的破解系統(tǒng)。在接下來的研究中,我們將逐步對上一節(jié)中闡述的局限進行完善。如嘗試使用生成對抗網絡,通過少量數據集的標注訓練生成對抗網絡,進而借助生成模型生成數據集;嘗試使用Pix2Pix網絡對驗證碼圖片進行降噪處理;除此之外,嘗試探索更多如循環(huán)神經網絡等深度學習框架在驗證碼破解方面的應用。最后,隨著滑動驗證碼、計算驗證碼、GoogleRecaphcta等基于非文本的驗證碼技術逐步成熟,越來越多網站開始使用這類驗證碼系統(tǒng),這也將會是我們下一個可能嘗試研究突破的方向。參考文獻劉瀟誼.Web安全登錄的研究與實現[D].西安工業(yè)大學,2016.Bostik,Ondrej,andJanKlecka.”RecognitionofCAPTCHAcharactersbysupervisedmachinelearningalgorithms.”IFAC-PapersOnLine51,no.6(2018):208-213.Yan,Xuehu,FengLiu,WeiQiYan,andYuliangLu.”ApplyingVisualCryptographytoEnhanceTextCaptchas.”Mathematics8,no.3(2020):332.Sivakorn,Suphannee,JasonPolakis,andAngelosD.Keromytis.”Imnotahuman:BreakingtheGooglereCAPTCHA.”BlackHat(2016)Kaur,Kiranjot,andSunnyBehal.”DesigningaSecureText-basedCAPTCHA.”ProcediaComput.Sci57(2015):122-125.VonAhn,Luis,BenjaminMaurer,ColinMcMillen,DavidAbraham,andManuelBlum.”recaptcha:Human-basedcharacterrecognitionviawebsecuritymeasures.”Science321,no.5895(2008):1465-1468Goodfellow,IanJ.,YaroslavBulatov,JulianIbarz,SachaArnoud,andVinayShet.”Multi-digitnumberrecognitionfromstreetviewimageryusingdeepconvolutionalneuralnetworks.”arXivpreprintarXiv:1312.6082(2013).Nazario,Jose.”DDoSattackevolution.”NetworkSecurity2008,no.7(2008):7-10.Garg,Geetika,andChrisPollett.”Neuralnetworkcaptchacrackers.”In2016FutureTechnologiesConference(FTC),pp.853-861.IEEE,2016.Sivakorn,Suphannee,IasonasPolakis,andAngelosD.Keromytis.”Iamrobot:(deep)learningtobreaksemanticimagecaptchas.”In2016IEEEEuropeanSymposiumonSecurityandPrivacy(EuroS&P),pp.388-403.IEEE,2016.Stark,Fabian,CanerHazrbas,RudolphTriebel,andDanielCremers.“Captcharecognitionwithactivedeeplearning.”InWorkshopnewchallengesinneuralcomputation,vol.2015,p.94.Citeseer,2015.Karthik,CHBL-P.,andRajendranAdriaRecasens.“BreakingmicrosoftsCAPTCHA.”Technicalreport(2015).Kopp,Martin,MatejNikl,andMartinHolena.”Breakingcaptchaswithconvolutionalneuralnetworks.”ITAT2017Proceedings(2017):93-99.Zhao,Nathan,YiLiu,andYijunJiang.”CAPTCHABreakingwithDeepLearning.”(2017).Stark,Fabian,CanerHazrbas,RudolphTriebel,andDanielCremers.”Captcharecognitionwithactivedeeplearning.”InWorkshopnewchallengesinneuralcomputation,vol.2015,p.94.Citeseer,2015.Kwon,Hyun,HyunsooYoon,andKi-WoongPark.”CAPTCHAImageGenerationUsingStyleTransferLearninginDeepNeuralNetwork.”InInternationalWorkshoponInformationSecurityApplications,pp.234–246.Springer,Cham,2019.Algwil,Abdalnaser,DanCiresan,BeibeiLiu,andJeffYan.”AsecurityanalysisofautomatedChineseturingtests.”InProceedingsofthe32ndAnnualConferenceonComputerSecurityApplications,pp.520-532.2016.Jia,Yang,WangFan,ChenZhao,andJungangHan.”AnApproachforChineseCharacterCaptchaRecognitionUsingCNN.”InJournalofPhysics:ConferenceSeries,vol.1087,no.2,p.022015.IOPPublishing,2018.Wang,Ye,andMiLu.”Anoptimizedsystemtosolvetext-basedCAPTCHA.”arXivpreprintarXiv:1806.07202(2018).Bursztein,Elie,JonathanAigrain,AngelikaMoscicki,andJohnC.Mitchell.”Theendisnigh:Genericsolvingoftext-basedcaptchas.”In8thUSENIXWorkshoponOffensiveTechnologies(WOOT14).2014.Osadchy,Margarita,JulioHernandez-Castro,StuartGibson,OrrDunkelman,andDanielPrez-Cabo.”NobotexpectstheDeepCAPTCHA!Introducingimmutableadversarialexamples,withapplicationstoCAPTCHAgeneration.”IEEETransactionsonInformationForensicsandSecurity12,no.11(2017):2640-2653.Kwon,Hyun,YongchulKim,HyunsooYoon,andDaeseonChoi.”Captchaimagegenerationsystemsusinggenerativeadversarialnetworks.”IEICETRANSACTIONSonInformationandSystems101,no.2(2018):543–546.George,Dileep,WolfgangLehrach,KenKansky,MiguelLzaro-Gredilla,ChristopherLaan,BhaskaraMarthi,XinghuaLouetal.“Agenerativevisionmodelthattrainswithhighdataefficiencyandbreakstext-basedCAPTCHAs.”Science358,no.6368(2017):eaag2612.Ye,Guixin,ZhanyongTang,DingyiFang,ZhanxingZhu,YansongFeng,PengfeiXu,XiaojiangChen,andZhengWang.”Yetanothertextcaptchasolver:Agenerativeadversarialnetworkbasedapproach.”InProceedingsofthe2018ACMSIGSACConferenceonComputerandCommunicationsSecurity,pp.332-348.2018.WilhelmyR,RosasH.AComparisonofSupervisedLearningAlgorithmstoSolveCAPTCHAs.2012.StokesM,AndersonM,ChandrasekarS,etal.“AStandardDefaultColorSpacefortheInternet—sRGB”[C]1996.ThresholdSelectionMethodfromGray-LevelHistograms,IEEETransactionsonSystemsManandCybernetics[J].IEEETrans.syst.manCybern,1979,9.SuzukiS,BeK.Topologicalstructuralanalysisofdigitizedbinaryimagesbyborderfollowing[J].ComputerVisionGraphics&ImageProcessing,1985,30(1):32-46.KingmaD,BaJ.Adam:AMethodforStochasticOptimization[J].ComputerScience,2014.NouriZ,RezaeiM.Deep-CAPTCHA:ADeepLearningBasedCAPTCHASolverforVulnerabilityAssessment[J].SocialScienceElectronicPublishing.
附錄2下為8階k鄰域降噪算法的Python實現代碼,僅供讀者參考。defnoise_remove(image,k):defcalculate_noise_count(i
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年行政主體資格審核與年度合同規(guī)范執(zhí)行協(xié)議
- 2025年事業(yè)單位工勤技能-廣東-廣東有線廣播電視機務員二級(技師)歷年參考題庫含答案解析(5套)
- 2025年度離職人員知識產權保護與違約責任協(xié)議書
- 2025年智能網絡設備采購與安全維護合作協(xié)議
- 2025年新型數字化電商平臺運營支持與人才輸送合作協(xié)議
- 2025年社區(qū)便利店多元化服務與商品配送合作協(xié)議
- 2025年新建智能化輕鋼廠房施工與附屬設施升級改造合同
- 2025年校園安全監(jiān)控系統(tǒng)建設、安裝與后續(xù)技術支持合同
- 2025年度綠色航運船舶廢棄物資源化利用合作協(xié)議
- 2025年事業(yè)單位工勤技能-北京-北京護理員二級(技師)歷年參考題庫含答案解析(5套)
- 運用PDCA循環(huán)管理提高手衛(wèi)生依從性
- JGJT251-2011建筑鋼結構防腐蝕技術規(guī)程
- HG/T 2952-2023 尿素二氧化碳汽提塔技術條件 (正式版)
- DZ∕T 0054-2014 定向鉆探技術規(guī)程(正式版)
- 福建省泉州市五中七中等七校聯(lián)合2022-2023學年八年級上學期期末教學質量檢測數學試題
- 預防老年人保健品騙局
- 安全生產培訓(完整版)課件
- 鋼結構長廊施工方案
- 信保業(yè)務自查問題統(tǒng)計表
- 年產3萬噸環(huán)保型鋁箔容器系列產品生產線項目環(huán)境影響報告
- 安慶匯辰藥業(yè)有限公司高端原料藥、醫(yī)藥中間體建設項目環(huán)境影響報告書
評論
0/150
提交評論