基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別_第1頁
基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別_第2頁
基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別_第3頁
基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別_第4頁
基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄摘要 ⅠAbstract Ⅰ1緒論 緒論研究的目的和意義在量子信息處理、量子通訊等諸多研究方向中,軌道角動量是實現(xiàn)更高效率和更高安全性的量子應(yīng)用的關(guān)鍵,隨著量子計算和通信的迅猛發(fā)展,軌道角動量整數(shù)階疊加態(tài)作為量子信息處理的關(guān)鍵組成部分,其自動識別的研究對于推動量子科技的實際應(yīng)用具有重要意義。傳統(tǒng)的人工檢測方式費時費力,無法適用于大樣本的檢測,在處理大規(guī)模、高維度的量子態(tài)數(shù)據(jù)時往往受到限制,無法滿足迅速增長的數(shù)據(jù)處理需求。而基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法通過對數(shù)據(jù)進行端到端的學(xué)習(xí),具有更強大的特征提取和模式識別能力。在當(dāng)前科學(xué)技術(shù)不斷演進的大背景下,基于卷積神經(jīng)網(wǎng)絡(luò)的軌道角動量整數(shù)階疊加態(tài)的識別成為了量子信息領(lǐng)域中備受矚目的前沿研究方向。為此,本課題擬利用深度學(xué)習(xí),尤其是卷積神經(jīng)網(wǎng)絡(luò),來實現(xiàn)對上述狀態(tài)的自動精確識別。本課題擬以大樣本數(shù)據(jù)為基礎(chǔ),通過對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,使其能準確地刻畫出軌道角動量的整數(shù)階疊加態(tài)的復(fù)雜性,進而對其進行有效的分類。將重點研究如何提升新模型在未知數(shù)據(jù)下的推廣能力,以及對不同角動量大小的敏感度。同時,通過對其整數(shù)階疊加態(tài)的鑒別,加深人們對其物理本質(zhì)的認識,并為將來的量子科學(xué)研究打下基礎(chǔ)。本項目擬將深度學(xué)習(xí)與量子物理相結(jié)合,實現(xiàn)對軌道角動量的自動、高效、智能化的鑒別,為量子科學(xué)的研究與應(yīng)用提供新的思路和方法。因此,通過這一研究,擬將深度學(xué)習(xí)與量子物理相結(jié)合,有望實現(xiàn)對軌道角動量整數(shù)階疊加態(tài)的高效、準確的自動化識別。為量子科學(xué)的研究與應(yīng)用提供新的思路和方法,為量子信息處理提供更為先進的工具和技術(shù)。國內(nèi)外研究現(xiàn)狀目前,基于卷積神經(jīng)網(wǎng)絡(luò)的軌道角動量整數(shù)階疊加態(tài)的識別已經(jīng)成為國際上和國內(nèi)量子信息領(lǐng)域的一個引人注目的研究方向。在國際層面,研究者們積極探索深度學(xué)習(xí)方法在量子信息處理中的應(yīng)用,其中包括使用深度神經(jīng)網(wǎng)絡(luò)對量子態(tài)進行自動分類、生成和優(yōu)化。在這一背景下,一些國際研究團隊開始關(guān)注卷積神經(jīng)網(wǎng)絡(luò)在軌道角動量整數(shù)階疊加態(tài)識別中的潛在應(yīng)用,希望通過深度學(xué)習(xí)技術(shù)提高對這些復(fù)雜態(tài)的自動化識別精度。1992年,Allenetal.[1]提出OAM光束多路傳輸可顯著提高光通信系統(tǒng)的容量與帶寬利用率,因此近年來受到國內(nèi)外學(xué)者的高度重視[2-3]。在接收端,對多路OAM光束的復(fù)用是其中的一項重要技術(shù)。目前常用的共軛位相探測方法是用一個拓撲荷為l的渦旋光裝載一個拓撲荷值為-l的螺相,利用觀測到的OAM狀態(tài)在接收面上有無,一次僅能分辨出一個軌道角動量,如果要分辨出多個狀態(tài),就必須對其進行分光,因此能量利用率不高[4]。本項目提出一種基于坐標轉(zhuǎn)換的軌道角動量分離方法,將具有不同軌道角動量的光束轉(zhuǎn)化為具有不同傾角的截止波,再利用透鏡將其聚焦在各探測面上,實現(xiàn)軌道角動量光束的分離[5]。由于軌道角動量光束對大氣湍流、側(cè)向偏移、角度傾斜等因素的影響,對光路的校準要求較高[6]。近年來,機器學(xué)習(xí)在圖像識別、通信等方面得到了廣泛的應(yīng)用。Krennetal.[7]在2014年首次提出了BP-ANN模型,該模型用于拉蓋爾高斯光束疊加后的光強分布,誤差只有1.7%左右。在2016年,Knutson[8]等人使用VGG16模型對110種軌道角動量狀態(tài)進行了分類,識別準確率達到74%。2017年,DosterandWatnik[9]首次提出了一種新的基于Alexnet模型的貝塞爾高斯復(fù)用波束鑒別的新思路,該方案在多路分解效率上有了很大的提升。2017年,Lietal.[10]比較研究了基于BP-ANN,KNN,NBC,卷積神經(jīng)網(wǎng)絡(luò)在LG多路分束器中的識別率本項目的研究成果將為OAM重疊光束的探測開辟一條全新的途徑。在國內(nèi),量子信息處理的研究也取得了顯著進展。2019年北京郵電大學(xué)尹霄麗課題組[11]基于修正的vonKarman功率譜模型利用功率譜反演法生成隨機相位屏應(yīng)用多步衍射法數(shù)值模擬拉蓋爾高斯疊加光束在大氣湍流信道的傳輸,發(fā)現(xiàn)了利用混合訓(xùn)練集進行訓(xùn)練有利于提高識別正確率。2021年華南師范大學(xué)張凌峰課題組證明了神經(jīng)網(wǎng)絡(luò)可以訓(xùn)練來識別具有不同拓撲電荷和未知疊加的OAM模式[13]。2022年長春理工大學(xué)鄭崇輝課題組[14]提出使用遷移學(xué)習(xí)的方式識別軌道角動量光束,加快了基于深度學(xué)習(xí)的軌道角動量光束識別模型的訓(xùn)練速度。完美渦旋光束(POVB)現(xiàn)在已經(jīng)被應(yīng)用于光學(xué)操控、光通信、激光材料處理等領(lǐng)域,其中,POVB軌道角動量狀態(tài)的探測是關(guān)鍵且有挑戰(zhàn)的技術(shù)。2022年上海理工大學(xué)成科課題組[15]本研究通過并行梯度下降算法,構(gòu)建了光學(xué)衍射神經(jīng)網(wǎng)絡(luò)(DNN),實驗上實現(xiàn)了軌道角動量階數(shù)在-50~+50范圍內(nèi)的POVB的識別。在這一過程中,衍射轉(zhuǎn)換效率達到了58%。本研究為POVB的OAM探測提供了新的思路,在POVB的各類應(yīng)用中均存在潛在應(yīng)用價值??傮w而言,國際和國內(nèi)的研究者們都將深度學(xué)習(xí)技術(shù)應(yīng)用于軌道角動量的識別,力圖提高對這些量子態(tài)的自動化分析水平。這一跨學(xué)科的研究勢頭有望為量子信息處理領(lǐng)域帶來新的突破,推動深度學(xué)習(xí)在量子物理研究中的更廣泛應(yīng)用。綜上所述,基于卷積神經(jīng)網(wǎng)絡(luò)的軌道角動量整數(shù)階疊加態(tài)的識別是當(dāng)前量子信息處理領(lǐng)域的前沿研究之一。研究內(nèi)容第一節(jié)介紹了基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)態(tài)疊加態(tài)識別這一課題的研究目的和意義并闡述了目前在國內(nèi)外的研究背景和目前OAM識別在國內(nèi)外研究現(xiàn)狀。第二節(jié)介紹了相關(guān)理論概念的介紹。介紹了軌道角動量和整數(shù)階疊加態(tài)的相關(guān)知識,并介紹了本課題所運用的LG光束,給出了單個LG光束的光強分布和相位分布,給出了相關(guān)規(guī)律變化,之后又闡述了疊加態(tài)OAM光束的相關(guān)知識,介紹了相關(guān)公式和給出了兩束拓撲荷數(shù)絕對值相同,符號相反的LG光束疊加所得的圖像,給出相關(guān)結(jié)論。第三節(jié)介紹了大氣湍流的相關(guān)概念以及LG光束在受到大氣湍流后的光強分布圖,并給出了湍流強度與折射率結(jié)構(gòu)常數(shù)的關(guān)系,對LG光束在受到不同湍流程度的光強分布圖進行了比較。第四節(jié)介紹了深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與相關(guān)概念,并闡述了數(shù)據(jù)集對深度學(xué)習(xí)的重要性以及有哪些增強數(shù)據(jù)集的方法,之后介紹了本課題所使用的卷積神經(jīng)網(wǎng)絡(luò),并介紹了訓(xùn)練過程以及訓(xùn)練結(jié)果,并得出訓(xùn)練曲線,最后給出在加入收湍流影響后的光強分布驗證的準確率。第五節(jié)對本文進行了總結(jié),并對基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的未來進行了展望。2相關(guān)理論介紹2.1軌道角動量的概念軌道角動量(OAM)是一種非常重要的物理特性,它既能反映微粒運動本身的復(fù)雜特性,又在量子信息處理等方面具有潛在的潛在應(yīng)用價值。本節(jié)旨在詳盡介紹量子力學(xué)中軌道角動量的基本概念,并闡述其顯著特點。軌道角動量,源自于量子力學(xué)對粒子波函數(shù)旋轉(zhuǎn)對稱性的深入剖析。當(dāng)一個粒子(如電子或光子)在空間中呈螺旋狀分布,即其波函數(shù)呈現(xiàn)出旋轉(zhuǎn)對稱性時,便具備了軌道角動量。這種角動量并非源于粒子本身的自旋,而是由其在空間中運動軌跡的形狀決定,類似于經(jīng)典力學(xué)中物體圍繞某個中心軸旋轉(zhuǎn)時所具有的角動量。在量子力學(xué)的框架下,軌道角動量被賦予量子化的特性,表現(xiàn)為離散的整數(shù)或半整數(shù)值,記作(ell),這與角動量量子數(shù)相聯(lián)系。2.2整數(shù)階疊加態(tài)的定義整數(shù)階疊加態(tài)特指那些與軌道角動量相關(guān)的量子態(tài)疊加。軌道角動量,源自量子力學(xué)對粒子旋轉(zhuǎn)運動的量子化描述,是量子系統(tǒng)固有角動量的一種類型,與電子繞核旋轉(zhuǎn)、光子自旋等現(xiàn)象密切相關(guān)。根據(jù)量子數(shù)l(即角量子數(shù)),軌道角動量可取整數(shù)值l=0,1,2,...,對應(yīng)不同的“角動量殼層”。每一種特定的l值對應(yīng)一組具有相同角動量大小但方向各異的量子態(tài),這些狀態(tài)構(gòu)成了一個l維的“角動量空間”。整數(shù)階疊加態(tài)的定義,正是建立在這種角動量空間的基礎(chǔ)上。當(dāng)一個量子系統(tǒng)處于某個特定的軌道角動量態(tài)時,其角動量大小為l?(?為約化普朗克常數(shù)),方向則由另一個量子數(shù)m(即磁量子數(shù),取值范圍為-l到l,步長為1)確定。當(dāng)系統(tǒng)處于整數(shù)階疊加態(tài)時,意味著其角動量態(tài)并非單一的m值所決定,而是多個不同m值對應(yīng)的量子態(tài)的線性疊加。具體地,這樣的疊加態(tài)可以表示為:Psi=其中,cml是復(fù)系數(shù),它們提供了每個態(tài)在疊加中的權(quán)重和相位信息。這個公式表面,系統(tǒng)的總狀態(tài)是所有可能的ml態(tài)的疊加,每個態(tài)都乘以一個系數(shù)cmlml,然后所有這些乘積相加得到最終的疊加態(tài)。2.3軌道角動量整數(shù)階疊加態(tài)的應(yīng)用軌道角動量整數(shù)階疊加態(tài)在量子信息處理領(lǐng)域扮演著至關(guān)重要的角色,其獨特性質(zhì)與豐富內(nèi)涵賦予了量子信息處理諸多獨特優(yōu)勢與廣闊應(yīng)用前景。量子通信:在量子計算和量子通信中,OAM疊加態(tài)可以用于構(gòu)造高維量子比特(qubits),這有助于提高量子系統(tǒng)的信息處理能力和安全性。研究表明,利用軌道角動量實現(xiàn)的12維量子密鑰分發(fā)系統(tǒng),其理論密鑰生成速率相較于二進制編碼提升了6倍。成像技術(shù):在光學(xué)成像領(lǐng)域,OAM疊加態(tài)可以用于提高成像系統(tǒng)的分辨率和深度感知能力。量子存儲:在量子存儲中,利用固態(tài)介質(zhì)如金剛石色心等對軌道角動量光子態(tài)的高效存儲能力,可實現(xiàn)大規(guī)模、高容量的量子信息存儲。研究指出,金剛石色心中的氮-空位中心對軌道角動量光子態(tài)具有長達毫秒級的相干存儲時間,這對于構(gòu)建穩(wěn)定、長壽命的量子存儲器至關(guān)重要。2.4拉蓋爾高斯光束在1992年,具有拉蓋爾-高斯振幅分布的激光具有軌道角動量被Allen等人所發(fā)現(xiàn),并且拉蓋爾高斯光束(Laguerre-Gaussian,LG)目前作為OAM-FSO通信系統(tǒng)中應(yīng)用最廣泛和成熟的OAM光束之一。LG光束還具有多模式疊加的能力,能同時進行傳輸多個OAM模式,提高通信系統(tǒng)的信息傳輸效率。LG光束的光場復(fù)振幅表達式如下LG其中:k=2π/λ為波數(shù),λ為波長,I為拓撲荷數(shù),ω(z)=ω01+z2/zR2,zR=πL下圖為利用的Matlab仿真的拓撲荷數(shù)為+2,-2,+5,-5的LG光束的光強分布與相位圖像a)b)c)d)e)f)g)h)圖SEQ圖\*ARABIC1拓撲荷數(shù)為+2,-2,+5,-5的LG光束的光強分布與相位圖像a)l=+2的光強分布b)l=-2的光強分布c)l=+5的光強分布d)l=-5的光強分布e)l=+2的相位圖像f)l=-2的相位圖像g)l=+5的相位圖像h)l=-5的相位圖像由此可以看出,LG光束的光強分布形狀為中空的圓環(huán),而隨著拓撲荷數(shù)l的增大,圓環(huán)的半徑也逐漸變得越大,而圓環(huán)的光強與l值成負相關(guān),隨著l值的增大光束的光強逐漸減弱,而l值所對應(yīng)的正負值在光強分布上并無區(qū)別。在相位分布方面,光束相位變化的次數(shù)等于拓撲荷數(shù)l的數(shù)值,且l值所對應(yīng)的正負值在相位分布上旋轉(zhuǎn)方向相反。2.5疊加態(tài)的OAM光束在此基礎(chǔ)上,我們將重點研究兩束激光拉蓋爾高斯光束疊加態(tài)的光場特性。在傳播距離z=0且徑向指數(shù)p=0時,兩束LG光束疊加形成的復(fù)合OAM光束光場復(fù)振幅可表示為:&u其中ω0為束腰半徑,θ為方位角,l1、A(r)=2Br,lB(r,l)=1且該疊加光束的光強分布滿足:I=u下面圖2為利用Matlab仿真的拓撲荷數(shù)為±1~±10疊加的LG光束的光強分布圖。a)b)c)d)e)f)g)h)j)圖2拓撲荷分別為±1到±10的OAM光束的光強a)l=±1的光強b)l=±2的光強c)l=±3的光強d)l=±4的光強e)l=±5的光強f)l=±6的光強g)l=±7的光強h)l=±8的光強i)l=±9的光強j)l=±01的光強由圖可以看出,當(dāng)兩束I符號相反的LG光束進行疊加干涉時,生成的衍射光場強度圖為一個整體為“花瓣狀”的分裂狀光斑。其生成的光亮斑的個數(shù)等于兩個I絕對值的和。相較于單階整數(shù)的LG光束有著相似度較高的“甜甜圈”分布,疊加態(tài)LG光束的光強分布則與其大不相同。而拓撲荷數(shù)分別為±l的兩束LG光束的疊加光場,具有獨特且有規(guī)律的花瓣狀光強分布,每種疊加態(tài)光束具有的“花瓣”數(shù)目為l的2倍,適宜利用CNN進行識別。

3大氣湍流環(huán)境的模擬3.1大氣湍流的基本理論氣流為無規(guī)則旋轉(zhuǎn)的旋渦,其運動軌跡十分復(fù)雜,可分為橫向、縱向和橫向兩個方向,并且在某一區(qū)域內(nèi),任意位置的流速也會發(fā)生變化。這種湍流流動會引起光束傳播過程中各參量的隨機改變,進而影響光束的質(zhì)量,具體體現(xiàn)為光束截面的強度閃爍、光束的彎曲和漂移(方向抖動)、散射變形、空間相干性劣化等。這種湍流流動會引起光束在傳播過程中的各種物理參量的隨機改變,進而影響光束的質(zhì)量,具體體現(xiàn)為光束截面的強度閃爍、光束的彎曲和漂移(方向抖動)、漫射變形以及空間相干性的退化。大氣湍流對大氣折射率的影響將導(dǎo)致光波的參量(振幅、相位)發(fā)生無序波動,從而導(dǎo)致光束閃爍、彎曲、分裂、散射、空間相干性下降、偏振狀態(tài)波動等。紊流是一種流體。當(dāng)流動速度很慢時,兩種流體之間沒有相互摻混而成的分層現(xiàn)象叫做層流,也被稱為穩(wěn)定狀態(tài)或分層狀態(tài);基于這一結(jié)果,我們提出了一個新的轉(zhuǎn)捩模式,即轉(zhuǎn)捩流動。當(dāng)速度增大時,流動中會產(chǎn)生大量的小渦流,導(dǎo)致層流破裂,在每一層流動中都存在著滑移和混合現(xiàn)象。在管內(nèi)流動時,管內(nèi)液體會發(fā)生無規(guī)則的移動,這一現(xiàn)象被稱為紊流、擾流或紊流。圖3.1為層流及湍流的示意圖:圖3.1層流及湍流大氣湍流可以改變大氣的折射率,從而導(dǎo)致波束在傳輸過程中發(fā)生相位漲落、光強閃爍、到達角度起伏、波束偏移、波束加寬等波前畸變。3.2光束在湍流介質(zhì)中的傳輸湍流環(huán)境中由于其不斷變化的折射率導(dǎo)致渦旋光束在傳播過程中的相位和光強等產(chǎn)生畸變,相位畸變和光強閃爍導(dǎo)致渦旋光束的傳播質(zhì)量下降。渦旋光束在湍流介質(zhì)中的傳輸是一個復(fù)雜的過程,由于其復(fù)雜的動力學(xué)特性,導(dǎo)致其在湍流介質(zhì)中的輸運特性發(fā)生了變化。湍流介質(zhì)中充滿了不同尺度的渦旋和不均勻性,這些因素導(dǎo)致光束傳輸過程中遭遇折射、散射和吸收等現(xiàn)象,從而引起光束的波前畸變、強度減弱和傳播方向偏離。此外,湍流的動態(tài)變化意味著這些擾動是不穩(wěn)定和難以預(yù)測的,進一步增加了渦旋光束在湍流介質(zhì)中穩(wěn)定傳輸?shù)奶魬?zhàn)。因此,湍流介質(zhì)的不規(guī)則性和動態(tài)性是影響渦旋光束傳輸?shù)年P(guān)鍵因素。目前有效的模擬方法是通過多個空間隨機相位屏的疊加來模擬自由空間中的湍流介質(zhì)[16,17]。因此,光束在湍流介質(zhì)中的傳輸可以看作光束在多個具有固定間隔的隨機相位屏之間進行傳輸[18-19]。下圖3.2為拓撲荷數(shù)分別為±5的兩束LG光束疊加在受到湍流影響的前后對比:b)c)d)圖3.2拓撲荷數(shù)分別為±5的兩束LG光束疊加在受到湍流影響的前后對比圖a)未受湍流影響的疊加圖b)受到強湍影響的疊加圖c)受到中湍影響的疊加圖d)受到弱湍影響的疊加圖由此可見未受湍流影響時光強圖為花瓣狀,而受到弱湍后光強圖變成了“甜甜圈”狀,隨著湍流強度的不斷增加,光強分布進一步發(fā)生改變,當(dāng)湍流強度增加到中湍時,光強分布開始逐漸變形且模糊,增加到強湍時,光強分布就變得模糊不清,只能看到光斑而無法清楚看清其形狀及分布。大氣湍流折射率的變化可以用大氣折射率結(jié)構(gòu)常數(shù)表示,即:(8)其中為折射率系數(shù)結(jié)構(gòu)函數(shù),的大小表示湍流強度,r為空間兩點之間的距離。以下是大氣湍流強弱與折射率結(jié)構(gòu)常數(shù)對應(yīng)表:湍流強度折射率結(jié)構(gòu)常數(shù)弱湍流C中等湍流強度6.4×強湍流C表格SEQ表格\*ARABIC1大氣湍流強弱與折射率結(jié)構(gòu)常數(shù)對應(yīng)表4基于卷積神經(jīng)網(wǎng)絡(luò)的OAM的識別4.1深度學(xué)習(xí)基礎(chǔ)概念深度學(xué)習(xí)是一種基于多層神經(jīng)網(wǎng)絡(luò)的高層次抽象表示技術(shù)。神經(jīng)網(wǎng)絡(luò)是一個多層結(jié)構(gòu),每個結(jié)構(gòu)中都含有大量的神經(jīng)元,它們之間的信息通過加權(quán)聯(lián)系進行傳輸。深度學(xué)習(xí)模型一般由輸入層、隱藏層、輸出層三個層次組成,隱藏層能夠通過學(xué)習(xí)數(shù)據(jù)中的各種抽象特征,來學(xué)習(xí)與推理復(fù)雜的模式與關(guān)系。然后,利用BP神經(jīng)網(wǎng)絡(luò)建立BP神經(jīng)網(wǎng)絡(luò),并利用BP神經(jīng)網(wǎng)絡(luò)對BP神經(jīng)網(wǎng)絡(luò)的權(quán)重進行修正。其中,最常見的激勵函數(shù)為Sigmoid,ReLU,Tanh等,損耗函數(shù)主要有均方誤差,交叉熵等。深度學(xué)習(xí)在計算機視覺、自然語言處理、語音識別等領(lǐng)域具有重要的應(yīng)用價值,已成為當(dāng)今人工智能領(lǐng)域的一個研究熱點。深度學(xué)習(xí)是近年來興起的一種機器學(xué)習(xí)方法,其核心思想是利用多層神經(jīng)網(wǎng)絡(luò)來抽取和表示數(shù)據(jù)。提出了一種基于神經(jīng)網(wǎng)絡(luò)的深度網(wǎng)絡(luò)學(xué)習(xí)方法,該方法由輸入層、多個隱藏層、輸出級組成。輸入層對諸如圖象或音頻信號之類的原始數(shù)據(jù)進行接收;隱含層采用非線性激活函數(shù)進行特征抽取和學(xué)習(xí);最后,輸出層基于所學(xué)習(xí)的特性生成期望的結(jié)果,例如類別標記或預(yù)測值。下面是深度學(xué)習(xí)的結(jié)構(gòu)示意圖:以下為深度學(xué)習(xí)的結(jié)構(gòu)圖:圖4.1深度學(xué)習(xí)結(jié)構(gòu)圖該模型中各神經(jīng)元具有一定的聯(lián)系權(quán)值,并且各神經(jīng)元具有偏向性,可以作為網(wǎng)絡(luò)學(xué)習(xí)的參數(shù)來進行優(yōu)化。數(shù)據(jù)通過網(wǎng)絡(luò)的過程稱為前向傳播,在此過程中,信息從一層傳至另一層,直至生成最終輸出。當(dāng)模型生成的輸出與真實標簽存在差異時,會通過損失函數(shù)來計算這種差異的大小,然后利用反向傳播算法逐層更新權(quán)重和偏置,以減小這個差異。為了更有效地訓(xùn)練模型并防止過擬合,深度學(xué)習(xí)中引入了多種正則化技術(shù)和優(yōu)化策略。例如,L1/L2正則化可以避免模型參數(shù)過大,dropout隨機忽略一部分神經(jīng)元,以增強模型的泛化能力。此外,使用優(yōu)化器如梯度下降或Adam可以加速模型參數(shù)的優(yōu)化過程。訓(xùn)練通常在多個epochs內(nèi)進行,即多次遍歷整個數(shù)據(jù)集,直到模型性能達到滿意的水平。整體上,深度學(xué)習(xí)的結(jié)構(gòu)設(shè)計使得它能夠處理復(fù)雜的數(shù)據(jù)模式,適用于眾多領(lǐng)域,包括計算機視覺、自然語言處理和強化學(xué)習(xí)等。通過調(diào)整網(wǎng)絡(luò)架構(gòu)、激活函數(shù)、優(yōu)化器和正則化策略,深度學(xué)習(xí)模型能夠適應(yīng)各種特定任務(wù)的需求,不斷推動人工智能技術(shù)的進步。4.2卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為一種深度學(xué)習(xí)方法,在圖像識別,語音識別,自然語言處理等領(lǐng)域展現(xiàn)出良好的性能。本章主要介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本原理及結(jié)構(gòu)特征。下圖為CNN的結(jié)構(gòu)圖:圖4.2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖卷積神經(jīng)網(wǎng)絡(luò)的核心在于其特有的卷積操作。卷積層通過一組可學(xué)習(xí)的濾波器(也稱卷積核或權(quán)重矩陣),對輸入數(shù)據(jù)(如圖像像素矩陣)進行滑窗掃描并執(zhí)行卷積運算。卷積過程實質(zhì)上是對輸入數(shù)據(jù)進行局部特征提取,每個濾波器旨在捕獲特定類型的特征,如邊緣、紋理、顏色分布等。濾波器在輸入數(shù)據(jù)上逐個位置移動(步長決定移動距離),對每個位置執(zhí)行元素級乘法后求和生成一個輸出值。這一過程可以形象地理解為濾波器“感受”輸入數(shù)據(jù)的特定部分,從而產(chǎn)生對該部分特征的響應(yīng)。每個濾波器在遍歷整個輸入數(shù)據(jù)后,形成一個特征映射(FeatureMap)。通過多個濾波器的卷積,可得到多通道的特征映射,共同構(gòu)成卷積層的輸出,實現(xiàn)了對輸入數(shù)據(jù)多維度、多層次特征的編碼。在卷積層之后,通常會引入池化層,其核心思想是對特征進行降采樣,通過對數(shù)據(jù)維數(shù)的降維,從而降低計算復(fù)雜性,同時提高對輸入平移、旋轉(zhuǎn)等變換的魯棒性。常用的池化操作有最大池化和均化池。極大化池選擇了濾波器窗中的極大值,以保持最有意義的特征;對圖像進行平均化時,采用了窗內(nèi)像元的平均值,從而更好地反應(yīng)了圖像的全局特性。池化層采用一定尺寸的過濾窗沿特征圖移動,并對窗中的象素進行池化,得到降采樣的特征圖。在對幾個卷積和池化層進行處理之后,這些功能典型地被提供給完全連通層。在全連通層中,每一個結(jié)點都和前面一層的結(jié)點完全相連,構(gòu)成一個密集的權(quán)值矩陣。整個連通級通過對前一步所得到的特征的整體集成和抽象,完成由局部特征向全局分類的轉(zhuǎn)化。最后一個層次是完全連通的網(wǎng)絡(luò),該網(wǎng)絡(luò)的節(jié)點數(shù)目與分類問題的類別數(shù)目相對應(yīng),利用softmax函數(shù)或其它激勵函數(shù)生成類概率分布,從而實現(xiàn)分類任務(wù)。4.3數(shù)據(jù)集本課題分析為兩束LG光束拓撲荷數(shù)分別+1~+10和-1~-10的疊加態(tài)分類識別。軌道角動量整數(shù)階疊加態(tài)數(shù)據(jù)集的構(gòu)建,首要任務(wù)是確定數(shù)據(jù)的獲取途徑。通常,此類數(shù)據(jù)可通過實驗測量或理論模擬兩種方式獲得。而本文數(shù)據(jù)都為通過使用matlab軟件理論模擬獲得。4.3.1數(shù)據(jù)集的建立在CNN中數(shù)據(jù)集不僅是訓(xùn)練的基礎(chǔ)也是評估、優(yōu)化和改進模型的關(guān)鍵因素。數(shù)據(jù)集為CNN模型提供了其所需要的輸入數(shù)據(jù)和對應(yīng)的標簽,而豐富多樣的數(shù)據(jù)集更可以讓CNN從中提取到復(fù)雜的特征。一個豐富多樣且具有代表性的數(shù)據(jù)集更有助于CNN在遇到未見過的數(shù)據(jù)時候能更好的進行評估,也會更方便CNN來進行合理的分配以此來達到更好的訓(xùn)練效果。相反,若數(shù)據(jù)集過于簡單則可能會導(dǎo)致模型過擬合,從而表現(xiàn)不佳。4.3.2數(shù)據(jù)集的增強在CNN識別不理想的情況下我們可以通過增強數(shù)據(jù)集來讓其達到更好的識別,且數(shù)據(jù)增強是機器學(xué)習(xí)中一種常用的技術(shù),特別是在數(shù)據(jù)量有限的情況下。該方法通過對原始數(shù)據(jù)進行一系列的隨機變換,生成新的訓(xùn)練樣本,既可以增大樣本規(guī)模,又可以擴大樣本的多樣性,增強模型的推廣能力。目前常用的圖像增強方法有:旋轉(zhuǎn),縮放,翻轉(zhuǎn),平移,剪切,遮擋,加噪等。下圖為以下增強后的數(shù)據(jù)以拓撲荷±5疊加為例:a)b)c)d)e)圖4.3數(shù)據(jù)圖原圖b)旋轉(zhuǎn)后c)平移后d)裁剪后e)遮擋后4.4基于ResNet模型的OAM光束識別方法Resnet是一種很好的處理復(fù)雜圖像的方法,通過使用shorcut短連來解決深層網(wǎng)絡(luò)中的模型退化問題。與一般的網(wǎng)絡(luò)相比,在2/3層間加入了一個短路機制,利用差異化學(xué)習(xí)來實現(xiàn)深度網(wǎng)絡(luò)的功能。而本文選擇的是ResNet50。在ResNet50中,數(shù)字"50"代表該模型具有50個層。具體來說,殘差網(wǎng)絡(luò)(ResNet,ResNet)是一個深度卷積神經(jīng)網(wǎng)絡(luò)框架,該框架采用"殘差"學(xué)習(xí)單位,有效地克服了深層網(wǎng)絡(luò)中的梯度丟失及表達能力的瓶頸。它包括50層:這些層由卷積層、批歸一化層、激活函數(shù)(如ReLU)以及跳過連接(即殘差連接)組成。ResNet50的設(shè)計允許網(wǎng)絡(luò)通過這些殘差連接來學(xué)習(xí)輸入與輸出之間的差異,從而更容易地訓(xùn)練更深的網(wǎng)絡(luò)。ResNet50通常用于圖像識別任務(wù),并且在各種基準測試和實際應(yīng)用中表現(xiàn)出色。它的預(yù)訓(xùn)練版本在大型數(shù)據(jù)集(如ImageNet)上進行了訓(xùn)練,可以識別1000多個不同的對象類別。由于其出色的通用性和性能,ResNet50經(jīng)常被用作遷移學(xué)習(xí)和計算機視覺任務(wù)的出發(fā)點。利用ResNet50模型來進行訓(xùn)練并識別。首先,它通過導(dǎo)入必要的庫(如torch和torchvision)開始。然后,定義了一系列數(shù)據(jù)預(yù)處理步驟,包括將圖像大小調(diào)整為224x224像素,將其轉(zhuǎn)換為張量,并進行標準化。接下來,該代碼使用torchvision庫中的ImageFolder類加載了訓(xùn)練集和測試集,并使用DataLoader將這些數(shù)據(jù)集分批處理,并設(shè)定合適的Batch-size(一次訓(xùn)練所使用的數(shù)據(jù)樣本數(shù)量)以便高效地進行訓(xùn)練和評估。之后,代碼實例化了一個預(yù)訓(xùn)練的ResNet-50模型,并凍結(jié)了其所有參數(shù),這樣在訓(xùn)練過程中就不會改變預(yù)訓(xùn)練模型的權(quán)重。然后修改了模型的最后一層全連接層,使其輸出與訓(xùn)練集中的類別數(shù)相匹配。定義了損失函數(shù)(交叉熵損失)和優(yōu)化器(Adam優(yōu)化器),并且設(shè)置了學(xué)習(xí)率。然后,檢查是否有可用的GPU,并將模型及其數(shù)據(jù)移動到GPU上以加速計算。在訓(xùn)練階段,通過設(shè)定合適個epoch對模型進行訓(xùn)練,每個epoch結(jié)束時計算并打印出平均損失和準確率。這允許用戶跟蹤模型在訓(xùn)練過程中的性能。完成訓(xùn)練后,保存了模型的權(quán)重到一個文件中,然后重新加載這些權(quán)重,確保可以在不同的運行中繼續(xù)使用訓(xùn)練好的模型。最后,在測試階段,遍歷測試集,并對每個輸入圖像進行分類。然后,它將預(yù)測的類別名稱輸出到控制臺,提供了模型性能的直觀展示。下圖是輸出結(jié)果展示:圖4.4輸出結(jié)果展示下圖4.4為根據(jù)ResNet所構(gòu)建的辨識模型的訓(xùn)練曲線,經(jīng)過20輪的訓(xùn)練,從圖表中可以明顯看到,從第十輪起,該模型的驗證集合的準確率超過了90%,第十五輪以后,該算法的準確率和有效性都保持在95%左右,并且在第二十輪的時候,訓(xùn)練精度更是達到了95.27%。當(dāng)將訓(xùn)練輪次改為50次時,訓(xùn)練精度基本維持在98%左右。圖4.5利用ResNet建立的識別模型的訓(xùn)練曲線將經(jīng)過湍流后的光強圖加入驗證集中,會發(fā)現(xiàn)訓(xùn)練精度會出現(xiàn)下降,但最低也在90%以上,以下是訓(xùn)練曲線:圖4.6加入湍流影響后的驗證集的訓(xùn)練曲線5總結(jié)與展望5.1總結(jié)本文研究的是兩束LG光束拓撲荷數(shù)分別為+1~+10和-1~-10的疊加態(tài)的十分類的識別,利用Matlab生成了所需的疊加態(tài)LG光束,給出了每種疊加態(tài)LG光束的光圖并給出了他們之間的不同之處,也列出了疊加態(tài)LG光束在經(jīng)過不同程度湍流影響后的圖像,并進行了比較,發(fā)現(xiàn)了隨著湍流強度的增大,在經(jīng)過湍流后的光強分布圖畸形會越來越嚴重,最后取每種疊加態(tài)光強分布圖200張作為數(shù)據(jù)集,總共選取10(十分類)×200(每個分類的數(shù)據(jù)集),總共選取2000張。然后通過pycharm利用神經(jīng)網(wǎng)絡(luò)ResNet50對數(shù)據(jù)集進行特征提取和訓(xùn)練,并調(diào)整batch_size(一次訓(xùn)練所抓取的數(shù)據(jù)樣本數(shù)量)到合適的數(shù)量,固定epoch(所有訓(xùn)練樣本在神經(jīng)網(wǎng)絡(luò)中都進行了一次正向傳播和一次反向傳播)為20。然后建立驗證集進行識別,可得出準確率基本維持在95%,再將epoch改為50之后,準確率維持在了98%左右。將經(jīng)過湍流后的光強分布圖加入驗證集進行驗證,準確率出現(xiàn)了降低,但依然維持在90%以上。可以得出卷積神經(jīng)網(wǎng)絡(luò)在這方面的優(yōu)勢。5.2展望本論文研究的是基于卷積神經(jīng)網(wǎng)絡(luò)的整數(shù)階疊加態(tài)的識別,采用的是ResNet50神經(jīng)網(wǎng)絡(luò)模型,可進一步找出更好的卷積神經(jīng)網(wǎng)絡(luò)模型來對數(shù)據(jù)集進行訓(xùn)練達到更好效果,或者進一步提高數(shù)據(jù)集的多樣性,增加數(shù)據(jù)集的數(shù)量,以此來達到更好的識別效果。參考文獻:AllenL,BeijersbergenMW,SpreeuwRJ,etal.OrbitalangularmomentumoflightandthetransformationofLaguerre-Gaussianlasermodes[J].PhysicalReviewA,1992,45(11):8185-8189.

WangJ,YangJY,FazalIM,etal.Terabitfree-spacedatatransmissionemployingorbitalangularmomentummultiplexing[J].NaturePhotonics,2012,6(7):488-496.

RenYongxiong,WangZhe,LiaoPeicheng,etal.Experimentalcharacterizationofa400Gbit/sorbitalangularmomentummultiplexedfree-spaceopticallinkover120m[J].OpticsLetters,2016,41(3):622-625.KhoninaSN,KotlyarVV,SkidanovRV,etal.Gauss-Laguerremodeswithdifferentindicesinprescribeddiffractionordersofadiffractivephaseelement[J].OpticsCommunications,2000,175(4-6):301-308.BerkhoutGC,LaveryMP,CourtialJ,etal.Efficientsortingoforbitalangularmomentumstatesoflight[J].PhysicalReviewLetters,2010,105(15):153601.

YinXiaoli,SangHongqing,CuiXiaozhou,etal.Offsettoleranceofanorbitalangularmomentumopticalcommunicationsystemwithangulardeflection[J].

OpticsCommunications,2017(393):34-39.KrennM,FicklerR,FinkM,etal.CommunicationwithspatiallymodulatedlightthroughturbulentairacrossVienna[J].

NewJournalofPhysics,2014(16):113028.KnutsonEM,LohaniS,DanaciO,etal.Deeplearningasatooltodistinguishbetweenhighorbitalangularmomentumopticalmodes[C]//OpticsandPhotonicsforInformationProcessingX.Bellingham:SPIE,2016:997013.DosterT,WatnikAT.MachinelearningapproachtoOAMbeamdemultiplexingviaconvolutionalneuralnetworks[J].AppliedOptics,2017,56(12):3386-3396.

LiJin,ZhangMin,WangDanshi.Adaptivedemodulatorusingmachinelearningfororbitalangularmomentumshiftkeying[J].

IEEEPhotonicsTechnologyLetters,2017:1-1.尹霄麗,郭翊麟,崔小舟,常歡,陳小政.基于卷積神經(jīng)網(wǎng)絡(luò)的多OAM態(tài)識別方法[J].北京郵電大學(xué)學(xué)報,2019,42(1):47-52.謝炎辰等.渦旋光束軌道角動量檢測技術(shù)研究[D].西安理工大學(xué),2019.Ling-FengZhang,Y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論