




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
摘要風(fēng)電作為一種重要的可再生能源,其在全球范圍內(nèi)的大規(guī)模開發(fā)和應(yīng)用對于減少溫室氣體排放、實現(xiàn)能源轉(zhuǎn)型以及實現(xiàn)雙碳目標(biāo)至關(guān)重要。然而,風(fēng)電功率受風(fēng)速、風(fēng)向、溫度、濕度等多種氣象條件影響,呈現(xiàn)出隨機(jī)性和波動性,這給電網(wǎng)的安全穩(wěn)定運行帶來了挑戰(zhàn)。本文提出通過生成對抗網(wǎng)絡(luò)挖掘并模擬氣象條件與風(fēng)電功率歷史數(shù)據(jù)之間的深層內(nèi)在聯(lián)系,以解決新建風(fēng)電場數(shù)據(jù)量不足導(dǎo)致難以預(yù)測的問題。借助生成對抗網(wǎng)絡(luò)生成逼真的數(shù)據(jù),豐富訓(xùn)練集,從而提高模型對風(fēng)電功率波動特性的理解和模擬能力,提升預(yù)測精度。精確的風(fēng)電功率預(yù)測對于電力系統(tǒng)具有雙重意義:一是幫助相關(guān)部門提前預(yù)知風(fēng)電出力變化,合理調(diào)配其他電源,確保電網(wǎng)供需平衡和供電質(zhì)量相對穩(wěn)定。二是能夠幫助風(fēng)電企業(yè)不斷優(yōu)化發(fā)電相關(guān)計劃,降低市場潛在風(fēng)險,減少風(fēng)電波動造成的各種損失,并通過科學(xué)運維降低成本,提升風(fēng)電項目的整體經(jīng)濟(jì)和社會效益。通過實驗分析,驗證了基于生成對抗網(wǎng)絡(luò)的風(fēng)電功率預(yù)測方法在應(yīng)對風(fēng)電隨機(jī)性和波動性方面的優(yōu)秀性能,以及在解決新建風(fēng)電場歷史數(shù)據(jù)匱乏問題上的有效性和應(yīng)用價值。結(jié)論顯示,生成對抗網(wǎng)絡(luò)技術(shù)為提升風(fēng)電功率預(yù)測準(zhǔn)確性、保障電網(wǎng)穩(wěn)定運行、推動清潔能源產(chǎn)業(yè)經(jīng)濟(jì)高效發(fā)展提供了強有力的技術(shù)支持,對于促進(jìn)風(fēng)電產(chǎn)業(yè)的可持續(xù)發(fā)展具有重要的理論價值和實踐意義。關(guān)鍵詞:風(fēng)電功率預(yù)測,生成對抗網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)
[18](ConvolutionalNeuralNetwork,CNN)作為一種在深度學(xué)習(xí)領(lǐng)域廣泛應(yīng)用的模型架構(gòu),尤其擅長應(yīng)對那些組織成網(wǎng)格形態(tài)的信息。通過整合卷積層機(jī)制與池化層操作,CNN能夠有效地從輸入數(shù)據(jù)中提煉關(guān)鍵特征并進(jìn)行高層次的抽象表達(dá),進(jìn)而賦能系統(tǒng)完成對各類復(fù)雜數(shù)據(jù)集的細(xì)致分類、精準(zhǔn)識別以及有效分割等多元化任務(wù)。經(jīng)典的CNN結(jié)構(gòu)如圖3.5所示。圖3.5CNN網(wǎng)絡(luò)結(jié)構(gòu)CNN模型訓(xùn)練過程的關(guān)鍵在于調(diào)整各類卷積核參數(shù)以實現(xiàn)特征抽取。卷積層定義如下:(3.11)其中為卷積層輸出;為激活函數(shù);為卷積核權(quán)重;為偏置;為卷積符號。在CNN架構(gòu)中,卷積層執(zhí)行的操作涉及將輸入信號與一組可訓(xùn)練的濾波函數(shù)進(jìn)行互作用,這些濾波函數(shù)亦即卷積核,其核心機(jī)制是對輸入信號各部分與其對應(yīng)的核權(quán)重進(jìn)行點對點相乘后再累加整合,以構(gòu)建出所謂的輸出特征映射。這種卷積機(jī)制的根本理念是通過讓一組學(xué)習(xí)型濾波器在輸入數(shù)據(jù)域中進(jìn)行滑窗式掃描并與之進(jìn)行元素級運算,繼而在每一步驟中匯總這些乘積值,以便提煉出輸入數(shù)據(jù)的局部空間關(guān)聯(lián)性或時序關(guān)聯(lián)性。值得注意的是,在卷積過程中,每一個濾波器的權(quán)值在整個輸入?yún)^(qū)域中保持一致性,即權(quán)值共享原理,它保證了無論在輸入數(shù)據(jù)的哪個位置應(yīng)用該濾波器,所使用的參數(shù)都是同一組。這一特性賦予卷積操作天然的平移不變性,有利于高效地捕獲并識別輸入信號中的局部結(jié)構(gòu)及特征模式。從直觀視角看,原始數(shù)據(jù)在卷積計算層作用前位于結(jié)構(gòu)的一側(cè),而經(jīng)由輸入數(shù)據(jù)與特定卷積核實施卷積運算之后,會生成新的二維表征數(shù)據(jù)位于結(jié)構(gòu)的另一側(cè)。在新生成的數(shù)據(jù)矩陣中,各個數(shù)值具體體現(xiàn)了輸入數(shù)據(jù)塊與相應(yīng)卷積核做內(nèi)積運算的累積結(jié)果。激勵單元(ReLU激活函數(shù))作為一種廣泛應(yīng)用在深度學(xué)習(xí)模型中的核心組件,其目標(biāo)在于強化神經(jīng)網(wǎng)絡(luò)對非線性關(guān)系的建模效能。在神經(jīng)網(wǎng)絡(luò)內(nèi)部,激活函數(shù)扮演著關(guān)鍵角色,它負(fù)責(zé)對接收到的節(jié)點輸入施加轉(zhuǎn)換規(guī)則以決定節(jié)點的最終輸出響應(yīng),進(jìn)而引入額外的復(fù)雜度至輸入與輸出間的映射關(guān)系。ReLU激活函數(shù)的具體實現(xiàn)機(jī)制體現(xiàn)在,它對所有負(fù)數(shù)值輸入直接賦予零值輸出,而對于正數(shù)值輸入則保持原樣傳遞,此非線性操作增強了網(wǎng)絡(luò)對復(fù)雜數(shù)據(jù)分布的表達(dá)力和適應(yīng)性。ReLU激活函數(shù)的表達(dá)式如下: (3.12)特征縮減模塊(POOL)的主要功能是為了縮減特征圖譜的空間維度,進(jìn)而減輕數(shù)據(jù)流經(jīng)網(wǎng)絡(luò)時的存儲和運算壓力,并且有助于遏制過擬合現(xiàn)象的發(fā)生。在標(biāo)準(zhǔn)網(wǎng)絡(luò)架構(gòu)設(shè)計中,POOL層通常被整合于連續(xù)卷積層之間,藉此逐步增強所抽取特征的概括性和層次感。該層執(zhí)行操作時,通過對局部特征區(qū)域?qū)嵤┲T如平均取值或最大值選取等池化策略,確保僅保留最為顯著和關(guān)鍵的特征信息。池化層定義如下: (3.13)其中為激活函數(shù);為權(quán)重函數(shù);為池化函數(shù);為偏置。全連接層(FC)作為一種核心神經(jīng)網(wǎng)絡(luò)組件,其作用機(jī)制在于確保前一層所有神經(jīng)元單元均與后一層的所有單元形成獨立權(quán)重的連接關(guān)系。在卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)內(nèi),全連接層往往布局于網(wǎng)絡(luò)深度末端,旨在匯集并融合自先前卷積階段提煉出的多元特征信息,進(jìn)而服務(wù)于整體模型的最后階段——實現(xiàn)對輸入實例的精確分類或回歸預(yù)測任務(wù)。3.4基于神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測模型3.4.1基于神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測流程本文采用處理器IntelCorei7-10510U、開發(fā)環(huán)境python3.8和軟件平臺PyCharm進(jìn)行程序編寫。預(yù)測流程主要分為以下幾點,如圖3.6所示。數(shù)據(jù)收集和預(yù)處理:首先開展的是數(shù)據(jù)的收集和預(yù)處理操作。借助現(xiàn)代化的數(shù)據(jù)捕獲與監(jiān)控技術(shù)手段,實際獲取風(fēng)力發(fā)電機(jī)產(chǎn)生的實時風(fēng)速、風(fēng)向、溫度、濕度、氣壓、高度以及降雨量等等的基礎(chǔ)數(shù)據(jù)。在此基礎(chǔ)上,經(jīng)過數(shù)據(jù)預(yù)處理工序之后,減少數(shù)據(jù)集中的冗余信息,使數(shù)據(jù)更加干凈和可靠,同時可以使模型更容易學(xué)習(xí)到特征之間的關(guān)系,提高模型的性能和泛化能力,加快處理速度和模型收斂。劃分訓(xùn)練集和測試集:將風(fēng)電場數(shù)據(jù)合理劃分為兩個子集——訓(xùn)練集和測試集,可以驗證模型性能,客觀地評價模型的泛化能力,即模型對新數(shù)據(jù)的適應(yīng)能力,也可以及早發(fā)現(xiàn)過擬合問題,從而調(diào)整模型復(fù)雜度,還可以使用測試集上的性能作為評價指標(biāo)。這樣可以確保所選模型或參數(shù)配置不僅在訓(xùn)練集上表現(xiàn)良好,而且在未見過的數(shù)據(jù)上也具有較好的性能。一般采用70%或80%的數(shù)據(jù)用于訓(xùn)練模型,而剩余的30%或20%的數(shù)據(jù)則保留在測試集中,以供后續(xù)評估模型性能。訓(xùn)練測試和誤差對比:將風(fēng)電場劃分好訓(xùn)練集和測試集之后,將這兩部分?jǐn)?shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)模型的輸入,然后利用平均絕對誤差、均方根誤差和決定系數(shù)作為評價指標(biāo),這些指標(biāo)能夠從不同角度反映模型在風(fēng)電場數(shù)據(jù)上的預(yù)測精度和泛化能力,從而為我們提供更為全面和客觀的模型性能評估結(jié)果。圖3.6基于神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測流程3.4.2評價指標(biāo)風(fēng)電預(yù)測技術(shù)因其多樣化的特性及應(yīng)用場景的不同,在性能表現(xiàn)和適應(yīng)性上展現(xiàn)出各自的獨特性與差異性。為了能夠合理且準(zhǔn)確地評價這些預(yù)測方法的有效性和優(yōu)劣,科學(xué)合理地選擇評價標(biāo)準(zhǔn)顯得至關(guān)重要。評價指標(biāo)體系旨在采用量化的手段刻畫預(yù)測模型的實際效能,通常情況下,會選擇和構(gòu)建一系列基于誤差為基礎(chǔ)的衡量標(biāo)準(zhǔn)。面對新能源功率預(yù)測這一特定領(lǐng)域,常用的評價指標(biāo)有:平均絕對偏差(MAE,MeanAbsoluteError)、均方根誤差(RMSE,RootMeanSquareError)和決定系數(shù)(R2)。這些指標(biāo)共同構(gòu)成了評價風(fēng)電功率預(yù)測精確度的重要參考依據(jù)。上述誤差準(zhǔn)則計算公式如下:平均絕對誤差 (3.14)式中,n代表樣本數(shù)量,yi表示預(yù)測值,yi為實際數(shù)值。該誤差就是將所有樣本預(yù)測值與實際值之間的絕對差值求和后除以樣本總數(shù),這樣計算出的平均值能反映出模型預(yù)測的平均偏離程度。因為采用了絕對值計算,所以不論預(yù)測值比實際值偏大還是偏小,其誤差都會被同等看待,這使得均方根誤差 (3.15)式中,n代表樣本數(shù)量,yi表示預(yù)測值,yi為實際數(shù)值。該誤差決定系數(shù) (3.16)式中,n代表樣本數(shù)量,表示預(yù)測值,為實際數(shù)值,代表實際值的平均值。決定系數(shù)也稱為判定系數(shù),其數(shù)值等于相關(guān)系數(shù)的平方。決定系數(shù)R2衡量了模型預(yù)測值與實際值之間的擬合優(yōu)度,取值范圍在0到1之間,越接近1表示模型解釋力越強。3.4.3可行性驗證為了探討采用神經(jīng)網(wǎng)絡(luò)模型對風(fēng)電場短期功率的預(yù)測性能,本實驗選取了內(nèi)蒙古某一風(fēng)電場10天的實測數(shù)據(jù),數(shù)據(jù)每隔1小時采集一次,即共選取240組數(shù)據(jù)。其中訓(xùn)練數(shù)據(jù)集為70%,測試集為30%,并將這兩部分?jǐn)?shù)據(jù)進(jìn)行處理數(shù)據(jù)之后,再利用BP、LSTM、CNN三個模型進(jìn)行訓(xùn)練和預(yù)測。表3-2不同模型的風(fēng)電功率預(yù)測誤差對比預(yù)測模型RMSEMAER2BP模型0.1599170.1347100.653233LSTM模型0.2386230.1768820.227905CNN模型0.1617300.1269130.645328圖3.7不同模型的預(yù)測功率與實際功率對比圖經(jīng)過實驗數(shù)據(jù)分析,LSTM模型的RMSE與MAE相對較高,說明其在本次實驗條件下對風(fēng)電功率的預(yù)測誤差較大。BP模型和CNN模型這兩項指標(biāo)上表現(xiàn)最佳,顯示出較高的預(yù)測準(zhǔn)確性。而且BP模型與CNN模型的R2值均超過0.6,顯示出較強的解釋能力,而LSTM模型的R2值較低,說明其對風(fēng)電場短期功率的預(yù)測效果相對較弱。從圖3.7可知,LSTM模型曲線在整體上波動最小,但預(yù)測效果最差,BP模型與CNN模型在總體趨勢上與實際功率曲線較吻合,預(yù)測效果較好。通過對BP、LSTM、CNN三種神經(jīng)網(wǎng)絡(luò)模型在該風(fēng)電場短期功率預(yù)測實驗的對比研究,發(fā)現(xiàn)BP模型與CNN模型在預(yù)測精度與解釋力方面表現(xiàn)出色,尤其是BP模型在RMSE、MAE及R2各項指標(biāo)上均顯示出較好的預(yù)測性能。相比之下,LSTM模型在本次實驗數(shù)據(jù)集上的預(yù)測效果不盡理想。但從圖3.7也可以看出,實際功率曲線的波動較大,這也說明風(fēng)電的不穩(wěn)定性和隨機(jī)性,而且還有可能是因為歷史數(shù)據(jù)量太少,導(dǎo)致預(yù)測效果不夠精確。因此需要考慮在利用預(yù)測模型之前增強歷史數(shù)據(jù),從而提高預(yù)測模型在風(fēng)電功率預(yù)測的精度。3.5本章小結(jié)本章探討了風(fēng)電功率預(yù)測的理論框架與實踐方法、數(shù)據(jù)預(yù)處理技術(shù)以及神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用。預(yù)測流程始于明確短期風(fēng)電預(yù)測目標(biāo),繼而收集風(fēng)電場各項關(guān)鍵數(shù)據(jù),并通過數(shù)據(jù)預(yù)處理提高數(shù)據(jù)質(zhì)量和模型訓(xùn)練效果。文中介紹了max-min標(biāo)準(zhǔn)化進(jìn)行數(shù)據(jù)預(yù)處理,還介紹了對抗生成網(wǎng)絡(luò)(GANs)進(jìn)行數(shù)據(jù)增強,以增加數(shù)據(jù)多樣性并提升模型泛化能力。在神經(jīng)網(wǎng)絡(luò)模型方面,通過對比實驗驗證了不同神經(jīng)網(wǎng)絡(luò)模型在實際風(fēng)電場數(shù)據(jù)上的預(yù)測性能,為風(fēng)電功率預(yù)測模型的選擇提供了依據(jù)。
4基于生成對抗網(wǎng)絡(luò)的風(fēng)電功率預(yù)測由于新建的風(fēng)電場的歷史數(shù)據(jù)樣本少,風(fēng)電功率預(yù)測依賴于這些數(shù)據(jù)進(jìn)行模型訓(xùn)練和參數(shù)優(yōu)化。若樣本量不足,模型的訓(xùn)練將不夠充分,難以捕捉到風(fēng)電場實際運行中的復(fù)雜特性和規(guī)律。這會導(dǎo)致預(yù)測結(jié)果與實際功率輸出之間存在較大的偏差,降低了預(yù)測的準(zhǔn)確性。從模型泛化能力的角度看,雖然少量的樣本會在一定程度上降低了模型過擬合的風(fēng)險,但很可能導(dǎo)致模型過于簡單,無法捕捉到風(fēng)電功率變化的全部細(xì)節(jié),出現(xiàn)欠擬合現(xiàn)象,表現(xiàn)為模型對既有數(shù)據(jù)的擬合度差,對未來數(shù)據(jù)的預(yù)測準(zhǔn)確性不高。特別是在面對復(fù)雜多變的天氣條件和機(jī)組運行狀態(tài)時,模型可能無法準(zhǔn)確地進(jìn)行預(yù)測,影響了風(fēng)電場的穩(wěn)定運行。此外,歷史數(shù)據(jù)樣本少還可能導(dǎo)致預(yù)測結(jié)果的不穩(wěn)定性增加。由于訓(xùn)練樣本的局限性,模型容易受到噪聲和異常值的影響,使得預(yù)測結(jié)果波動較大。這不僅影響了風(fēng)電場的運營管理,還可能對電網(wǎng)的穩(wěn)定運行帶來潛在風(fēng)險。4.1基于生成對抗網(wǎng)絡(luò)的風(fēng)電功率預(yù)測過程針對新建的風(fēng)電場歷史數(shù)據(jù)樣本有限這一問題時,生成對抗網(wǎng)絡(luò)GANs可以作為一個有效的工具來解決這個挑戰(zhàn)。GANs通過學(xué)習(xí)現(xiàn)有數(shù)據(jù)的分布特征,并生成與真實數(shù)據(jù)相似的合成數(shù)據(jù),可以彌補歷史數(shù)據(jù)不足所帶來的缺陷。通過利用GANs生成的合成數(shù)據(jù),不但可以擴(kuò)充新建的風(fēng)電場的歷史數(shù)據(jù)集,還提高數(shù)據(jù)的豐富程度和多樣性,從而提高對風(fēng)電場運行狀態(tài)的監(jiān)測和預(yù)測能力?;谏蓪咕W(wǎng)絡(luò)的風(fēng)電功率預(yù)測流程圖如圖4.1所示。在運用BP、LSTM、CNN模型進(jìn)行風(fēng)電功率預(yù)測之前,一個不可或缺的前置步驟是對由GANs增益的數(shù)據(jù)集進(jìn)行嚴(yán)謹(jǐn)?shù)馁|(zhì)量評估。這主要源于GANs依據(jù)不同生成策略和參數(shù)配置,可生成多尺度、多樣化的補充數(shù)據(jù),而這些數(shù)據(jù)在數(shù)量上的差異無疑會對后續(xù)預(yù)測性能產(chǎn)生顯著影響。具體而言,GANs可能生成小批量的精細(xì)數(shù)據(jù),專注于對特定現(xiàn)象或模式的精確模擬;或者生成大規(guī)模的粗略數(shù)據(jù),旨在涵蓋更廣泛的場景和潛在變異性。每一種數(shù)據(jù)量級的選擇,都會在訓(xùn)練階段引入不同的信息豐富度與噪聲比例,從而導(dǎo)致預(yù)測結(jié)果的精度呈現(xiàn)出不同程度的差異。因此,對GANs生成數(shù)據(jù)的質(zhì)量把控不僅包括對其真實性、一致性及與原始數(shù)據(jù)分布擬合度的考察,還應(yīng)涉及在不同預(yù)測模型應(yīng)用下實際提升預(yù)測效果的能力評價。圖4.1基于生成對抗網(wǎng)絡(luò)的風(fēng)電功率預(yù)測流程圖4.2算例和結(jié)果分析4.2.1探究GANs生成數(shù)據(jù)的質(zhì)量和有效性本實驗同樣選取了內(nèi)蒙古某一風(fēng)電場10天的實測數(shù)據(jù),數(shù)據(jù)每隔1小時采集一次,即共選取240組數(shù)據(jù)。其中訓(xùn)練數(shù)據(jù)集為70%,測試集為30%,鑒于所選訓(xùn)練集涵蓋的觀測天數(shù)相對有限,本實驗進(jìn)一步探究了借助GANs技術(shù)增強訓(xùn)練數(shù)據(jù)的時間跨度的可能性。運用GANs生成了從1日到10日范圍內(nèi)的虛擬風(fēng)速數(shù)據(jù),這些數(shù)據(jù)在生成過程中力求保持與真實觀測數(shù)據(jù)的高度相似性,生成的每一天數(shù)據(jù)隨后被整合入原有訓(xùn)練集中,形成一系列擴(kuò)充后的訓(xùn)練集,分別對應(yīng)增加一天至十天的真實觀測數(shù)據(jù)。接下來,針對每一個經(jīng)GANs數(shù)據(jù)增強后的訓(xùn)練集合,我們依次運用BP、LSTM和CNN模型進(jìn)行重新訓(xùn)練與預(yù)測工作。這樣的設(shè)計旨在揭示在初始有限的訓(xùn)練數(shù)據(jù)基礎(chǔ)上,通過GANs生成數(shù)據(jù)逐步擴(kuò)大訓(xùn)練集規(guī)模,對于提升各模型預(yù)測風(fēng)電場風(fēng)速的能力是否存在顯著效果,以及何種程度的數(shù)據(jù)擴(kuò)充最為適宜。表4.1基于GANs生成不同數(shù)據(jù)量的BP模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2710.1519620.1260940.68687520.1456150.1200030.71248730.1406890.1137380.73160940.1598820.1311880.65338550.1483770.1185900.69004760.1518020.1149320.67981570.1634830.1349450.63759880.1352490.1109680.66619890.1475070.1124390.704968100.1528650.1258940.683142圖4.2基于不同數(shù)據(jù)量的BP預(yù)測功率與實際功率對比圖
表4.2基于GANs生成不同數(shù)據(jù)量的LSTM模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2710.2450560.1849560.18571620.2501720.1883630.15135630.2103910.1570010.39979340.2079970.1574700.41337350.1821370.1339830.53295860.2519280.1921990.11814870.2226780.1615740.32764180.2063020.1504540.22334890.2396390.1772830.221314100.1973070.1332480.472127圖4.3基于不同數(shù)據(jù)量的LSTM預(yù)測功率與實際功率對比圖
表4.3基于GANs生成不同數(shù)據(jù)量的CNN模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2710.1724830.1438350.59659720.1601570.1234480.65219230.1652740.1267220.62961440.1507510.1192410.69184650.2046550.1688320.41033460.1610740.1335670.63950870.1602180.1241090.65192980.1588170.1228910.53973290.1613500.1253280.646992100.1611150.1241520.648019圖4.4基于不同數(shù)據(jù)量CNN預(yù)測功率與實際功率對比圖
從分別提供的三個模型的數(shù)據(jù)表4.1到表4.3來看,不同訓(xùn)練集數(shù)據(jù)量及GANs生成數(shù)據(jù)量對模型預(yù)測誤差有明顯的影響。在BP模型的預(yù)測誤差中,隨著訓(xùn)練集數(shù)據(jù)量的增加和GANs生成數(shù)據(jù)量的變化,RMSE、MAE和R2呈現(xiàn)出一定的波動。在LSTM和CNN模型的預(yù)測誤差中,也存在類似的趨勢。這些數(shù)據(jù)波動表明,數(shù)據(jù)擴(kuò)充并不總是能帶來預(yù)測性能的提升,擴(kuò)充的數(shù)據(jù)量和原始數(shù)據(jù)集的比例需要找到一個平衡點。值得注意的是,在部分情況下,如BP模型在訓(xùn)練集數(shù)據(jù)量為7天、生成數(shù)據(jù)量為1天時,或者在LSTM模型在訓(xùn)練集數(shù)據(jù)量為7天、生成數(shù)據(jù)量為4天時,預(yù)測誤差相對較低,表明在這些特定情況下,數(shù)據(jù)擴(kuò)充對模型性能的提升效果較為顯著。然而,在其他情況下,如訓(xùn)練集數(shù)據(jù)量和生成數(shù)據(jù)量較大時,預(yù)測誤差反而增加,這是由于過多的生成數(shù)據(jù)引入了噪聲,影響了模型的預(yù)測精度。從分別提供的三個模型的對比圖4.2到圖4.4來看,當(dāng)訓(xùn)練集數(shù)據(jù)量較少時,LSTM模型的預(yù)測功率曲線與實際功率曲線之間存在較大的偏差,這可能是由于模型未能充分學(xué)習(xí)到數(shù)據(jù)的內(nèi)在規(guī)律。隨著GANs生成數(shù)據(jù)量的適當(dāng)擴(kuò)充,預(yù)測功率曲線逐漸接近實際功率曲線,表明模型的預(yù)測能力得到了提升。然而,當(dāng)生成數(shù)據(jù)量過大時,預(yù)測功率曲線又出現(xiàn)了一定程度的偏離,這可能是由于過多的數(shù)據(jù)導(dǎo)致模型過擬合,降低了泛化能力。結(jié)合實驗數(shù)據(jù)和對比圖進(jìn)行分析,GANs生成的數(shù)據(jù)可以在一定程度上提升模型的預(yù)測能力,但不是都有效。擴(kuò)充的數(shù)據(jù)量和原始數(shù)據(jù)集的比例需要仔細(xì)調(diào)整,以找到最佳的平衡點。對于不同的模型,其對于數(shù)據(jù)擴(kuò)充的敏感度和最佳擴(kuò)充量可能有所不同,因此在實際應(yīng)用中需要根據(jù)具體情況進(jìn)行調(diào)整。4.2.2探究GANs生成數(shù)據(jù)集和原始數(shù)據(jù)集的最佳比例為了找到生成的數(shù)據(jù)量和原始數(shù)據(jù)集的比例之間的最佳平衡點。本實驗選取了內(nèi)蒙古某一風(fēng)電場27天的實測數(shù)據(jù),數(shù)據(jù)每隔一小時采集一次,即總共648組數(shù)據(jù),其中訓(xùn)練數(shù)據(jù)集為20天(約70%),測試集為7天(約30%)。下面依舊采取BP、LSTM和CNN三個模型進(jìn)行預(yù)測。表4.4基于GANs生成不同數(shù)據(jù)量的BP模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2206(30%)0.0897380.0678260.77235412(60%)0.1166830.0884560.68812118(90%)0.1055650.0795530.78914524(120%)0.1271770.0945250.77036730(150%)0.1348390.1022870.70444436(180%)0.1022510.0763550.76468842(210%)0.1077080.0870350.69738648(240%)0.1529770.1234210.71048854(270%)0.1007280.0769240.75850160(300%)0.1333860.1012630.779890圖4.5基于不同數(shù)據(jù)量的BP預(yù)測功率與實際功率對比圖
表4.5基于GANs生成不同數(shù)據(jù)量的LSTM模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2206(30%)0.1202920.0931340.59094712(60%)0.1272620.0951310.62900718(90%)0.1375190.1010100.64217524(120%)0.1544140.1203540.66147630(150%)0.1501930.1135430.63330236(180%)0.1327490.1048450.60338342(210%)0.1212190.0911570.61670448(240%)0.1777520.1410550.60911954(270%)0.1284840.0952990.60706960(300%)0.1701640.1273790.641776圖4.6基于不同數(shù)據(jù)量的LSTM預(yù)測功率與實際功率對比圖
表4.6基于GANs生成不同數(shù)據(jù)量的CNN模型預(yù)測誤差訓(xùn)練集數(shù)據(jù)量/天生成數(shù)據(jù)量/天RMSEMAER2206(30%)0.0897900.0690920.77208712(60%)0.1037230.0781130.75355518(90%)0.1073840.0812930.78181824(120%)0.1341980.1033150.74431330(150%)0.1261600.0965100.74126636(180%)0.1021730.0784990.76505042(210%)0.1176020.0960360.63924148(240%)0.1413020.1071830.75299054(270%)0.1091120.0848750.71662660(300%)0.1363280.1001070.770073圖4.7基于不同數(shù)據(jù)量的CNN預(yù)測功率與實際功率對比圖
從表格數(shù)據(jù)中,我們可以觀察到不同擴(kuò)充數(shù)據(jù)量對各個模型預(yù)測誤差的影響。以BP模型為例,當(dāng)生成數(shù)據(jù)量為原始數(shù)據(jù)量的30%時,RMSE為0.089738,MAE為0.067826,R2為0.772354。隨著生成數(shù)據(jù)量的增加,預(yù)測誤差呈現(xiàn)出一定的波動。當(dāng)生成數(shù)據(jù)量為原始數(shù)據(jù)量的180%時,RMSE和MAE均有所降低,R2也有所提升,表明預(yù)測性能有所提高。然而,當(dāng)生成數(shù)據(jù)量進(jìn)一步增加到原始數(shù)據(jù)量的210%時,預(yù)測誤差反而增大,說明過多的擴(kuò)充數(shù)據(jù)可能引入了噪聲或干擾信息,影響了模型的預(yù)測性能。類似地,對于LSTM和CNN模型,也可以觀察到類似的趨勢。不同的模型在不同的擴(kuò)充數(shù)據(jù)量下表現(xiàn)出不同的預(yù)測性能。這可能是由于不同模型對數(shù)據(jù)量的敏感度和處理能力不同所致。通過圖4.5到圖4.7可以發(fā)現(xiàn),在適當(dāng)?shù)臄U(kuò)充數(shù)據(jù)量下,模型的預(yù)測結(jié)果與實際功率更加接近,曲線的吻合度更高。然而,當(dāng)擴(kuò)充數(shù)據(jù)量過多時,預(yù)測結(jié)果的波動性和誤差也會增加。綜上所述,擴(kuò)充數(shù)據(jù)量可以在一定程度上提高模型的預(yù)測性能,但并非越多越好。過多的擴(kuò)充數(shù)據(jù)可能引入噪聲或干擾信息,影響模型的預(yù)測準(zhǔn)確性。在本實驗結(jié)合三個預(yù)測模型的結(jié)果來看,GANs生成的數(shù)據(jù)在原始數(shù)據(jù)的90%的時候效果最好。因此,在實際應(yīng)用中,我們需要根據(jù)具體情況選擇合適的擴(kuò)充數(shù)據(jù)量,以達(dá)到最佳的預(yù)測效果。同時,也需要結(jié)合不同的模型和數(shù)據(jù)集進(jìn)行實驗,以找到最適合的擴(kuò)充策略和模型參數(shù)。4.2.3GANs增強數(shù)據(jù)下三種模型性能對比與最優(yōu)模型甄選從4.2.2小節(jié)可以得到,增加GANs生成數(shù)據(jù)的比例,能夠提升模型預(yù)測性能至一定閾值,表現(xiàn)為RMSE和MAE下降,R2值上升。但當(dāng)數(shù)據(jù)量超過某個臨界點后,繼續(xù)增加生成數(shù)據(jù)反而可能導(dǎo)致預(yù)測誤差增大,模型性能下降。這一現(xiàn)象在BP、LSTM和CNN模型中均有體現(xiàn),說明過量的擴(kuò)充數(shù)據(jù)可能引入噪聲或干擾信息,對模型的泛化能力和預(yù)測準(zhǔn)確性產(chǎn)生負(fù)面影響。盡管所有模型在90%數(shù)據(jù)比例下都有所改善,但具體到每個模型,其性能提升的程度及最優(yōu)數(shù)據(jù)比例可能存在差異。綜合上述實驗結(jié)果,可以得到表4.7。表4.7基于GANs生成數(shù)據(jù)量為90%時不同模型的預(yù)測效果預(yù)測模型RMSEMAER2BP0.1055650.0795530.789145LSTM0.1375190.1010100.642175CNN0.1073840.0812930.781818圖4.8基于GANs生成數(shù)據(jù)量為90%時不同模型的預(yù)測效果對比圖從表4.7可以看出,BP模型在生成數(shù)據(jù)占原始數(shù)據(jù)90%時,顯示出良好的預(yù)測效果。相比之下,LSTM模型在相同數(shù)據(jù)比例下的表現(xiàn)稍遜。而CNN模型則介于兩者之間。通過定量分析,可以明顯看出BP模型在本實驗條件下具有最優(yōu)的預(yù)測性能。圖4.8提供的可視化信息也證實了這一結(jié)論。在生成數(shù)據(jù)占原始數(shù)據(jù)90%時,BP模型預(yù)測的風(fēng)力發(fā)電功率曲線與實際功率曲線的擬合度最高,波動最小,誤差分布最為集中。LSTM模型的預(yù)測曲線雖然也有一定的吻合度,但其波動性相對較大,誤差范圍較寬。CNN模型的預(yù)測曲線則在擬合度和波動性方面位于BP模型和LSTM模型之間。4.3本章小結(jié)本章針對新建的風(fēng)電場歷史數(shù)據(jù)樣本不足對風(fēng)電功率預(yù)測準(zhǔn)確性與穩(wěn)定性帶來的挑戰(zhàn)進(jìn)行了深入探討。首先強調(diào)了歷史數(shù)據(jù)樣本稀缺對模型訓(xùn)練的不利影響,為應(yīng)對上述問題,提出使用GANs作為有效工具來生成與真實數(shù)據(jù)相似的虛假數(shù)據(jù),在基于GANs的風(fēng)電功率預(yù)測過程中,特別強調(diào)了對GANs生成數(shù)據(jù)質(zhì)量的嚴(yán)格把控。數(shù)據(jù)量的差異會顯著影響預(yù)測性能。因此,不僅要評估生成數(shù)據(jù)的真實性、一致性及
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 詩經(jīng)子衿古詩文教學(xué)課程
- 2025年高溫中暑試題及答案
- 2025勞動合同的法律規(guī)定
- 企業(yè)IT系統(tǒng)運維管理模板(含故障處理)
- 2025年感控知識考核試題及答案
- 文檔管理模板統(tǒng)一文檔存檔與檢索標(biāo)準(zhǔn)
- 供應(yīng)鏈訂單跟蹤與物流查詢系統(tǒng)
- 西安市慶安初級中學(xué)2026屆化學(xué)高三第一學(xué)期期末考試試題含解析
- 農(nóng)業(yè)合作社內(nèi)部經(jīng)營管理協(xié)議
- 家庭農(nóng)場農(nóng)牧業(yè)發(fā)展協(xié)議
- 空調(diào)與制冷操作考試試題(含答案)
- 從《大學(xué)衍義補》窺探丘濬法律思想的時代映照與傳承價值
- 臨床護(hù)理實踐指南2024版
- 《百團(tuán)大戰(zhàn)》歷史課件
- 馬克思主義基本原理課件- (全套完整課件)全版
- 【優(yōu)秀】腦膜瘤護(hù)理查房課件
- GB∕T 3480.3-2021 直齒輪和斜齒輪承載能力計算 第3部分:輪齒彎曲強度計算
- 社區(qū)居民信息登記卡
- 小金庫治理-PPT優(yōu)秀課件
- 水穩(wěn)層施工方案(完整版)
- 抵押物清單模板
評論
0/150
提交評論