GPU如何加速流體仿真分析 附GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用_第1頁
GPU如何加速流體仿真分析 附GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用_第2頁
GPU如何加速流體仿真分析 附GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用_第3頁
GPU如何加速流體仿真分析 附GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用_第4頁
GPU如何加速流體仿真分析 附GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

優(yōu)秀的計(jì)算性能和尖端的數(shù)值方法的組合,在更短的時間內(nèi)研窕復(fù)雜的流體

問題,將成為未來CFD領(lǐng)域高效而主流的方式。

01流體仿真發(fā)展趨勢與計(jì)算需求

計(jì)算流體仿真力學(xué),英文全稱ComputationalFluidDynamics,縮寫為CFD,

興起于近50年來,是一門相對年輕的學(xué)科。它是數(shù)值數(shù)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合的

產(chǎn)物,通過空間離散和數(shù)值求解的思路,對流體力學(xué)的各類問題進(jìn)行數(shù)值實(shí)驗(yàn)、

模擬和分析研究,以解決學(xué)習(xí)、科研或者工程設(shè)計(jì)中的問題。

作為一個強(qiáng)大的計(jì)算工具,CFD在產(chǎn)品研發(fā)的諸多環(huán)節(jié)發(fā)揮著重要作用,

不僅具有低成木,還可以捕捉到實(shí)驗(yàn)中難以采集的信息,此外,還能提供可控的

環(huán)境因素和良好的復(fù)現(xiàn)性。從CFD的發(fā)展趨勢來看,一方面,CFD工具的發(fā)展

呈現(xiàn)為準(zhǔn)確度、自動化、易用性、應(yīng)用性能的持續(xù)提升;另一方面,CFD也與

熱學(xué)、電化學(xué)、聲學(xué)等學(xué)科不斷融合發(fā)展,CFD工具變得更加強(qiáng)大。

面對一個具體的工程問題,CFD工程師在應(yīng)用CFD工具進(jìn)行仿真分析時的

基本流程,通??梢钥偨Y(jié)為五步:前處理、網(wǎng)格劃分、邊界條件加載、求解計(jì)算

和后處理。但如何去平衡計(jì)算量(網(wǎng)格數(shù)量)和計(jì)算時間,對于很多CFD工程

師都是個挑戰(zhàn)。

在實(shí)際解決問題的過程中,CFD工程師除了希望能選擇一款稱手的軟件工

具外,當(dāng)然也希望計(jì)算機(jī)的主頻越高越好,核心越多越好。但是,核心與計(jì)算速

度并非線性關(guān)系,不會因?yàn)楹诵牡缺壤鲩L。若想在單臺電腦上發(fā)揮極限運(yùn)算能

力,還需要使用GPU加速,因?yàn)镚PU加速通過協(xié)調(diào)處理器并行運(yùn)算,能夠極大

地提升計(jì)算能力,尤其適合多個項(xiàng)目同時進(jìn)行,這樣獲得的時間收益較大。

02流體仿真為什么要選擇GPU?

從1970年到今天,CFD始終向處理更高精確度、更復(fù)雜的幾何結(jié)構(gòu)方向發(fā)

展。但現(xiàn)階段,CFD軟件應(yīng)用于復(fù)雜流體問題方面還有待拓展,受到的阻礙主

要源自以下三個方面:

隱式算法的高內(nèi)存要求-----些CFD分析工程師總是希望得到完美的殘差

收斂曲線,以證明計(jì)算結(jié)果的可靠性,因此,他們會首選隱式算法,這意味著高

內(nèi)存?的需求;

CFD結(jié)果對網(wǎng)格的強(qiáng)依賴性一一網(wǎng)格的合理設(shè)計(jì)和高質(zhì)量生成是CFD計(jì)算

的前提條件,是影響CFD計(jì)算結(jié)果的最主要的決定性因素之一,是CFD工作中

人工工作量最大的部分,也是制約CFD工作效率的瓶頸問題之一。即使在CFD

高度發(fā)達(dá)的國家,網(wǎng)格生成仍占整個CFD計(jì)算任務(wù)全部人力時間的70%?80%。

工程流體仿真問題復(fù)雜多變一一在流體力學(xué)模擬中,由于流體力學(xué)模擬是個

復(fù)雜的過程,存在極端變形、自由液面以及物質(zhì)運(yùn)動交界面等問題,在應(yīng)用網(wǎng)格

數(shù)值模擬時,會出現(xiàn)網(wǎng)格扭曲導(dǎo)致計(jì)算不收斂或者產(chǎn)生很大的計(jì)算誤差,需要重

新模擬,這使得計(jì)算成本大大增加。

從CFD的發(fā)展歷程看,CFD的每一步發(fā)展,都離不開計(jì)算機(jī)速度和內(nèi)存的

數(shù)量級提升。自1999年NVIDIA發(fā)布Geforce256圖形處理芯片以來,NVIDIA

的顯卡芯片就開始以GPU稱呼,最早是輔助CPU進(jìn)行圖形圖像的處理,將降低

CPU的運(yùn)算壓力,后來隨著GPU性能的不斷提升,其應(yīng)用場景也不斷拓展。近

年來,隨著移動計(jì)算、工業(yè)智能化的發(fā)展,GPU開始用于手機(jī)、平板電腦到無

人機(jī)和機(jī)器人等平臺的應(yīng)用程序的加速,世界各地實(shí)驗(yàn)室、高校、企業(yè)以及科研

院的研究人員紛紛采用GPU獲得高性能計(jì)算支持,在工業(yè)領(lǐng)域,GPU也普遍用

于仿真計(jì)算加速,尤其在汽車、航空航天、工業(yè)設(shè)備等多個高科技領(lǐng)域,更是掀

起了新一輪的CFD應(yīng)用熱潮。

那么,CFD為何要選擇GPU加速呢?這是為了使CFD仿真發(fā)揮最大效用,

CFD工程師往往需要快速得到計(jì)算結(jié)果。而借助于GPU加速計(jì)算所提供的非凡

應(yīng)用程序性能,能將CFD程序計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時仍有

CPU運(yùn)行其余程序代碼,這樣計(jì)算速度大大提升。另外,從計(jì)算性能來看,在

CFD應(yīng)用中單個GPU的性能遠(yuǎn)遠(yuǎn)優(yōu)于CPU,基于GPU加速的CFD計(jì)算速度明

顯加快,很多復(fù)雜的CFD難題得以解決,因此,越來越多的CFD工程師選擇

GPU加速。

03流體仿直分析GPU選擇分享

CFD是一個計(jì)算需求強(qiáng)烈的領(lǐng)域,GPU的選擇將從根本上決定CFD分析過

程的體驗(yàn)。在CFD分析中,工程師前期花費(fèi)的時間主要在模型建立和修改上,

后期真正的分析時間消耗在計(jì)算機(jī)上,因此,選擇一款適合自身的CFD軟件和

高性能建模工作站就顯得尤為重要。接下來小編軟件將選擇Altair的CFD工具,

硬件將選擇NVIDIARTX8000,通過一些案例模型進(jìn)行實(shí)際評測,希望對大家選

擇GPU時有所幫助。

評測案例一:基于AcuSolve軟件的GPU加速

軟件環(huán)境介紹---AltairAcuSolve是一款基于GLS-FEM算法的通用熱流體

求解器,不但有快速良好的收斂速度,還能達(dá)到很高的求解精度,同時對網(wǎng)格有

良好的兼容性,特別方便于復(fù)雜模型網(wǎng)格的劃分,廣泛應(yīng)用于汽車、流體機(jī)械和

海洋平臺等工業(yè)和科學(xué)應(yīng)用問題的解決。值得一提的是,最新版本的AcuSolve,

不僅通過GPU加速提高了3~4倍的計(jì)算速度,同時也支持核態(tài)沸騰、熱輻射、

冷凝/蒸發(fā)多相流和流固耦合(FSI)等CFD難題的解決。

硬件環(huán)境介紹——CPU采用單顆Intel(R)Xeon(R)Gold6126CPU@

2.60GH;GPU選用NVIDIARTX8000,它采用了NVIDIATuring架構(gòu)和NVIDIA

RTX平臺支持,對于追求以高穩(wěn)健性、高精度為目標(biāo)的CFD仿真分析帶來了卓

越的計(jì)算性能體驗(yàn)。

測試模型:在新能源汽車、醫(yī)療設(shè)備、軍工設(shè)備等人功率密度的應(yīng)用場合,

設(shè)備運(yùn)行時會產(chǎn)生大量的熱損耗,為保證設(shè)備的安全運(yùn)行,需要采用各種冷卻措

施來對設(shè)備進(jìn)行冷卻,水冷是其中一種方式。以新能源車的水冷板為例,其設(shè)計(jì)

直接影電池的溫度均勻性,進(jìn)而影響車輛的續(xù)航里程和安全性。本測試模型擁有

網(wǎng)格數(shù)量4300萬,求解方程采用湍流+固體傳熱組合,湍流模型選擇基于SA—

方程的模型,設(shè)置穩(wěn)態(tài)迭代步為200步,分別采用無GPU和1塊GPU加速進(jìn)行

計(jì)算時間對比。

動力電池水冷板模型

測試結(jié)果:數(shù)據(jù)表明,無GPU加速時,水冷板分析的計(jì)算時間需要21小時;

采用單塊NVIDIARTX8000加速,水冷板分析的計(jì)算時間只需要4小時。由此

可見,采用AltairAcuSolve進(jìn)行水冷板仿真分析,并提供NVIDIAGPU的增強(qiáng)

支持,計(jì)算速度與無GPU加速相比提高了4.25倍。顯然,這種方式對于CFD

工程師快速探索水冷板的設(shè)計(jì),并根據(jù)準(zhǔn)確的計(jì)算結(jié)果做出決策非常有益。

計(jì)算時間對比

評測案例二:基于AltairnanoFluidX軟件的GPU加速

軟件介紹:窗體頂端

軟件環(huán)境介紹AltairnanoFluidX是一款基于粒子的流體動力學(xué)(SPH)

仿真工具,用于預(yù)測運(yùn)動軌跡復(fù)雜的幾何結(jié)構(gòu)周圍的流體。以整車CFD仿真為

例,傳統(tǒng)CFD方法需要建立網(wǎng)格耗時巨大,但AltairnanoFluidX基于粒孑的特

性,無需建立網(wǎng)格,還可基于GPU顯卡計(jì)算,非常有助于工程師獲得簡潔而高

效的CFD解決方案。

硬件環(huán)境介紹——CPU采用單顆Intel(R)Xeon(R)Gold6126CPU@

2.60GH;GPU選用NVIDIARTX8000和NVIDIATeslaVI00,由于Altair

nanoFluidX采用的粒子方法,其計(jì)算是由?系列的流體粒子的相互作用完成,在

計(jì)算中每個粒子所執(zhí)行的計(jì)算是完全相同的,而在不同的數(shù)據(jù)上執(zhí)行相同的程

序,恰恰是GPU計(jì)算最擅長的。

◎整車涉水模型

窗體底端

測試模型:整車涉水分析是近年來新興的CFD仿真領(lǐng)域,主要研究汽車以

一定速度涉水時,關(guān)鍵零部件的進(jìn)水風(fēng)險,如防火墻滲水,傳統(tǒng)的發(fā)動機(jī)進(jìn)氣口

進(jìn)水,電動汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計(jì)算資源和

時間進(jìn)行求解,以本次建立的整車涉水模型為例,擁有粒子數(shù)量為4100萬,設(shè)

置車速為50公里/小時、瞬態(tài)物理時間為4秒,建立單相流模型,本次測試分別

采用1塊NVIDIARTX8000、2塊NVIDIARTX8(X)、4塊NVIDIARTX8000和

4塊VI00加速,對比計(jì)算時間。

計(jì)算時間eN寸)

■l^RTXSOOO

■執(zhí)RTXSOOO

?田Rixeooo

■依V18

計(jì)算時間對比

測試結(jié)果:數(shù)據(jù)表明,采用1塊、2塊、4塊NVIDIARTX8000加速,整車

涉水分析分別需要花費(fèi)48小時、28小時、13小時;采用4塊V100,則需要16

個小時。從計(jì)算時間來看,采用4塊NVIDIARTX8000加速,計(jì)算時間最少,

與采用1塊NVIDIARTX8000加速相比,計(jì)算速度提升了約2.7倍。計(jì)算結(jié)果也

表明,采用基于GPU加速和AltairnanoFluidX的組合方式,允許CFD工程師在

一個更可接受的短時間內(nèi)研究類似整車涉水這樣的復(fù)雜流體問題。

評測案例三:基于AltairultraFluidX軟件的GPU加速

軟件環(huán)境介紹——AltairultraFluidX專用于超快預(yù)測乘用車、輕型卡車、賽

車和重型車輛的空氣動力特性的仿真分析,它基于格子玻爾茲曼(LBM)技術(shù),

無需建立網(wǎng)格,這大大縮短了建模時間,使得設(shè)計(jì)變得更加容易,同時保留了所

有重要的幾何細(xì)節(jié)。

硬件環(huán)境介紹——CPU采用單顆Intel(R)Xeon(R)Gold6126CPU@

2.60GH;GPU選用NVIDIARTX8000和NVIDIATeslaV100,由于Altair

ultraFluidX采用的LBM方法,非常適合大規(guī)模并行架構(gòu),而采用GPU加速,可

以明顯提高吞吐量,達(dá)到AltairultraFluidX的周轉(zhuǎn)時間,同時降低硬件和能源成

本。

測試模型:對于車輛的早期開發(fā)優(yōu)化,采用CFD手段無疑是最有效且最經(jīng)

濟(jì)的方法,但這類CFD分析往往是高內(nèi)存和高計(jì)算資源消耗的典型代表,需要

使用GPU來優(yōu)化計(jì)算性能。以此次建立的汽車虛擬風(fēng)洞模型為例,擁有格子數(shù)

量1億6千萬,格子的最小尺寸為1.8mm,設(shè)置車速為14()公里/小時、瞬態(tài)物

理時間為2秒,分別采用2塊NVIDIARTX8000、4塊NVIDIARTX8000和4塊

V1()()加速,對比計(jì)算時間。

汽車虛擬風(fēng)洞模型

測試結(jié)果:數(shù)據(jù)表明,采用2塊、4塊NVID1ARTX8000加速,模擬汽車虛

擬風(fēng)洞分別需要花費(fèi)14小時、8小時;采用4塊V100,則需要8.4個小時,三

種GPU加速中,采用4塊NVIDIARTX8000加速,計(jì)算時間最少,與采用2塊

NVIDIARTX8000加速相比,計(jì)算速度提升了約0.75倍。計(jì)算結(jié)果也表明,基

于GPU和AltairultraFluidX的組合方式,可以明顯加速汽車虛擬風(fēng)洞分析,有效

縮短汽車開發(fā)周期。

計(jì)算時間CN寸)

■第RTX808

■4MRTX8000

■鍬V18

CPU:x?5nt?l(R)Xaon(R)GoW6126CPU@2.C0GH

計(jì)算時間對比

04總結(jié)

作為當(dāng)前最重要的三大協(xié)處理加速技術(shù)之一,GPU已經(jīng)成為數(shù)值分析的新

寵,廣泛應(yīng)用于各個領(lǐng)域。以流體仿真領(lǐng)域?yàn)槔?,隨著CFD分析對計(jì)算能力的

要求日益增高,越來越多的CFD工程師傾向于采用GPU加速,例如借助NVIDIA

RTX8000加速,能以遠(yuǎn)低于傳統(tǒng)CPU解決方案的成本、空間和功耗,獲得無

與倫比的計(jì)算性能。

同時,在渲染方面,利用NVIDIARTX8000強(qiáng)大的運(yùn)算能力,將流場和流

體構(gòu)件建立數(shù)學(xué)模型,并用數(shù)字化可視化的形式表現(xiàn)出來,可以獲得任意位置的

結(jié)果值,這無疑也極大地提高了設(shè)計(jì)的精確性。e-works認(rèn)為,優(yōu)秀的計(jì)算性能

和尖端的數(shù)值方法的組合,在更短的時間內(nèi)研究復(fù)雜的流體問題,將成為未來

CFD領(lǐng)域高效而主流的方式。

GPU加速的SPH方法在溢洪道水流模擬中的應(yīng)用

川<加收汗環(huán)境實(shí)現(xiàn)為法的碎朱川及r校z形式的悚度收運(yùn)式如卜

研寬成果收明CPV對"II方法計(jì)算效率的提高有明<1^),=£-,傳.與漢昭小)(6)

S的幫助/的.閏內(nèi)在SPH方1£中采用CPU加速">'p,P,'

技術(shù)的樹關(guān)研究較少.木文相在此力一作初步會試.并式中力用于)為球力

應(yīng)用干水利工程中的溢洪道流動仙覽研究2.3狀態(tài)方程

2WH數(shù)值方法為實(shí)現(xiàn)漁場壓力的求笛,4文SHI方法采用了描

述瑞可樂液體的狀態(tài)方程建證粒子尿力9液體搟度間

2.1控制方程的關(guān)系:

本文M尸拉格朗H描述的SPI方法迸行流場故

「=〃[(i)?]⑺

值模KL相應(yīng)激體控制方程為

-^?V?V?0(I)

P<1/式中.為叁與悵度,常數(shù)y=7.系數(shù)8=代//人小

卻-/—*(2)速,墻存取液場最大速度的10倍

式中5為流體搟度/為隙力.V為速度向收層為張力3CPI加速住SPH方法中的實(shí)現(xiàn)

加速度向*.y是運(yùn)動拈性系數(shù)Ad)和式(2)的時GPI:住設(shè)計(jì)之初是為廣滿足八行高度并行化特

間與致項(xiàng)是以初質(zhì)與數(shù)的形式玷升的在/「法中.檢口的圖像處JICll具備更多的計(jì)筲核

,的(;,置和其他物理發(fā)部是蔣公格用描述法表達(dá)

rH心:例如.件通的仟式電腦花番的CPV圳68個計(jì)算

的.因此不T要計(jì)算“彼項(xiàng)

核心.而癥備的圖形8」:則擁小上r?個計(jì)算核心,這些

2.2粒子作用模型計(jì)算核心淀并發(fā)執(zhí)行較多的任務(wù).從血儺使?分為通

2.2.1杭扇效電腦兌成一價高性值I作站的H尊任務(wù)

為了充分利用(;Pt設(shè)備的并行計(jì)尊使力.名姿M

在SPII方法中.焉要謂明檢喊數(shù)財本同任總場雨

故〃,)進(jìn)行近?枳分入東:SPH計(jì)算程序進(jìn)行改進(jìn).使之譙夠同時調(diào)川CPt和

CM的升構(gòu)硬件謊世本文在SPH程序的實(shí)現(xiàn)過印

中.梟陽C??濟(jì),丫編。主道理.采用CUDA訴;i

式中.,為任意里r的空間矢依,為HM;WF的空閭(CoaipuleUnifiedDevicrArrhitEun".通用并行if*算皋

矢崎.〃為,的積分城濟(jì)為量分域的光抗小稅』(,-削知UGPl議番并發(fā)執(zhí)行計(jì)算任務(wù).改造后的~小

,'.4)為校南數(shù)本文采刖的核南依&達(dá)式如F:i|-WMS?fflI所示W(wǎng)iSIU方法.好居依f的技

[2/3??'?,/20<^<IJ和粒廣間相比作川力的計(jì)算處儕個流fi!中計(jì)算fcU"

=7胃:卜2-,/6I<y<2

大的模塊部分,由于謨建分是V示計(jì)為過程,非常送合

^02c<r

采川并發(fā)任務(wù)執(zhí)行戢略.故而4文將該稱分計(jì)。任務(wù)

⑷分用TGPVim端國時.為I?減少GPU段都和

式中闖=r/k,<:l't之間數(shù)據(jù)通信箱點(diǎn)的計(jì)算越遲現(xiàn)皺.東文將枇個

2.2.2型度槎型時間步內(nèi)竹產(chǎn)位就的更新任務(wù)同樣分此TGPI:設(shè)備

ftSPH方法中.液體是科可H的.流體內(nèi)f的密設(shè)

度可通過北作川域內(nèi)所否較f的考度作加權(quán)平均將

到.這電的加權(quán)函數(shù)即為上述核函改:[??*nq,[------

P.=?,(5)

fS)

式中血為粒f,的密li.;為粒f/Mffillt.r,為粒(■

i之間的卻離

2.2.3梯度模型HIGH卻請的N”計(jì)H3UI

ihF控制方程中存在東力律度項(xiàng).本文SPH方法》UISill〈altvlMMiIkmIKntrjHB<4GPIjfxrlf'ruluHi

3

圖2幾何模型(單位:m)

Fig.2SchematicofsinnilalitNiHHMICI

表1計(jì)算環(huán)境硬件參數(shù)

Tab.1l\iraineteisofcompulalionaldevices

項(xiàng)目設(shè)令內(nèi)存計(jì)算編譯

型號空間核心語育陣

CPUIntel@Coi^?i7-4790K16GB8gce.MXAPICH

GPU(RhorerGTX9602GB1024CUDA7.0

圖3自由水面高度對比

Fig.3ComparisonofwaterlevelsbetweenSPIIand

cxfM*rimrnlaldata

圖4最大速度沿程變化曲線

Fig.4Variationofmaxiniuinvelocityalongihespillway

摘要:基于拉格朗日描述的光滑粒子動力學(xué)方法(SPH)擅長于處理自由面

劇烈變化的水流現(xiàn)象,十分適合水利工程中泄洪等問題的數(shù)值模擬。然而,SPH

方法通常采用均勻分布的粒子對流體計(jì)算域進(jìn)行空間離散,對于工程問題而言需

要的粒子數(shù)量較多、計(jì)算量大。為了突破SPH方法在實(shí)際大規(guī)模計(jì)算中的適用

范圍,采用C++和CUDA混合編程的技術(shù),借助GPU實(shí)現(xiàn)了對SPH方法的并

行加速。通過WES三圓弧段組成的光滑溢洪道過流問題,驗(yàn)證了GPU加速的

SPH方法的計(jì)算精度和可靠性,計(jì)算效率相對原始的SPH仿真過程提高了61.8

倍。最后,將GPU加速的SPH方法應(yīng)用于水利工程的溢洪道泄流問題,分別模

擬了光滑溢洪道和臺階式溢洪道流動特性,通過自由面的演化過程及泄流沿程截

面上的速度分布狀態(tài),對比分析了臺階對泄流現(xiàn)象的影響。

關(guān)鍵詞:光滑粒子動力學(xué)方法;GPU加速;臺階式溢洪道;消能率

1研究背景

臺階式溢洪道是將傳統(tǒng)光滑溢洪道的泄流槽做成臺階式,水流在流經(jīng)臺階時

與每級臺階均產(chǎn)生劇烈的碰撞,形成水流的旋滾及內(nèi)部的紊動剪切作用,促使水

流表面破碎,進(jìn)而能顯著增加溢洪道的泄流消能率,有助于減小下游消力池的規(guī)

模[1-2]。

所以,目前臺階式溢洪道在國內(nèi)外許多工程上得以應(yīng)用[3-5]。然而,水流與

臺階之間的劇烈作用將對溢洪道的安全提出挑戰(zhàn),有必要對臺階式溢洪道的流動

現(xiàn)象及機(jī)理進(jìn)行系統(tǒng)研究,以確保溢洪設(shè)施的安全。盡管世界各國水利工程技術(shù)

人員對此流動問題開展了大量的試驗(yàn)研究[6],但受限于尺度效應(yīng)、測量手段、

經(jīng)費(fèi)等原因,難以獲取流動機(jī)理分析所必備的詳細(xì)數(shù)據(jù)。相較之下,采用數(shù)值模

擬的手段對該泄流問題進(jìn)行研究能夠得到豐富的可視化結(jié)果,故而深受研究人員

的青睞[7-8]。

在既往的研究中,水利工作者多采用以有限體積法為代表的網(wǎng)格類方法開展

溢洪過程中流場的數(shù)值模擬。此類方法雖然通過與VOF.Level-set等自由面捕

捉技術(shù)的結(jié)合,實(shí)現(xiàn)了對一系列水力學(xué)問題的模擬,但仍難以真實(shí)再現(xiàn)自由面的

翻卷、破碎、飛濺等劇烈流動現(xiàn)象。近年來具有拉格朗H特性的SPH方法在自

由表面流動模擬中取得了較大進(jìn)展[9-10],能夠較為真實(shí)地捕捉自由面的翻卷、

破碎等非線性現(xiàn)象,并成功應(yīng)用于入水沖擊[11]、液艙晃蕩[12]、波浪與結(jié)構(gòu)物

的相互作用等復(fù)雜流動問題[13]。由于臺階式溢洪道的泄流問題與此類問題具有

相似的特性,例如水流的翻滾、碰撞等,故而本文嘗試采用SPH方法對臺階式

溢洪道的泄洪過程進(jìn)行數(shù)值模擬。

傳統(tǒng)的SPH方法是通過粒子的運(yùn)動來表示流動現(xiàn)象,為了精確模擬強(qiáng)非線

性變化的自由面,需要采用大量的粒子對流體空間進(jìn)行離散,同時需要采用較小

的計(jì)算時間步長,故而對計(jì)算資源的消耗大,計(jì)算效率通常不高。近年來,GPU

(GraphicsProcessingUnit,圖形處理器)硬件的計(jì)算核心數(shù)和存儲能力迅速提升,

國外一些學(xué)者逐步采用基于GPU加速的技術(shù)來提高SPH方法的計(jì)算效率。例如,

Crespo等[14],Xia和Liang"5],Mokos等[16]分別采用CUDA語言編寫程序調(diào)

用GPU硬件環(huán)境實(shí)現(xiàn)對SPH方法的加速計(jì)算,這些研究成果表明GPU對SPH

方法計(jì)算效率的提高有明顯的幫助。然而,國內(nèi)在SPH方法中采用GPU加速技

術(shù)的相關(guān)研究較少,本文將在此方面作初步嘗試,并應(yīng)用于水利工程中的溢洪道

流動問題研究。

2SPH數(shù)值方法

2.1控制方程

本文基于拉格朗E描述的SPH方法進(jìn)行流場數(shù)值模擬.相應(yīng)流體控制方程為

公式

式中,p為流體密度,P為壓力,V為速度向量,g為重力加速度向量,y

是運(yùn)動黏性系數(shù)。式(1)和式(2)的時間導(dǎo)數(shù)項(xiàng)是以物質(zhì)導(dǎo)數(shù)的形式給出的。

在粒子法中,粒子的位置和其他物理量都是基于拉格朗日描述法表達(dá)的,因此不

需要計(jì)算對流項(xiàng)。

2.2粒子作用模型

2.2.1核函數(shù)

一在SPH方法中,需要借助核函數(shù)對空間任意場函數(shù)f(r)進(jìn)行近似積分表

示:

公式

R中,I?為任意粒子的空間矢量,為目標(biāo)粒子的空間矢量,。為「的積分域,

h為積分域的光滑半徑,W(r-r',h)為核函數(shù)。本文采用的核函數(shù)表達(dá)式如下:

公式

式中,q=r/ho

2.2.2密度模型

在SPH方法中,流體是弱可壓的,流體粒子的密度可通過其作用域內(nèi)所有

粒子的密度作加權(quán)平均得到,這里的加權(quán)函數(shù)即為,上述核函數(shù):

公式

式中,pi為粒子i的密度,mj為粒子j的質(zhì)量,rij為粒子i與j之間的距離。

2.2.3梯度模型

由于控制方程中存在壓力梯度項(xiàng),本文SPH方法采用粒子模型形式的梯度

表達(dá)式如下

公式

式中,Pi為粒子i的壓力。

2.3狀態(tài)方程

為實(shí)現(xiàn)流場壓力的求解,本文SPH方法采用了描述弱可壓流體的狀態(tài)方程

建立粒子壓力與流體密度間的關(guān)系:

公式

式中,po為參考密度,常數(shù)y=7,系數(shù)B=poc2/y,聲速c通常取流場最大速

度的1()倍。

3GPU加速在SPH方法中的實(shí)現(xiàn)

GPU在設(shè)計(jì)之初是為了滿足具有高度并行化特征的圖像處理工作,相較于

CPU具備更多的計(jì)算核心。例如,普通的臺式電腦配備的CPU擁有8個計(jì)算核

心,而配備的圖形顯卡則擁有,上千個計(jì)算核心,這些計(jì)算核心能并發(fā)執(zhí)行較多

的任務(wù),從而能使一臺普通電腦完成一臺高性能工作站的計(jì)算任務(wù)。

為了充分利用GPU設(shè)備的并行計(jì)算能力,需要對SPH計(jì)算程序進(jìn)行改進(jìn),

使之能夠同時調(diào)用CPU和GPU的異構(gòu)硬件資源。本文在SPH程序的實(shí)現(xiàn)過程

中,采用C++語言編寫主流程,采用CUDA語言

(ComputeUnifiedDeviceArchitecture,通用并行計(jì)算架構(gòu))調(diào)用GPU設(shè)備并發(fā)執(zhí)

行計(jì)算任務(wù),改造后的SPH計(jì)算流程如圖1所示。

對于SPH方法,鄰居粒子的搜尋和粒子間相互作用力的計(jì)算是整個流程中

計(jì)算量最人的模塊部分,由于該部分是顯示計(jì)算過程,非常適合采用并發(fā)任務(wù)執(zhí)

行策略,故而本文將該部分計(jì)算任務(wù)分配于GPU設(shè)備端。同時,為了減少GPU

設(shè)備和CPU之間數(shù)據(jù)通信帶來的計(jì)算延遲現(xiàn)象,本文將每個時間步內(nèi)粒子位置

的更新任務(wù)同樣分配于GPU設(shè)備端。

4GPU加速的SPH方法數(shù)值驗(yàn)證

在采用SPH方法數(shù)值模擬臺階式溢洪道的流動問題之前,首先采用GPU加

速對該方法的精度和效率進(jìn)行驗(yàn)證。本節(jié)對WES曲線(Xxl.85=2.0Hd0.85Y)表

達(dá)的三圓弧光滑式溢流道的過流問題進(jìn)行模擬,并基于Michels的實(shí)驗(yàn)數(shù)據(jù)對本

文GPU加速的SPH方法進(jìn)行驗(yàn)證[⑺。

本文采用的WES光滑式溢流道模型如圖2所示。仿真時水的密度

p=1000kg/m3,流體的運(yùn)動黏性系數(shù)v=1.01xl0-6m2/s,重力加速度g=9.81m/s2。

采用粒子對圖中模型進(jìn)行空間離散,初始粒子間距1為0.04m,模型粒子總數(shù)為

42.15萬,計(jì)算時間步長為0.0005so本文的仿真工作均采用表1所示的計(jì)算環(huán)境。

圖3為利用SPH方法模擬得到的溢洪道上各水平位置處流體粒子的最大速

度與實(shí)驗(yàn)測定流速的布比。其中,L表示相對壩頂?shù)乃骄嚯x,h為水面相對溢

洪道的垂直距離。由圖可知,在整個溢洪道上,SPH方法得到的流速與實(shí)驗(yàn)結(jié)果

基本一致?;诖?,SPH方法亦能夠獲得與實(shí)驗(yàn)一致的溢流水面形態(tài),二者結(jié)果

的對比如圖4所示。通過本文結(jié)果與Michels實(shí)驗(yàn)結(jié)果的對比可知,SPH方法在

處理此類自由面問題時具有較好的可靠性,可進(jìn)一步應(yīng)用于臺階式溢洪道流動等

水利問題的數(shù)值模擬研究。

本文分別在不調(diào)用和調(diào)用GPU加速的工況下開展仿真模擬,兩種工況下計(jì)

算5000個時間步的機(jī)器運(yùn)行時間如圖5所示,在SPH方法中采用GPU加速技

術(shù)的計(jì)算效率相對無加速時提高了61.8倍。由此可見,在SPH方法不但能夠?qū)?/p>

溢洪道泄流問題進(jìn)行精確地模擬,通過結(jié)合GPU加速技術(shù),還能夠顯著提高該

方法的數(shù)值仿真效率,有助于SPH方法在工程問題中的推廣應(yīng)用。

5臺階式溢洪道泄流問題數(shù)值模擬

截至目前,水利工作者對溢洪道的泄流問題開展了較多的數(shù)值研究,但受到

計(jì)算規(guī)模和效率的限制。采用SPH方法對該問題研究時,通常在蓄水池處分配

了較小的計(jì)算域,難以保持泄洪流動狀態(tài)的穩(wěn)定性。本文采用的GPU加速技術(shù)

有助于提高SPH方法的計(jì)算規(guī)模和效率,故而可采用較寬的計(jì)算域?qū)υ撔沽鲉?/p>

題進(jìn)行數(shù)值模擬。

5.1計(jì)算模型及工況

為對比分析溢洪道泄流水動力特性,本文分別開展了光滑溢洪道和臺階式溢

洪道的泄流數(shù)值模擬研究,兩種溢洪道的斜升角相同,二者幾何模型尺寸如圈6

所示。模型左側(cè)為蓄水池,中部為過渡段及溢洪道,右側(cè)為出流區(qū)域,其中臺階

式溢洪道共設(shè)置了10個臺階,每級臺階的長和高分別為0.1m和0.05m。采用初

始間距為0005m的粒子對圖6幾何模型進(jìn)行空間離散,SPH方法的計(jì)算工況參

數(shù)為:流體密度為1000kg/m3,運(yùn)動黏性系數(shù)為1.01xl0-6m2/s;粒子間距為

0.0025m,粒子總數(shù)為275529,光滑長度系數(shù)為1.0,時間步長為0.00005s,模

擬時長為6so

5.2數(shù)值結(jié)果及分析

本文首先采用GPU加速的SPH方法對光滑式溢洪道的溢流過程進(jìn)行數(shù)值模

擬,并與無加速時的計(jì)算速度進(jìn)行了對比,兩者運(yùn)行的硬件環(huán)境如表1所示,運(yùn)

行時間的對比如圖7所示。由該圖可見,在GPU加速狀態(tài)下對27.5萬粒子數(shù)規(guī)

模的溢流問題進(jìn)行仿真,計(jì)算運(yùn)行時間相較無加速工況下單個CPU核心計(jì)算時

間提高了73倍。

圖8為臺階式溢洪道和光滑溢洪道的自由水面演化過程,包括開始泄流的瞬

間、水流與溢洪道相互作用的初始階段、水流在溢洪道上的穩(wěn)定泄流階段等。由

圖8可見,泄流開始時刻(t=0.5s),兩種溢洪道的流態(tài)高度相似,上游水平堰頂

的水深均為0.11m,水頭越過水平堰頂?shù)挠叶讼蛞绾榈佬沽?。在t=1.0s時刻,光

滑溢洪道.Hl勺水流表面較為光順;在臺階式溢洪道上,水流因與臺階的碰撞而產(chǎn)

生明顯的翻卷、融合現(xiàn)象,自由面的形狀粗糙。在t=2.0s和t=3.6s時,光滑溢洪

道上水流的速度和自由面形態(tài)基本相似,泄流過程中溢洪道的底部水流速度相

對,上部明顯增高,達(dá)到3.5m/s。該階段的泄流過程得到充分發(fā)展,流動狀態(tài)穩(wěn)

定。在l=2.0s時刻,更多的水流粒子沖擊到臺階上,并因局部的水流翻卷而形成

大量的粒子聚集。在t=3.6s時刻,臺階式溢洪道上水流狀態(tài)達(dá)到穩(wěn)定狀態(tài),并形

成水流截面上的流速分層現(xiàn)象,即臺階近壁面上流速較低,水流表面處速度較高,

但溢洪道上水流最大速度為3.29m/s,低于光滑溢洪道上的流動速度。

此外,在流動的穩(wěn)定階段,臺階式溢洪道截面,上水面厚度相對光滑溢洪道

上水面厚度較厚。通過兩種溢洪道上流動狀態(tài)的定性對比可知,盡管本文模擬的

溢洪道泄流高度較小,仍可觀測到階梯式溢洪道具有較好的泄洪消能作用。

圖9通過矢量圖的形式展示了臺階式溢洪道上流體粒子的運(yùn)動速度??梢?,

在各級臺階近壁面處均出現(xiàn)了渦旋。由圖1()的局部放大矢量圖可見,臺階的整

個夾角區(qū)域均由流體渦旋占據(jù),夾珀區(qū)域外側(cè)與光滑溢洪道上流動狀態(tài)相似,流

體質(zhì)點(diǎn)以滑移流的方式向下游運(yùn)動,但在臺階,上滑移流和渦旋之間存在動量的

轉(zhuǎn)換,進(jìn)而導(dǎo)致水流動能的沿程耗散。

圖11為兩種溢洪道泄流的沿程水深對比。由圖可見,兩種溢洪道上游泄流

段水深高度基本一致,均約為0.081m,表明其來流狀態(tài)相同。隨著向下游的泄

流過程,溢洪道上的水深逐步降低。其中,光滑溢洪道上的水深沿程降低更為迅

速,在x=0.9m處水深高度約為().()397m;臺階式溢洪道上的水深沿程降低幅度相

對較小,在x=0.9m處水深高度約為0.05426m。

圖12?13分別展示了光滑溢洪道和臺階式溢洪道不同沿程截面處沿水深方

向的流體粒子速度分布。其中,光滑溢洪道上沿程流速逐步增加,各截面處在水

深方向上近似保持相市恒定的流速,而臺階式溢洪道上沿程流速以及各截面沿水

深方向上的流速均逐步增加。溢洪道的上半段(例如x=0.1?0.3m段),近臺階

處流速較低,在水深d=0.02m處流速增大至較大值,水深d>0.02m處流速近似

恒定。溢洪道的下半段(例如x=0.7?0.9m段),雖然近臺階處流速較低,但在

較深的水深處(d>0.04m)流速才接近穩(wěn)定,這表明在溢洪道的下半段臺階內(nèi)的

渦旋對水深的影響范圍更大。

為定量比較臺階式溢洪道的泄洪消能效果,本文通過消能率對兩種溢洪道的

消能效果進(jìn)行比較。消能率n的計(jì)算公式如下:

公式

式中,E為溢洪道墻頂U(kuò)截面處水流總能量,由流經(jīng)該截面處的流體粒子

動能與勢能之和組成;Ez為溢洪道壩下II-II截面處水流總能量。

表2對兩種溢洪道的消能率進(jìn)行了對比,本文采用的臺階式溢洪道雖然具有

較小的壩體高度并設(shè)置了較少的臺階數(shù)量,但消能率仍達(dá)到了38.79%,是光滑

式溢洪道的14.01%的消能率的2.77倍。美國Rice等[18]研究結(jié)論表明,臺階式

溢洪道的能量損失是光滑溢洪道的能量損失的2?3倍,本文結(jié)果與該結(jié)論基本

一致。

6結(jié)語

采用結(jié)合了GPU加速技術(shù)的SPH方法對臺階式溢洪道的泄流過程進(jìn)行了數(shù)

值研究。首先,通過對WES三圓弧段組成的光滑溢洪道標(biāo)準(zhǔn)問題進(jìn)行數(shù)值模擬,

驗(yàn)證了SPH方法的精度和效率。數(shù)值結(jié)果表明本文GPU加速的SPH方法獲得

了與已發(fā)表實(shí)驗(yàn)數(shù)據(jù)相吻合的結(jié)果,同時計(jì)算效率相對原始的SPH仿真過程提

高了61.8倍。隨后,對光滑溢洪道的泄流過程進(jìn)行了數(shù)值模擬。在GPU加速狀

態(tài)下對27.5萬粒子數(shù)規(guī)模的泄流問題進(jìn)行仿真,計(jì)算運(yùn)行時間相較無加速工況

下單個CPU核心計(jì)算時間提高了73倍,粒子數(shù)較多時GPU加速技術(shù)能夠更有

效地提高SPH方法的計(jì)算效率。

最后,對臺階式溢洪道的泄流過程進(jìn)行了數(shù)值研究,并與光滑溢洪道的流動

現(xiàn)象進(jìn)行了對比分析工通過自由而的演化過程可見,SPH方法能夠成功捕獲泄流

過程水頭與臺階的沖擊、臺階上水體的翻卷等現(xiàn)象。通過水粒子的速度矢量圖可

見,泄流過程中臺階上存在明顯的渦旋,渦旋和臺階外側(cè)滑移流之間的動量交換

使得泄流過程水流動能的耗散。對比了兩種溢洪道的沿程水深變化以及各沿程截

面處的流速分布情況。兩種溢洪道沿程水深均有所降低,但臺階式溢洪道的降低

幅度較小。

總之,本文作為初步嘗試,實(shí)現(xiàn)了SPH方法在臺階式溢洪道流動問題的應(yīng)

用,并展示了GPU加速技術(shù)對于SPH方法計(jì)算速度提高的明顯效果。

參考文獻(xiàn):

[1]張峰,劉韓生,張為法.臺階式溢洪道滑行水流消能特性研究[J].長江科學(xué)

院院報,2014,31(6):37-40.

[2]任雨,王承恩,劉斌.階梯式溢洪道水平面上時均壓強(qiáng)試驗(yàn)研究[J].人民黃

河,2011,33(3):123-124.

[3]鐘曉鳳,張法星,孫寧,等.某水庫階梯溢洪道水力特性研究[J].人民黃河,

2016,38(6):115-118.

[4]ChakibB.NumericalComputationofInceptionPointLocationforFlat-sloped

SteppedSpillway[J].InternationalJournalofHydraulicEngineering,2013,2(3):

47-52.

l5]McirclcsI,MatosJ.Skimmingflowinthenonaeratedregionof

steppedspillwaysoverembankmentdams[J].JourmalofHydraulicEngineering,

2009,135(8):685-689.

[6]張志昌,曾東洋,劉亞菲.臺階式溢洪道滑行水流水面線和消能效果的試

驗(yàn)研究[J].應(yīng)用力學(xué)學(xué)報,2005,22(1):30-35.

[7]高夢露,劉亞坤,孫洪亮,等.階梯式溢洪道的數(shù)值模擬研究[J].水利與建

筑工程學(xué)報,2015(2);28-32.

[8]趙相航,解宏偉,郭馨.臺階式溢洪道水力特性數(shù)值研究[J].青海大學(xué)學(xué)報,

2016,34(4):98-103.

[9]MonaghanJ,KocharyanA.SPHsimulationofmulti-phaseflow[J].Computer

PhysicsCommunications,1995,87(1-2):225-235.

[10]AmicarelliAAlbanoR,MiraudaD,elal.Asmoothedparticle

hydrodynamicsmodelfor3Dsolidbodytransportinfreesurfaceflows[J].Computers

&Fluids,2015(116):205-228.

[11]OgcrG,DoringM,AlcssandriniB,etal.TwodimensionalSPHsimulations

ofwedgewaterentries]J].JournalofComputationalPhysics,2006(213):803-822.

[12]CaoX,MingF,ZhangA,etaLSloshinginarectangulartankbasedonSPH

simulation[J].AppliedOceanResearch,2014(29):241-254.

[13]AltomareC>CrespoA,DominguezJ,etaLApplicabilityofs

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論