浙大黃煒概率課件_第1頁
浙大黃煒概率課件_第2頁
浙大黃煒概率課件_第3頁
浙大黃煒概率課件_第4頁
浙大黃煒概率課件_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

演講人:日期:浙大黃煒概率課件目錄CATALOGUE01概率基本概念02隨機變量及其分布03數(shù)學(xué)期望與方差04極限定理05多維隨機變量06概率模型應(yīng)用PART01概率基本概念樣本空間與事件樣本空間定義樣本空間是隨機試驗所有可能結(jié)果的集合,通常記為(S)。例如,擲一枚骰子的樣本空間為(S={1,2,3,4,5,6}),涵蓋所有可能的點數(shù)結(jié)果。事件運算事件可通過并集(至少一個發(fā)生)、交集(同時發(fā)生)、補集(不發(fā)生)等運算組合。例如,(AcupB)表示事件(A)或(B)發(fā)生,(AcapB)表示兩者同時發(fā)生。事件分類事件是樣本空間的子集,分為基本事件(單一結(jié)果)和復(fù)合事件(多個結(jié)果組合)。如“擲骰子得到偶數(shù)”對應(yīng)事件(A={2,4,6}),屬于復(fù)合事件。包括(P(emptyset)=0)、(P(A^c)=1-P(A)),以及單調(diào)性(若(AsubseteqB),則(P(A)leqP(B)))。這些性質(zhì)為概率計算提供理論基礎(chǔ)。概率基本性質(zhì)對任意兩事件(A)和(B),有(P(AcupB)=P(A)+P(B)-P(AcapB))。該公式用于計算非互斥事件的聯(lián)合概率。加法公式概率公理與性質(zhì)條件概率定義在事件(B)發(fā)生的條件下,事件(A)發(fā)生的概率記為(P(A|B)=frac{P(AcapB)}{P(B)})(要求(P(B)>0))。例如,抽撲克牌時,已知抽到紅色牌后抽到紅心的概率為(frac{1}{2})。條件概率與獨立性乘法公式由條件概率衍生出(P(AcapB)=P(A|B)P(B)),常用于聯(lián)合概率的分解。若事件獨立,則簡化為(P(AcapB)=P(A)P(B))。獨立性判定事件(A)與(B)獨立當(dāng)且僅當(dāng)(P(AcapB)=P(A)P(B))。獨立性可推廣至多個事件,如三事件獨立需滿足兩兩獨立及三者聯(lián)合獨立。PART02隨機變量及其分布離散型隨機變量定義與特征離散型隨機變量是指其取值只能是有限個或可列無限多個數(shù)值的隨機變量,例如拋硬幣的結(jié)果(正面或反面)、擲骰子的點數(shù)(1至6)等。其概率分布通常用概率質(zhì)量函數(shù)(PMF)來描述,每個取值對應(yīng)一個明確的概率值。030201常見分布類型離散型隨機變量包括伯努利分布(二項分布的特例)、二項分布(描述n次獨立伯努利試驗的成功次數(shù))、泊松分布(描述單位時間內(nèi)稀有事件發(fā)生次數(shù))以及幾何分布(描述首次成功所需的試驗次數(shù))等,每種分布都有其特定的應(yīng)用場景和數(shù)學(xué)性質(zhì)。期望與方差計算離散型隨機變量的期望(均值)和方差是重要的數(shù)字特征,期望反映了隨機變量取值的平均水平,方差則衡量了取值的離散程度。計算時需對每個可能取值乘以其概率并求和(期望),或計算平方偏差的期望(方差)。定義與特征連續(xù)型隨機變量包括均勻分布(區(qū)間內(nèi)等概率)、正態(tài)分布(廣泛存在于自然和社會現(xiàn)象中)、指數(shù)分布(描述無記憶性的等待時間)以及伽馬分布(用于建模多階段過程的時間)等。正態(tài)分布因其中心極限定理的重要性尤為突出。常見分布類型概率計算與性質(zhì)連續(xù)型隨機變量的概率在單點處為零,概率計算需針對區(qū)間進行積分。其期望和方差同樣通過積分定義,且可能涉及變換(如線性變換或函數(shù)變換)后的分布特性分析。連續(xù)型隨機變量的取值充滿某個區(qū)間(或整個實數(shù)軸),其取值不可列,例如電子元件的壽命、測量誤差等。其概率分布通過概率密度函數(shù)(PDF)描述,概率計算需通過積分而非求和。連續(xù)型隨機變量分布函數(shù)(F(x))定義為隨機變量(X)取值小于等于(x)的概率,即(F(x)=P(Xleqx))。對于連續(xù)型隨機變量,CDF是PDF的積分;對于離散型,CDF是PMF的累加。分布函數(shù)與密度函數(shù)分布函數(shù)(CDF)定義連續(xù)型隨機變量的PDF(f(x))需滿足非負(fù)性及全域積分為1。PDF在某點的值不直接表示概率,但其積分給出區(qū)間概率。離散型隨機變量無PDF概念,但可通過狄拉克函數(shù)形式化描述。密度函數(shù)(PDF)特性CDF與PDF互為微分與積分關(guān)系(連續(xù)型)。CDF是單調(diào)不減的右連續(xù)函數(shù),且極限行為明確((lim_{xto-infty}F(x)=0),(lim_{xto+infty}F(x)=1))?;旌闲碗S機變量需結(jié)合離散與連續(xù)部分處理。關(guān)系與轉(zhuǎn)換PART03數(shù)學(xué)期望與方差期望的定義與計算數(shù)學(xué)期望的基本概念數(shù)學(xué)期望是概率論中描述隨機變量長期平均值的核心指標(biāo),定義為所有可能取值與其對應(yīng)概率乘積的總和。對于離散型隨機變量,計算公式為E(X)=Σx_i·P(x_i);對于連續(xù)型隨機變量則通過積分E(X)=∫x·f(x)dx實現(xiàn)。期望的線性性質(zhì)數(shù)學(xué)期望具有重要的線性運算特性,即E(aX+bY+c)=aE(X)+bE(Y)+c,其中a,b,c為常數(shù)。這一性質(zhì)在金融衍生品定價、風(fēng)險評估等領(lǐng)域具有廣泛應(yīng)用價值。條件期望與迭代期望條件期望E(X|Y)表示在給定Y條件下X的期望值,滿足迭代期望定律E[E(X|Y)]=E(X)。這個概念在時間序列分析和馬爾可夫過程中尤為重要。典型分布的期望計算常見分布如二項分布E(X)=np、泊松分布E(X)=λ、正態(tài)分布E(X)=μ等,掌握這些分布的期望公式能顯著提升實際問題的求解效率。方差與標(biāo)準(zhǔn)差方差Var(X)衡量隨機變量偏離其期望的程度,定義為Var(X)=E[(X-E(X))2]=E(X2)-[E(X)]2。這個二階中心矩在統(tǒng)計學(xué)中用于量化數(shù)據(jù)的離散程度。標(biāo)準(zhǔn)差σ=√Var(X)與原始數(shù)據(jù)同量綱,更直觀反映數(shù)據(jù)波動范圍。在正態(tài)分布中,68-95-99.7法則就是基于標(biāo)準(zhǔn)差構(gòu)建的重要概率區(qū)間。包括Var(aX+b)=a2Var(X),以及對于獨立隨機變量有Var(X+Y)=Var(X)+Var(Y)。這些性質(zhì)在投資組合理論中用于風(fēng)險分散分析。二項分布Var(X)=np(1-p)、泊松分布Var(X)=λ、正態(tài)分布Var(X)=σ2等。理解這些特性有助于快速評估不同概率模型的波動特征。方差的數(shù)學(xué)定義標(biāo)準(zhǔn)差的實際意義方差的重要性質(zhì)常見分布的方差特性協(xié)方差與相關(guān)系數(shù)協(xié)方差的定義與計算協(xié)方差Cov(X,Y)=E[(X-E(X))(Y-E(Y))]衡量兩個隨機變量的聯(lián)合波動,其值可正可負(fù)。計算時常用公式Cov(X,Y)=E(XY)-E(X)E(Y)。01協(xié)方差矩陣的應(yīng)用在多元統(tǒng)計分析中,協(xié)方差矩陣Σ=[Cov(X_i,X_j)]是描述多個隨機變量間相關(guān)結(jié)構(gòu)的核心工具,廣泛應(yīng)用于主成分分析(PCA)等降維技術(shù)。02相關(guān)系數(shù)的標(biāo)準(zhǔn)化特性相關(guān)系數(shù)ρ=Cov(X,Y)/(σ_Xσ_Y)將協(xié)方差標(biāo)準(zhǔn)化到[-1,1]區(qū)間,消除了量綱影響。ρ=1表示完全正線性相關(guān),ρ=-1表示完全負(fù)線性相關(guān)。03相關(guān)與因果的辨析需要特別注意相關(guān)系數(shù)僅反映線性關(guān)聯(lián)程度,不能推斷因果關(guān)系。在經(jīng)濟學(xué)和社會學(xué)研究中,常需要通過工具變量法等技術(shù)來識別真實因果關(guān)系。04PART04極限定理大數(shù)定律伯努利大數(shù)定律在獨立重復(fù)試驗中,事件發(fā)生的頻率隨著試驗次數(shù)的增加而趨于穩(wěn)定,并收斂于該事件的概率。例如,擲硬幣實驗中,隨著投擲次數(shù)增加,正面朝上的頻率會逐漸接近0.5。01切比雪夫大數(shù)定律對于獨立同分布的隨機變量序列,其算術(shù)平均值在概率意義上收斂于數(shù)學(xué)期望。這一理論為統(tǒng)計估計提供了理論基礎(chǔ),例如樣本均值對總體均值的無偏估計。強大數(shù)定律在幾乎必然收斂的意義下,隨機變量序列的算術(shù)平均值收斂于數(shù)學(xué)期望。與弱大數(shù)定律相比,強大數(shù)定律給出了更強的收斂性結(jié)論,適用于更嚴(yán)格的數(shù)學(xué)分析場景。應(yīng)用領(lǐng)域大數(shù)定律在保險精算、金融風(fēng)險管理、質(zhì)量控制等領(lǐng)域有廣泛應(yīng)用,例如通過大量歷史數(shù)據(jù)預(yù)測未來損失概率或產(chǎn)品缺陷率。0203042014中心極限定理04010203獨立同分布情形當(dāng)隨機變量獨立同分布且具有有限方差時,其標(biāo)準(zhǔn)化和的分布隨著樣本量增大而趨近于標(biāo)準(zhǔn)正態(tài)分布。例如,無論總體分布如何,樣本均值的分布在大樣本下近似正態(tài)分布。李雅普諾夫定理對于不同分布的獨立隨機變量,只要滿足李雅普諾夫條件(各階矩存在且可控),其和仍可收斂于正態(tài)分布。這一結(jié)論在復(fù)雜系統(tǒng)的誤差分析中尤為重要。德莫弗-拉普拉斯定理二項分布當(dāng)試驗次數(shù)足夠大時,可用正態(tài)分布近似計算概率。例如,在民意調(diào)查中,用正態(tài)分布近似計算支持率的置信區(qū)間。實際意義中心極限定理解釋了自然界中許多現(xiàn)象呈正態(tài)分布的原因,為假設(shè)檢驗、置信區(qū)間構(gòu)建等統(tǒng)計方法提供了理論支撐,是六西格瑪管理等質(zhì)量控制技術(shù)的核心依據(jù)。定理應(yīng)用實例1234金融風(fēng)險管理利用大數(shù)定律計算投資組合的預(yù)期收益,同時通過中心極限定理估計極端損失的概率分布,為VaR(風(fēng)險價值)模型提供數(shù)學(xué)基礎(chǔ)。在生產(chǎn)線上,通過中心極限定理建立控制圖,監(jiān)控產(chǎn)品尺寸、重量等指標(biāo)的波動范圍,當(dāng)數(shù)據(jù)超出3σ范圍時觸發(fā)預(yù)警機制。工業(yè)質(zhì)量控制醫(yī)學(xué)統(tǒng)計研究在新藥臨床試驗中,運用大數(shù)定律確保樣本量足夠反映總體療效,并基于中心極限定理進行假設(shè)檢驗,判斷治療效果是否具有統(tǒng)計學(xué)顯著性。選舉預(yù)測模型民意調(diào)查機構(gòu)利用中心極限定理,根據(jù)樣本數(shù)據(jù)計算候選人支持率的置信區(qū)間,同時結(jié)合大數(shù)定律確保抽樣誤差隨樣本量增加而減小。PART05多維隨機變量聯(lián)合分布與邊緣分布聯(lián)合概率密度函數(shù)描述多維隨機變量在整體樣本空間中的分布特性,通過積分可計算任意區(qū)域內(nèi)的概率值,需滿足非負(fù)性與全域積分為1的條件。02040301離散型聯(lián)合分布律適用于多維離散隨機變量,以概率質(zhì)量函數(shù)形式列出所有可能取值組合的概率,常用于分類數(shù)據(jù)建模與交叉分析。邊緣分布推導(dǎo)從聯(lián)合分布中通過積分或求和消去其他變量維度,得到單一隨機變量的邊緣分布,是分析單個變量統(tǒng)計特性的基礎(chǔ)工具。連續(xù)型聯(lián)合分布性質(zhì)要求聯(lián)合密度函數(shù)在定義域內(nèi)連續(xù)可積,其幾何意義對應(yīng)于多維空間中的概率曲面,協(xié)方差矩陣可反映變量間的線性關(guān)聯(lián)程度。通過檢驗聯(lián)合分布是否等于邊緣分布的乘積來判定獨立性,適用于理論分布已知的情況,需嚴(yán)格驗證所有取值點條件?;诹新?lián)表數(shù)據(jù)的非參數(shù)檢驗方法,計算觀測頻數(shù)與期望頻數(shù)的偏差平方和,通過卡方統(tǒng)計量判斷變量間的關(guān)聯(lián)顯著性。皮爾遜相關(guān)系數(shù)適用于線性關(guān)系檢驗,而斯皮爾曼秩相關(guān)系數(shù)可檢測單調(diào)關(guān)系,零相關(guān)是獨立的必要非充分條件。在給定其他變量條件下,利用偏相關(guān)系數(shù)或圖模型方法檢驗變量間的局部獨立性,對構(gòu)建貝葉斯網(wǎng)絡(luò)至關(guān)重要。獨立性檢驗數(shù)學(xué)定義驗證卡方檢驗法相關(guān)系數(shù)檢驗條件獨立性判定條件分布與期望通過聯(lián)合密度與邊緣密度的比值定義,需注意分母不為零的條件限制,其積分域需與條件事件嚴(yán)格對應(yīng)。條件概率密度推導(dǎo)全期望定律將復(fù)雜條件期望分解為分層計算,在馬爾可夫過程與遞推算法中有重要理論價值。重期望公式應(yīng)用作為隨機變量的函數(shù)具有可測性,滿足線性運算規(guī)則,在預(yù)測問題中表現(xiàn)為最小均方誤差意義下的最優(yōu)估計量。條件期望性質(zhì)010302通過方差分解公式揭示條件異方差現(xiàn)象,在金融時間序列建模與異方差回歸模型中具有實際應(yīng)用意義。條件方差分析04PART06概率模型應(yīng)用伯努利模型描述僅有兩個互斥結(jié)果的單次隨機試驗(如成功/失?。浜诵膮?shù)為事件發(fā)生概率p。該模型要求各次試驗相互獨立且概率恒定,構(gòu)成n重伯努利試驗時,可推導(dǎo)出二項分布等經(jīng)典概率分布?;径x與特性若定義隨機變量X為事件發(fā)生次數(shù)(X=1成功,X=0失?。?,則期望值E(X)=p,方差D(X)=p(1-p)。當(dāng)試驗次數(shù)n→∞時,二項分布可近似為泊松分布或正態(tài)分布。數(shù)學(xué)表達與衍生廣泛應(yīng)用于質(zhì)量控制(產(chǎn)品合格率檢測)、醫(yī)學(xué)試驗(藥物有效性驗證)和社會統(tǒng)計(選舉投票傾向分析)。例如,在生產(chǎn)線抽樣檢驗中,每次抽取產(chǎn)品是否為次品即構(gòu)成伯努利試驗。典型應(yīng)用場景010302伯努利模型嚴(yán)格獨立性假設(shè)在實際中可能不成立(如傳染病傳播場景),此時需引入馬爾可夫模型或網(wǎng)絡(luò)模型進行修正。局限性與擴展04泊松過程基本概念與公理化定義泊松過程是計數(shù)過程的重要類型,滿足獨立增量性、平穩(wěn)增量性和稀有性。其強度參數(shù)λ表示單位時間內(nèi)事件發(fā)生的平均次數(shù),事件間隔時間服從指數(shù)分布。01數(shù)學(xué)性質(zhì)與推廣泊松過程的疊加與分解性質(zhì)使其可建模復(fù)雜系統(tǒng)。非齊次泊松過程(λ(t)可變)能描述周期性波動,如節(jié)假日客流量;復(fù)合泊松過程則用于帶隨機幅度的累計損失建模。實際應(yīng)用領(lǐng)域在通信工程中用于模擬呼叫到達(如交換機話務(wù)量),在交通流理論中刻畫車輛通過檢測點,在金融領(lǐng)域模擬稀有市場事件(如債券違約)。典型案例包括核衰變粒子計數(shù)、客服中心來電分析。02當(dāng)伯努利試驗次數(shù)n極大而p極小時,二項分布收斂為泊松分布。泊松過程也可視為連續(xù)時間的伯努利過程,是馬爾可夫過程和更新過程的特例。0403與其他過程的聯(lián)系通信網(wǎng)絡(luò)流量建模某4G基站每小時接入嘗試次數(shù)服從λ=300的泊松過程,通過計算P(N(1)>350)可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論