肥尾效應(yīng)(前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用)_第1頁(yè)
肥尾效應(yīng)(前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用)_第2頁(yè)
肥尾效應(yīng)(前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用)_第3頁(yè)
肥尾效應(yīng)(前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用)_第4頁(yè)
肥尾效應(yīng)(前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用)_第5頁(yè)
已閱讀5頁(yè),還剩414頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

肥尾效應(yīng)前漸進(jìn)論、認(rèn)識(shí)論和應(yīng)用目錄\h第一章序言,?\h第二章術(shù)語(yǔ)、符號(hào)和定義\h2.1一般符號(hào)和常用符號(hào)\h2.2一般&特殊概念目錄\h2.2.1冪律類分布□\h2.2.2大數(shù)定律(弱)\h2.2.3中心極限定理(CLT)\h2.2.4中數(shù)定律和漸進(jìn)論\h2.2.5Kappa統(tǒng)計(jì)量\h2.2.6橢圓分布\h2.2.7統(tǒng)計(jì)獨(dú)立性\h2.2.8多變量(列維)穩(wěn)定分布\h2.2.9多變量穩(wěn)定分布\h2.2.10卡拉瑪塔點(diǎn)\h2.2.11亞指數(shù)\h2.2.12近似替代:學(xué)生T分布\h2.2.13引用環(huán)\h2.2.14學(xué)術(shù)尋租\h2.2.15偽經(jīng)驗(yàn)主義或Pinker問(wèn)題\h2.2.16前漸進(jìn)性\h2.2.17隨機(jī)化\h2.2.18在險(xiǎn)價(jià)值(VaR),條件在險(xiǎn)價(jià)值(CVaR)\h2.2.19風(fēng)險(xiǎn)共擔(dān)\h2.2.20MS圖\h2.2.21最大吸引域(MDA)\h2.2.22心理學(xué)文獻(xiàn)中的積分替換\h2.2.23概率的不可分拆性(另一個(gè)常見(jiàn)誤區(qū))\h2.2.24維特根斯坦的尺子\h2.2.25黑天鵝\h2.2.26經(jīng)驗(yàn)分布會(huì)超出經(jīng)驗(yàn)\h2.2.27隱藏的尾部\h2.2.28影子矩\h2.2.29尾部依賴\h2.2.30元概率\h2.2.31動(dòng)態(tài)對(duì)沖\h第一部分肥尾及其效應(yīng)介紹\h第三章非數(shù)理視角概述——?jiǎng)虼髮W(xué)達(dá)爾文學(xué)院講義,?\h3.1薄尾和厚尾的差異\h3.2直觀理解:搖尾巴的狗\h3.3一種(更合理的)厚尾分類方式及其效應(yīng)\h3.4肥尾分布的主要效應(yīng)及其與本書的關(guān)聯(lián)\h3.4.1預(yù)測(cè)\h3.4.2大數(shù)定律\h3.5認(rèn)識(shí)論與非對(duì)稱推理\h3.6幼稚的經(jīng)驗(yàn)主義:不應(yīng)該把埃博拉病毒和從梯子上跌落進(jìn)行對(duì)比\h3.6.1風(fēng)險(xiǎn)是如何倍增的\h3.7冪律入門(幾乎沒(méi)有數(shù)學(xué))\h3.8隱藏性質(zhì)在哪里?\h3.9貝葉斯圖譜\h3.10X和f(X):混淆我們理解的X和相應(yīng)風(fēng)險(xiǎn)敞口\h3.11破產(chǎn)和路徑依賴\h3.12如何應(yīng)對(duì)\h第四章單變量肥尾,有限矩(第一層)?\h4.1構(gòu)造輕微肥尾的簡(jiǎn)單方法\h4.1.1固定方差的增厚尾部方法\h4.1.2通過(guò)有偏方差增厚尾部\h4.2隨機(jī)波動(dòng)率能否產(chǎn)生冪律?\h4.3分布的軀干、肩部和尾部\h4.3.1交叉和隧穿效應(yīng)\h4.4肥尾、平均差和上升范數(shù)\h4.4.1常見(jiàn)誤區(qū)\h4.4.2指標(biāo)分析\h4.4.3肥尾效應(yīng)對(duì)STDvsMAD“有效性”的影響\h4.4.4矩和冪均不等式\h4.4.5評(píng)述:為什么我們應(yīng)該立刻棄用標(biāo)準(zhǔn)差?\h4.5可視化p上升產(chǎn)生的等范數(shù)邊界效應(yīng)\h第五章亞指數(shù)和冪律(第二層)\h5.0.1重新排序\h5.0.2什么是邊界概率分布?\h5.0.3創(chuàng)建一個(gè)分布\h5.1尺度和冪律(第三層)\h5.1.1有尺度和無(wú)尺度,對(duì)肥尾更深層的理解\h5.1.2灰天鵝\h5.2冪律的性質(zhì)\h5.2.1變量求和\h5.2.2變換\h5.3鐘形vs非鐘形冪律\h5.4冪律分布尾部指數(shù)插值:一個(gè)例子\h5.5超級(jí)肥尾:對(duì)數(shù)帕累托分布\h5.6偽隨機(jī)波動(dòng)率:一項(xiàng)研究\h第六章高維空間厚尾?\h6.1高維空間中的厚尾,有限矩\h6.2聯(lián)合肥尾分布及其橢圓特性\h6.3多元學(xué)生T分布\h6.3.1肥尾條件下的橢圓性和獨(dú)立性\h6.4肥尾和互信息\h6.5肥尾和隨機(jī)矩陣,一個(gè)小插曲\h6.6相關(guān)性和未定義方差\h6.7線性回歸模型的肥尾殘差\hA殊厚尾案例\hA.1多重模型與厚尾,戰(zhàn)爭(zhēng)-和平模型\hA.2轉(zhuǎn)移概率:有不可逆破碎可能的事物終將破碎\h第二部分中數(shù)定律\h第七章極限分布綜述,?\h7.1溫習(xí):弱大數(shù)定律和強(qiáng)大數(shù)定律\h7.2中心極限過(guò)程\h7.2.1穩(wěn)定分布\h7.2.2穩(wěn)定分布的大數(shù)定律\h7.3CLT的收斂速度:直觀探索\h7.3.1迅速收斂:均勻分布\h7.3.2中速收斂:指數(shù)分布\h7.3.3慢速收斂:帕累托分布\h7.3.4半立方帕累托分布及其收斂分布族\h7.4累積量和收斂性\h7.5數(shù)理基礎(chǔ):傳統(tǒng)版本的中心極限定理\h7.6高階矩的大數(shù)定律\h7.6.1高階矩\h7.7穩(wěn)定分布的平均差\h第八章需要多少數(shù)據(jù)?肥尾的定量衡量方法?\h8.1定義與介紹\h8.2統(tǒng)計(jì)量\h8.3收斂性基準(zhǔn),穩(wěn)定分布類\h8.3.1穩(wěn)定分布的等價(jià)表述\h8.3.2樣本充足率的實(shí)際置信度\h8.4數(shù)量化效應(yīng)\h8.4.1非對(duì)稱分布的一些奇異特性\h8.4.2學(xué)生T分布向高斯分布的收斂速率\h8.4.3對(duì)數(shù)正態(tài)分布既非薄尾,又非肥尾\h8.4.4κ可以為負(fù)嗎?\h8.5效應(yīng)總結(jié)\h8.5.1投資組合的偽穩(wěn)定性\h8.5.2其他領(lǐng)域的統(tǒng)計(jì)推斷\h8.5.3最終評(píng)述\h8.6附錄、推導(dǎo)和證明\h8.6.1立方學(xué)生T分布(高斯族)\h8.6.2對(duì)數(shù)正態(tài)分布\h8.6.3指數(shù)分布\h8.6.4負(fù)Kappa和負(fù)峰度\h第九章極值和隱藏尾部,?\h9.1極值理論簡(jiǎn)介\h9.1.1各類冪律尾如何趨向弗雷歇分布\h9.1.2高斯分布的情形\h9.1.3皮克蘭茲-巴爾克馬-德哈恩定理\h9.2冪律分布看不見(jiàn)的尾\h9.2.1和正態(tài)分布對(duì)比\h9.3附錄:經(jīng)驗(yàn)分布的經(jīng)驗(yàn)有限\hB增速和結(jié)果并非同類分布\hB.1謎題\hB.2瘟疫的分布極度肥尾\hC大偏差理論簡(jiǎn)介\hC.1簡(jiǎn)單示例:切諾夫界\hD帕累托性質(zhì)擬合\hD.1樣本尾部指數(shù)的分布\h第十章“事實(shí)就是這樣”:標(biāo)準(zhǔn)普爾500指數(shù)分析?\h10.1帕累托性和矩\h10.2收斂性測(cè)試\h10.2.1測(cè)試1:累積樣本峰度\h10.2.2最大回撤\h10.2.3經(jīng)驗(yàn)Kappa\h10.2.4測(cè)試2:超越某值的條件期望\h10.2.5測(cè)試3:四階矩的不穩(wěn)定性\h10.2.6測(cè)試4:MS圖\h10.2.7歷史記錄和極值\h10.2.8左右尾不對(duì)稱\h10.3總結(jié):事實(shí)就是這樣\hE計(jì)量經(jīng)濟(jì)學(xué)的問(wèn)題\hE.1標(biāo)準(zhǔn)帶參風(fēng)險(xiǎn)統(tǒng)計(jì)量的表現(xiàn)\hE.2標(biāo)準(zhǔn)非參風(fēng)險(xiǎn)統(tǒng)計(jì)量的表現(xiàn)\hF有關(guān)機(jī)器學(xué)習(xí)\hF.1擬合有角函數(shù)\h第三部分預(yù)報(bào)、預(yù)測(cè)和不確定性\h第十一章肥尾條件下的概率校準(zhǔn)?\h11.1連續(xù)vs離散分布:定義和評(píng)述\h11.1.1與描述的差異\h11.1.2肥尾條件下不存在“崩潰”、“災(zāi)難”或“成功”\h11.2心理學(xué)中對(duì)尾部概率的偽高估\h11.2.1薄尾情況\h11.2.2肥尾情況\h11.2.3誤區(qū)\h11.2.4分布的不確定性\h11.3校準(zhǔn)和校準(zhǔn)失誤\h11.4表現(xiàn)統(tǒng)計(jì)量\h11.4.1分布推導(dǎo)\h11.5收益函數(shù)/機(jī)器學(xué)習(xí)\h11.6結(jié)論\h11.7附錄:證明和推導(dǎo)\h11.7.1二元計(jì)數(shù)分布p(n)\h11.7.2布里爾分?jǐn)?shù)的分布\h第十二章鞅過(guò)程大選預(yù)測(cè):套利法?\h12.0.1主要結(jié)論\h12.0.2框架\h12.0.3有關(guān)風(fēng)險(xiǎn)中性的討論\h12.1巴舍利耶風(fēng)格的估值\h12.2有界雙重鞅過(guò)程\h12.3與德菲內(nèi)蒂概率評(píng)估的關(guān)系\h12.4總結(jié)和評(píng)述\h第四部分肥尾條件下的不均估計(jì)\h第十三章無(wú)限方差下的基尼系數(shù)估計(jì)?\h13.1介紹\h13.2無(wú)限方差下非參估計(jì)的漸進(jìn)性質(zhì)\h13.2.1α穩(wěn)定隨機(jī)變量回顧\h13.2.2基尼系數(shù)的α穩(wěn)定漸進(jìn)極限\h13.3極大似然估計(jì)\h13.4帕累托數(shù)據(jù)\h13.5小樣本修正\h13.6總結(jié)\h第十四章分位數(shù)貢獻(xiàn)的估計(jì)誤差和超可加性?\h14.1介紹\h14.2帕累托尾分布\h14.2.1偏差和收斂性\h14.3累加不等性質(zhì)的不等性\h14.4尾部指數(shù)的混合分布\h14.5變量和越大,□越大\h14.6結(jié)論以及如何合理估計(jì)集中度\h14.6.1穩(wěn)健方法和完整數(shù)據(jù)的使用\h14.6.2我們應(yīng)該如何測(cè)量集中度?\h第五部分影子矩相關(guān)論文\h第十五章無(wú)限均值分布的影子矩?\h15.1介紹\h15.2雙重分布\h15.3回到y(tǒng):影子均值(或總體均值)\h15.4和其他方法的比較\h15.5應(yīng)用\h第十六章暴力事件的尾部風(fēng)險(xiǎn)?\h16.1介紹\h16.2統(tǒng)計(jì)討論匯總\h16.2.1結(jié)果\h16.2.2總結(jié)\h16.3研究方法討論\h16.3.1重整化方法\h16.3.2條件期望(嚴(yán)謹(jǐn)性稍弱)\h16.3.3數(shù)據(jù)可靠性和對(duì)尾部估計(jì)的影響\h16.3.4“事件”的定義\h16.3.5事件遺漏\h16.3.6生存偏差\h16.4數(shù)據(jù)分析\h16.4.1閾值之上的峰值\h16.4.2事件間隔和自相關(guān)性\h16.4.3尾部分析\h16.4.4有關(guān)極大值的另類視角\h16.4.5全數(shù)據(jù)集分析\h16.5額外的魯棒性和可靠性測(cè)試\h16.5.1GPD自展法\h16.5.2估計(jì)邊界的擾動(dòng)\h16.6結(jié)論:真實(shí)世界是否比看起來(lái)更不安全?\hG第三次世界大戰(zhàn)發(fā)生的概率有多高?,?\h第六部分元概率相關(guān)論文\h第十七章遞歸的認(rèn)知不確定性如何導(dǎo)致肥尾?\h17.1方法和推導(dǎo)\h17.1.1不確定性的層級(jí)累加\h17.1.2標(biāo)準(zhǔn)高斯分布的高階積分\h17.1.3小概率效應(yīng)\h17.2狀態(tài)2:a(n)為衰減參數(shù)\h17.2.1狀態(tài)2-a:“失血”高階誤差\h17.2.2狀態(tài)2-b:第二種方法,無(wú)倍增誤差率\h17.3極限分布\h第十八章不對(duì)稱冪律的隨機(jī)尾部指數(shù)?\h18.1背景\h18.2隨機(jī)α的單尾分布\h18.2.1一般情況\h18.2.2隨機(jī)α不等式\h18.2.3□分布類近似\h18.3冪律分布求和\h18.4不對(duì)稱穩(wěn)定分布\h18.5α為對(duì)數(shù)正態(tài)分布的帕累托分布\h18.6α為伽馬分布的帕累托分布\h18.7有界冪律,西里洛和塔勒布(2016)\h18.8其他評(píng)論\h第十九章p值的元分布和p值操控?\h19.1證明和推導(dǎo)\h19.2檢驗(yàn)的逆功效\h19.3應(yīng)用和結(jié)論\hH行為經(jīng)濟(jì)學(xué)的謬誤\hH.1案例研究:短視損失厭惡的概念謬誤\h第七部分肥尾下的期權(quán)交易與定價(jià)\h第二十章金融理論在期權(quán)定價(jià)上的缺陷?\h20.1巴舍利耶而非布萊克—斯科爾斯\h20.1.1現(xiàn)實(shí)和理想的距離\h20.1.2實(shí)際動(dòng)態(tài)復(fù)制過(guò)程\h20.1.3失效:對(duì)沖誤差問(wèn)題\h第二十一章期權(quán)定價(jià)的唯一測(cè)度(無(wú)動(dòng)態(tài)對(duì)沖和完備市場(chǎng))?\h21.1背景\h21.2證明\h21.2.1案例1:使用遠(yuǎn)期作為風(fēng)險(xiǎn)中性測(cè)度\h21.2.2推導(dǎo)\h21.3當(dāng)遠(yuǎn)期不滿足風(fēng)險(xiǎn)中性時(shí)\h21.4評(píng)述\h第二十二章期權(quán)交易員從來(lái)不用BSM公式?\h22.1打破鏈條\h22.2介紹\h22.2.1布萊克—斯科爾斯只是理論\h22.3誤區(qū)1:交易員在BSM之前無(wú)法對(duì)期權(quán)定價(jià)\h22.4方法和推導(dǎo)\h22.4.1期權(quán)公式和Delta對(duì)沖\h22.5誤區(qū)2:今天的交易員使用布萊克-斯科爾斯定價(jià)\h22.5.1我們什么時(shí)候定價(jià)?\h22.6動(dòng)態(tài)對(duì)沖的數(shù)學(xué)不可能性\h22.6.1高斯分布(令人困惑)的穩(wěn)健性\h22.6.2訂單流和期權(quán)\h22.6.3巴舍利耶-索普方程\h第二十三章冪律條件下的期權(quán)定價(jià):穩(wěn)健的啟發(fā)式方法,?\h23.1介紹\h23.2卡拉瑪塔點(diǎn)之上的看漲期權(quán)定價(jià)\h23.2.1第一種方法,S屬于正規(guī)變化類\h23.2.2第二種方法,S的幾何收益率屬于正規(guī)變化類\h23.3看跌期權(quán)定價(jià)\h23.4套利邊界\h23.5評(píng)述\h第二十四章量化金融領(lǐng)域的四個(gè)錯(cuò)誤,?\h24.1混淆二階矩和四階矩\h24.2分析期權(quán)收益時(shí)忽略詹森不等式\h24.3保險(xiǎn)和被保資產(chǎn)之間的不可分割性\h24.4金融領(lǐng)域計(jì)價(jià)單位的必要性\h24.5附錄(押注分布尾部)\h第二十五章尾部風(fēng)險(xiǎn)約束和最大熵?\h25.1投資組合的核心約束是左尾風(fēng)險(xiǎn)\h25.1.1杰恩斯眼中的杠鈴策略\h25.2重新審視均值-方差組合\h25.2.1分析約束條件\h25.3再論高斯分布\h25.3.1兩個(gè)正態(tài)分布混合\h25.4最大熵\h25.4.1案例A:全局均值約束\h25.4.2案例B:均值絕對(duì)值約束\h25.4.3案例C:右尾服從冪律\h25.4.4擴(kuò)展到多階段模型\h25.5總結(jié)評(píng)述\h25.6附錄/證明第一章序言*,?\h[1]對(duì)世界的了解越是粗淺,做決策越是輕易。圖1.1核心問(wèn)題不是不知道“肥尾”,而是缺乏對(duì)其效應(yīng)的理解。說(shuō)出“它是肥尾”意味的不僅是改變分布的名稱,而且是對(duì)統(tǒng)計(jì)工具和決策類型的全面革新。感謝斯特凡·加西奇。不確定性(Incerto)項(xiàng)目背后的主要思想在于,雖然我們所在的世界是如此不確定和不透明,信息和我們的理解也極不完整,但是沒(méi)有人研究在這種不確定性的基礎(chǔ)上我們應(yīng)該做什么。本書主要講述產(chǎn)生極端事件的統(tǒng)計(jì)分布類型,以及在這類分布下如何進(jìn)行統(tǒng)計(jì)推斷和做出決策,內(nèi)容包括:(1)公開(kāi)發(fā)表的論文;(2)未經(jīng)審查的公開(kāi)評(píng)述?,F(xiàn)有的大多數(shù)“標(biāo)準(zhǔn)”統(tǒng)計(jì)理論均來(lái)自薄尾分布,它們?cè)趹?yīng)用于肥尾的過(guò)程中需要經(jīng)過(guò)漸進(jìn)性調(diào)整,這往往不是小改動(dòng),原理論可能會(huì)被完全舍棄。圖1.2沒(méi)有洞察力的復(fù)雜性:許多使用統(tǒng)計(jì)學(xué)和數(shù)據(jù)科學(xué)的專業(yè)人士頭腦清晰,但不了解核心概念,即根本意義。感謝維基媒體。根據(jù)作者的經(jīng)驗(yàn),一些學(xué)界教授或業(yè)界人士會(huì)說(shuō),“我們當(dāng)然知道這一點(diǎn)”,或是更粗暴地給出結(jié)論,“肥尾沒(méi)有什么新東西”,同時(shí)在分析中使用“方差”、“GARCH”(自回歸條件異方差均值模型)、“峰度”、“夏普比率”或“在險(xiǎn)價(jià)值”這樣的指標(biāo),或者開(kāi)展一些所謂“統(tǒng)計(jì)意義顯著”實(shí)則完全不顯著的研究。此外,本書來(lái)自作者的不確定性[226]系列和相關(guān)的量化研究,主要關(guān)注我們?cè)撊绾卧谝粋€(gè)不確定性結(jié)構(gòu)過(guò)于復(fù)雜的現(xiàn)實(shí)世界中生活。不確定性系列嘗試在五個(gè)不同領(lǐng)域統(tǒng)一尾部概率和極端事件,包括數(shù)學(xué)、哲學(xué)、社會(huì)科學(xué)、契約論、決策論和現(xiàn)實(shí)世界。至于為什么是契約論,答案是:期權(quán)理論是基于或有契約或概率契約的概念,旨在調(diào)整和轉(zhuǎn)移分布尾部的風(fēng)險(xiǎn)敞口;從某種意義上說(shuō),期權(quán)理論也屬于數(shù)學(xué)契約論。決策論不是為了了解世界,而是為了擺脫困境并求得生存。這也是不確定性系列量化研究下一卷的主題,目前暫定書名為《凸性、風(fēng)險(xiǎn)和脆弱性》。術(shù)語(yǔ)解釋“厚尾”常常被用于學(xué)術(shù)場(chǎng)合,用金融從業(yè)者的術(shù)語(yǔ)來(lái)說(shuō),厚尾表征的是“比高斯分布峰度更高的分布”。而對(duì)于“肥尾”,我們傾向于將其理解為極端厚尾或冪律尾類分布(第八章會(huì)論證兩者的一致性)。一般來(lái)說(shuō),我們的定義相對(duì)更窄一些,僅僅將肥尾限定于“冪律”或“正規(guī)變化”——但我們更喜歡將“冪律”直接稱為“冪律”(當(dāng)對(duì)該類過(guò)程非常確定時(shí))。因此,我們所稱的“肥尾”從嚴(yán)格意義上說(shuō),對(duì)許多人而言更像是“極度厚尾”。為了避免歧義,我們?cè)谶@里不使用諸如“重尾”或者“長(zhǎng)尾”的說(shuō)法。在接下來(lái)的兩章中,我們會(huì)進(jìn)一步闡明上述概念。圖1.3關(guān)于肥尾的經(jīng)典回應(yīng):一個(gè)有效的“替代方案”是不妨礙學(xué)術(shù)尋租的方案。感謝斯特凡·加西奇。\h[1]討論章節(jié)。第二章術(shù)語(yǔ)、符號(hào)和定義本章是書中主要議題和數(shù)學(xué)符號(hào)的概要總結(jié)。一般來(lái)說(shuō),數(shù)學(xué)符號(hào)在各個(gè)章節(jié)中也會(huì)有注解,為了方便讀者,這里先做個(gè)匯總。從論文中提取的章節(jié)會(huì)有特殊符號(hào)標(biāo)注。我們會(huì)盡可能保持全書符號(hào)的一致性,但不同研究小組在使用上可能有一定的差異。2.1一般符號(hào)和常用符號(hào)是表示概率的符號(hào),一般以表示,其中X是隨機(jī)變量,x是其取值。在第十一章和其他有必要的地方,我們會(huì)使用更正式(更法式)的理論定義。是期望操作符。是方差操作符。是平均絕對(duì)偏差,以均值為對(duì)稱(和中位數(shù)不同)。φ(.)和f(.)一般被用來(lái)表征給定分布的PDF(概率密度函數(shù))。在某些章節(jié)中,當(dāng)隨機(jī)變量X和Y滿足不同的分布時(shí),我們會(huì)用fx(x)和fy(y)來(lái)區(qū)分。n一般表示求和的數(shù)目。p一般表示矩的階數(shù)。F(.)一般被用來(lái)表示CDF[累積分布函數(shù)或者S是的生存函數(shù)?!硎疽粋€(gè)隨機(jī)變量滿足某種法則下的分布。是分布的特征函數(shù),在某些討論中,參數(shù)也以ω表示,有時(shí)特征函數(shù)也以Ψ表示。表示收斂于某分布,假設(shè)有一系列隨機(jī)變量代表隨機(jī)變量Xn的累積分布函數(shù)Fn滿足(在F連續(xù)的條件下,對(duì)于所有實(shí)數(shù)x):表示收斂于某概率,對(duì)于任意ε>0,上述相同序列滿足:表示必然收斂,是更強(qiáng)的收斂條件,可表示為:Sn一般表示n個(gè)變量求和。α和αs,我們一般使用αs∈(0,2]來(lái)表征柏拉圖式穩(wěn)定分布的尾部指數(shù),而采用αp∈(0,∞)來(lái)表征帕累托(漸進(jìn)于帕累托)分布的尾部指數(shù),有時(shí)兩個(gè)α?xí)煜?,直接出現(xiàn)的α可以通過(guò)上下文來(lái)理解。是均值為μ1,方差為σ21的高斯分布。或者是表示對(duì)數(shù)正態(tài)分布,概率密度函數(shù)f(L)(.)一般可以表示為,其中均值為X0,方差是尾部參數(shù)αs∈(0,2]的穩(wěn)定分布,對(duì)稱指數(shù)β∈(?1,1),中心參數(shù)和離散參數(shù)σ>0。是冪律類分布(見(jiàn)下節(jié))。是亞指數(shù)類分布(見(jiàn)下節(jié))。δ(.)是狄拉克δ函數(shù)。θ(.)是階躍θ函數(shù)。erf(.)是誤差函數(shù),是高斯分布的積分是誤差函數(shù)的補(bǔ)函數(shù)1?erf(.)。一般定義為實(shí)向量的向量范數(shù)注意這里加上了絕對(duì)值。是合流超幾何函數(shù):是正則化廣義超幾何函數(shù):,這里是Pochhammer表達(dá)式。是Q-Pochhammer表達(dá)式,定義為2.2一般&特殊概念目錄下面是一些核心要點(diǎn)的定義(可能和后面存在重復(fù))。2.2.1冪律類分布冪律類分布一般通過(guò)如下生存函數(shù)的性質(zhì)來(lái)定義。假設(shè)隨機(jī)變量X屬于右尾為“冪律”的分布類,也就是:這里是緩變函數(shù),對(duì)于所有k>0,定義如下[22]:變量X的生存函數(shù)屬于“正規(guī)變化”類RVα,具體來(lái)說(shuō),函數(shù)在無(wú)窮大處以指數(shù)ρ變化:更進(jìn)一步看,會(huì)存在一個(gè)點(diǎn),使得L(x)趨向于極限的時(shí)候?yàn)槌?shù)l,我們稱它為“卡拉瑪塔常數(shù)”(Karamata),該點(diǎn)也被稱為“卡拉瑪塔點(diǎn)”。在該值之外,冪律尾可以通過(guò)希爾估計(jì)這樣的標(biāo)準(zhǔn)方法來(lái)擬合。該區(qū)域內(nèi)的分布也被曼德博[162][75]稱為強(qiáng)帕累托法則。對(duì)于分布左尾,上述規(guī)律類似。2.2.2大數(shù)定律(弱)大數(shù)定律的標(biāo)準(zhǔn)形式如下,假設(shè)X1,X2…Xn是獨(dú)立同分布(i.i.d.)的無(wú)限序列(勒貝格可積),且(盡管有時(shí)可以放松獨(dú)立同分布條件)。樣本均值會(huì)收斂到期望值,對(duì)于這里方差有限并非必要條件(不過(guò)各高階矩的存在會(huì)加快收斂速度)。強(qiáng)大數(shù)定律有需要時(shí)再做討論。2.2.3中心極限定理(CLT)中心極限定理的標(biāo)準(zhǔn)形式(Lindeberg-Lévy)如下,假設(shè)有一系列獨(dú)立同分布的隨機(jī)變量,是n個(gè)樣本的均值,當(dāng)n趨于無(wú)窮時(shí),隨機(jī)變量的和會(huì)收斂到高斯分布[20][21]。這里收斂到分布的意思是,對(duì)于每一個(gè)實(shí)數(shù)z,的CDF(累積分布函數(shù))會(huì)點(diǎn)對(duì)點(diǎn)收斂到標(biāo)準(zhǔn)高斯分布的CDF,N(0,σ):Φ(z)是z處標(biāo)準(zhǔn)高斯分布的CDF值。中心極限定理還有很多其他版本,下面有需要時(shí)會(huì)展開(kāi)論述。2.2.4中數(shù)定律和漸進(jìn)論這是全書的主旨,我們想要了解隨機(jī)變量數(shù)目n比較大但又不是極大時(shí)的漸進(jìn)行為。對(duì)高斯分布來(lái)說(shuō),這不是什么大問(wèn)題,因?yàn)槭諗克俣群芸欤ù髷?shù)定律和中心極限定理都是),但是對(duì)很多其他的隨機(jī)變量來(lái)說(shuō)并非如此。見(jiàn)下面的Kappa統(tǒng)計(jì)量。2.2.5Kappa統(tǒng)計(jì)量這一統(tǒng)計(jì)量不應(yīng)該被視為數(shù)學(xué)上表征距離的函數(shù),我們應(yīng)該以偏向工程學(xué)的思維,將其視為一種量化比較的手段。Kappa是本書作者自己設(shè)計(jì)的統(tǒng)計(jì)量(發(fā)表于論文中[235]),取值范圍為[0,1],代表隨機(jī)變量的漸進(jìn)行為。對(duì)高斯分布來(lái)說(shuō),取值為0(基準(zhǔn)值),而對(duì)柯西分布或其他均值不存在的分布取值為1。假設(shè)X1,X2…Xn是均值有限的獨(dú)立同分布隨機(jī)變量,也即。定義為部分序列和。那么可以定義為n個(gè)隨機(jī)變量求和的平均絕對(duì)偏差(參照之前我們不使用中位數(shù),而是以均值為中心)。接著定義n個(gè)額外變量和收斂的“速率”(從n0開(kāi)始):在最為基礎(chǔ)的n=n0+1時(shí),我們簡(jiǎn)單地用來(lái)表示。2.2.6橢圓分布p×1維的隨機(jī)變量X為橢圓分布(橢圓等高分布)的定義是:假設(shè)位置參數(shù)為μ,存在非負(fù)矩陣Σ和標(biāo)量函數(shù)Ψ使得特征函數(shù)滿足exp(it′μ)Ψ(tΣt′)的形式。換句話說(shuō),對(duì)于聯(lián)合分布,我們必須有奇協(xié)方差矩陣才能滿足其橢圓特性。狀態(tài)轉(zhuǎn)換協(xié)方差和隨機(jī)協(xié)方差這樣的條件都會(huì)使聯(lián)合分布遠(yuǎn)離橢圓分布。我們會(huì)在第六章給出,只要違反橢圓特性,薄尾變量的線性組合就可以展現(xiàn)出極度肥尾的性質(zhì),除了肥尾性質(zhì)本身,這一條又額外證偽了很多現(xiàn)代金融學(xué)理論。2.2.7統(tǒng)計(jì)獨(dú)立性假設(shè)兩個(gè)獨(dú)立的隨機(jī)變量X和Y,如果其各自的概率密度函數(shù)(PDF)為f(x)和f(y),無(wú)論相關(guān)系數(shù)如何,聯(lián)合PDFf(x,y)都滿足:在橢圓分布類中,相關(guān)系數(shù)為0的雙變量高斯分布既獨(dú)立又不相關(guān)。但是對(duì)多變量學(xué)生T分布或柯西分布來(lái)說(shuō),上述條件就不成立了。2.2.8多變量(列維)穩(wěn)定分布這是中心極限定理的廣義版本。假設(shè)X1,X2…Xn是獨(dú)立同分布隨機(jī)變量,它們的和為Sn,那么我們有:這里的Xs服從穩(wěn)定分布S,an和bn是常量,代表收斂到分布(當(dāng)n→∞時(shí)X的分布)。下一章我們會(huì)對(duì)S的性質(zhì)進(jìn)行更完備的定義。這里可以認(rèn)為Xs服從穩(wěn)定分布(或者α穩(wěn)定分布),寫作XsS(αs,β,μ,σ),特征函數(shù)的形式如下:分布參數(shù)的限制條件為2.2.9多變量穩(wěn)定分布隨機(jī)向量滿足多變量穩(wěn)定分布的條件是,所有成分的線性組合服從穩(wěn)定分布。也即對(duì)于任意常向量,隨機(jī)變量Y=aTX應(yīng)該是一個(gè)單變量穩(wěn)定分布。2.2.10卡拉瑪塔點(diǎn)見(jiàn)冪律類分布。2.2.11亞指數(shù)平均斯坦和極端斯坦的自然邊界為亞指數(shù)類分布,有如下性質(zhì):假設(shè)是實(shí)數(shù)域上的獨(dú)立同分布隨機(jī)變量,累積分布函數(shù)為F,亞指數(shù)類的分布可以定義為(見(jiàn)[248][196]):這里的的累積分布函數(shù)(兩個(gè)相同的獨(dú)立隨機(jī)變量X的和),上面的定義代表了X1+X2超過(guò)x的兩倍的概率是任意單個(gè)X超過(guò)x的概率的兩倍。因此,對(duì)足夠大的x來(lái)說(shuō),每當(dāng)和超過(guò)x的時(shí)候,往往是其中某個(gè)X超過(guò)了x——兩者中的較大值,另外一個(gè)X的貢獻(xiàn)則微乎其微。更一般地看,可以證明n個(gè)變量的和會(huì)由這些變量中的最大值主導(dǎo)。從嚴(yán)謹(jǐn)?shù)慕嵌戎v,下面兩條性質(zhì)等價(jià)于亞指數(shù)條件[43][84]。對(duì)于假設(shè)因此,求和項(xiàng)Sn和樣本中的最大值Mn有相同的量級(jí),這也是尾部起主導(dǎo)作用的另一種表達(dá)。直觀來(lái)看,亞指數(shù)分布的尾部應(yīng)該比指數(shù)分布下降更慢,因?yàn)橹笖?shù)分布的尾部并非由超大尾部事件主導(dǎo)。實(shí)際上,我們可以證明,亞指數(shù)分布不存在指數(shù)矩:所有。然而,反過(guò)來(lái)不一定成立,如果一個(gè)分布的指數(shù)矩不存在,那么它不一定滿足亞指數(shù)分布的條件。2.2.12近似替代:學(xué)生T分布我們可以方便地使用自由度為α的學(xué)生T分布近似作為雙尾冪律分布,α=1對(duì)應(yīng)柯西分布,而α→∞對(duì)應(yīng)高斯分布。學(xué)生T分布屬于主流的鐘形冪律分布,也即PDF平滑連續(xù),對(duì)于極大的正值/負(fù)值x概率趨于0,且具備單一的尖峰最大值(另外,PDF是準(zhǔn)凹結(jié)構(gòu)而不是簡(jiǎn)單的凹結(jié)構(gòu))。2.2.13引用環(huán)這是學(xué)術(shù)界的一種高度循環(huán)的引用機(jī)制,這種機(jī)制認(rèn)為,杰出論文的標(biāo)準(zhǔn)在于他人的引用,從而忽略來(lái)自外部的過(guò)濾條件。這樣會(huì)導(dǎo)致學(xué)術(shù)研究方向過(guò)于集中,很容易卡在某個(gè)“角落”,聚焦于沒(méi)有實(shí)際意義的領(lǐng)域。該機(jī)制與缺乏成熟監(jiān)督,且缺乏“風(fēng)險(xiǎn)共擔(dān)”的學(xué)術(shù)體系運(yùn)行模式有關(guān)。典型的此類領(lǐng)域有現(xiàn)代金融理論、計(jì)量經(jīng)濟(jì)學(xué)(特別是宏觀變量計(jì)量學(xué))、GARCH過(guò)程、心理計(jì)量學(xué)、隨機(jī)控制金融學(xué)、行為經(jīng)濟(jì)和金融學(xué)、不確定性決策學(xué)、宏觀經(jīng)濟(jì)學(xué)等。這里的很多學(xué)術(shù)成果根本無(wú)法應(yīng)用于現(xiàn)實(shí),唯一的作用是貢獻(xiàn)額外的論文,并通過(guò)引用機(jī)制產(chǎn)生更多論文,如此循環(huán)下去。2.2.14學(xué)術(shù)尋租科研人員在研究方向的選擇上存在利益沖突,學(xué)術(shù)部門(和研究者個(gè)人)的目標(biāo)變成了盡可能獲得引用和榮譽(yù),從而犧牲了研究方向的客觀性。比如,很多人卡在某個(gè)科研“角落”中,僅僅因?yàn)檫@對(duì)他們的職業(yè)生涯和學(xué)術(shù)組織更有利。2.2.15偽經(jīng)驗(yàn)主義或Pinker問(wèn)題很多人都在討論統(tǒng)計(jì)學(xué)意義并不顯著的“證據(jù)”,或者使用對(duì)隨機(jī)變量完全不適用且毫無(wú)信息量的統(tǒng)計(jì)指標(biāo),比如推斷肥尾變量的均值或者相關(guān)性。這一點(diǎn)源于:(i)統(tǒng)計(jì)學(xué)教學(xué)上對(duì)高斯分布和其他薄尾變量的強(qiáng)調(diào)。(ii)死記硬背統(tǒng)計(jì)術(shù)語(yǔ)的時(shí)候缺乏對(duì)統(tǒng)計(jì)知識(shí)的理解。(iii)對(duì)于維度性質(zhì)毫無(wú)概念。上述幾條在社會(huì)科學(xué)研究者中很常見(jiàn)。偽經(jīng)驗(yàn)主義的例子有:比較恐怖襲擊或埃博拉病毒等流行病的致死率(肥尾)和從梯子上跌落的死亡率(薄尾)。這種看似實(shí)證的“實(shí)證主義”是現(xiàn)代科學(xué)研究中的一種頑疾,在多維和肥尾條件下完全失效。實(shí)際上,我們并不需要區(qū)分肥尾和高斯隨機(jī)變量就可以看出這種行為的不嚴(yán)謹(jǐn)性:沒(méi)有達(dá)到簡(jiǎn)單的統(tǒng)計(jì)顯著性標(biāo)準(zhǔn)——這些操作者也不理解顯著性這個(gè)概念。2.2.16前漸進(jìn)性數(shù)學(xué)上的統(tǒng)計(jì)研究一般聚焦于當(dāng)n=1(n為求和的數(shù)目)和n=∞的情況。而真實(shí)世界正是處于中間的那部分——這也是本書的核心。部分分布(方差有限)對(duì)于n=∞的漸進(jìn)極限是高斯分布,但是對(duì)于n很大又不為無(wú)窮的情況并不成立。2.2.17隨機(jī)化將確定性變量隨機(jī)化的方式有兩種:(i)較為簡(jiǎn)單的二元方法;(ii)通過(guò)更復(fù)雜的連續(xù)或離散分布實(shí)現(xiàn)。(i)假設(shè)s為確定性變量,我們以雙狀態(tài)伯努利分布來(lái)進(jìn)行隨機(jī)化(入門級(jí)別),假定以概率p取s1,概率1-p取s2。該變換以ps1+(1-p)s2=s的形式保留了變量的均值s,當(dāng)然,我們也可以通過(guò)相同的方式保留變量的方差,等等。(ii)我們可以使用一個(gè)完整的統(tǒng)計(jì)分布,雙尾條件下一般是高斯分布,單尾條件下一般是對(duì)數(shù)正態(tài)分布或指數(shù)分布(很少會(huì)用冪律分布)。當(dāng)s為標(biāo)準(zhǔn)差的時(shí)候,我們可以隨機(jī)化s2,它變成了“隨機(jī)波動(dòng)率”,該波動(dòng)率的方差或標(biāo)準(zhǔn)差一般被稱為“Vvol”。2.2.18在險(xiǎn)價(jià)值(VaR),條件在險(xiǎn)價(jià)值(CVaR)對(duì)于某隨機(jī)變量x,分布函數(shù)為F,某參數(shù)λ,VaR的數(shù)學(xué)表達(dá)為:然后,相應(yīng)λ下的CVaR或預(yù)期損失ES為:或者反過(guò)來(lái)在正的定義域上,考慮X的正向尾部。一般來(lái)說(shuō),參數(shù)k的預(yù)期損失為2.2.19風(fēng)險(xiǎn)共擔(dān)風(fēng)險(xiǎn)共擔(dān)是一種過(guò)濾機(jī)制,強(qiáng)迫做菜的廚師品嘗自己做的食物,讓他們暴露在自身問(wèn)題的風(fēng)險(xiǎn)之中,這樣一來(lái)就可以將危險(xiǎn)分子驅(qū)逐出去。能夠“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:管道維修、牙齒診療、外科診療、工程建造,這些領(lǐng)域的從業(yè)者以有形的工作成果被外界評(píng)估,在職業(yè)生涯斷送或破產(chǎn)的風(fēng)險(xiǎn)下從事職業(yè)活動(dòng)。無(wú)法“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:互相引用的學(xué)術(shù)界。學(xué)術(shù)領(lǐng)域的從業(yè)者只依賴同儕的相互評(píng)估而非從真實(shí)世界中獲得反饋。2.2.20MS圖MS圖(maximumtosum)表示最大單一觀測(cè)對(duì)某階矩的貢獻(xiàn)(隨著n不斷變大),我們可以觀察到大數(shù)定律的行為。對(duì)隨機(jī)變量X來(lái)說(shuō),在MS圖上觀察給定樣本的高階矩表現(xiàn)是一種判定的收斂性的簡(jiǎn)易方法[或者看看是否存在]。其中一種做法如圖10.3所示。根據(jù)對(duì)變量極大值的統(tǒng)計(jì),MS圖的原理正是大數(shù)定律[184]。對(duì)于獨(dú)立同分布的非負(fù)X1,X2…Xn,假設(shè)對(duì)于,那么隨著這里為求和函數(shù),然后為極大值函數(shù)(對(duì)于存在負(fù)值的隨機(jī)變量X,我們也可以采用取絕對(duì)值的形式來(lái)求奇數(shù)階矩)。2.2.21最大吸引域(MDA)極值分布考慮的是隨機(jī)變量的最大值,當(dāng)(分布的“右端點(diǎn)”)在最大吸引域上[116],也可以表示為:2.2.22心理學(xué)文獻(xiàn)中的積分替換心理學(xué)文獻(xiàn)中經(jīng)常有如下混淆:假設(shè)為某一閾值,f(.)是概率密度函數(shù),并且是超過(guò)K的概率,g(x)是影響函數(shù)。定義I1是超過(guò)K之上的期望收益:而I2是K處的影響乘以超過(guò)K的概率:這里很容易混淆的是I1和I2,g(.)在K以上是常數(shù)的時(shí)候[比如,階躍θ函數(shù)]兩者相等。對(duì)一階導(dǎo)為正的g(.)來(lái)說(shuō),I1和I2只有在薄尾分布下才比較接近,在肥尾條件下會(huì)相去甚遠(yuǎn)。2.2.23概率的不可分拆性(另一個(gè)常見(jiàn)誤區(qū))定義是導(dǎo)數(shù)為f的概率分布,以及是測(cè)量函數(shù)或“收益函數(shù)”,那么對(duì)于的子集在離散分布下,假設(shè)概率質(zhì)量函數(shù)π(.):這里的思想在于,概率只是積分等式中的核,而不是決策之外的最終結(jié)果。2.2.24維特根斯坦的尺子“維特根斯坦的尺子”是一個(gè)哲學(xué)比喻:我們是在用尺子量桌子還是在用桌子量尺子?這主要取決于結(jié)果。假設(shè)存在兩種分布:高斯分布和冪律分布,我們認(rèn)為,當(dāng)出現(xiàn)一個(gè)超大偏差的時(shí)候,比如“6個(gè)標(biāo)準(zhǔn)差”事件意味著原分布屬于冪律分布。2.2.25黑天鵝總的來(lái)說(shuō),有些事件在你的預(yù)期和建模能力之外,而且其效應(yīng)極為顯著。好的方法不是去預(yù)測(cè)它們,而是對(duì)它們產(chǎn)生的影響呈現(xiàn)出凸性(至少不是凹性):我們能了解自身對(duì)某類事件的脆弱性,甚至可以對(duì)其量化衡量(考量二階影響和結(jié)果的非對(duì)稱性),但是想對(duì)它們做可信的統(tǒng)計(jì)處理基本上是癡心妄想。這一點(diǎn)向來(lái)很難跟建模人員解釋清楚,我們需要和從未見(jiàn)過(guò)(甚至從未想過(guò))的事物共處,但事實(shí)就是這樣。\h[1]注意認(rèn)知的維度。黑天鵝和觀察者相關(guān):火雞的黑天鵝對(duì)屠夫來(lái)說(shuō)是白天鵝。9·11恐怖襲擊事件對(duì)受害者來(lái)說(shuō)是黑天鵝,但對(duì)恐怖分子不是。這種觀察者依賴是一種中心化的性質(zhì)。一個(gè)所謂的“客觀”的黑天鵝概率模型不僅不存在,而且是對(duì)其自身意義的消解,因?yàn)樗陨砭驮谏⒉バ畔⒌牟煌陚湫??;姨禊Z:統(tǒng)計(jì)性質(zhì)上穩(wěn)定、低頻且有重大影響的大偏差被稱為“灰天鵝”。當(dāng)然,“灰”的程度取決于觀察者:冪律分布使用者的灰天鵝對(duì)困在薄尾框架體系下的天真的統(tǒng)計(jì)學(xué)家來(lái)說(shuō)就是黑天鵝。重申一下:黑天鵝不是肥尾,只是肥尾會(huì)讓它們變得更糟糕。肥尾和黑天鵝的聯(lián)系在于,肥尾區(qū)域的大偏差會(huì)放大黑天鵝的影響。\h[1]正如保羅·波爾泰西常說(shuō)的(這里可能是正確或是誤用了他的話)那樣:“你從未見(jiàn)過(guò)分布的另一面?!?.2.26經(jīng)驗(yàn)分布會(huì)超出經(jīng)驗(yàn)經(jīng)驗(yàn)分布的生存函數(shù)定義如下,假設(shè)X1,X2…Xn為獨(dú)立同分布實(shí)隨機(jī)變量,具有共同的累積分布函數(shù)F(t)。這里是指示函數(shù)。由格利文科-坎泰利定理可知,無(wú)論初始分布如何,最大范數(shù)都會(huì)收斂到單一分布,可以通過(guò)科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)來(lái)驗(yàn)證:這種和分布無(wú)關(guān)的收斂性主要考慮的是概率,而不是矩——本書作者由此出發(fā),探究了最大值之上的“隱藏矩”。我們可以看到如下結(jié)果(因?yàn)橹罉O值為0和1,頓斯科將其進(jìn)一步轉(zhuǎn)化為布朗橋):“經(jīng)驗(yàn)分布會(huì)超出經(jīng)驗(yàn)”的意思是,經(jīng)驗(yàn)分布一定會(huì)出現(xiàn)在某區(qū)間[xmin,xmax],此時(shí)肥尾分布會(huì)帶來(lái)巨大的問(wèn)題,因?yàn)槲覀儾皇窃诟怕士臻g,而是在收益空間分析肥尾。更進(jìn)一步的內(nèi)容見(jiàn)隱藏的尾部(下一小節(jié))。2.2.27隱藏的尾部假設(shè)Kn為n個(gè)獨(dú)立同分布隨機(jī)變量樣本的最大值,Kn=max(X1,X2…Xn),假設(shè)X分布的密度函數(shù)為,我們可以將矩分解為兩部分,在K0以上的部分為“隱藏矩”。這里μL是分布中可觀察的部分的矩,而μK是隱藏部分的矩(大于K)。格利文科-坎泰利定理告訴我們,μK,0應(yīng)該和X的分布無(wú)關(guān)。但是這一條對(duì)高階矩并不成立,所以科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)在這里存在問(wèn)題。2.2.28影子矩影子矩在本書中被稱為通過(guò)“插入式”估計(jì)來(lái)求解的矩。它不是直接用可觀察的樣本求均值,而是通過(guò)對(duì)分布參數(shù)進(jìn)行最大似然估計(jì)(如使用最大似然參數(shù)尾部指數(shù)α)得出影子均值。因?yàn)樵诜饰矖l件下直接可觀察的樣本均值存在偏差。2.2.29尾部依賴假設(shè)X1和X2是兩個(gè)不一定為同分布類型的隨機(jī)變量,假設(shè)是概率為q的逆CDF,也即,上尾依賴可以定義為:下尾依賴的定義與此類似。2.2.30元概率通過(guò)將變量隨機(jī)化這樣的技巧來(lái)比較兩個(gè)不同的概率分布?;蚴请S機(jī)化某個(gè)參數(shù)以得到對(duì)應(yīng)的分布,如看漲期權(quán)價(jià)格,VaR、CVaR等風(fēng)險(xiǎn)指標(biāo),并檢驗(yàn)結(jié)果分布的魯棒性或凸性。2.2.31動(dòng)態(tài)對(duì)沖標(biāo)的為S,到期時(shí)間為T的歐式看漲期權(quán)C的收益可以通過(guò)如下動(dòng)態(tài)對(duì)沖的方法得到復(fù)制,在當(dāng)前時(shí)間t和T之間:我們將時(shí)間區(qū)間分成n個(gè),這里的對(duì)沖比率是在時(shí)刻計(jì)算的,但是我們?cè)诠善鄙系玫降氖菍?duì)沖時(shí)刻和之間的價(jià)格差。理論上,的時(shí)候會(huì)使上式收斂到確定性收益。在高斯世界中,上式為伊藤-麥肯積分。但在這里我們看到,在肥尾條件所伴隨的漸進(jìn)性質(zhì)下,這樣的動(dòng)態(tài)復(fù)制完全不可能實(shí)現(xiàn)。第一部分肥尾及其效應(yīng)介紹第三章非數(shù)理視角概述——?jiǎng)虼髮W(xué)達(dá)爾文學(xué)院講義*,?\h[1]本章濃縮了整個(gè)肥尾效應(yīng)項(xiàng)目的主要思想,對(duì)研究結(jié)果進(jìn)行了非數(shù)理視角的全面展示,同時(shí)匯總了厚尾條件下的一系列統(tǒng)計(jì)推論。\h[1]研究討論章節(jié)。2017年1月27日,作者在英國(guó)劍橋大學(xué)達(dá)爾文學(xué)院講授了本章的簡(jiǎn)化版本。在這里,作者誠(chéng)摯地感謝李約瑟,朱利葉斯·魏茨德費(fèi)爾,以及他們的助手耐心、準(zhǔn)確地把講座轉(zhuǎn)錄成文本。同時(shí)還感謝蘇珊·普凡嫩施密特和奧利·彼得斯對(duì)一些錯(cuò)誤的修正。另外,在賈米勒·巴茲的建議下,本章添加了更多注釋,以方便經(jīng)濟(jì)學(xué)家和計(jì)量經(jīng)濟(jì)學(xué)家理解,說(shuō)不定最終能獲得他們的認(rèn)可。3.1薄尾和厚尾的差異我們通過(guò)劃分平均斯坦(薄尾)和極端斯坦(厚尾)這兩個(gè)類別來(lái)介紹厚尾的概念,由此展開(kāi)對(duì)厚尾和極端值的關(guān)系的研究。·在平均斯坦中,隨著樣本量逐漸擴(kuò)大,沒(méi)有任何單一的觀測(cè)可以真正改變統(tǒng)計(jì)特性?!ぴ跇O端斯坦中,尾部(罕見(jiàn)事件)在決定統(tǒng)計(jì)特性方面發(fā)揮了極大的作用。另外一種視角:假設(shè)有一個(gè)很大的偏離X?!ぴ谄骄固怪?,隨機(jī)變量連續(xù)兩次大于X的概率大于單次大于2X的概率。·在極端斯坦中,隨機(jī)變量單次大于2X的概率大于連續(xù)兩次大于X的概率。接下來(lái),我們?cè)谄骄固怪须S機(jī)選擇兩個(gè)人,假設(shè)兩人身高之和為4.1米(一個(gè)極小概率的尾部事件)。根據(jù)高斯分布(或者類似特性的單尾分布),最可能的情況是,兩人的身高均為2.05米,而不是10厘米和4米。簡(jiǎn)單來(lái)說(shuō),出現(xiàn)3個(gè)標(biāo)準(zhǔn)差之外事件的概率是0.00135,出現(xiàn)6個(gè)標(biāo)準(zhǔn)差(翻了一番)之外事件的概率為9.86×10?10,而連續(xù)兩次出現(xiàn)3個(gè)標(biāo)準(zhǔn)差之外事件的概率為1.8×10?6。因此,連續(xù)兩次出現(xiàn)3個(gè)標(biāo)準(zhǔn)差事件的概率遠(yuǎn)大于一次出現(xiàn)6個(gè)標(biāo)準(zhǔn)差事件的概率,這也是非厚尾分布帶來(lái)的結(jié)果。在圖3.1中,我們從出現(xiàn)兩個(gè)3倍標(biāo)準(zhǔn)差事件的概率除以6倍標(biāo)準(zhǔn)差事件的概率出發(fā),擴(kuò)展到計(jì)算出現(xiàn)兩個(gè)4倍標(biāo)準(zhǔn)差事件的概率除以一個(gè)8倍標(biāo)準(zhǔn)差事件的概率,等等。越往尾部延展(圖3.1的右側(cè)),我們會(huì)看到大偏差更可能來(lái)自多個(gè)中等偏差的和。換句話說(shuō),如果發(fā)生了一個(gè)很糟糕的事件,那么它應(yīng)該來(lái)自一系列不太常見(jiàn)的事件,而不是來(lái)自單次極端事件,這正是平均斯坦遵循的邏輯。圖3.1在高斯分布*下,出現(xiàn)兩次K和一次2K標(biāo)準(zhǔn)差事件之間的比值。K越大,即越處于尾部,極端事件來(lái)自兩次獨(dú)立K事件的可能性越大,即P(K)2,而來(lái)自一次2K事件的可能性越小。*這是為教學(xué)而做的簡(jiǎn)化。更嚴(yán)謹(jǐn)?shù)姆椒ㄊ潜容^出現(xiàn)兩次K和一次2K+1標(biāo)準(zhǔn)差事件的比值——但上圖的最終結(jié)果不變。接下來(lái)我們轉(zhuǎn)到極端斯坦,同樣隨機(jī)選取兩個(gè)人,且他們的財(cái)富之和為3600萬(wàn)美元。這時(shí)最可能的情況不是兩人都有1800萬(wàn)美元,而是一人擁有35999000美元,另一個(gè)人擁有1000美元。這個(gè)例子清晰地展示了兩個(gè)大類之間的差異,對(duì)于亞指數(shù)類分布來(lái)說(shuō),破產(chǎn)更可能來(lái)自某次極端事件,而不是一系列糟糕事件的累積。這一邏輯在20世紀(jì)早期由精算學(xué)家菲利普·倫德伯格提出[155],到20世紀(jì)30年代由哈拉爾德·克拉默整理完善[51],對(duì)傳統(tǒng)風(fēng)險(xiǎn)管理理論形成了巨大挑戰(zhàn)。但如今,很多經(jīng)濟(jì)學(xué)家完全忽視了這一點(diǎn)。從保險(xiǎn)的角度講,分散化有效的前提是,損失更可能來(lái)自一系列事件而不是單個(gè)事件。這一點(diǎn)也說(shuō)明,保險(xiǎn)只能在平均斯坦中起作用,在存在巨災(zāi)風(fēng)險(xiǎn)的情況下,永遠(yuǎn)不要出售一種損失無(wú)上限的保險(xiǎn),這一點(diǎn)被稱為災(zāi)難原則。正如我們之前所見(jiàn),偏離中心很遠(yuǎn)的極端事件扮演了非常重要的角色。黑天鵝的核心并非“頻繁出現(xiàn)”(這個(gè)詞經(jīng)常被這樣誤用),而在于出現(xiàn)時(shí)的影響更大。最肥的肥尾分布只會(huì)有一次非常大的極端偏離,而不是多次較大的偏離。下一章的圖4.4顯示,如果我們采用像高斯那樣的分布并開(kāi)始逐漸增肥尾部,那么超過(guò)給定標(biāo)準(zhǔn)差的樣本數(shù)量就會(huì)下降。事件落在一個(gè)標(biāo)準(zhǔn)差范圍內(nèi)的概率是68%。隨著尾部增肥,以金融市場(chǎng)的回報(bào)為例,一個(gè)事件落在一個(gè)標(biāo)準(zhǔn)差內(nèi)的概率會(huì)上升到75%至95%。所以請(qǐng)注意,尾部增肥會(huì)讓峰度更高,肩部縮小,發(fā)生大偏差的概率會(huì)增加。這是因?yàn)?,概率之和?(哪怕在法國(guó)也是如此),概率密度在某一區(qū)域的升高會(huì)導(dǎo)致另一區(qū)域密度的降低。3.2直觀理解:搖尾巴的狗狗尾搖狗效應(yīng)總的來(lái)說(shuō),分布的尾部越厚,狗尾搖狗的作用越大。也就是說(shuō),信息主要集中在尾部,而較少存在于分布的“軀干”(中心部分)。實(shí)際上,對(duì)極度厚尾的現(xiàn)象來(lái)說(shuō),除了真正的尾部大偏差,所有普通偏差包含的信息量都很小。這樣一來(lái),分布的中間部分完全變成了噪聲,雖然“基于實(shí)證”的科學(xué)研究可能無(wú)法理解這一點(diǎn)。但在此類情況下,中心部分并不包含“實(shí)證”的信息。該性質(zhì)也解釋了在存在尾部大偏差的領(lǐng)域中,由于單次樣本的信息含量很低,大數(shù)定律作用緩慢。該性質(zhì)還解釋了為什么觀察到100萬(wàn)只白天鵝依然不能否認(rèn)黑天鵝的存在,或者為什么進(jìn)行100萬(wàn)次肯定性觀察還趕不上一次否定性觀察。在本章后面我們會(huì)將其與波普爾的非對(duì)稱性聯(lián)系起來(lái)。它也解釋了為什么人們永遠(yuǎn)不該比較由尾部驅(qū)動(dòng)的隨機(jī)變量(如流行?。┖陀绍|干驅(qū)動(dòng)的隨機(jī)變量(如在游泳池中溺水的人數(shù))。可以參考論文中系統(tǒng)性風(fēng)險(xiǎn)對(duì)政策制定的啟示(西里洛、塔勒布,2020)[48]。圖3.2兩個(gè)獨(dú)立高斯分布的密度等高線。直線為x+y=4.1,可以直觀地看到,最大概率出現(xiàn)在x=y=2.05處。圖3.3兩個(gè)獨(dú)立厚尾分布的密度等高線(冪律分布類),直線為x+y=36,可以直觀地看到,最大概率出現(xiàn)在x=36?ε或y=36?ε處,隨著x+y變大,ε會(huì)趨于0。圖3.4和圖3.3相同的密度等高線,但是輔助直線和冪律分布的外側(cè)等高線相切。我們可以看到,等高線越來(lái)越像一個(gè)十字,用術(shù)語(yǔ)表示為聯(lián)合分布失去了橢圓特性。3.3一種(更合理的)厚尾分類方式及其效應(yīng)下面我們先以一種簡(jiǎn)單的分類來(lái)考量厚尾的程度(本書后面會(huì)逐步深入展開(kāi)),不同分布按厚尾的嚴(yán)重程度排序如下:分布特征:厚尾分布?亞指數(shù)分布?冪律分布(帕累托分布)排在前面的是入門級(jí)厚尾分布,這一類包括了所有尾部厚度超過(guò)正態(tài)的分布,如在一個(gè)正負(fù)標(biāo)準(zhǔn)差之內(nèi)的概率大于﹝誤差函數(shù)erf是高斯分布的積分﹞且峰度高于3﹝隨機(jī)變量X的p階矩是X的p次方的期望,﹞的各類分布。排在第二的是滿足我們之前實(shí)驗(yàn)的亞指數(shù)分布(災(zāi)難原則),在觸及冪律分布之前,這類分布并不算真正意義上的厚尾,因?yàn)槠浣y(tǒng)計(jì)性質(zhì)并不由罕見(jiàn)事件主導(dǎo)。換句話說(shuō),這類分布的各階矩依然存在。排在第三的分布有很多種名稱,有的被稱為冪律分布,有的被稱為正規(guī)變化分布,或“帕累托尾”分布。這些才是真正的厚尾分布,且肥尾程度依賴于其尾部參數(shù)。這里暫時(shí)不展開(kāi)討論尾部參數(shù),我們可以認(rèn)為這類分布的某階矩?zé)o窮大,并且高于該階的矩均為無(wú)窮大。下面我們對(duì)著圖3.6從下往上看,最左下角的是退化分布,只有一種可能的結(jié)果(不存在隨機(jī)性,沒(méi)有變化)。在這之上是伯努利分布,只有兩種可能的結(jié)果,沒(méi)有其他可能性。再往上是兩種高斯分布,分別為自然高斯分布(允許出現(xiàn)正負(fù)無(wú)窮)和從隨機(jī)游走中求和而來(lái)的高斯分布(緊支撐,除非我們用無(wú)窮多的變量來(lái)求和﹝緊支撐的意思是,實(shí)數(shù)隨機(jī)變量X在一個(gè)有界范圍內(nèi)取值,如[a,b]、(a,b]、[a,b)等等。由于高斯分布有偏差呈指數(shù)e?x2下降的趨勢(shì),所以阿德里安·杜阿迪等人把高斯分布?xì)w為緊支撐。﹞)。這兩種高斯分布完全不同,一個(gè)允許到無(wú)窮,另一個(gè)不允許(極限趨近不算)。然后,在高斯分布之外是不屬于冪律類分布的亞指數(shù)分布,這類分布的各階矩都存在。亞指數(shù)分布包含對(duì)數(shù)正態(tài)分布,這里我們經(jīng)常搞混,這也是統(tǒng)計(jì)領(lǐng)域中最奇怪的事情之一,對(duì)數(shù)正態(tài)分布在方差較小的時(shí)候是薄尾分布,而在方差較大的時(shí)候是厚尾分布。有些人看到手上的數(shù)據(jù),發(fā)現(xiàn)不是冪律分布而是對(duì)數(shù)正態(tài)分布,以為是件好事,但事實(shí)并非如此。第八章我們會(huì)展開(kāi)討論對(duì)數(shù)正態(tài)分布的奇怪特性。圖3.5當(dāng)觀測(cè)值數(shù)目n增大時(shí),均值的分布會(huì)發(fā)生怎樣的變化?這是圖3.5在分布/概率空間的表達(dá)。肥尾分布并不像高斯分布那樣很快就壓縮到中心。你需要更大的樣本集來(lái)求解,事實(shí)就是這樣。圖3.6不同收斂性下的厚尾分類圖(大數(shù)定律的收斂性)以及經(jīng)驗(yàn)外推問(wèn)題的嚴(yán)重程度,冪律分布類用白色表示,其余用黃色表示,見(jiàn)恩布列切等[82]。亞指數(shù)類中的分布不滿足克拉默條件,從而使保險(xiǎn)成為可能,可以回顧本章開(kāi)始時(shí)的小實(shí)驗(yàn)(如圖3.1所示)。更嚴(yán)謹(jǐn)?shù)刂v,克拉默條件意味著隨機(jī)變量的指數(shù)期望存在。﹝數(shù)學(xué)描述:假設(shè)有隨機(jī)變量X,克拉默條件意味著:對(duì)所有r>0,是求期望操作符。﹞一旦離開(kāi)了黃色區(qū)域,也即大數(shù)定律(LLN)起作用的區(qū)域\h[1],中心極限定律將不再有效\h[2],然后將面臨收斂性問(wèn)題。在這里,我們會(huì)遇到冪律分布,將根據(jù)尾部指數(shù)α來(lái)區(qū)分其厚尾程度,尾部指數(shù)越小,尾部越肥。當(dāng)時(shí),我們稱其為超立方分布(α=3時(shí)是立方分布)。按照非正式的邊界劃分:分布只存在一階矩和二階矩,此時(shí)理論上大數(shù)定律和中心極限定理依然有效。然后是的分布類,我們簡(jiǎn)單歸納為列維穩(wěn)定分布[雖然該類也包含α<2的冪律分布,但在理論上,當(dāng)我們對(duì)該類隨機(jī)變量求和時(shí),由于廣義中心極限定理(GCLT)的存在,總和最終會(huì)落在和原來(lái)相同的分布類型中,而不是向高斯分布收斂]。從這里開(kāi)始我們會(huì)遇到一些問(wèn)題,因?yàn)榉讲畈辉俅嬖?。在的情況下,雖然方差不存在,但是平均絕對(duì)偏差依然存在(變量的平均絕對(duì)值差異)。再往上到最外層頂部,連均值都不存在了。我們將其稱為“別想了”。如果看到這一類分布,你就徑直回家,不用再談?wù)撍?。?duì)傳統(tǒng)的統(tǒng)計(jì)學(xué)家來(lái)說(shuō),處理厚尾的方法向來(lái)是假設(shè)一個(gè)不同于正態(tài)的分布,然后一切照舊,使用相同的統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)測(cè)試和置信度區(qū)間進(jìn)行研究。而一旦離開(kāi)上述黃色區(qū)域,再使用常規(guī)統(tǒng)計(jì)手段,事情就不像我們想的那樣了。下一節(jié)我們會(huì)介紹隨之而來(lái)的十幾個(gè)衍生問(wèn)題,幾乎都是終極問(wèn)題。后面我們會(huì)引入一些術(shù)語(yǔ),并給出更數(shù)量化的表達(dá)。將統(tǒng)計(jì)過(guò)度標(biāo)準(zhǔn)化帶來(lái)的問(wèn)題統(tǒng)計(jì)估計(jì)基于兩大基本元素:中心極限定理(假設(shè)對(duì)“大量”變量求和成立,從而很方便地將一切都?xì)w到正態(tài)分布上)和大數(shù)定律(當(dāng)樣本規(guī)模增加的時(shí)候預(yù)測(cè)方差降低)。但是事情并沒(méi)有那么簡(jiǎn)單,我們需要考慮一些注意事項(xiàng)。在第八章中,我們將展示取樣是如何依賴于分布,并在同一分布類中展現(xiàn)出巨大差異的。布紹和波特[27]與索內(nèi)特[214]認(rèn)為,在隨機(jī)變量求和的過(guò)程中,某些方差有限但高階矩?zé)o限的分布可以在的范圍內(nèi)收斂到高斯分布,也即在這個(gè)中心范圍內(nèi)成為高斯分布,但是較遠(yuǎn)的尾部區(qū)域則不再如此——而恰恰是較遠(yuǎn)的尾部決定了主要的統(tǒng)計(jì)性質(zhì)。人生正是在漸進(jìn)過(guò)程中展開(kāi)的。遺憾的是,在經(jīng)典的《統(tǒng)計(jì)學(xué)百科全書》[147]關(guān)于統(tǒng)計(jì)估計(jì)的條目中,霍夫丁寫道:統(tǒng)計(jì)量的實(shí)際分布通常非常復(fù)雜,很難進(jìn)行處理。因此,人們需要更簡(jiǎn)單、性質(zhì)更清晰的分布來(lái)近似描述實(shí)際分布。而概率論中的極限定理為這種近似提供了重要工具。經(jīng)典的中心極限定理表明,一般情況下,大量獨(dú)立隨機(jī)變量的和近似于正態(tài)分布。實(shí)際上,在所有可能的分布中,正態(tài)分布占絕對(duì)主導(dǎo)地位。這里引用格涅堅(jiān)科和科爾莫戈羅夫的論述([111],第5章):然而,對(duì)于限制獨(dú)立隨機(jī)變量的和分布收斂到正態(tài)分布這一規(guī)律,除了通過(guò)使變量無(wú)窮?。ɑ驖u近于常數(shù)),就只有對(duì)求和本身進(jìn)行限制了。如果想要收斂到另一種極限分布,則求和函數(shù)本身需要一些非常特殊的性質(zhì)。此外,許多統(tǒng)計(jì)量的漸進(jìn)行為類似于獨(dú)立隨機(jī)變量的和。上述這些都有助于解釋正態(tài)分布作為漸進(jìn)分布的重要性。那么,在尚未達(dá)到高斯分布時(shí)應(yīng)該怎么辦?我們的人生對(duì)應(yīng)的是漸進(jìn)階段,這也是本書要探討的內(nèi)容。\h[3]\h[1]讀者目前可以將大數(shù)定律(LLN)簡(jiǎn)單理解如下:如果有一個(gè)分布存在有限的均值,并且不斷將獨(dú)立的該分布隨機(jī)變量相加求平均——也就是說(shuō),隨著樣本量逐漸變大——最終結(jié)果會(huì)收斂到均值。收斂速度有多快呢?這正是本書討論的關(guān)鍵問(wèn)題。\h[2]我們之后將不斷討論中心極限定理(CLT),不過(guò)這里先給出直觀的解釋:在二階矩有限的情況下,n個(gè)獨(dú)立隨機(jī)變量的和最終會(huì)逼近高斯分布。這個(gè)事兒很神奇,但速度有多快呢?從理論上說(shuō),從冪律分布出發(fā)需要無(wú)窮多的隨機(jī)變量求和,也就是說(shuō)幾乎永遠(yuǎn)不會(huì)達(dá)到高斯分布。第七章會(huì)討論極限分布并回答其核心問(wèn)題:CLT和LLN的收斂速度“有多快”?速度有多快是一件非常重要的事情,因?yàn)樵诂F(xiàn)實(shí)世界中,我們根本找不到n等于無(wú)窮大的東西。\h[3]這里邀請(qǐng)本書讀者查閱各類教科書或在線百科全書中的“統(tǒng)計(jì)估計(jì)”條目?;旧喜豢赡艹霈F(xiàn)“如果沒(méi)有達(dá)到漸進(jìn)極限會(huì)發(fā)生什么”的相關(guān)討論——即使是9500頁(yè)的經(jīng)典《統(tǒng)計(jì)學(xué)百科全書》也沒(méi)有提及。此外,如果問(wèn)一個(gè)經(jīng)常使用統(tǒng)計(jì)方法的人,不同分布下需要多少數(shù)據(jù)來(lái)估計(jì)統(tǒng)計(jì)量,你不要驚訝于其荒謬的回答。主要問(wèn)題在于,人們的大腦中裝了太多統(tǒng)計(jì)工具,而他們從未進(jìn)行過(guò)深入推理。用一句格言來(lái)總結(jié):“統(tǒng)計(jì)從來(lái)都不是標(biāo)準(zhǔn)的?!?.4肥尾分布的主要效應(yīng)及其與本書的關(guān)聯(lián)圖3.7衡量不公平的測(cè)度(比如基尼系數(shù))在厚尾條件下需要完全不同的估計(jì)方法,我們會(huì)在第三部分討論這個(gè)問(wèn)題。追求科學(xué)并不容易。當(dāng)移到上述黃色區(qū)域(經(jīng)典統(tǒng)計(jì)的舒適區(qū))之外時(shí),會(huì)出現(xiàn)如下效應(yīng):效應(yīng)1在現(xiàn)實(shí)世界中,大數(shù)定律即便有效,其奏效速度也會(huì)很慢。讀者可能無(wú)法想象,僅這一條就否定了絕大多數(shù)統(tǒng)計(jì)估計(jì)方法,如圖3.8所示。在第八章我們會(huì)進(jìn)一步討論,區(qū)分統(tǒng)計(jì)估計(jì)不同類型的分布所需的樣本量。\h[1]效應(yīng)2樣本均值大概率不會(huì)貼近分布的實(shí)際均值,尤其是遇到偏態(tài)分布(或單尾分布)時(shí),均值的估計(jì)量會(huì)持續(xù)被小樣本效應(yīng)主導(dǎo)(即被低估或高估)。這是樣本不足問(wèn)題的另一種體現(xiàn),沒(méi)有一個(gè)極度厚尾-單尾分布可以用樣本均值來(lái)估計(jì)總體均值,想要直接估計(jì)的前提是擁有近乎無(wú)限的數(shù)據(jù)。\h[2]比如,一般的冪律分布(符合80/20法則的分布)會(huì)有92%的觀察值落在真實(shí)均值以下。為了讓樣本均值有意義,我們需要遠(yuǎn)遠(yuǎn)超出我們正常所能擁有的數(shù)據(jù)量(經(jīng)濟(jì)學(xué)專家從未真正理解這一點(diǎn),但交易員對(duì)此有直觀感受)。針對(duì)這一問(wèn)題,我們會(huì)在章節(jié)3.8繼續(xù)討論,并在第十五章“影子均值”中詳細(xì)論證。此外,在章節(jié)3.8中,我們還會(huì)進(jìn)一步介紹隱藏統(tǒng)計(jì)量的概念,不僅是均值,用樣本來(lái)估計(jì)總體也會(huì)導(dǎo)致方差被低估。圖3.8大數(shù)定律體現(xiàn)了樣本均值收斂的速度,而在極端斯坦下收斂速度極慢。這里以高斯分布和尾部指數(shù)1.13的帕累托分布為例(帕累托80/20分布),保持上述分布的絕對(duì)平均偏差相同并觀察收斂效果。該結(jié)論適用于所有需要樣本統(tǒng)計(jì)的領(lǐng)域,比如投資組合理論。效應(yīng)3方差和標(biāo)準(zhǔn)差這樣的統(tǒng)計(jì)量是不可用的。即使分布背后的統(tǒng)計(jì)量存在,甚至各階統(tǒng)計(jì)量均存在,它們?cè)跇颖局庖惨欢〞?huì)失效,這一點(diǎn)我們會(huì)在第四章展開(kāi)討論。很多人喜歡用標(biāo)準(zhǔn)差(經(jīng)常被誤認(rèn)為是平均偏差)作為衡量離散程度的指標(biāo),這屬于一種看似科學(xué)的謬誤,因?yàn)橹挥性谧罾硐氲那闆r下,標(biāo)準(zhǔn)差才能勉強(qiáng)地正確估計(jì)離散程度。效應(yīng)4貝塔系數(shù)、夏普比率和其他慣用的金融統(tǒng)計(jì)量均無(wú)參考意義。這是上一條效應(yīng)的簡(jiǎn)單推論。\h[3]如果依賴這些統(tǒng)計(jì)量,我們要么需要更多的數(shù)據(jù),要么需要某種尚未被發(fā)現(xiàn)的模型。圖3.9展示了夏普比率在樣本外的糟糕的預(yù)測(cè)能力——幾乎起到完全相反的效果。然而,很多人還是執(zhí)迷不悟,沉浸在看似科學(xué)的分析數(shù)字中。圖3.9橫軸代表各個(gè)對(duì)沖基金在2008年之前的夏普比率,縱軸代表它們?cè)诮鹑谖C(jī)中損失的標(biāo)準(zhǔn)差。夏普比率不僅對(duì)樣本之外的表現(xiàn)完全沒(méi)有預(yù)測(cè)作用,甚至不能作為一個(gè)有效防止破產(chǎn)的指標(biāo)。感謝拉斐爾·杜阿迪。實(shí)際上,所有經(jīng)濟(jì)金融領(lǐng)域的變量和證券回報(bào)都是厚尾分布的。我們統(tǒng)計(jì)了超過(guò)4萬(wàn)只證券的時(shí)間序列,沒(méi)有一只滿足薄尾分布,這也是經(jīng)濟(jì)金融研究中最大的誤區(qū)。理論金融學(xué)家有時(shí)會(huì)得出一些極其不嚴(yán)謹(jǐn)?shù)慕Y(jié)論,如“哪怕收益是厚尾分布的,只要分布的前兩階矩存在,均值方差投資組合理論就成立”(這實(shí)際上是加入了分布橢圓特性的條件,后面會(huì)進(jìn)一步討論)。實(shí)際上,即使存在方差,我們也不知道其精確性如何。一個(gè)隨機(jī)變量二階矩的尾部會(huì)比該變量本身的尾部更厚,所以,統(tǒng)計(jì)量服從極其緩慢的大數(shù)定律。而且,隨機(jī)變量的相關(guān)性或協(xié)方差也會(huì)以厚尾的形式存在(失去橢圓特性),從而使統(tǒng)計(jì)估計(jì)失效。在經(jīng)濟(jì)學(xué)術(shù)領(lǐng)域,所有使用協(xié)方差矩陣的論文都很可疑。詳情見(jiàn)第四章(單變量分布)和第六章(多變量分布)。效應(yīng)5穩(wěn)健統(tǒng)計(jì)并不穩(wěn)健,經(jīng)驗(yàn)估計(jì)會(huì)超出經(jīng)驗(yàn)。以我個(gè)人的經(jīng)歷為例,穩(wěn)健統(tǒng)計(jì)的概念如同一個(gè)惡作劇,但是絕大多數(shù)專家并未意識(shí)到它有多么可笑。首先,穩(wěn)健統(tǒng)計(jì)尋求一種既不想對(duì)統(tǒng)計(jì)框架進(jìn)行大改動(dòng),又想要處理尾部事件的方法論。這是一種完全錯(cuò)誤的穩(wěn)健概念:如果統(tǒng)計(jì)量不隨尾部事件發(fā)生大幅變化,可能僅僅因?yàn)闃颖景奈膊啃畔⒉蛔?。而且,這種方法對(duì)研究期望收益毫無(wú)幫助。其次,穩(wěn)健統(tǒng)計(jì)屬于“非參估計(jì)”,人們一般認(rèn)為,不引入?yún)?shù)可以讓整個(gè)分析變得不太依賴于底層分布,但實(shí)際上,這樣做只會(huì)讓事情變得更糟糕。移除樣本極值的縮尾法會(huì)扭曲期望值,并讓信息減少——不過(guò)檢查一下異常值也好,看看它到底是真實(shí)的異常還是“數(shù)據(jù)錯(cuò)誤”(筆誤或計(jì)算機(jī)故障)造成的偽異常。所謂非參數(shù)的“經(jīng)驗(yàn)分布”完全沒(méi)有經(jīng)驗(yàn)性的借鑒意義(而且會(huì)在尾部的期望收益上造成誤導(dǎo)),至少在金融和風(fēng)險(xiǎn)管理領(lǐng)域是這樣的,第十章會(huì)進(jìn)一步討論。這里可以簡(jiǎn)單解釋如下:如果沒(méi)有科學(xué)的外推方法,從過(guò)去的數(shù)據(jù)中簡(jiǎn)單估計(jì)未來(lái)的極值,偏差會(huì)很大。這就像有人想通過(guò)修筑堤壩來(lái)防止洪水,簡(jiǎn)單的“經(jīng)驗(yàn)”分布會(huì)基于歷史最高水位,也就是說(shuō),更高水位的概率為0。但是反過(guò)來(lái)想,歷史最高水位在成為最高水位之前肯定要超越之前的最高水位,因此,經(jīng)驗(yàn)分布已經(jīng)被突破。在厚尾分布下,過(guò)去極大值和未來(lái)期望極大值的差異會(huì)遠(yuǎn)遠(yuǎn)大于薄尾分布。效應(yīng)6最小二乘線性回歸失效(高斯-馬爾可夫定理不成立)。如圖3.10所示,最小二乘回歸背后的原理是高斯-馬爾可夫定理,要求變量滿足薄尾分布,這樣才能通過(guò)所有數(shù)據(jù)點(diǎn)擬合出唯一的直線。而在肥尾條件下,我們需要遠(yuǎn)遠(yuǎn)多于預(yù)期的數(shù)據(jù)來(lái)最小化偏差平方和(高斯-馬爾可夫定理依然成立,但是現(xiàn)實(shí)世界的數(shù)據(jù)是有限的,而不是無(wú)限的,所以其效果近似于不成立),或者因?yàn)樽兞慷A矩不存在,我們可能無(wú)法求解。在二階矩不存在的情況下,如果僅僅最小化平均絕對(duì)偏差(MAD),一方面我們會(huì)面臨數(shù)據(jù)不足的問(wèn)題,另一方面我們求得的斜率也可能不唯一。圖3.10在厚尾條件下,我們可以對(duì)同樣的樣本擬合出完全不同的直線(線性回歸所需的高斯-馬爾可夫定理不再成立)。左圖:常規(guī)回歸的結(jié)果。右圖:嘗試補(bǔ)償大偏差得出的回歸線——可以看作某種“對(duì)沖比率”,補(bǔ)償了大偏差但是對(duì)小偏差數(shù)據(jù)的誤差很大,如果忽視大偏差,結(jié)果就是災(zāi)難性的。這里的樣本并不包含大偏差值,但回歸時(shí)會(huì)通過(guò)“影子均值”的方法進(jìn)行估計(jì)。我們?cè)谡鹿?jié)6.7中會(huì)進(jìn)一步討論,由于厚尾的小樣本效應(yīng),回歸樣本內(nèi)的決定系數(shù)(R2)遠(yuǎn)遠(yuǎn)大于真實(shí)值。當(dāng)隨機(jī)變量方差無(wú)窮大的時(shí)候,R2應(yīng)該等于0。但是,因?yàn)榛貧w樣本量必然有限,R2會(huì)給出高于0的欺騙性結(jié)果。因此,在厚尾條件下,R2不僅完全沒(méi)有意義,還會(huì)因?yàn)楦吖罆r(shí)不時(shí)產(chǎn)生十足的欺騙作用(就像智商研究一樣)。效應(yīng)7極大似然估計(jì)對(duì)于部分分布參數(shù)的估計(jì)依然有效(好消息)。以冪律分布為例,我們可以估計(jì)其分布的形狀參數(shù)和尾部指數(shù)(本書用α表示\h[4]),以幫助我們更好地理解分布,然后從分布反向估計(jì)均值,其效果會(huì)遠(yuǎn)好于直接用樣本均值估計(jì)整體期望。示例:一個(gè)簡(jiǎn)單帕累托分布(最小值L,尾部指數(shù)α,的期望是(一個(gè)和α相關(guān)的函數(shù))。因此,我們可以從這兩個(gè)參數(shù)出發(fā)(其中一個(gè)已知),通過(guò)插入式估計(jì)量獲得均值。我們可以直觀估計(jì)α(或者采用低方差的極大似然估計(jì),這里α滿足倒伽馬分布),然后計(jì)算得到均值。這樣的均值估計(jì)比直接求樣本均值要準(zhǔn)確得多。讓我們?cè)購(gòu)?qiáng)調(diào)一下上述邏輯:通過(guò)擬合尾部指數(shù)α的方法,可以獲得數(shù)據(jù)中沒(méi)有出現(xiàn)的小概率尾部信息,而且該信息對(duì)分布均值有巨大的影響。這一方法可以推廣到基尼系數(shù)和其他的不平均估計(jì)量上。因此,在一些情況下,我們可以針對(duì)尾部指數(shù)構(gòu)建函數(shù),從而得到更可靠(或者至少?zèng)]有那么不可靠)的統(tǒng)計(jì)量,當(dāng)然,僅僅是在一些情況下。接下來(lái),我們要面臨一個(gè)現(xiàn)實(shí)世界中的問(wèn)題:如果沒(méi)有靠譜的統(tǒng)計(jì)量怎么辦?那最好還是在家里待著,我們不能把自己暴露在脆弱性的風(fēng)險(xiǎn)之下。不過(guò),如果可以鎖定最大損失,我們就可以做出承擔(dān)風(fēng)險(xiǎn)的決策。效應(yīng)8經(jīng)驗(yàn)可證實(shí)和可證偽之間的差距遠(yuǎn)比常規(guī)統(tǒng)計(jì)能覆蓋的范圍更大,即不能證明和證明不可行之間的差異變得更大了。(所謂“基于證據(jù)”的科學(xué)除非經(jīng)過(guò)嚴(yán)格的驗(yàn)證,否則通常是經(jīng)驗(yàn)外推的,其證據(jù)既不充分,也不算科學(xué)。)作者此前和認(rèn)知語(yǔ)言學(xué)家兼科普作家斯蒂芬·平克有過(guò)一次爭(zhēng)論:從最近的數(shù)據(jù)變化中得出結(jié)論(或歸納出理論)并不可行,除非滿足一定的置信度條件,這就需要在厚尾條件下有更多的數(shù)據(jù)(和緩慢大數(shù)定律的邏輯相同)。因此,根據(jù)最近一年或十年非自然死亡人數(shù)的下降,得出“暴力致死行為有所下降”這樣的結(jié)論并不科學(xué)。科學(xué)論斷之所以和奇聞逸事不同,是因?yàn)樗鼘?duì)樣本外發(fā)生的事情有預(yù)測(cè)作用,統(tǒng)計(jì)意義顯著。這里我再次強(qiáng)調(diào),統(tǒng)計(jì)意義不顯著的結(jié)論并不算真正的科學(xué)。不過(guò),說(shuō)暴力行為在某次觀察中上升則可能是一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)論斷。在薄尾的情況下解讀描述性統(tǒng)計(jì)量的做法可能是可以接受的(因?yàn)轱@著結(jié)論所需的樣本量不大),但在厚尾情況下肯定不行,除非包含尾部信息的超大偏差重復(fù)出現(xiàn)在樣本集中。效應(yīng)9主成分分析(PCA)和因子分析很可能會(huì)產(chǎn)生錯(cuò)誤的結(jié)論。這一點(diǎn)比較專業(yè),通過(guò)主成分分析這樣的降維方法,樣本不足的問(wèn)題可以轉(zhuǎn)換為大型隨機(jī)向量。這是大數(shù)定律問(wèn)題的高維表達(dá)。圖3.26從PCA數(shù)據(jù)不足的角度很好地表述了魏格納效應(yīng)。用專業(yè)的語(yǔ)言表述,就是馬爾琴科-帕斯圖爾分布無(wú)法應(yīng)用于四階矩不存在的情況(或是尾部指數(shù)超過(guò)4的情況)。\h[5]圖3.11在厚尾條件下,一犯錯(cuò)誤就完了;而在薄尾條件下,犯錯(cuò)誤可以成為寶貴的學(xué)習(xí)機(jī)會(huì)。資料來(lái)源:《你曾有份工作》。(圖中文字為:我從犯錯(cuò)中學(xué)到了太多東西,以至我想再犯點(diǎn)兒錯(cuò)誤。)效應(yīng)10矩估計(jì)法(MoM)失效,高階矩意義不大,甚至可能不存在。當(dāng)年獲得諾貝爾獎(jiǎng)的廣義矩估計(jì)法也不成立。里面的細(xì)節(jié)很多,可以先這么理解:如果高階矩?zé)o限大,通過(guò)矩來(lái)估計(jì)分布就行不通,因?yàn)槊恳唤M樣本都會(huì)得出一個(gè)不同的矩,正如后面所展示的標(biāo)準(zhǔn)普爾500指數(shù)四階矩。簡(jiǎn)單來(lái)說(shuō),厚尾分布的高階矩會(huì)呈爆炸式上升,尤其是在經(jīng)濟(jì)領(lǐng)域。效應(yīng)11不存在所謂典型的大偏差。在考慮出現(xiàn)大偏差的情況下,厚尾變量的條件偏差并不收斂,尤其是在極度厚尾條件下(如冪律尾分布),這一點(diǎn)和我們之前看到的災(zāi)難原則類似。在高斯分布中,隨機(jī)變量變動(dòng)大于4倍標(biāo)準(zhǔn)差的條件期望約等于4倍標(biāo)準(zhǔn)差。而對(duì)冪律分布來(lái)說(shuō),條件期望會(huì)數(shù)倍于該值,我們稱其為林迪效應(yīng),第五章和第十一章會(huì)進(jìn)一步討論。效應(yīng)12基尼系數(shù)不可加。衡量基尼系數(shù)的方法是樣本外推法,因此還是無(wú)法擺脫上面的問(wèn)題,也即樣本均值會(huì)高估或低估真實(shí)均值。這里有一個(gè)額外的復(fù)雜點(diǎn),基尼系數(shù)在厚尾下具備超可加性。隨著樣本空間的增大,常規(guī)的基尼系數(shù)無(wú)法有效揭示真實(shí)的財(cái)富集中度。(換句話說(shuō),一個(gè)大陸,比如歐洲大陸,其收入的不平等程度可能超過(guò)其成員國(guó)收入不平等程度的加權(quán)值。)不僅是基尼系數(shù),這一結(jié)論同樣適用于集中度的其他衡量指標(biāo),如前1%的人擁有財(cái)富總量的x%等。第十三章和第十四章會(huì)有專門論述。效應(yīng)13大偏差理論無(wú)法應(yīng)用于厚尾。在厚尾條件下,大偏差理論完全失效。\h[6]大偏差定律在薄尾條件下非常有用(瓦拉丹[260],登博和澤圖尼[59],等),但是也僅限于此,我們會(huì)在附錄C和第七章討論極限理論時(shí)再提及。效應(yīng)14動(dòng)態(tài)對(duì)沖永遠(yuǎn)不可能對(duì)沖掉期權(quán)的所有風(fēng)險(xiǎn)。這一條也比較專業(yè),非金融領(lǐng)域的讀者可能不感興趣。金融領(lǐng)域布萊克-斯科爾斯期權(quán)定價(jià)模型的對(duì)沖基礎(chǔ)完全建立在動(dòng)態(tài)對(duì)沖的可行性和必要性之上,而在第二十章和第二十一章中我們會(huì)證明兩者都存在問(wèn)題。有效的動(dòng)態(tài)對(duì)沖要求誤差呈指數(shù)下降,也即統(tǒng)計(jì)分布必須超出亞指數(shù)類分布。這里我們討論的實(shí)際上是克拉默條件——最終都可以歸結(jié)為指數(shù)矩問(wèn)題。本書的作者是一位期權(quán)交易員,而對(duì)交易員來(lái)說(shuō),期權(quán)并不是由動(dòng)態(tài)對(duì)沖的方式定價(jià)的——在整個(gè)期權(quán)交易的歷史上都是如此。效應(yīng)15預(yù)測(cè)頻率與預(yù)測(cè)期望收益有巨大差異。效應(yīng)16在心理學(xué)和決策論中,大多數(shù)有關(guān)“高估尾部概率”和“非理性行為”的結(jié)論都來(lái)自研究人員對(duì)尾部風(fēng)險(xiǎn)的誤解。比如,混淆概率和期望收益,誤用統(tǒng)計(jì)分布,以及忽視極值理論(EVT)。上面兩點(diǎn)在下一章會(huì)展開(kāi)討論:只考慮頻率不考慮期望的錯(cuò)誤在薄尾條件下不算太嚴(yán)重,但是在厚尾條件下會(huì)有巨大影響,其結(jié)果見(jiàn)圖3.12和圖3.13。圖3.12心理學(xué)研究中的概率校準(zhǔn):x軸是預(yù)測(cè)者估計(jì)的概率,y軸是實(shí)際發(fā)生的概率。比如某人預(yù)測(cè)下雨的概率是30%,且實(shí)際上有30%的時(shí)間會(huì)下雨,那么這稱為“完美校準(zhǔn)”。只有在學(xué)術(shù)領(lǐng)域,我們才把這種校準(zhǔn)放在頻率空間,把現(xiàn)實(shí)生活中的錯(cuò)誤預(yù)測(cè)作為一個(gè)二元事件來(lái)考量,這一點(diǎn)在厚尾條件下問(wèn)題很大。第十一章將詳細(xì)討論這一點(diǎn)。圖3.13在冪律條件下,上圖對(duì)概率的估計(jì)誤差會(huì)轉(zhuǎn)變成下圖的收益誤差。這里使用的是帕累托分布(尾部指數(shù)α=1.15)。同樣,這一點(diǎn)第十一章將詳細(xì)討論。效應(yīng)17在厚尾條件下,破產(chǎn)問(wèn)題的嚴(yán)重性更甚,同時(shí)需要考慮遍歷性。相關(guān)的討論比較專業(yè),本章末尾會(huì)有解釋。下面我們就一些要點(diǎn)展開(kāi)討論。3.4.1預(yù)測(cè)在《隨機(jī)漫步的傻瓜》一書中,某人被問(wèn),到月底市場(chǎng)更有可能上漲還是下跌?他表示上漲的可能性更大,但后來(lái)發(fā)現(xiàn),他在押注市場(chǎng)下跌。對(duì)不懂概率的人來(lái)說(shuō),這似乎很矛盾,但是對(duì)交易員來(lái)說(shuō)再正常不過(guò)了,尤其是在非標(biāo)準(zhǔn)分布的條件下(確實(shí),市場(chǎng)更有可能上漲,但如果下跌會(huì)跌得更多)。這個(gè)例子表明,人們常?;煜A(yù)測(cè)和風(fēng)險(xiǎn)敞口(預(yù)測(cè)的結(jié)果是二元的,而風(fēng)險(xiǎn)敞口的結(jié)果更多元,取決于整個(gè)分布的狀態(tài))。在這個(gè)例子中,一個(gè)非?;镜腻e(cuò)誤是,將發(fā)生概率理解為單個(gè)數(shù)字而非分布結(jié)果,而在進(jìn)一步研究之后,我們會(huì)發(fā)現(xiàn)很多并不明顯或不為人知的類似的悖論式問(wèn)題。簡(jiǎn)單來(lái)說(shuō),作者認(rèn)為,將“概率”作為最終標(biāo)的,甚至作為決策的“基礎(chǔ)”來(lái)討論并不嚴(yán)謹(jǐn)。在現(xiàn)實(shí)世界中,一個(gè)人所獲得的不是概率,而是直接的財(cái)富(或生存權(quán)利等)。這時(shí),分布的尾部越肥,就越需要關(guān)心收益空間——俗話說(shuō)得好:“收益遠(yuǎn)勝于概率?!比绻稿e(cuò)的成本夠低,決策者可以經(jīng)常犯錯(cuò),只要收益是凸性的(也即當(dāng)他正確的時(shí)候會(huì)獲得很大的收益)。反過(guò)來(lái)說(shuō),決策者可以在預(yù)測(cè)的準(zhǔn)確率達(dá)到99.99%的情況下破產(chǎn)(實(shí)際上,破產(chǎn)的可能性說(shuō)不定更大:在2008—2009年金融危機(jī)期間,破產(chǎn)的基金恰恰是那些之前業(yè)績(jī)無(wú)可挑剔的基金\h[7])。正如《動(dòng)態(tài)對(duì)沖》[225]一書所討論的那樣(對(duì)非量化金融領(lǐng)域的讀者來(lái)說(shuō),可能專業(yè)性略強(qiáng)),這是相同行權(quán)價(jià)的香草期權(quán)和二元期權(quán)之間的區(qū)別。違背直覺(jué)的是,肥尾效應(yīng)降低了二元期權(quán)的價(jià)值,同時(shí)提高了香草期權(quán)的價(jià)值。正如作者的格言所說(shuō):“我從未見(jiàn)過(guò)有錢的預(yù)言家?!奔臃饰膊繒?huì)導(dǎo)致高于1個(gè)標(biāo)準(zhǔn)差的事件的概率下降,但對(duì)應(yīng)的后果會(huì)加重(就對(duì)矩的貢獻(xiàn)而言,比如對(duì)平均值或其他指標(biāo)的影響),我們會(huì)在章節(jié)4.3.1中具體展開(kāi)。圖3.12展示了這個(gè)問(wèn)題的嚴(yán)重程度。評(píng)論1概率預(yù)測(cè)誤差(“校準(zhǔn)”)與真實(shí)世界中的損益變化(或真實(shí)收益)屬于完全不同的概率類別?!靶?zhǔn)”是一種衡量預(yù)測(cè)準(zhǔn)確程度的方法,聚焦于概率空間——介于0和1之間。無(wú)論所預(yù)測(cè)的隨機(jī)變量是否為厚尾分布,校準(zhǔn)對(duì)應(yīng)的所有標(biāo)準(zhǔn)測(cè)度都是薄尾的(而且因?yàn)橛薪?,必然是超薄尾的)。另外,現(xiàn)實(shí)世界中的收益可能是厚尾的,因此這種“校準(zhǔn)”的分布將遵循隨機(jī)變量本身的特性。我們會(huì)在第十一章給出完整的推導(dǎo)和證明。\h[1]我們定義的漸進(jìn)性是n很大但不為無(wú)窮大時(shí)的求和性質(zhì),這也是本書的焦點(diǎn)之一。\h[2]樣本均值是我們對(duì)總體取樣后的平均值。顯然,我們能接觸到的都是樣本均值。有時(shí)我們也可以拿到總體數(shù)據(jù),如財(cái)富或者戰(zhàn)爭(zhēng)傷亡的分布,但此時(shí)總體均值和樣本會(huì)有較大偏差。這里我們可以通過(guò)“影子均值”的概念,從產(chǎn)生數(shù)據(jù)的本質(zhì)過(guò)程或機(jī)理中求解期望。\h[3]簡(jiǎn)單來(lái)說(shuō),貝塔系數(shù)是表征資產(chǎn)A在多大程度上會(huì)受到總體市場(chǎng)變動(dòng)(或者某個(gè)給定的市場(chǎng)基準(zhǔn)或指數(shù)變動(dòng))影響的統(tǒng)計(jì)量。用公式表達(dá)為資產(chǎn)A與市場(chǎng)收益的協(xié)方差除以市場(chǎng)收益的方差。夏普比率表達(dá)的是某資產(chǎn)或策略的平均回報(bào)(或超額回報(bào))除以自身的標(biāo)準(zhǔn)差。\h[4]厘清一下術(shù)語(yǔ),在本書中,用α表示的尾部指數(shù)是指log大于K的生存函數(shù)除以logK的極限,對(duì)柯西分布來(lái)說(shuō)等于1。有些研究者會(huì)用相應(yīng)概率密度函數(shù)中的α-1表示。\h[5]用更專業(yè)一點(diǎn)兒的話表述,一般當(dāng)相關(guān)性為0時(shí),主成分相互獨(dú)立。但是對(duì)于肥尾分布來(lái)說(shuō),相關(guān)性為0并不能推導(dǎo)出相互獨(dú)立,我們會(huì)在章節(jié)6.3.1中展開(kāi)講解。\h[6]不要弄混大偏差理論(LDT)和極值理論(EVT),EVT可以覆蓋所有主要的分布類型。\h[7]R.杜阿迪,來(lái)自風(fēng)險(xiǎn)數(shù)據(jù)(RiskData)關(guān)于在2008年金融危機(jī)中清盤的基金的數(shù)據(jù),作者通過(guò)個(gè)人交流方式獲知。3.4.2大數(shù)定律下面我們來(lái)討論大數(shù)定律,作為統(tǒng)計(jì)學(xué)的基礎(chǔ),大數(shù)定律告訴我們,當(dāng)增加觀測(cè)值時(shí),樣本均值會(huì)逐漸變得穩(wěn)定,收斂速率約為。圖3.8顯示,在肥尾分布下,均值要趨于穩(wěn)定需要更多的觀察值?!暗葍r(jià)”并不簡(jiǎn)單。極端斯坦下收益遠(yuǎn)勝于概率為了考量平均斯坦和極端斯坦之間的差異,我們以飛機(jī)失事為例。假設(shè)100~400人在事件中喪生(令人痛心),也即一個(gè)獨(dú)立的負(fù)面事件,對(duì)預(yù)測(cè)和風(fēng)險(xiǎn)管理來(lái)說(shuō),我們會(huì)盡可能最小化此類風(fēng)險(xiǎn),使其可以忽略不計(jì)。接下來(lái),我們考慮一種特殊的飛機(jī)失事事件,該事件會(huì)殺死所有乘坐飛機(jī)的人,包括所有過(guò)去乘坐過(guò)飛機(jī)的人。那么這還是同一類型的事件嗎?后者屬于極端斯坦,而對(duì)于這樣的事件,我們不考慮概率,而是關(guān)注其影響?!?duì)于第一種類型的事件,管理者主要考慮降低其發(fā)生概率——事件的發(fā)生頻率。這里我們會(huì)數(shù)發(fā)生的次數(shù),并嘗試減少。·對(duì)于第二種類型的事件,主要在于降低事件發(fā)生時(shí)造成的影響。這時(shí)我們不計(jì)算概率,而是衡量其影響。如果覺(jué)得上述實(shí)驗(yàn)有些奇怪,你可以考慮一下1982年美國(guó)央行在危機(jī)中失去了之前歷史上賺到的所有錢,存貸行業(yè)(現(xiàn)在已經(jīng)不復(fù)存在)也出現(xiàn)過(guò)同樣的事情,銀行系統(tǒng)在2008—2009年賠掉了之前所有的利潤(rùn)。我們會(huì)經(jīng)常看到,某人在單次市場(chǎng)事件中賠掉之前的所有積蓄。而同樣的事情會(huì)在很多行業(yè)發(fā)生,如汽車業(yè)和航空業(yè)。上面的銀行僅僅和錢有關(guān),對(duì)于戰(zhàn)爭(zhēng),我們就無(wú)法只關(guān)注頻率而不考慮其量級(jí)了,正如科普作家斯蒂芬·平克所說(shuō)[194],第十六章會(huì)討論這一點(diǎn)。這里還不考慮本節(jié)末尾提到的破產(chǎn)問(wèn)題(和非遍歷性)。更嚴(yán)格地說(shuō),如果想讓原始的概率值有意義,我們就要讓一系列事件滿足非亞指數(shù)的克拉默條件。上述類比是本書作者和極富洞察力的拉斯·羅伯特在一次經(jīng)濟(jì)學(xué)討論的播客中提出的。在統(tǒng)計(jì)現(xiàn)象中,最知名的是帕累托分布(即80/20法則),如20%的意大利人擁有80%的土地。表3.1顯示,在高斯分布下需要取30個(gè)觀測(cè)值才能使均值達(dá)到穩(wěn)定的區(qū)間,而在帕累托分布下需要1011個(gè)觀測(cè)值才能使誤差達(dá)到同樣的水平(假設(shè)均值存在)。盡管

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論