




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
概述現(xiàn)實(shí)生活中,有很多諸如需要確定客戶(hù)買(mǎi)或不買(mǎi)某種商品、銀行客戶(hù)信用好或不好等情況這時(shí),某個(gè)事件以多大概率出現(xiàn)和哪些影響量決定該概率的問(wèn)題尤為重要如果用狀態(tài)1(購(gòu)買(mǎi))和0(不買(mǎi))的因變量(Y)表示事件,則事件發(fā)生的概率P有如下關(guān)系:P(y=0)+P(y=1)=1當(dāng)前1頁(yè),總共41頁(yè)。由于這類(lèi)問(wèn)題的因變量是類(lèi)別變量,無(wú)法應(yīng)用回歸方程來(lái)解決邏輯回歸是通過(guò)回歸方程,確定概率的期望值一種通過(guò)分析影響因素,來(lái)得到某種結(jié)果的概率分為二項(xiàng)邏輯回歸和多項(xiàng)邏輯回歸當(dāng)前2頁(yè),總共41頁(yè)。當(dāng)前3頁(yè),總共41頁(yè)。當(dāng)前4頁(yè),總共41頁(yè)。建立邏輯回歸方程例子:超市的銷(xiāo)售主管想知道,顧客收入水平是否對(duì)購(gòu)買(mǎi)新的高級(jí)黃油產(chǎn)品有影響。為此,他選擇了12位顧客,調(diào)查他們的月凈收入(x)及是否購(gòu)買(mǎi)了該類(lèi)黃油產(chǎn)品購(gòu)買(mǎi)記為{y=1},未購(gòu)買(mǎi)記為{y=0}調(diào)查結(jié)果如下:當(dāng)前5頁(yè),總共41頁(yè)。購(gòu)買(mǎi)黃油=-0.749+0.000336×收入當(dāng)前6頁(yè),總共41頁(yè)。邏輯回歸不是要估計(jì)二元變量的觀察值,而是要明確這些觀察值的出現(xiàn)概率通常把狀態(tài){y=1}看作“事件y發(fā)生”,而狀態(tài){y=0}為“事件不發(fā)生”假設(shè)存在一個(gè)非經(jīng)驗(yàn)觀察到的隱變量z,它能對(duì)應(yīng)自變量的狀態(tài)xj給出因變量y的二元水平當(dāng)前7頁(yè),總共41頁(yè)。y通過(guò)隱變量與xj建立聯(lián)系:邏輯函數(shù):(1)(2)(1)、(2)構(gòu)成邏輯回歸方程。z值稱(chēng)為L(zhǎng)ogit當(dāng)前8頁(yè),總共41頁(yè)。當(dāng)前9頁(yè),總共41頁(yè)。分析過(guò)程邏輯回歸分析可分為五個(gè)步驟:(1)建模(2)估計(jì)邏輯回歸函數(shù)(3)解釋回歸系數(shù)(4)檢驗(yàn)?zāi)P驼w(5)檢驗(yàn)特征變量當(dāng)前10頁(yè),總共41頁(yè)。(1)建模邏輯回歸分析的前提也是使用者首先根據(jù)實(shí)施邏輯思考確定,哪些事件應(yīng)作為可能的因變量類(lèi)型,哪些影響量決定事件類(lèi)型的概率,從而提出關(guān)于自變量和因變量可能關(guān)系的假設(shè)自變量和事件{y=1}的出現(xiàn)概率間的連帶關(guān)系假設(shè)當(dāng)前11頁(yè),總共41頁(yè)。二元邏輯回歸:因變量是二元的,即只有0和1兩個(gè)水平;因變量多于兩類(lèi)的,多元邏輯回歸分析自變量也稱(chēng)為共變量,可以是基數(shù)測(cè)度和非基數(shù)測(cè)度,也可“混合”xj自變量線性組合z指數(shù)連接eZ邏輯連接P(y=1)聯(lián)合影響量Logit可能性比P(y=1)/P(y=0)出現(xiàn)概率當(dāng)前12頁(yè),總共41頁(yè)。數(shù)據(jù)當(dāng)前13頁(yè),總共41頁(yè)。(2)估計(jì)邏輯回歸函數(shù)通常用極大似然估計(jì)法估計(jì)模型的參數(shù),目的是使觀察到的調(diào)查數(shù)據(jù)的概率最大,來(lái)確定反映自變量權(quán)重的邏輯回歸模型參數(shù)bj若對(duì)每個(gè)觀察個(gè)體k考慮如下關(guān)系式:當(dāng)前14頁(yè),總共41頁(yè)。Newton-Raphson算法合成一個(gè)方程:似然函數(shù):求解:判別準(zhǔn)則:Pk>0.5,把個(gè)體分入{y=1};否則分入{y=0}當(dāng)前15頁(yè),總共41頁(yè)。確定zk值(Logit)的回歸方程:zk×可涂抹性k+1.119×保質(zhì)期k將原始數(shù)據(jù)代入回歸方程Y=1Y=0當(dāng)前16頁(yè),總共41頁(yè)。(3)解釋回歸系數(shù)自變量xj與概率Pk(y=1)間不存在線性關(guān)系,導(dǎo)致回歸系數(shù)間不能相互比較,無(wú)法直接解釋回歸系數(shù)當(dāng)前17頁(yè),總共41頁(yè)。常數(shù)項(xiàng)只影響邏輯函數(shù)的水平位置。為正時(shí),邏輯函數(shù)左移;為負(fù)時(shí),邏輯函數(shù)右移回歸系數(shù)影響邏輯函數(shù)的走向。回歸系數(shù)較大時(shí),概率值很快接近邏輯函數(shù)的邊緣負(fù)的回歸系數(shù)使事件{y=1}的概率隨x值增大而減小,而正回歸系數(shù)則使事件{y=1}的概率隨x值增大而增大當(dāng)前18頁(yè),總共41頁(yè)。邏輯回歸的發(fā)生比:邏輯回歸的Logit:z=Logit=ln(發(fā)生比)當(dāng)前19頁(yè),總共41頁(yè)?!翱赏磕ㄐ浴钡幕貧w系數(shù)為負(fù),該變量降低了人造黃油的購(gòu)買(mǎi)概率;“保質(zhì)期”的回歸系數(shù)為正,它對(duì)購(gòu)買(mǎi)概率產(chǎn)生正向影響;若自變量增加1單位,則有利于事件{y=1}的可能性比(發(fā)生比)擴(kuò)大ebj倍發(fā)生比說(shuō)明了變量對(duì)出現(xiàn)概率的影響程度,發(fā)生比也稱(chēng)為效應(yīng)系數(shù)當(dāng)前20頁(yè),總共41頁(yè)。正、負(fù)回歸系數(shù)對(duì)事件{y=1}的出現(xiàn)概率的影響:當(dāng)前21頁(yè),總共41頁(yè)。(4)檢驗(yàn)?zāi)P驼w需要回答兩個(gè)問(wèn)題:參數(shù)估計(jì)在整體中能多有效地描述定義的回歸模型?是否存在極端觀察個(gè)體,應(yīng)把它看作離群者剔除掉,還是由于其經(jīng)常出現(xiàn)而改變模型?回歸方程的評(píng)價(jià)指標(biāo):基于對(duì)數(shù)似然函數(shù)的評(píng)價(jià);偽R2統(tǒng)計(jì)量;分類(lèi)結(jié)果的評(píng)價(jià);當(dāng)前22頁(yè),總共41頁(yè)。似然比值檢驗(yàn)(LikelihoodRatioTest)該方法將考慮所有解釋變量最大的LL值與所有自變量的回歸系數(shù)都為0且僅考慮常數(shù)項(xiàng)時(shí)所得出的LL值比較若兩偏差的絕對(duì)差較小,則自變量對(duì)區(qū)分y水平的貢獻(xiàn)小;若偏差絕對(duì)差較大,則認(rèn)為自變量的解釋能力強(qiáng);考慮所有解釋變量時(shí)LL最大值給定數(shù)據(jù)組的零模型的LL最大值LLvLL0當(dāng)前23頁(yè),總共41頁(yè)。似然比值檢驗(yàn)(LR檢驗(yàn))的假設(shè):H0:所有回歸系數(shù)都等于0H1:所有回歸系數(shù)都不等于0零模型和完整模型的偏差作為檢驗(yàn)統(tǒng)計(jì)量,它近似服從自由度為J(自變量個(gè)數(shù))的卡方分布在本例中,LL0=30.498,LLv=15.818,卡方值為14.68;卡方表中值5.99(自由度2,α=0.05),故模型是顯著的當(dāng)前24頁(yè),總共41頁(yè)。偽R2統(tǒng)計(jì)量偽R2統(tǒng)計(jì)量試圖量化回歸模型中已解釋“變化”比例;通常McF-R2值達(dá)到0.2或0.4以上就已認(rèn)為模型擬合度良好;LR檢驗(yàn)回答了模型顯著性以及結(jié)果能夠運(yùn)用到總體的問(wèn)題,McF-R使自變量的判別能力總和可用數(shù)值表示,并可在不同模型間相互比較當(dāng)前25頁(yè),總共41頁(yè)。Cox&Snell-R2:L0:零模型的似然LV:完整模型的似然K:樣本容量當(dāng)前26頁(yè),總共41頁(yè)。Nagelkerke-R2:該值大于0.5時(shí)認(rèn)為模型解釋能力非常好當(dāng)前27頁(yè),總共41頁(yè)。分類(lèi)結(jié)果評(píng)價(jià)將由自變量水平0和1表示的實(shí)際觀察組屬性與由回歸方程算出的概率相比較通常使用概率0.5作為分類(lèi)的判別值把出現(xiàn)概率Pk(y=1)>0.5的個(gè)體分入人造黃油的購(gòu)買(mǎi)者(M),其他分入未購(gòu)買(mǎi)者(N)當(dāng)前28頁(yè),總共41頁(yè)。分類(lèi)矩陣(Confusion-Matrix)判對(duì)比例(hitratio)=判對(duì)數(shù)目/總數(shù)=20/24=0.833當(dāng)前29頁(yè),總共41頁(yè)。如果樣本容量允許,把隨機(jī)樣本分成兩個(gè)子樣本:一個(gè)分析樣本和一個(gè)檢驗(yàn)樣本(Holdout-sample)。分析樣本用于估計(jì)邏輯回歸函數(shù),然后根據(jù)此函數(shù)將檢驗(yàn)樣本中的元素分類(lèi),并計(jì)算判對(duì)比率;當(dāng)前30頁(yè),總共41頁(yè)。PressQ檢驗(yàn)該檢驗(yàn)統(tǒng)計(jì)量服從自由度為1的卡方分布取α=0.05,查得臨界值為3.84,故該分類(lèi)結(jié)果與隨機(jī)分類(lèi)結(jié)果有顯著差別當(dāng)前31頁(yè),總共41頁(yè)。重要模型擬合度評(píng)價(jià)指標(biāo)總結(jié)當(dāng)前32頁(yè),總共41頁(yè)。離群者診斷除了說(shuō)明邏輯回歸方程的整體擬合度外,單個(gè)觀察個(gè)體對(duì)模型整體有效性有何作用也很重要邏輯估計(jì)的模型關(guān)系與調(diào)查數(shù)據(jù)擬合度不佳的基本原因有兩個(gè):模型不合適;存在許多個(gè)體(觀察值),不具有模型所描述的關(guān)系,并由于其特殊的變量水平明顯偏離結(jié)果;當(dāng)前33頁(yè),總共41頁(yè)。對(duì)于第二種情況,通過(guò)確定每個(gè)個(gè)體的單獨(dú)殘差可說(shuō)明在觀察中是否存在“離群者”,對(duì)個(gè)體k殘差如下:通常認(rèn)為殘差絕對(duì)值大于0.5(兩組情況下)為離群者,并導(dǎo)致分類(lèi)錯(cuò)誤為了更好地辨認(rèn)出此類(lèi)離群者,采用一種加權(quán)方法,標(biāo)準(zhǔn)化殘差:當(dāng)前34頁(yè),總共41頁(yè)。當(dāng)前35頁(yè),總共41頁(yè)。對(duì)第三位受訪者,他購(gòu)買(mǎi)了人造黃油{y=1},根據(jù)他的評(píng)價(jià)(可涂抹性=6,保質(zhì)期=5),用估計(jì)出來(lái)的邏輯方程計(jì)算出購(gòu)買(mǎi)概率為0.073,其標(biāo)準(zhǔn)化殘差值為3.589,明顯將該受訪者分類(lèi)錯(cuò)誤必須深入分析離群者的情況,以解釋極端位置的原因,通??紤]如下原因:(1)受訪者回答問(wèn)題的方式反常,把該觀察值去除;(2)大的殘差值表明模型的解釋能力差,模型中未考慮重要影響量,需擴(kuò)展或修正模型當(dāng)前36頁(yè),總共41頁(yè)。(5)檢驗(yàn)特征變量
似然比檢驗(yàn)LR檢驗(yàn)也可用于與簡(jiǎn)約模型的比較。分別令一個(gè)回歸系數(shù)為0,構(gòu)建不同的簡(jiǎn)約模型,再寫(xiě)出完整模型(LLV)和一個(gè)簡(jiǎn)約模型(LLR)的-2倍對(duì)數(shù)似然之差相應(yīng)的零假設(shè)為:H0:回歸系數(shù)bj的效應(yīng)為0;H1:回歸系數(shù)bj的效應(yīng)不為0當(dāng)前37頁(yè),總共41頁(yè)。完整模型(LLV)和一個(gè)簡(jiǎn)約模型(LLR)的-2倍對(duì)數(shù)似然之差所形成的檢驗(yàn)統(tǒng)計(jì)量服從卡方分布,自由度為兩模型參數(shù)個(gè)數(shù)之差。若僅檢驗(yàn)一個(gè)變量,則自由度等于1當(dāng)前38頁(yè),總共41頁(yè)。Wald統(tǒng)計(jì)量分母是bj的標(biāo)準(zhǔn)差W基本服從自由度為1的卡方分布回歸系數(shù)標(biāo)準(zhǔn)誤差Walddf顯著水平可涂抹性保質(zhì)期常數(shù)項(xiàng)-1.9431.1193.5280.7980.5862.3385.9243.6452.2761110.0150.0560.131當(dāng)前39頁(yè),總共41頁(yè)。多項(xiàng)邏輯回歸
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025農(nóng)產(chǎn)品買(mǎi)賣(mài)合同模板
- 水閘消防安全知識(shí)培訓(xùn)課件
- 水粉畫(huà)草叢中的鴨子課件
- 鄉(xiāng)鎮(zhèn)水源保護(hù)方案
- 小升初語(yǔ)文古詩(shī)鑒賞知識(shí)點(diǎn)銜接-《曲》練習(xí)(含答案)
- 橋梁檢測(cè)設(shè)備選型與使用方案
- 學(xué)生宿舍節(jié)能設(shè)計(jì)與技術(shù)應(yīng)用方案
- 水電驗(yàn)收課件第五元素
- 水電站業(yè)務(wù)知識(shí)培訓(xùn)課件簡(jiǎn)報(bào)
- 二零二五年度新能源設(shè)備采購(gòu)及運(yùn)營(yíng)合作協(xié)議
- 陜西省特種設(shè)備隱患排查清單(2025年)
- 快遞行業(yè)交通安全培訓(xùn)
- 貨款轉(zhuǎn)讓協(xié)議書(shū)
- 燃?xì)夤炯託庹静僮饕?guī)程及安全要求
- 裝修砸墻安全協(xié)議書(shū)
- DB4407∕T 70-2021 地理標(biāo)志產(chǎn)品 新會(huì)陳皮
- 送水工勞務(wù)合同協(xié)議
- 讀博協(xié)議和合同
- 2025CACA子宮頸癌診療指南解讀
- 2025年第34屆全國(guó)中學(xué)生物理競(jìng)賽預(yù)賽試卷及答案(完整版)
- 骨科護(hù)理10分鐘小講課
評(píng)論
0/150
提交評(píng)論