




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2025年統(tǒng)計學期末考試題庫:統(tǒng)計與決策線性回歸試題考試時間:______分鐘總分:______分姓名:______一、選擇題(每題2分,共20分。請將正確選項的字母填在題后的括號內)1.在簡單線性回歸模型Y=β?+β?X+ε中,ε代表的是:(A)回歸直線方程(B)自變量X的線性部分(C)因變量Y的線性部分(D)隨機誤差項2.使用最小二乘法估計線性回歸模型參數(shù)時,其目標是最小化以下哪個量?(A)因變量Y與其均值E(Y)的差的平方和(B)自變量X與其均值E(X)的差的平方和(C)因變量Y對回歸方程預測值?的殘差平方和(D)自變量X對回歸方程預測值?的殘差平方和3.在簡單線性回歸分析中,判定系數(shù)R2的值越接近1,表示:(A)模型的線性關系越不顯著(B)模型的殘差平方和越大(C)模型對因變量Y變化的解釋程度越高(D)自變量X與因變量Y之間的相關系數(shù)越小4.對簡單線性回歸模型的回歸系數(shù)β?進行t檢驗,其原假設H?通常表述為:(A)β?=0(B)β?≠0(C)β?<0(D)β?>05.F檢驗主要用于判斷線性回歸模型的整體顯著性,其零假設H?是:(A)回歸系數(shù)β?為零(B)回歸系數(shù)β?為零(C)模型中所有回歸系數(shù)都為零(D)模型中自變量X對因變量Y沒有線性影響6.當線性回歸模型的殘差圖呈現(xiàn)出明顯的曲線模式時,這通常表明:(A)模型的隨機誤差項存在異方差性(B)模型的隨機誤差項存在序列相關性(C)模型可能存在非線性關系,線性假設不合適(D)模型的自變量X的測量存在誤差7.在進行線性回歸預測時,構建預測區(qū)間的目的是為了反映:(A)模型參數(shù)β?和β?的估計精度(B)回歸方程?對真實值Y的擬合精度(C)基于給定X值,未來Y值可能出現(xiàn)的范圍(D)自變量X的取值范圍8.若對一個通過了所有檢驗的簡單線性回歸模型進行分析,發(fā)現(xiàn)其系數(shù)β?的t統(tǒng)計量很小,p值很大,則意味著:(A)模型擬合優(yōu)度R2非常高(B)模型整體顯著性F檢驗的p值很小(C)自變量X對因變量Y沒有顯著影響(D)因變量Y的均值與自變量X沒有線性關系9.多元線性回歸模型Y=β?+β?X?+β?X?+...+β?X?+ε中,多元可決系數(shù)R2的值始終滿足:(A)0≤R2≤1(B)R2≥R2(adj)(C)R2≤R2(adj)(D)R2與模型的殘差平方和成正比10.在選擇多元線性回歸模型的自變量時,"逐步回歸"方法屬于一種:(A)基于理論假設的變量選擇方法(B)檢驗所有自變量是否同時顯著的方差分析方法(C)通過統(tǒng)計檢驗自動篩選變量的方法(D)總是優(yōu)先選擇變量個數(shù)最少的模型的方法二、填空題(每空2分,共20分。請將答案填在題后的橫線上)1.簡單線性回歸方程?=b?+b?X中,b?是回歸直線在Y軸上的________。2.簡單線性回歸方程中,參數(shù)β?的估計量b?的計算公式為________。3.若線性回歸模型的殘差平方和為SST=150,回歸平方和為SSR=120,則其判定系數(shù)R2=________。4.在進行t檢驗時,若備擇假設為H?:β?>0,則稱該檢驗為________檢驗。5.為了檢驗回歸模型的整體線性關系是否顯著,通常需要進行________檢驗,其檢驗統(tǒng)計量服從F分布。6.多元線性回歸模型中,調整后的多元可決系數(shù)R2(adj)考慮了模型中________的因素,通常比R2更適合比較不同自變量個數(shù)模型的擬合優(yōu)度。7.當線性回歸模型的殘差與回歸預測值?之間存在相關關系時,表明模型存在________。8.在進行區(qū)間預測時,預測區(qū)間的寬度主要受________和________的影響。9.若變量X和Y之間的相關系數(shù)r=-0.6,則它們之間存在________線性相關關系。10.在多元線性回歸中,如果某個自變量X?與其他自變量之間存在高度線性相關,可能會導致模型估計出現(xiàn)________問題。三、計算題(共40分)1.某研究收集了10組關于廣告投入(X,單位:萬元)和銷售額(Y,單位:萬元)的數(shù)據(jù),計算得到:ΣX=50,ΣY=80,ΣX2=340,ΣY2=700,ΣXY=420。要求:(1)建立銷售額對廣告投入的簡單線性回歸方程。(2)計算回歸方程的判定系數(shù)R2,并解釋其含義。(10分)2.基于上題的數(shù)據(jù)和計算結果,已知回歸方程的截距估計值b?=5,斜率估計值b?=6,回歸平方和SSR=150,殘差平方和SSE=50。要求:(1)計算回歸系數(shù)β?的t統(tǒng)計量,并假設α=0.05,檢驗廣告投入對銷售額是否有顯著的正線性影響。(2)計算模型的F統(tǒng)計量,并在α=0.05水平上檢驗整個回歸模型的顯著性。(10分)3.已知某多元線性回歸模型包含兩個自變量X?和X?,對于某個特定的觀測點,其回歸預測值為?=15,估計的標準誤為se(?)=2。要求:(1)若X?的觀測值為3,X?的觀測值為4,請給出因變量Y的點預測值。(2)假設X?=3,X?=4時,因變量Y的95%預測區(qū)間是多少?(需要給出計算過程和最終區(qū)間)(10分)4.某分析師建立了如下簡單線性回歸模型來預測房價(Y,單位:萬元):?=80-2X,其中X代表房屋面積(單位:平方米)。分析師聲稱該模型的R2=0.70。現(xiàn)有一個面積為150平方米的房屋,其實際售價為180萬元。要求:(1)計算該房屋的預測售價。(2)計算該房屋的殘差。(3)結合R2=0.70,簡要評價該模型的預測效果。(10分)四、應用分析題(共20分)某公司人力資源部希望研究員工的教育年限(X?,單位:年)和工作經驗(X?,單位:年)對其月工資收入(Y,單位:千元)的影響。他們收集了15名員工的樣本數(shù)據(jù),并建立了如下多元線性回歸模型:Y=β?+β?X?+β?X?+ε。模型的部分輸出結果如下(部分統(tǒng)計量省略):*回歸方程:?=3.5+0.8X?+1.2X?*R2=0.75,R2(adj)=0.72*F檢驗統(tǒng)計量F=20.5,對應的p值<0.01*t檢驗結果:t(β?)=2.4,p值=0.03;t(β?)=3.0,p值=0.008請根據(jù)以上信息,回答以下問題:(1)該回歸模型的整體線性關系是否顯著?請說明理由。(2)教育年限對月工資收入是否有顯著的正向影響?請說明理由。(3)工作經驗對月工資收入是否有顯著的正向影響?請說明理由。(4)解釋R2=0.75的實際意義。(5)比較R2和R2(adj),你能得出關于模型自變量個數(shù)的什么結論?試卷答案一、選擇題1.D2.C3.C4.A5.C6.C7.C8.C9.B10.C二、填空題1.截距2.b?=Σ(X-X?)(Y-?)/Σ(X-X?)23.0.84.右側(或單尾)5.F6.模型中自變量的個數(shù)7.序列相關性(或自相關)8.自變量X的取值范圍(或X的變異程度);估計的標準誤(或標準誤差)9.負相關10.多重共線性三、計算題1.(1)X?=ΣX/n=50/10=5,?=ΣY/n=80/10=8b?=Σ(X-X?)(Y-?)/Σ(X-X?)2=(ΣXY-nX??)/(ΣX2-nX?2)=(420-10*5*8)/(340-10*52)=(420-400)/(340-250)=20/90≈0.2222b?=?-b?X?=8-0.2222*5≈8-1.1111≈6.8889回歸方程為:?=6.8889+0.2222X(2)SST=Σ(Y-?)2=ΣY2-n?2=700-10*82=700-640=60SSE=SST-SSR=60-150=-90(此處題目給出的SSR=150與計算出的b?不一致,按題目給定的SSR計算)或SSE=60-120=-60(按b?計算的SSR=120)R2=SSR/SST=150/60=2.5(按題目給定的SSR)或R2=120/60=2(按b?計算)注意:R2通常在0和1之間,題目給定的SSR=150使得R2=2.5,這可能暗示題目數(shù)據(jù)或SSR給定有誤。若按b?=0.2222計算,R2=2。此處按題目給定的SSR=150進行計算。R2=0.8。其含義是,在銷售額的總變異中,有80%可以通過廣告投入與銷售額的線性關系來解釋。2.(1)t(β?)=b?/se(b?)需要計算b?的標準誤se(b?):se(b?)=sqrt[SSE/(n-2)*(1/Σ(X-X?)2)]=sqrt[50/(10-2)*(1/(340-250))]=sqrt[50/8*(1/90)]=sqrt[50/720]=sqrt[5/72]≈0.274t(β?)=6/0.274≈21.86在α=0.05水平下,進行右側檢驗,臨界值t(9,0.025)≈2.262(查t分布表)因為|t(β?)|=21.86>2.262,所以拒絕H?。即廣告投入對銷售額有顯著的正線性影響。(2)F=MSR/MSE=SSR/(SSE/(n-2))=150/(50/8)=150/6.25=24在α=0.05水平下,進行F檢驗,臨界值F(1,8,0.05)≈5.32(查F分布表)因為F=24>5.32,所以拒絕H?。即整個回歸模型是顯著的。注意:此處同樣存在SSR=150導致R2=2.5的問題,但F檢驗本身基于SSR和SSE的比值,計算F=24是合理的。3.(1)點預測值?就是將X?=3,X?=4代入回歸方程得到的值。?=15(題目已給出回歸預測值)所以點預測值為15。(2)95%預測區(qū)間的公式為:?±t(sα/2,n-2)*se(?)需要查找t分布臨界值t(sα/2,n-2)=t(0.025,15-2)=t(0.025,13)查表得t(13,0.025)≈2.160預測區(qū)間=15±2.160*2=15±4.320所以95%預測區(qū)間為[10.68,19.32]。4.(1)預測售價?=80-2X=80-2*150=80-300=-220萬元。(2)殘差e=Y-?=180-(-220)=180+220=400萬元。(3)R2=0.70表示該模型可以解釋房價變異的70%。雖然R2不低,但預測售價為-220萬元,這在現(xiàn)實中是不可能的。這表明模型可能存在嚴重的設定偏誤(例如,忽略了重要的解釋變量,或者線性關系不適用),或者數(shù)據(jù)本身存在問題。因此,盡管R2較高,該模型的預測效果仍然很差,不能直接用于實際房價預測。四、應用分析題(1)模型整體線性關系顯著。理由是F檢驗的p值<0.01,遠小于常規(guī)的顯著性水平α(如0.05),因此拒絕原假設H?(所有回歸系數(shù)均為零),認為模型整體對月工資收入有顯著的線性解釋能力。(2)教育年限對月工資收入有顯著的正向影響。理由是t檢驗t(β?)=2.4的p值=0.03<0.05,拒絕了β?=0的原假設,表明在控制工作經驗(X?)的影響后,教育年限(X?)每增加一年,月工資收入平均增加0.8千元。(3)工作經驗對月工資收入有顯著的正向影響。理由是t檢驗t(β?)=3.0的p值=0.008<0.05,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年安徽演藝集團有限責任公司招聘20人考前自測高頻考點模擬試題及答案詳解1套
- 2025廣西桂林市住房和城鄉(xiāng)建設局所屬事業(yè)單位桂林市市政工程管理處直接考核招聘高層次專業(yè)技術人員1人考前自測高頻考點模擬試題及答案詳解(易錯題)
- 2025年安慶職業(yè)技術學院招聘33人模擬試卷及答案詳解(名師系列)
- 2025年安徽藝術學院高層次人才招聘30人考前自測高頻考點模擬試題完整答案詳解
- 2025福建泉州市安溪縣部分公辦學校專項招聘編制內新任教師65人(三)考前自測高頻考點模擬試題有答案詳解
- 2025第十三屆貴州人才博覽會貴陽貴安事業(yè)單位引進人才770人模擬試卷及答案詳解(名校卷)
- 2025廣西貴港市覃塘區(qū)黃練鎮(zhèn)儲備村“兩委”后備干部人選130人考前自測高頻考點模擬試題及完整答案詳解
- 2025年寧波前灣新區(qū)衛(wèi)生系統(tǒng)事業(yè)單位招聘高層次人才11人模擬試卷附答案詳解
- 2025貴州人才博覽會專場活動貴州茅臺酒廠(集團)技術開發(fā)有限公司引進人才模擬試卷有完整答案詳解
- 2025年中國化妝品用海洋膠原蛋白行業(yè)市場分析及投資價值評估前景預測報告
- 2025年輔警考試真題及答案
- 2025-2026學年統(tǒng)編版五年級上冊語文第二單元過關試卷附答案(三套)
- 2025年農村土地租賃協(xié)議(合同樣本)
- 2025年固態(tài)變壓器(SST)行業(yè)研究報告及未來發(fā)展趨勢預測
- 海上安全培訓課課件
- 神經外科重癥管理臨床指南
- 少年讀史記課件
- 鐵路客運防寒過冬課件
- 基礎知識產權培訓課件
- 2025四川天府新區(qū)籍田中心衛(wèi)生院招聘醫(yī)師、藥師、護士崗位6人筆試參考題庫附答案解析
- 2025年三力測試題試題及答案
評論
0/150
提交評論