




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第八章相關(guān)分析與回歸分析第一節(jié)相關(guān)分析的意義和內(nèi)容任何事物的變化都與其他事物是相互聯(lián)系和相互影響的,用于描述事物數(shù)量特征的變量之間自然也存在一定的關(guān)系。變量之間的關(guān)系歸納起來可以分為兩種類型,即函數(shù)關(guān)系和統(tǒng)計關(guān)系。一、函數(shù)關(guān)系與相關(guān)關(guān)系函數(shù)關(guān)系當(dāng)一個變量x取一定值時,另一變量y可以按照確定的函數(shù)公式取一個確定的值,記為y
=
f(x),則稱y是x的函數(shù),也就時說y與x兩變量之間存在函數(shù)關(guān)系。如,某種商品在其價格不變的情況下,銷售額和銷售量之間的關(guān)系就是一種函數(shù)關(guān)系:銷售額=價格×銷售量。變量函數(shù)關(guān)系圖形化的表示。
函數(shù)關(guān)系是一一對應(yīng)的確定性關(guān)系,比較容易分析和測度,可是在現(xiàn)實中,變量之間的關(guān)系往往并不那么簡單。相關(guān)分析當(dāng)一個或幾個變量取一定值時,與之相應(yīng)的另一個變量值雖然不確定,但仍按某種規(guī)律在一定范圍內(nèi)變化。變量間的這種不確定性的相互關(guān)系稱為相關(guān)關(guān)系。
相關(guān)分析是分析變量間是否有相關(guān)關(guān)系,確定相關(guān)關(guān)系是否存在,描述相關(guān)關(guān)系呈現(xiàn)的形式和方向,以及變量間相關(guān)的密切程度的方法。
如,旅游土特產(chǎn)商品,其平均畝產(chǎn)量和施肥量之間存在著一定的依存關(guān)系,即在一定時候隨著施肥量的增加,其平均畝產(chǎn)量也相應(yīng)增加,但平均畝產(chǎn)量還受土壤、氣溫、雨量、密植程度等因素影響,并不是唯一確定的,這種關(guān)系就是相關(guān)關(guān)系。
變量相關(guān)關(guān)系的圖形化表示二、相關(guān)分析的分類(一)按相關(guān)的變量多少不同,可分為單相關(guān)和復(fù)相關(guān)(二)按相關(guān)的表現(xiàn)形式不同,可分為直線相關(guān)和曲線相關(guān)(三)按相關(guān)的程度不同,可分為不相關(guān)、完全相關(guān)和不完全相關(guān)(四)按相關(guān)的方向不同,可把直線相關(guān)分為正相關(guān)和負(fù)相關(guān)三、相關(guān)分析的主要內(nèi)容(一)確定現(xiàn)象之間有無關(guān)系(二)確定相關(guān)關(guān)系的表現(xiàn)形式(三)測定相關(guān)關(guān)系的密切程度和方向第二節(jié)相關(guān)關(guān)系的測定一、相關(guān)表相關(guān)表是一種統(tǒng)計表,它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值按從小到大的順序排列,并將另一變量的值與之對應(yīng)排列形成的統(tǒng)計表。
飯店編號年廣告費投入月平均營業(yè)額12345678910
1215232633343945556021233234424349525963
表7-1年廣告費投入和月平均營業(yè)額相關(guān)表
單位:萬元二、相關(guān)圖相關(guān)圖又稱散點圖,它是用直角坐標(biāo)系的軸代表自變量,軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。
年廣告費投入與月平均營業(yè)額相關(guān)圖三、相關(guān)系數(shù)相關(guān)系數(shù)是在直線相關(guān)條件下,說明兩個變量相互之間變化方向及密切程度的統(tǒng)計分析指標(biāo)。相關(guān)系數(shù)通常用表示。相關(guān)系數(shù)的測定方法,直接來源于數(shù)理統(tǒng)計中相關(guān)系數(shù)的定義
式中:為資料項數(shù);為變量的標(biāo)淮差;為變量的標(biāo)準(zhǔn)差;為兩個變量的協(xié)方差。7.1式的分子分母中,有公因子,同時約掉化簡得:(7.1)(7.2)7.2式是通過各個變量離差乘積的方法來計算相關(guān)系數(shù)的,也稱為“積差法”相關(guān)系數(shù)公式。由于各變量的離差通常帶有小數(shù),因而“積差法”公式的計算結(jié)果往往缺乏準(zhǔn)確性。在實際應(yīng)用中,如果依據(jù)原始資料計算相關(guān)系數(shù),可用7.2式的簡化公式計算?,F(xiàn)將7.2式的分子分母轉(zhuǎn)換為:把以上結(jié)果代入7.2式,可得:
或(7.3)(7.4)序號年廣告費投入月平均營業(yè)額
123456789101215232633343945556021233234424349525963
144225529676108911561521202530253600
44152910241156176418492401270434813969
252345736884138614621911234032453780合計342418139901931816341現(xiàn)在用表7-1的資料為例,計算年廣告宣傳費投入和月平均營業(yè)額之間的相關(guān)系數(shù)。表7-2相關(guān)系數(shù)計算表由表中資料得如下有關(guān)數(shù)據(jù):代人7.3式,計算相關(guān)系數(shù)為:計算結(jié)果表明年廣告宣傳費投入和月平均營業(yè)額之間存在高度的正相關(guān)關(guān)系。(二)相關(guān)系數(shù)的意義相關(guān)系數(shù)對于判斷變量之間相關(guān)關(guān)系的密切程度,有其重要的意義。相關(guān)系數(shù)的取值范圍:是在-1和+1之間,即。當(dāng)>0,為正相關(guān),<0則為負(fù)相關(guān)。相關(guān)系數(shù)的絕對值越接近于1,表示相關(guān)關(guān)系越強,越接近于0,表示相關(guān)關(guān)系越弱。如果||=1,則表示兩個變量完全直線相關(guān)。如果||=0,則表示兩個變量完全不相關(guān)。但要注意的是只表示與的直線相關(guān)密切程度,當(dāng)很小甚至為0時,并不表示與之間不存在其他非直線型的相關(guān)關(guān)系。相關(guān)系數(shù)與相關(guān)密切程度等級相關(guān)系數(shù)絕對值||相關(guān)密切程度等級0.3以下0.3-0.50.5-0.80.8以上不相關(guān)低度相關(guān)顯著相關(guān)高度相關(guān)第三節(jié)一元線性回歸分析一、回歸分析的概念回歸分析是指對具有相關(guān)關(guān)系的變量,依據(jù)其關(guān)系形態(tài),選擇一個合適的數(shù)學(xué)模型(或稱回歸方程式),用來近似地表示變量間數(shù)量平均變化關(guān)系的一種統(tǒng)計方法。
按分析變量的多少不同,可分為一元回歸分析與多元回歸分析;按分析變量間的表現(xiàn)形態(tài)不同,可分為線性回歸分析與非線性回歸分析等。二、相關(guān)分析與回歸分析的關(guān)系相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時,進行回歸分析尋求其相關(guān)的具體形式才有意義。兩者的區(qū)別主要體現(xiàn)在以下三個方面:1.在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對等的;而在回歸分析中,則必須根據(jù)研究對象的性質(zhì)和研究分析的目的,對變量進行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對等的。2.在相關(guān)分析中所有的變量都必須是隨機變量;而在回歸分析中,自變量是給定的,因變量才是隨機的,即將自變量的結(jié)定值代人回歸方程后,所得到的因變量的估計值不是唯一確定的,而會表現(xiàn)出一定的隨機波動性。3.相關(guān)分析主要是通過一個指標(biāo)即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對等的,因此相關(guān)系數(shù)是唯一確定的。而在回歸分析中,對于互為因果的兩個變量(如商品的價格與需求量),則有可能存在多個回歸方程。三、一元線性回歸(一)一元線性回歸模型其表達形式:
式中:為因變量的估計理論值;為自變量的實際值;、為待定參數(shù),為直線方程的截距,即為當(dāng)為0時的估計值,是回歸系數(shù),即當(dāng)每增加一個單位時的平均增加量。(7.5)(二)用最小二乘法求回歸系數(shù)用最小二乘法擬合的直線最具有代表性,也稱最佳線。
(7.6)令則是兩個待定參數(shù)和的函數(shù)。要使為最小值,就要用數(shù)學(xué)中對二元函數(shù)求極值的原理,求關(guān)于和的偏導(dǎo)數(shù),并令其等于零,整理得出直線回歸方程中求解參數(shù)、的標(biāo)準(zhǔn)方程組,(7.7)(7.8)應(yīng)用7.7和7.8式,求出與的值,代入7.5式,即可得出具體的直線回歸方程式。由標(biāo)準(zhǔn)方程組的7.7式,得:(7.9)將7.9式代入7.8式,有即(7.10)現(xiàn)仍用表7-1某飯店年廣告費投入和月平均營業(yè)額的有關(guān)資料為例,計算、的值得到:將和的數(shù)值代入7.5式,得出年廣告費投入和月平均營業(yè)額的直線回歸方程:式中:,是回歸直線在軸上的截距;,表示年廣告費投入每增加一個單位(萬元),月平均營業(yè)額平均增加0.892(萬元)。四、一元回歸估計標(biāo)準(zhǔn)誤差(一)估計標(biāo)準(zhǔn)誤差的意義回歸方程的一個重要作用在于根據(jù)自變量的已知值估計因變量的理論值(估計值)。而理論值與實際值存在著差距,這就產(chǎn)生了推算結(jié)果的準(zhǔn)確性問題。如果差距小,說明推算結(jié)果的準(zhǔn)確性高;反之,則低。為此,分析理論值與實際值的差距很有意義。估計標(biāo)準(zhǔn)誤差是衡量回歸直線代表性大小的統(tǒng)計分析指標(biāo),它說明觀察值圍繞著回歸直線的變化程度或分散程度。(二)一元估計標(biāo)準(zhǔn)誤差的計算估計標(biāo)準(zhǔn)誤差是用來說明回歸方程代表性大小的統(tǒng)計分析指標(biāo),其計算原理與標(biāo)準(zhǔn)差基本相同,估計標(biāo)準(zhǔn)誤差說明估計理論值的代表性。
1.定義公式。定義公式是直接根據(jù)剩余變差計算的,是剩余變差平均數(shù)的平方根,反映了實際觀察值與估計值之間的平均離差程度。(7.11)式中:為估計標(biāo)推誤差;為自由度,因在一元線性回歸方程中.計算了、兩個參數(shù),即失去了兩個自由度。2.簡化公式。簡化公式是根據(jù)回歸直線方程中的參數(shù)、計算,特點是能與相關(guān)分析和回歸分析中的數(shù)據(jù)資料相結(jié)合,其計算結(jié)果等同于定義公式。(7.12)仍以表7-2的資料為例,結(jié)合說明估計標(biāo)準(zhǔn)誤差的計算方法??闪谐鲇嬎惚恚绫?-3所示。表7-3估計標(biāo)準(zhǔn)誤差計算表序號
年廣告費投入
月平均營業(yè)額
12345678910
12152326333439455560
21233234424349525963
22.0024.6731.8134.4940.7341.6246.0851.4360.3564.81
1.002.800.040.241.611.908.510.321.833.29
合計
342418418.0021.54將計算表的有關(guān)資料代入公式得:計算結(jié)果表明,估計標(biāo)準(zhǔn)差是1.641萬元。如果用建立線性回歸模型后公式計算,則有:(萬元)(萬元)五、估計標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系估計標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)在數(shù)量上也存在著換算關(guān)系,這就從另一角度說明了相關(guān)分析與回歸分析之間的聯(lián)系。二者之間的換算公式是:(7.13)(7.14)(1)需要先求出回歸直線方程,計算出估計標(biāo)準(zhǔn)誤差,才能求得相關(guān)系數(shù)。而從一般的認(rèn)識程序來看,只有相關(guān)關(guān)系密切的情況下,配合回歸方程才有意義;如果關(guān)系不密切,下一步的計算就不必要了,因而要求先計算相關(guān)系數(shù)以判斷相關(guān)關(guān)系的密切程度。(2)以這種方法計算出的,難以判斷是正相關(guān)還是負(fù)相關(guān)。在實際的相關(guān)分析中,—般不常用這種方法計算相關(guān)系數(shù),因這種計算方法存在兩個缺陷:六、一元線性回歸估計(一)點估計利用表7-2的資料,建立回歸方程為
可以用回歸方程來對給定某一特定值時的值進行點估計,或者預(yù)測某一特定值的值。例如,假定廣告費用是65萬元時,運用回歸方程,我們可以得到:(萬元)因此,當(dāng)廣告投入65萬元時,月平均銷售額的點估計值是69.274萬元。(二)區(qū)間估計對于預(yù)測問題,除了知道點估計的預(yù)測值外,還希望知道預(yù)測的精度,因為點估計不能給出與估計有關(guān)的任何準(zhǔn)確信息。我們往往更希望能給出一個預(yù)測值的變動范圍,即進行區(qū)間估計。而這一預(yù)測值范圍比只給可信。這個問題也就是對于給定的顯著水平找一個區(qū)間,使對應(yīng)于某特定的實際
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025黑龍江大慶市肇源縣公益性崗位招聘預(yù)模擬試卷及答案詳解(奪冠系列)
- 2025北京首都師范大學(xué)附屬育新學(xué)校招聘12人模擬試卷及一套答案詳解
- 2025年甘肅省中共嘉峪關(guān)市委黨校(市行政學(xué)院)招聘公益性崗位人員模擬試卷附答案詳解(模擬題)
- 2025黑龍江齊齊哈爾市建華區(qū)中華街道公益性崗位招聘1人考前自測高頻考點模擬試題及一套答案詳解
- 滄州市中醫(yī)院高血壓腦出血微創(chuàng)手術(shù)考核
- 2025黑龍江鶴崗市工農(nóng)區(qū)酒行招聘模擬試卷附答案詳解(突破訓(xùn)練)
- 衡水市中醫(yī)院甲狀腺再次手術(shù)技術(shù)準(zhǔn)入考核
- 2025廣東揭陽市惠來縣校園現(xiàn)場招聘教師70人(編制)模擬試卷及答案詳解(奪冠系列)
- 2025北京市房山區(qū)韓村河鎮(zhèn)社區(qū)衛(wèi)生服務(wù)中心招聘1人模擬試卷(含答案詳解)
- 邯鄲市人民醫(yī)院消化科造口治療師資格認(rèn)證考試題庫
- 2025年北森潛力測評試題及答案
- 2025銀行招聘試題及答案詳解
- 2025年成人高考高升專試題(含答案)
- 2025貴州冊亨縣招聘教師25人考試參考試題及答案解析
- 河南成人2024學(xué)位英語考試真題及答案
- 2025年淮南市大通區(qū)和壽縣經(jīng)開區(qū)公開招聘社區(qū)“兩委”后備干部30名考試參考試題及答案解析
- 長期照護師培訓(xùn)考核試卷及答案
- 醫(yī)保病歷審核課件
- 煤礦安全規(guī)程2025版解讀
- 2025年秋季開學(xué)典禮詩歌朗誦稿:紀(jì)念抗戰(zhàn)勝利八十周年
- 軍人識圖用圖課件
評論
0/150
提交評論