




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據分析(SAS描述性統(tǒng)計分析過程)
幾種描述性統(tǒng)計分析的SAS過程和作圖過程procmeans
procunivariate
proccorr
procplot//procgplot
proccapability數據分析(SAS描述性統(tǒng)計分析過程)
procmeans(1)
Means過程的語句格式
Means過程的主要控制語句如下:
procmeans輸入數據集名<選項列表>;var變量列表;class變量列表;byfreq變量列表;
變量;weight變量;id變量列表;
output<out=輸出數據集名><統(tǒng)計量關鍵字=變量名列表>;run;數據分析(SAS描述性統(tǒng)計分析過程)
procmeans(2)var語句——規(guī)定要求計算簡單描述性統(tǒng)計量的數值變量的次序。by語句——按by語句定義的變量進行分組計算其相應的簡單統(tǒng)計量,要求輸入數據集已按by變量排序。class語句——與by語句一樣,可用class變量定義觀測組,分別計算各組觀測的描述統(tǒng)計量。輸出格式與by不同且事先不需要按class變量排序。freq語句——指定一個數值型的freq變量,它的值表示輸入數據集中相應觀測出現(xiàn)的頻數。weight語句——規(guī)定一個weight變量,它的值表示相應觀測的權數。id語句——在輸出數據集中增加一個或幾個附加變量,目的在于識別輸出數據集里的觀測。其值為生成這個觀測的輸入數據集中相應觀測組里id變量具有的最大值。數據分析(SAS描述性統(tǒng)計分析過程)
ntcvprocmeans(3)
procmeans語句中可用的統(tǒng)計量關鍵字統(tǒng)計量名稱含義統(tǒng)計量名稱含義未丟失的觀測個數mode眾數,出現(xiàn)頻數最高的數nmissmeanstderrsumstdvarusscssskewnesskurtosis丟失的觀測個數算術平均均值的標準誤差加權和標準偏差方差變異系數的百分數加權平方和關于均值偏差的加權平方和對稱性的度量——偏度對尾部陡平的度量——峰度sumwgtmaxminrangemedianprtclmlclmuclm權數和最大值最小值極差,max—min中間值總體均值等于0的t統(tǒng)計量t分布的雙尾p值置信度上限和下限置信度下限置信度上限數據分析(SAS描述性統(tǒng)計分析過程)
procmeans(4)output語句中的選項。<out=輸出數據集名>——輸出數據集名。統(tǒng)計量關鍵字=變量名列表——規(guī)定在輸出數據集中要包含的統(tǒng)計量并規(guī)定這些統(tǒng)計量在新數據集中的變量名。means過程對output語句的次數沒有限制,可以使用幾個output語句來創(chuàng)建內容不同的多個數據集。數據分析(SAS描述性統(tǒng)計分析過程)Nprocmeans(5)
SAS程序
dataexamp1; inputx@@; cards; 70.472.076.574.376.577.667.372.075.074.3 73.579.573.574.765.076.581.675.472.772.7 67.276.572.770.477.268.867.367.367.372.7 75.873.575.072.773.573.572.781.670.374.3 73.579.570.476.572.777.284.375.076.570.4 ; procmeansdata=examp1nmeancvskewnesskurtosisrangemedian; varx; run;
輸出TheMEANSProcedureAnalysisVariable:xMeanVariationSkewnessKurtosisRangeMedian5073.74600005.40837940.15401110.358117919.300000073.5000000數據分析(SAS描述性統(tǒng)計分析過程)
procunivariate(1)單變量統(tǒng)計分析對一組單指標實驗數據進行分析常采用兩種方法:
圖示法——包括莖葉圖、盒型圖和正態(tài)概率圖。
描述統(tǒng)計量——包括矩、分位數、極端值和頻數分布表。數據分析(SAS描述性統(tǒng)計分析過程)procunivariate(2)
Univariate過程的主要控制語句如下:
procunivariate輸入數據集名<選項列表>;varbyfreqweightid變量列表變量列表變量;變量;變量列表;;;output<out=輸出數據集名><統(tǒng)計量關鍵字=變量名列表><pctlpts=
百分位數pctlpre=變量前綴名pctlname=變量后綴名>;run;數據分析(SAS描述性統(tǒng)計分析過程)procunivariate(3)
Univariate過程的主要控制語句如下:
procunivariate輸入數據集名<選項列表>;varbyfreqweightid變量列表變量列表變量;變量;變量列表;;;output<out=輸出數據集名><統(tǒng)計量關鍵字=變量名列表><pctlpts=
百分位數pctlpre=變量前綴名pctlname=變量后綴名>;run;數據分析(SAS描述性統(tǒng)計分析過程)教材1.1例題examp1_1(SAS程序)dataexamp1_1;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_1;varx;run;數據分析(SAS描述性統(tǒng)計分析過程)教材1.1例題examp1_1(SAS結果1)
TheUNIVARIATEProcedure Variable:x MomentsNMeanStdDeviationSkewness100SumWeights 73.66SumObservations 3.94008153Variance 0.06007521Kurtosis100 7366 15.5242424 0.03386864UncorrectedSS544116.46CorrectedSS1536.9CoeffVariation5.34901103StdErrorMean BasicStatisticalMeasures0.39400815LocationVariabilityMean73.66000StdDeviationMedian73.50000VarianceMode73.50000Range
3.94008 15.5242420.00000InterquartileRange4.60000數據分析(SAS描述性統(tǒng)計分析過程)教材1.1例題examp1_1(SAS結果2)
TheUNIVARIATEProcedure
Quantiles(Definition5)Quantile100%Max99%95%90%75%Q3Estimate 84.30 82.95 80.50 79.15 75.8050%Median25%Q110%
73.50 71.2068.405%1%0%Min67.3064.65 64.30數據分析(SAS描述性統(tǒng)計分析過程)
proccapability(能力分析過程)PROCCAPABILITYisdesignedforprocesscapabilityanalysis,including:Histograms(直方圖)andcomparativehistograms.Cumulativedistributionfunctionplots(cdfplots)(累積分布函數).Quantile-quantileplots(Q-Qplots),probabilityplots,andprobability-probabilityplots(P-Pplots).Theseplotsfacilitatethecomparisonofadatadistributionwithvarioustheoreticaldistributions.Goodness-of-fit(擬合優(yōu)度)testsforavarietyofdistributionsincludingthenormal.Statisticalintervals(prediction,tolerance,andconfidenceintervals)foranormalpopulation.數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_4(SAS程序)dataexamp1_4;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;proccapabilitydata=examp1_4;histogramx/normal(mu=estsigma=est);cdfplot/normal(mu=estsigma=est);qqplotx/normal(mu=estsigma=est);run;數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_4(SAS結果)
TheCAPABILITYProcedure FittedNormalDistributionforx ParametersforNormalDistribution ParameterSymbolEstimateMeanMu73.66
StdDevSigma3.940082QuantilesforNormalDistribution ------Quantile------ PercentObservedEstimated 1.064.650064.4940 5.067.300067.1791 10.068.400068.6106 25.071.200071.0025 50.073.500073.6600 75.075.800076.3175 90.079.150078.7094 95.080.500080.1409 99.082.950082.8260數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_4(SAS直方圖)數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_4(SAS分布函數圖)數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_4(SASqq圖)數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_6(SAS程序)dataexamp1_6;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_6plot;varx;run;數據分析(SAS描述性統(tǒng)計分析過程)#4教材1.2例題examp1_6(SAS結果)StemLeafBoxplot8438382812668035579555780888772267655555557588874333333337735555555555572777712222703444444469777680088867233336665006431 3 3 3 4 3 714 91114 8 3 5 5 2 1
0 | | | | | |+-----+||*--+--*||+-----+ | | | | | | 0數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_8(SAS程序)dataexamp1_8;inputx@@;cards;254550545561646872757578798183848484858686868789898990919192100;procunivariatedata=examp1_8normal;run;proccapabilitydata=examp1_8graphicsnoprint;histogramx/weibullvscale=proportion;run;datadelmin;setexamp1_8;ifx=25thendelete;run;proccapabilitydata=delmingraphicsnoprint;histogramx/weibullvscale=proportion;cdfplotx/weibull;run;數據分析(SAS描述性統(tǒng)計分析過程)2
教材1.2例題examp1_8(SAS結果1)TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.863287Pr<W0.0010Kolmogorov-SmirnovD0.195196Pr>D<0.0100Cramer-vonMisesAnderson-DarlingW-Sq0.295854 A-Sq1.593346Pr>W-Sq<0.0050Pr>A-Sq<0.0050結論:拒絕正態(tài)分布的假設
Goodness-of-FitTestsforWeibullDistributionTestCramer-vonMises----Statistic----- W-Sq0.2242363DF
------pValue------Pr>W-Sq<0.010Anderson-DarlingA-Sq1.2884219Pr>A-Sq<0.010Chi-SquareChi-Sq24.87188823Pr>Chi-Sq<0.001結論:拒絕Weibull分布的假設
Goodness-of-FitTestsforWeibullDistributionTest----Statistic-----DF------pValue------Cramer-vonMisesAnderson-DarlingChi-SquareW-Sq0.16341872 A-Sq1.00500667Chi-Sq5.22777090
Pr>W-Sq0.013Pr>A-Sq<0.010Pr>Chi-Sq0.073結論:對于刪去25的數據集,接受Weibull分布的假設數據分析(SAS描述性統(tǒng)計分析過程)教材1.2例題examp1_8(SAS結果2)數據分析(SAS描述性統(tǒng)計分析過程)
proccorr(1)
proccorr(相關分析過程)用于計算變量之間 的相關系數,包括Pearson(皮爾遜)的乘 積矩相關和加權乘積矩相關。還能產生三個 非參數的關聯(lián)測量:Spearman的秩相關,
Kendall的tau-b和Hoeffding的相關性度量D。
proccorr語句調用corr過程,且是唯一必須的語句。如果只使用proccorr這一條的語句,過程計算輸入數據集中所有數值變量之間的相關系數。其余語句是供選擇的。數據分析(SAS描述性統(tǒng)計分析過程)
proccorr(2)
proccorr過程一般由下列語句控制:proccorrvarwithpartialweightfreqByrun;
data=數據集<選項>;變量列表;變量列表;變量列表;變量;變量;變量列表;數據分析(SAS描述性統(tǒng)計分析過程)教材1.3例題examp1_9(SAS程序)dataexamp1_9;inputxy;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;run;run;數據分析(SAS描述性統(tǒng)計分析過程)xyNxy
教材1.3例題examp1_9(SAS結果1)TheCORRProcedure2Variables:xyCovarianceMatrix,DF=19
x 570.45007845.0789
y 7845.0789112404.2632SimpleStatisticsVariable20
Mean33.85000StdDev 23.88410Median 27.00000Minimum 5.00000Maximum70.0000020477.50000335.26745342.0000082.000001125數據分析(SAS描述性統(tǒng)計分析過程)xyxy教材1.3例題examp1_9(SAS結果2)
TheCORRProcedurePearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0
x1.000000.97971y0.97971 <.00011.00000
<.0001SpearmanCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0
x1.000000.97366<.0001y0.97366<.00011.00000數據分析(SAS描述性統(tǒng)計分析過程)教材1.3例題examp1_10(SAS程序)dataexam1_10;inputx1-x6;cards;19136505162601893752211060………156335415225731383368211043;proccorrdata=exam1_10covpearsonspearman;varx1-x6;run;數據分析(SAS描述性統(tǒng)計分析過程)Nx520教材1.3例題examp1_10(SAS結果1)TheCORRProcedure6Variables:x1x2x3x4x5x6CovarianceMatrix,DF=19(略)
SimpleStatisticsVariableMeanStdDevMedianMinimumMaximumx120178.6000024.69051
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程測量考試題型及答案
- 2025年湖南企業(yè)面試真題及答案
- 親情的力量記事作文(5篇)
- 高電壓理論考試題及答案
- 2025年福建省莆田華僑職業(yè)中專學校校聘教師招聘1人考前自測高頻考點模擬試題及答案詳解一套
- 紅旗汽車模擬測試題及答案
- 全面績效考核指標體系模板
- 跨平臺協(xié)作標準化工具及其功能覆蓋場景
- 2025杭州青少年活動中心招聘工勤崗位工作人員20人考前自測高頻考點模擬試題及完整答案詳解
- 銷售合同管理工具合同要素審核清單版
- 網絡安全教育主題班會通用課件
- DB4405-T 303-2023 獅頭鵝屠宰操作規(guī)程
- 經合組織成員國
- 人工智能技術及應用習題答案題庫
- 縣中醫(yī)院婦科重點??平ㄔO匯報
- 堅持人民至上 工會研討發(fā)言
- 美學原理全套教學課件
- 期末復習(課件)新思維英語四年級上冊
- 子宮脫垂試題及答案
- GB/T 90.1-2023緊固件驗收檢查
評論
0/150
提交評論