北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第1頁(yè)
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第2頁(yè)
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第3頁(yè)
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第4頁(yè)
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1答案一、單選題(每題2分,共60分)12345678910DBBBBBBDCD11121314151617181920ADCCACABBA21222324252627282930BDBDCDDBCC二、是非題(每題0.5分,共10分)12345678910TFTFFFTTFF11121314151617181920TTFFTTTFTF三、問(wèn)答題(每題10分,共30分)1.《數(shù)據(jù)分析報(bào)告》結(jié)論和建議部分編寫的注意事項(xiàng)是什么?答案:《數(shù)據(jù)分析報(bào)告》結(jié)論和建議負(fù)責(zé)得出結(jié)論、提出建議、解決矛盾(得2分),結(jié)論編寫應(yīng)措辭嚴(yán)謹(jǐn)、準(zhǔn)確、鮮明(每點(diǎn)得2分,計(jì)6分);其建議部分應(yīng)畫龍點(diǎn)睛(得2分):大部分決策者沒(méi)有時(shí)間通讀分析報(bào)告,但決策過(guò)程中報(bào)告的結(jié)論和建議等章節(jié)將會(huì)被重點(diǎn)閱讀。2.請(qǐng)說(shuō)明相關(guān)分析和回歸分析的相同點(diǎn)和不同點(diǎn)都有什么?答案:相同點(diǎn):相關(guān)分析和回歸分析能分析出多個(gè)變量之間的關(guān)系,從而分析目標(biāo)變量未來(lái)的發(fā)展變化趨勢(shì),是預(yù)測(cè)方法之一(得2分)。不同點(diǎn)一:相關(guān)分析研究的是隨機(jī)變量,不分自變量、因變量;(得2分)而回歸分析有自變量X和因變量Y之分,其中自變量X是普通變量,因變量Y是隨機(jī)變量。(得2分)不同點(diǎn)二:相關(guān)分析主要描述兩變量之間線性關(guān)系的緊密程度;(得2分)而回歸分析不僅揭示變量X對(duì)因變量Y的影響大小,還由回歸模型進(jìn)行預(yù)測(cè)。(得2分)3.針對(duì)大數(shù)據(jù)如何進(jìn)行相關(guān)分析?答案:相關(guān)分析步驟:1、根據(jù)預(yù)測(cè)目標(biāo),確定自變量和因變量;(得2分)2、收集整理數(shù)據(jù)形成相關(guān)表:收集整理兩變量數(shù)據(jù)形成相關(guān)表,相關(guān)表中自變量可以是數(shù)據(jù)直接進(jìn)行排序,也可以是個(gè)分組。(得2分)3、繪制散點(diǎn)圖/折線圖,確定相關(guān)模型類型;通過(guò)折線圖查看自變量對(duì)因變量的影響。(得2分)4、設(shè)置分析對(duì)象,對(duì)相關(guān)模型進(jìn)行檢驗(yàn)。(得2分)5、相關(guān)系數(shù)來(lái)進(jìn)行相關(guān)分析:函數(shù)計(jì)算r,分析兩變量的相關(guān)系數(shù)利用相關(guān)系數(shù)r分析數(shù)據(jù)相關(guān)性。(得2分)大數(shù)據(jù)分析入門(知識(shí)要點(diǎn))課程編號(hào):BWCST3008學(xué)籍號(hào):______________________學(xué)習(xí)中心:______________________姓名:______________________注意事項(xiàng):1、本試卷滿分100分,考試時(shí)間90分鐘;2、請(qǐng)將答案一律寫在答題紙上。一、單選題(每題2分,共60分)1.用戶提取大數(shù)據(jù)分析結(jié)果,可以不使用或使用()等工具。A、ExcelB、TableauC、數(shù)據(jù)庫(kù)SQLServerD、運(yùn)行在亞馬遜EC2彈性MapReduce計(jì)算云2.以下關(guān)于大數(shù)據(jù)說(shuō)法中,不正確的是()。A、大數(shù)據(jù)和大數(shù)據(jù)分析是研究大量的數(shù)據(jù)的過(guò)程中尋找模式,相關(guān)性和其他有用的信息,可以幫助企業(yè)更好地適應(yīng)變化,并做出更明智的決策。B、大數(shù)據(jù)級(jí)別的容量可能是TB、PB、YB、BB、DBC、大數(shù)據(jù)通常是萬(wàn)億或EB,可能收集自傳感器、氣候信息、公開信息(如雜志報(bào)紙文章)、或購(gòu)買交易記錄、網(wǎng)絡(luò)日志、病歷、軍事監(jiān)控、視頻和圖像檔案、大型電子商務(wù)大數(shù)據(jù)……D、大數(shù)據(jù)中,價(jià)值密度通常較低,如果能夠合理利用并正確、準(zhǔn)確地分析,將會(huì)帶來(lái)很高的價(jià)值回報(bào)。3.()能夠展示單個(gè)數(shù)據(jù)變量的分布情況。A、二維餅圖B、直方圖型柱形圖C、雷達(dá)圖D、散點(diǎn)圖4.RobertG.Brown提出指數(shù)平滑法,建立在一定的假設(shè)為前提下才能有效發(fā)揮預(yù)測(cè)作用。以下前提中,不適用于指數(shù)平滑的時(shí)間預(yù)測(cè)方法的是()。A、時(shí)間序列的態(tài)勢(shì)具有穩(wěn)定性,時(shí)間序列才能被合理地猜測(cè)。B、過(guò)去態(tài)勢(shì)會(huì)持續(xù)到未來(lái),所以將較大的關(guān)注放在時(shí)間序列中較遠(yuǎn)的數(shù)據(jù)上。C、最近的過(guò)去態(tài)勢(shì),某種程度上會(huì)持續(xù)到未來(lái),所以將較大的關(guān)注放在最近數(shù)據(jù)上。D、時(shí)間序列的態(tài)勢(shì)具有規(guī)則性,時(shí)間序列才能被合理地順勢(shì)推延。5.()是指兩個(gè)有聯(lián)系的指標(biāo)對(duì)比計(jì)算而得到的數(shù)值,用于反映客觀現(xiàn)象之間數(shù)量聯(lián)系程度的綜合指標(biāo)。A、絕對(duì)數(shù)B、相對(duì)數(shù)C、眾數(shù)D、均值6.大數(shù)據(jù)整理需要經(jīng)過(guò)無(wú)數(shù)次對(duì)海量數(shù)據(jù)的()處理才能得到一個(gè)簡(jiǎn)潔結(jié)果。A、收集整理B、甄別真?zhèn)蜟、邏輯運(yùn)算及其分析匯總D、論證檢查7.數(shù)據(jù)的直方圖分析屬于數(shù)據(jù)分析法中的()種分析。A、推斷統(tǒng)計(jì)分析工具B、描述性分析工具C、數(shù)據(jù)預(yù)測(cè)分析工具D、假設(shè)檢驗(yàn)分析工具8.以下判斷數(shù)據(jù)間關(guān)系的相關(guān)系數(shù)r的若干說(shuō)法中,不正確的是()。A、相關(guān)系數(shù)r反映變量間線性相關(guān)強(qiáng)度,是相關(guān)性的度量指標(biāo)B、相關(guān)系數(shù)r取值范圍[-1,1]C、關(guān)系數(shù)r的正負(fù)號(hào)能反映相關(guān)方向,大于零代表正相關(guān),小于零代表負(fù)相關(guān)。D、相關(guān)系數(shù)r大小可以反映相關(guān)程度,r越大則相關(guān)性越弱。9.線性相關(guān)中,一個(gè)數(shù)值變化時(shí),另一現(xiàn)象會(huì)有若干數(shù)值與之對(duì)應(yīng)變化,并遵循一定規(guī)律,圍繞若干數(shù)值的上下波動(dòng),其原因是影響現(xiàn)象變化的因素的數(shù)目()。A、為零B、為一個(gè)C、不止一個(gè)D、上述答案都不對(duì)10.24小時(shí)內(nèi)血壓動(dòng)態(tài)監(jiān)測(cè)儀獲得的血壓監(jiān)測(cè)數(shù)據(jù)屬于以下數(shù)據(jù)分析類的()數(shù)據(jù)。A、縱向比較B、橫向比較C、分類比較D、動(dòng)態(tài)分析11.為了分析運(yùn)動(dòng)量A和燃脂速度C之間的關(guān)系,C會(huì)隨A的提高而的增高,遵循明顯規(guī)律,二者屬于()關(guān)系。A、函數(shù)相關(guān)B、復(fù)相關(guān)C、強(qiáng)相關(guān)D、不相關(guān)12.時(shí)間序列預(yù)測(cè),簡(jiǎn)單地說(shuō),是根據(jù)事件發(fā)展來(lái)預(yù)測(cè)未來(lái)發(fā)展。關(guān)于該方法的說(shuō)法中,不正確的是它()。A、假設(shè)事物發(fā)展趨勢(shì)會(huì)延伸到未來(lái)B、預(yù)測(cè)所依據(jù)的數(shù)據(jù)具有不規(guī)則性C、不考慮事物發(fā)展之間的因果關(guān)系D、不考慮社會(huì)因素和突發(fā)事件13.相關(guān)關(guān)系分析的相關(guān)程度不包括()。A、完全相關(guān)B、不完全相關(guān)C、函數(shù)相關(guān)D、不相關(guān)14.為了廣告費(fèi)A和產(chǎn)品利潤(rùn)B是否存在關(guān)系,但從數(shù)據(jù)表面上無(wú)法確定具體關(guān)系,并非嚴(yán)格遵循A升高多大比例,B也升高相應(yīng)程度,二者屬于()關(guān)系。A、比例B、復(fù)數(shù)C、相關(guān)D、函數(shù)15.一個(gè)數(shù)據(jù)分布的鋒度系數(shù)為()時(shí),該數(shù)據(jù)分布曲線更趨近于平均分布。A、-1.12B、-0.13C、0.02D、1.216.在數(shù)據(jù)分布的描述分析上,平均值和眾數(shù)決定了數(shù)據(jù)分布是否遵循正態(tài)分布分析中,數(shù)值測(cè)度的()。A、分布形狀B、離散程度C、集中趨勢(shì)D、有效性17.在數(shù)據(jù)分布的描述分析上,偏度和峰度決定了數(shù)據(jù)分布是否遵循正態(tài)分布分析中,數(shù)值測(cè)度的()。A、分布形狀B、相關(guān)系數(shù)C、集中趨勢(shì)D、有效性18.大數(shù)據(jù)分析結(jié)果的表現(xiàn)形式中,直觀描述3個(gè)變量間關(guān)系則應(yīng)該選擇()。A、散點(diǎn)圖B、氣泡圖C、柱形圖D、餅圖19.()能有效預(yù)測(cè)房地產(chǎn)開發(fā)中存在的風(fēng)險(xiǎn),及時(shí)提醒規(guī)避。A、相關(guān)分析B、回歸分析C、描述統(tǒng)計(jì)分析D、對(duì)比分析20.2016年3月,特朗普在阿拉巴馬、阿肯色、喬治亞、馬薩諸塞、田納西、佛蒙特和維吉尼亞這7個(gè)州得票領(lǐng)先,但在得克薩斯、科羅拉多和俄克拉荷馬敗給克魯茲,在明尼蘇達(dá)州落后于盧比奧,得票率在共和黨內(nèi)處于領(lǐng)先地位,這樣的數(shù)據(jù)分析方法稱為()。A、橫向比較B、縱向比較C、分組分析D、結(jié)構(gòu)分析21.為了調(diào)研商品毛重量A、運(yùn)輸距離B和運(yùn)輸成本C的關(guān)系,分析數(shù)據(jù)確定三者的具體關(guān)系,遵循一定變化規(guī)律,三者屬于()關(guān)系。A、函數(shù)相關(guān)B、復(fù)相關(guān)C、線性相關(guān)D、非線性相關(guān)22.以下有關(guān)PowerPivot的說(shuō)法中,不正確的是()。A、PowerPivot整合多數(shù)據(jù)源:能從Web服務(wù)、文本文件、關(guān)系型數(shù)據(jù)庫(kù)等任何數(shù)據(jù)源導(dǎo)入數(shù)據(jù);B、PowerPivot處理海量數(shù)據(jù):支持大數(shù)據(jù)性能卓越,幾百萬(wàn)行數(shù)據(jù)集就如處理幾百行一樣出色C、PowerPivot操作簡(jiǎn)潔,熟悉Excel就能用PPD、PP實(shí)現(xiàn)任意平臺(tái)、任意系統(tǒng)的無(wú)邊界信息共享,并不局限于PPforSharePoint共享和發(fā)布上網(wǎng),還能兼容任何數(shù)據(jù)庫(kù)平臺(tái)的任何共享操作。23.2015年末中國(guó)大陸總?cè)丝?37462萬(wàn)人,其中,男性人口70414萬(wàn)人,女性人口67048萬(wàn)人。男女性別比為1.28:1該“男女性別比”屬于()數(shù)據(jù)。A、絕對(duì)數(shù)B、相對(duì)數(shù)C、眾數(shù)D、均值24.國(guó)際連鎖百貨零售企業(yè)大數(shù)據(jù)挖掘中,使用()能找出如何通過(guò)交叉銷售得到更大收入。A、回歸分析B、描述性分析C、抽樣調(diào)查D、關(guān)聯(lián)分析25.數(shù)據(jù)的相關(guān)分析屬于()類型的數(shù)據(jù)分析方法。A、客觀描述分析B、直方圖分析C、推斷預(yù)測(cè)分析D、抽樣分析26.指數(shù)平滑法中選擇加權(quán)的阻尼系數(shù)需要根據(jù)一定經(jīng)驗(yàn)做范圍選擇,因此,面對(duì)時(shí)間數(shù)據(jù)序列曲線波動(dòng)較平穩(wěn),應(yīng)選擇阻尼系數(shù)區(qū)間()更合適。A、[0.05~0.2]B、[0.3~0.5]C、[0.6~0.8]D、[0.8~0.95]27.以下關(guān)于數(shù)據(jù)準(zhǔn)備階段的數(shù)據(jù)清洗工作的說(shuō)法中,存在問(wèn)題的選項(xiàng)是()。A、數(shù)據(jù)清洗是數(shù)據(jù)分析前必不可少階段。B、數(shù)據(jù)清洗提供簡(jiǎn)潔、完整、正確的數(shù)據(jù)給后續(xù)數(shù)據(jù)加工。C、數(shù)據(jù)清洗原則是“多一分則肥,少一分則瘦”。D、數(shù)據(jù)清洗的目標(biāo)是為數(shù)據(jù)分析提供準(zhǔn)確的、數(shù)量足夠的數(shù)據(jù),因此刪除不合格的數(shù)據(jù)、修改錯(cuò)誤數(shù)據(jù)、填充缺失數(shù)據(jù)是十分必要的。任何數(shù)據(jù)經(jīng)過(guò)清洗都適合進(jìn)行數(shù)據(jù)分析。28.數(shù)據(jù)清洗過(guò)程中,去除數(shù)據(jù)臟點(diǎn)不包括以下選項(xiàng)中的()的操作。A、清除不必要的重復(fù)數(shù)據(jù)B、修改邏輯錯(cuò)誤的數(shù)據(jù)C、填充缺失數(shù)據(jù)D、檢測(cè)邏輯錯(cuò)誤的數(shù)據(jù)29.以下關(guān)于回歸分析的說(shuō)法中,不正確的是()。A、回歸分析基于觀測(cè)數(shù)據(jù),建立變量間適當(dāng)?shù)囊蕾囮P(guān)系,以分析數(shù)據(jù)內(nèi)在規(guī)律,主要用于預(yù)報(bào)、控制等實(shí)際問(wèn)題。B、歸分析是確定兩種及兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法C、回歸分析研究現(xiàn)象間是否存在依存關(guān)系,并探討依存關(guān)系的相關(guān)方向和相關(guān)程度。D、回歸分析能分析出多個(gè)變量之間的關(guān)系,從而分析目標(biāo)變量未來(lái)的發(fā)展變化趨勢(shì)。30.某新產(chǎn)品的推廣費(fèi)用和銷售額的相關(guān)系數(shù)=0.213,則該商品的廣告和銷售的關(guān)系屬于()。A、不相關(guān)B、強(qiáng)正相關(guān)C、低度相關(guān)D、中度相關(guān)二、是非題(每題0.5分,共10分)1.大數(shù)據(jù)分析中,若兩個(gè)數(shù)據(jù)變量彼此數(shù)量變化相互獨(dú)立,完全無(wú)關(guān),則可以認(rèn)為其關(guān)系為不相關(guān)。2.非線性相關(guān)意味著,當(dāng)給定某現(xiàn)象一個(gè)數(shù)值時(shí),另一現(xiàn)象會(huì)有若干數(shù)值與之對(duì)應(yīng)變化,并遵循一定規(guī)律波動(dòng)。3.如果統(tǒng)計(jì)一組大數(shù)據(jù)分布得到鋒度系數(shù)屬于[-1.2~0)區(qū)間,則稱其分布曲線具有平闊峰,這類數(shù)據(jù)分布較為平坦,峰度系數(shù)越趨近于-1.2,則曲線更矮、更胖(平坦)。4.在數(shù)據(jù)分析方法中,橫向比較是通過(guò)比較同一事物在不同的時(shí)間的狀態(tài),在不同時(shí)間條件下對(duì)事物總體指標(biāo)的靜態(tài)比較,對(duì)多種相關(guān)事物同層次的比較,了解其大小、多少和優(yōu)劣,以便為決策提供參考。5.對(duì)大數(shù)據(jù)做相關(guān)分析時(shí),相關(guān)系數(shù)r大小可以反映相關(guān)程度,r=0表示變量間存在函數(shù)相關(guān)關(guān)系。6.大數(shù)據(jù)是一個(gè)全新的技術(shù)領(lǐng)域,它不同于計(jì)算機(jī)技術(shù),應(yīng)用統(tǒng)計(jì)學(xué)、管理學(xué)等理論,可以為各種不同的應(yīng)用領(lǐng)域的相關(guān)數(shù)據(jù)提供大數(shù)據(jù)及其分析技術(shù)支持。7.大數(shù)據(jù)經(jīng)過(guò)清洗是否可以進(jìn)行數(shù)據(jù)分析,需要統(tǒng)計(jì)臟點(diǎn)出現(xiàn)的概率,如果超過(guò)10%的數(shù)據(jù)都是臟點(diǎn)就失去分析價(jià)值了,過(guò)高的錯(cuò)誤率使得分析結(jié)果有可能出現(xiàn)不可原諒的錯(cuò)誤。8.數(shù)據(jù)中重復(fù)、錯(cuò)誤、空白和遺失等問(wèn)題需要在初期統(tǒng)一處理,使用自動(dòng)化的方法進(jìn)行數(shù)據(jù)準(zhǔn)備不僅效率高,而且自動(dòng)檢索的處理保證的進(jìn)入分析階段的數(shù)據(jù)質(zhì)量比較高。9.回歸分析有自變量X和因變量Y之分,其中自變量X是隨機(jī)變量,因變量Y是普通變量。10.一組數(shù)據(jù)的描述統(tǒng)計(jì)結(jié)果中,眾數(shù)代表排序后居于所有數(shù)據(jù)的數(shù)值最中間位置的數(shù)值,它不能充分利用已知信息,但衡量時(shí)不受異常值影響,適合作為平均值的輔助參數(shù)之一,開共同衡量數(shù)據(jù)分布的集中趨勢(shì)。11.當(dāng)大數(shù)據(jù)分布統(tǒng)計(jì)曲線的集中程度越高,曲線兩側(cè)極端數(shù)據(jù)就相對(duì)更少,集中程度超過(guò)正態(tài)分布時(shí)峰態(tài)系數(shù)往往高于0。因此數(shù)據(jù)更集中分布在眾數(shù)周圍時(shí)尖削峰分布曲線更高、更瘦,越尖削則峰態(tài)系數(shù)越大。12.數(shù)據(jù)預(yù)測(cè)性分析通過(guò)分析現(xiàn)有數(shù)據(jù)間的相關(guān)性,探尋數(shù)據(jù)間存在的聯(lián)系,并進(jìn)一步通過(guò)建立相關(guān)回歸模型的方式對(duì)未來(lái)進(jìn)行合理的預(yù)測(cè),因此,預(yù)測(cè)性分析屬于展望未來(lái)的數(shù)據(jù)分析方式。13.曲面圖是對(duì)所選變量之間相關(guān)關(guān)系的一種直觀描述。14.現(xiàn)象之間存在的依存關(guān)系,對(duì)于某一變量的每一個(gè)數(shù)值,都有另一變量值與之對(duì)應(yīng),該關(guān)系能用一個(gè)數(shù)學(xué)表達(dá)式精確反映出來(lái),這種關(guān)系稱為相關(guān)關(guān)系。15.大數(shù)據(jù)的數(shù)據(jù)集來(lái)源可能包括:傳感器、氣候信息、公開信息(如雜志,報(bào)紙,文章)、購(gòu)買交易記錄、網(wǎng)絡(luò)日志、病歷、軍事監(jiān)控、視頻和圖像檔案及大型電子商務(wù),通常是萬(wàn)億或EB的大小,龐大而復(fù)雜,需要專門設(shè)計(jì)的硬件和軟件工具進(jìn)行處理。16.回歸分析就是要挖掘出函數(shù)關(guān)系的數(shù)學(xué)模型,可以根據(jù)回歸模型的規(guī)律預(yù)測(cè)未來(lái)變化。17.調(diào)查問(wèn)卷具體形式可以是紙質(zhì)調(diào)查問(wèn)卷,后期數(shù)字化后存儲(chǔ)形成結(jié)構(gòu)化數(shù)據(jù)表,也可

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論