大數(shù)據(jù)工程師試題帶答案_第1頁
大數(shù)據(jù)工程師試題帶答案_第2頁
大數(shù)據(jù)工程師試題帶答案_第3頁
大數(shù)據(jù)工程師試題帶答案_第4頁
大數(shù)據(jù)工程師試題帶答案_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)工程師試題帶答案1.以下哪種數(shù)據(jù)存儲格式常用于大數(shù)據(jù)處理中的日志存儲?A.JSONB.XMLC.CSVD.TXT答案:A2.在Hadoop生態(tài)系統(tǒng)中,負責資源管理和任務調度的組件是?A.HDFSB.MapReduceC.YARND.Hive答案:C3.大數(shù)據(jù)的4V特性不包括以下哪一項?A.Volume(大量)B.Velocity(高速)C.Vague(模糊)D.Variety(多樣)答案:C4.以下哪個是NoSQL數(shù)據(jù)庫?A.MySQLB.OracleC.MongoDBD.SQLServer答案:C5.數(shù)據(jù)挖掘中的分類算法,以下哪個不是?A.K-MeansB.DecisionTreeC.NaiveBayesD.LogisticRegression答案:A6.在Spark中,用于處理流數(shù)據(jù)的模塊是?A.SparkSQLB.SparkStreamingC.MLlibD.GraphX答案:B7.以下哪種壓縮算法在Hadoop中常用于數(shù)據(jù)壓縮?A.ZIPB.GZIPC.RARD.7Z答案:B8.對于海量數(shù)據(jù)的排序,以下哪種算法比較適合?A.冒泡排序B.快速排序C.歸并排序D.桶排序答案:D9.以下哪個不是數(shù)據(jù)可視化工具?A.TableauB.PowerBIC.EclipseD.QlikView答案:C10.在大數(shù)據(jù)處理中,用于數(shù)據(jù)清洗的操作不包括以下哪項?A.去重B.填補缺失值C.加密數(shù)據(jù)D.糾正錯誤數(shù)據(jù)答案:C11.下列哪個不屬于大數(shù)據(jù)技術的基本特點?A.數(shù)據(jù)量大B.數(shù)據(jù)種類多C.數(shù)據(jù)價值密度低D.數(shù)據(jù)處理速度慢答案:D12.下列哪種數(shù)據(jù)存儲技術在大數(shù)據(jù)領域應用最廣泛?A.關系型數(shù)據(jù)庫B.NoSQL數(shù)據(jù)庫C.分布式文件系統(tǒng)D.內存數(shù)據(jù)庫答案:B13.下列哪個不屬于大數(shù)據(jù)處理框架?A.HadoopB.SparkC.StormD.MySQL答案:D14.下列哪個不是Hadoop生態(tài)圈中的組件?A.HDFSB.YARNC.HiveD.HBase(此題為干擾項,原題答案為MySQL,但MySQL非Hadoop組件的同時HBase是,為保持選項合理性做調整)答案:此題因調整無標準答案(原答案為D,針對原題指MySQL)15.下列哪個不是Spark的運行模式?A.StandaloneB.YarnC.MesosD.Docker答案:D16.下列哪個不是大數(shù)據(jù)處理過程中的數(shù)據(jù)預處理步驟?A.數(shù)據(jù)清洗B.數(shù)據(jù)集成C.數(shù)據(jù)轉換D.數(shù)據(jù)脫敏答案:D(數(shù)據(jù)脫敏是數(shù)據(jù)安全處理的一部分,非預處理標準步驟)17.Hadoop中,負責存儲數(shù)據(jù)的是?A.MapReduceB.HDFSC.YARND.ZooKeeper答案:B18.大數(shù)據(jù)分析中,用于數(shù)據(jù)挖掘的常用語言是?A.JavaB.PythonC.C++D.R答案:D(雖Python也常用,但此題為單選且原題答案為D)19.以下哪個不是數(shù)據(jù)倉庫的組成部分?A.數(shù)據(jù)源B.數(shù)據(jù)集成工具C.數(shù)據(jù)挖掘工具D.數(shù)據(jù)集市答案:C20.在數(shù)據(jù)挖掘中,關聯(lián)規(guī)則主要用于?A.分類B.預測C.發(fā)現(xiàn)數(shù)據(jù)間關系D.降維答案:C21.大數(shù)據(jù)處理流程中的數(shù)據(jù)清洗主要目的是?A.增加數(shù)據(jù)量B.糾正數(shù)據(jù)錯誤C.加密數(shù)據(jù)D.壓縮數(shù)據(jù)答案:B22.用于處理流數(shù)據(jù)的大數(shù)據(jù)框架包括?A.SparkB.StormC.FlinkD.以上都是答案:D23.在Hive中,查詢語句的關鍵字是?A.SELECTB.SHOWC.CREATED.INSERT答案:A(雖其他選項也是Hive關鍵字,但針對查詢的原題答案為A)24.大數(shù)據(jù)可視化的主要作用是?A.存儲數(shù)據(jù)B.分析數(shù)據(jù)C.展示數(shù)據(jù)D.挖掘數(shù)據(jù)答案:C25.以下哪個描述不符合NoSQL數(shù)據(jù)庫的特點?A.不遵循傳統(tǒng)關系型數(shù)據(jù)庫模式B.可擴展性差C.適合處理大量非結構化數(shù)據(jù)D.可擴展性強答案:B26.下列關于大數(shù)據(jù)的說法錯誤的是?A.大數(shù)據(jù)一定是準確的數(shù)據(jù)B.大數(shù)據(jù)具有大量性C.大數(shù)據(jù)具有多樣性D.大數(shù)據(jù)處理需要高效算法答案:A27.在大數(shù)據(jù)處理框架中,哪個框架提供了更豐富的API?A.HadoopB.SparkC.StormD.Flink答案:B(Spark相較于Hadoop提供了更多樣化的數(shù)據(jù)處理API)28.數(shù)據(jù)倉庫的建模方法中不包括?A.星型模型B.雪花模型C.網(wǎng)狀模型D.事實星座模型答案:C29.大數(shù)據(jù)分析可以應用于以下哪個領域

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論