學(xué)堂在線 大數(shù)據(jù)系統(tǒng)基礎(chǔ) 章節(jié)測(cè)試答案_第1頁
學(xué)堂在線 大數(shù)據(jù)系統(tǒng)基礎(chǔ) 章節(jié)測(cè)試答案_第2頁
學(xué)堂在線 大數(shù)據(jù)系統(tǒng)基礎(chǔ) 章節(jié)測(cè)試答案_第3頁
學(xué)堂在線 大數(shù)據(jù)系統(tǒng)基礎(chǔ) 章節(jié)測(cè)試答案_第4頁
學(xué)堂在線 大數(shù)據(jù)系統(tǒng)基礎(chǔ) 章節(jié)測(cè)試答案_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一講1、

多選題

關(guān)于“大數(shù)據(jù)”與“數(shù)據(jù)科學(xué)”這兩個(gè)概念的論述哪些是準(zhǔn)確的?A“大數(shù)據(jù)”是用傳統(tǒng)數(shù)據(jù)處理系統(tǒng)難以處理的、大且復(fù)雜的數(shù)據(jù)集B“大數(shù)據(jù)”就是規(guī)模特別大的非結(jié)構(gòu)化數(shù)據(jù)集C實(shí)時(shí)處理是“大數(shù)據(jù)”的唯一處理方式D“數(shù)據(jù)科學(xué)”核心是領(lǐng)域?qū)I(yè)、統(tǒng)計(jì)挖掘和軟件編程三方面知識(shí)交叉融合EE.“大數(shù)據(jù)”強(qiáng)調(diào)“問題難度”,“數(shù)據(jù)科學(xué)”強(qiáng)調(diào)“數(shù)據(jù)思維”ADE2、多選題下面實(shí)例中哪些是“大數(shù)據(jù)分析”的代表性應(yīng)用?A電商管理員從數(shù)百億的消費(fèi)記錄中找到客戶張三的所有消費(fèi)記錄B電商管理員從數(shù)百億的消費(fèi)記錄推測(cè)某一個(gè)客戶的消費(fèi)偏好C電商管理員根據(jù)數(shù)百億的消費(fèi)記錄匯總銷售報(bào)表D電商管理員根據(jù)數(shù)百億的消費(fèi)記錄發(fā)現(xiàn)某種服裝銷售量與當(dāng)?shù)貧鉁赜嘘P(guān)EE.電商管理員根據(jù)歷史消費(fèi)記錄預(yù)測(cè)下一季度的服裝庫存BDE3、多選題

關(guān)于“大數(shù)據(jù)分析生命周期”的論述哪些是正確的?A“大數(shù)據(jù)分析生命周期”只包括大規(guī)模數(shù)據(jù)集的分析與建模任務(wù)B“數(shù)據(jù)獲取和記錄”階段應(yīng)盡量過濾掉“無用的”數(shù)據(jù)C“大數(shù)據(jù)分析生命周期”只需保留觀測(cè)數(shù)據(jù),而不用考慮元數(shù)據(jù)D“大數(shù)據(jù)分析”只要提供分析結(jié)果,而不用解釋處理過程EE.“大數(shù)據(jù)分析生命周期”的各個(gè)階段都需要人的參與BE4、

多選題關(guān)于“大數(shù)據(jù)處理技術(shù)”的論述哪些是正確的?A大數(shù)據(jù)應(yīng)用只有在百分之百正確的數(shù)據(jù)集上才能實(shí)施B大數(shù)據(jù)計(jì)算平臺(tái)只能用戶獨(dú)占,而無法和其他用戶分享C主流大數(shù)據(jù)系統(tǒng)主要采用分布并行計(jì)算范型來實(shí)現(xiàn)D大數(shù)據(jù)系統(tǒng)通常是將數(shù)據(jù)“搬運(yùn)”到某一個(gè)節(jié)點(diǎn)上集中處理EE.數(shù)據(jù)安全和隱私,是大數(shù)據(jù)領(lǐng)域面臨的重要技術(shù)挑戰(zhàn)CE5、多選題下面關(guān)于大數(shù)據(jù)生態(tài)系統(tǒng)論述哪些是正確的?AHadoop生態(tài)系統(tǒng)是典型的大數(shù)據(jù)生態(tài)系統(tǒng)B大數(shù)據(jù)生態(tài)系統(tǒng)是圍繞大數(shù)據(jù)分析生命周期展開的CSpark系統(tǒng)利用內(nèi)存提高了計(jì)算速度,但是其應(yīng)用程序代碼冗余D目前大數(shù)據(jù)生態(tài)系統(tǒng)只包括Hadoop和SparkEE.大數(shù)據(jù)系統(tǒng)參考架構(gòu)中只包括數(shù)據(jù)提供者和數(shù)據(jù)消費(fèi)者兩個(gè)角色AB第二講1、多選題

為什么人們從追求單個(gè)更快的計(jì)算機(jī)轉(zhuǎn)移到了追求更多的核,以及更多的機(jī)器A人們已經(jīng)無法造出更快的計(jì)算機(jī)來滿足需求B通過并行化,機(jī)器更容易使用C多個(gè)機(jī)器可以更好的容錯(cuò)D多個(gè)機(jī)器組成的集群要比單個(gè)大型計(jì)算機(jī)便宜ACD2、單選題

關(guān)于倉庫規(guī)模的計(jì)算機(jī),下邊哪個(gè)說法是錯(cuò)誤的:A倉庫規(guī)模的計(jì)算機(jī)通常放置于獨(dú)立的數(shù)據(jù)中心中B傳統(tǒng)的數(shù)據(jù)中心托管中心,可以很容易地升級(jí)為倉庫規(guī)模計(jì)算機(jī)C運(yùn)維倉庫規(guī)模計(jì)算機(jī)的過程中,PUE是一個(gè)重要的考慮因素D運(yùn)維倉庫規(guī)模計(jì)算機(jī)的過程中,節(jié)約人員成本是重要的考慮因素B3、

單選題關(guān)于虛擬機(jī),以下說法正確的是A現(xiàn)代所有虛擬機(jī)技術(shù)的核心思想,都是讓客戶操作系統(tǒng)完全不能感知到自己運(yùn)行在虛擬機(jī)當(dāng)中B客戶操作系統(tǒng)可以直接訪問I/O設(shè)備C在沒有硬件支持的虛擬化環(huán)境中,客戶操作系統(tǒng)直接管理自己內(nèi)部運(yùn)行的應(yīng)用的虛擬內(nèi)存映射D虛擬機(jī)管理器(Hypervisor)是一個(gè)比操作系統(tǒng)要簡(jiǎn)單的軟件系統(tǒng)D4、

單選題

關(guān)于網(wǎng)絡(luò)虛擬化,以下說法正確的是A通過VLAN進(jìn)行網(wǎng)絡(luò)虛擬化,可以使不同的客戶感覺是運(yùn)行在完全獨(dú)立的物理網(wǎng)絡(luò)上BVxLAN能夠帶來更高的性能,因此用戶正在逐漸從VLAN過渡到VxLANC軟件定義網(wǎng)絡(luò)能夠大大簡(jiǎn)化網(wǎng)絡(luò)虛擬化的實(shí)現(xiàn)方式,提升靈活程度D只要我們有效地抑制廣播范圍,二層網(wǎng)絡(luò)可以擴(kuò)展到任意大C5、

單選題關(guān)于存儲(chǔ)虛擬化,以下說法正確的是A、NAS的成本高于SAN,因?yàn)镹AS需要額外的存儲(chǔ)網(wǎng)絡(luò)B某人提供了一種存儲(chǔ)系統(tǒng),允許直接在Linux中將這一設(shè)備當(dāng)做/dev/sda使用,那么這一存儲(chǔ)系統(tǒng)提供了塊接口C對(duì)象存儲(chǔ)接口在現(xiàn)代云計(jì)算中很流行,主要是因?yàn)檫@一接口標(biāo)準(zhǔn)易用D網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)一般比本地存儲(chǔ)可靠性高B6、

多選題

關(guān)于Openstack,以下說法正確的是AOpenstack允許不同租戶的虛擬機(jī)運(yùn)行在同一臺(tái)物理服務(wù)器上BOpenstack允許同一臺(tái)物理服務(wù)器的單一網(wǎng)卡運(yùn)行在不同的二層虛擬網(wǎng)絡(luò)上COpenstack的虛擬網(wǎng)絡(luò)有多種實(shí)現(xiàn)方式,其中VLAN是一個(gè)流行的方式DOpenstack的調(diào)度器是整個(gè)系統(tǒng)的神經(jīng)中樞,所有的通訊和操作都是由調(diào)度器完成的。ABC第三講1、

多選題

以下的關(guān)于Google文件系統(tǒng)保存元數(shù)據(jù)的方法那些描述是正確的?AGoogle文件系統(tǒng)僅依靠一臺(tái)主服務(wù)器的內(nèi)存來保存文件系統(tǒng)的元數(shù)據(jù)。BGoogle文件系統(tǒng)的數(shù)據(jù)服務(wù)器的負(fù)載均衡由主服務(wù)來均衡。CGoogle文件系統(tǒng)的主服務(wù)器可靠性保證分為三級(jí):內(nèi)存數(shù)據(jù)快速保存到磁盤中,單個(gè)節(jié)點(diǎn)失效采用影子服務(wù)器,兩個(gè)節(jié)點(diǎn)失效采用元數(shù)據(jù)多地備份方式進(jìn)行恢復(fù)。D為了加快速度,Google文件系統(tǒng)的元數(shù)據(jù)僅采用日志的方式記錄到磁盤中。BC2、多選題

以下的關(guān)于Google文件系統(tǒng)的數(shù)據(jù)服務(wù)器的描述是正確的?A文件系統(tǒng)在刪除文件的同時(shí),一定要將數(shù)據(jù)服務(wù)器中的數(shù)據(jù)塊一起刪除,否則會(huì)浪費(fèi)磁盤空間。B某一個(gè)數(shù)據(jù)服務(wù)器失效的時(shí)候,數(shù)據(jù)副本恢復(fù)的時(shí)間與保存在這臺(tái)服務(wù)器中的數(shù)據(jù)量大小成正比。C為了保證數(shù)據(jù)塊的一致性,數(shù)據(jù)服務(wù)器采用了副本狀態(tài)機(jī)的方式保證數(shù)據(jù)塊寫入的一致性。D數(shù)據(jù)服務(wù)器在維護(hù)塊一致性的時(shí)候,需要主服務(wù)器的參與。CD3、

單選題以下的關(guān)于Google文件系統(tǒng)的可靠性的描述正確的是?A在保證元數(shù)據(jù)可靠性的時(shí)候,通過影子主服務(wù)器進(jìn)行數(shù)據(jù)讀寫的流程是:客戶端發(fā)送元數(shù)據(jù)請(qǐng)求給主服務(wù)器,隨后主服務(wù)器同時(shí)發(fā)送請(qǐng)求給影子主服務(wù)器以及操作本地的數(shù)據(jù),在本地操作數(shù)據(jù)完成之后返回成功或者失敗給客戶端。B在保證數(shù)據(jù)可靠性的時(shí)候,主服務(wù)器將頒發(fā)一個(gè)租期給主塊服務(wù)器。C在保證數(shù)據(jù)可靠性的時(shí)候,并不需要對(duì)數(shù)據(jù)進(jìn)行校驗(yàn),因?yàn)橛腥齻€(gè)數(shù)據(jù)副本,可以通過比較來獲知那個(gè)數(shù)據(jù)塊是正確的。D主塊服務(wù)器是固定的,因?yàn)橹荒苡梢慌_(tái)服務(wù)器來確定所有的操作的順序。B4、

多選題

關(guān)于Google文件系統(tǒng)的一致性模型的描述,以下哪些描述是正確的?A同一個(gè)文件的同一個(gè)區(qū)域的所有的數(shù)據(jù)塊時(shí)時(shí)刻刻都會(huì)保持一致。B在多個(gè)客戶端進(jìn)行寫入的時(shí)候,多個(gè)寫入操作并發(fā)進(jìn)行,寫入的結(jié)果不一定反應(yīng)多個(gè)并發(fā)寫入的結(jié)果。C在數(shù)據(jù)追加的過程中,寫入的數(shù)據(jù)可能混合了一些不一致的數(shù)據(jù)。D寫入成功的時(shí)候,總是能夠保證同一個(gè)邏輯數(shù)據(jù)塊的數(shù)據(jù)都是一樣的,與寫入操作提供的輸入數(shù)據(jù)也一致BC第四講1、

多選題關(guān)于MapReduce的冗余執(zhí)行(speculativeexecution),以下說法正確的是A通過冗余執(zhí)行,總能減少任務(wù)運(yùn)行的總時(shí)間B最后剩下的幾個(gè)Map任務(wù),如果運(yùn)行時(shí)間很長(zhǎng),大都是因?yàn)闄C(jī)器故障導(dǎo)致C任務(wù)的冗余執(zhí)行要求Map和Reduce函數(shù)不能有副作用D冗余執(zhí)行要求Map和Reduce的操作都是冪等的CD2、

多選題

有人改進(jìn)了MapReduce的架構(gòu),Map函數(shù)的輸出不寫入本地磁盤,而是直接(通過網(wǎng)絡(luò))傳遞給Reduce任務(wù),reduce任務(wù)收到所有Map的輸入后,再開始Reduce的處理。關(guān)于這種改動(dòng),以下說法正確的是A在某些情況下,整個(gè)任務(wù)的完成時(shí)間會(huì)縮短B這種改動(dòng)大大降低了MapReduce的容錯(cuò)性C在沒有錯(cuò)誤的情況下,有時(shí)任務(wù)完成時(shí)間也會(huì)延長(zhǎng)D經(jīng)過這樣的改動(dòng),reduce就不需要對(duì)輸入進(jìn)行專門的排序了,大大提升了系統(tǒng)運(yùn)行效率(沒有錯(cuò)誤的情況下)ABC3、多選題關(guān)于Hadoop和PigLatin的關(guān)系,以下正確的是A理論上講,PigLatin不一定要運(yùn)行在MapReduce上BPigLatin會(huì)翻譯為一系列的MapReduce任務(wù)來運(yùn)行CPigLatin提供了比MapReduce更豐富的操作ABC4、

多選題關(guān)于數(shù)據(jù)并行化,以下說法正確的是A不是所有數(shù)據(jù)都可以用數(shù)據(jù)平行的方法處理B數(shù)據(jù)并行需要輸入數(shù)據(jù)能夠被切分成獨(dú)立的若干塊,可以分別處理C數(shù)據(jù)并行每一塊的處理都必須是冪等的D數(shù)據(jù)并行就是使用MapReduce的另一種說法AB5、

單選題Shuffle步驟在Map進(jìn)行到哪一步的時(shí)候,就可以開始執(zhí)行A至少有一個(gè)Map任務(wù)開始有輸出B至少有一個(gè)Map任務(wù)完成了C所有的Map任務(wù)都有了輸出D所有的Map任務(wù)都完成了A第五講1、單選題Spark程序容錯(cuò)的主要方法是A重算B檢查點(diǎn)C冗余計(jì)算A2、

單選題如果Spark與MapReduce相比,主要的性能改進(jìn)來源于A支持更多的算子B用內(nèi)存代替硬盤存儲(chǔ)中間結(jié)果C使用Scala語言B3、單選題

一次機(jī)械硬盤的隨機(jī)讀寫所需的時(shí)間大致是一次內(nèi)存隨機(jī)讀寫所需時(shí)間的幾倍?A100B1000C10,000D100,000D4、

判斷題對(duì)于同樣的數(shù)據(jù),持久化屬性為MEMORY_ONLY_SER的RDD比屬性為MEMORY_ONLY的RDD需要占用更多的內(nèi)存錯(cuò)第六講1、

單選題

關(guān)于2010年前后新一輪NoSQL運(yùn)動(dòng)的論述哪些是準(zhǔn)確的?A僅否定SQL語言B否定關(guān)系模型、否定ACID、而且否定SQLC僅否定關(guān)系模型D僅否定ACIDB2、

多選題下面關(guān)于Cassandra數(shù)據(jù)模型的描述哪些是正確的?ACassandra的數(shù)據(jù)模型包括鍵空間、列族、行和列組成BCassandra的行是按照鍵值排序的CCassandra的列名會(huì)按照用戶定義比較函數(shù)來排序DCassandra的應(yīng)用程序通常會(huì)有多個(gè)鍵空間和多個(gè)列族EE.Cassandra的同一個(gè)鍵空間的不同列族,可以有不同的分區(qū)策略和副本數(shù)目ABC3、

多選題下面關(guān)于Cassandra架構(gòu)的論述哪些是正確的?ACassandra和Hadoop一樣都是采用Master-Slave架構(gòu)BCassandra機(jī)群初始化時(shí)采用Gossip協(xié)議傳播節(jié)點(diǎn)信息CCassandra中是通過Gossip協(xié)議實(shí)現(xiàn)P2P架構(gòu)的DGossip協(xié)議有時(shí)會(huì)交換冗余信息BCD4、

多選題關(guān)于Cassandra數(shù)據(jù)組織的論述哪些是正確的?ACassandra用同樣的哈希函數(shù)來計(jì)算數(shù)據(jù)對(duì)象和機(jī)器節(jié)點(diǎn)的哈希值BCassandra的客戶端決定與哪個(gè)節(jié)點(diǎn)連接,以完成查詢或者寫入數(shù)據(jù)C當(dāng)新節(jié)點(diǎn)進(jìn)入Cassandra系統(tǒng)時(shí),它將被添加到哈希環(huán)中并分?jǐn)偛糠謹(jǐn)?shù)據(jù)DCassandra服務(wù)器決定客戶端與哪個(gè)節(jié)點(diǎn)連接ABC5、多選題

下面關(guān)于Cassandra系統(tǒng)中副本管理的論述哪些是正確的?A將副本引入到分布式系統(tǒng)中,可以獲得系統(tǒng)可靠性收益BCassandra復(fù)制數(shù)據(jù)副本到協(xié)調(diào)者節(jié)點(diǎn)的N-1個(gè)后繼節(jié)點(diǎn)上,N是副本數(shù)目CCassandra中并發(fā)的更新不同的副本,可能會(huì)產(chǎn)生不一致的數(shù)據(jù)D在法團(tuán)協(xié)議中三個(gè)參數(shù)對(duì)讀取和寫入操作一致性非常重要,即,N副本數(shù)目、NR讀操作中需要讀取的節(jié)點(diǎn)數(shù)、NW寫操作中需要阻塞等待的節(jié)點(diǎn)數(shù)ABCD第七講1、

多選題

以下計(jì)算任務(wù)比較容易使用流計(jì)算模式的是:A某社交媒體網(wǎng)站中用戶發(fā)布內(nèi)容中的熱詞統(tǒng)計(jì)(即出現(xiàn)頻率最高的前K個(gè)熱詞)B搜索引擎中使用pagerank算法計(jì)算各個(gè)網(wǎng)頁的重要性C網(wǎng)絡(luò)監(jiān)控中識(shí)別某一種類型的數(shù)據(jù)包

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論