




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一講1、
多選題
關于“大數(shù)據(jù)”與“數(shù)據(jù)科學”這兩個概念的論述哪些是準確的?A“大數(shù)據(jù)”是用傳統(tǒng)數(shù)據(jù)處理系統(tǒng)難以處理的、大且復雜的數(shù)據(jù)集B“大數(shù)據(jù)”就是規(guī)模特別大的非結構化數(shù)據(jù)集C實時處理是“大數(shù)據(jù)”的唯一處理方式D“數(shù)據(jù)科學”核心是領域專業(yè)、統(tǒng)計挖掘和軟件編程三方面知識交叉融合EE.“大數(shù)據(jù)”強調“問題難度”,“數(shù)據(jù)科學”強調“數(shù)據(jù)思維”ADE2、多選題下面實例中哪些是“大數(shù)據(jù)分析”的代表性應用?A電商管理員從數(shù)百億的消費記錄中找到客戶張三的所有消費記錄B電商管理員從數(shù)百億的消費記錄推測某一個客戶的消費偏好C電商管理員根據(jù)數(shù)百億的消費記錄匯總銷售報表D電商管理員根據(jù)數(shù)百億的消費記錄發(fā)現(xiàn)某種服裝銷售量與當?shù)貧鉁赜嘘PEE.電商管理員根據(jù)歷史消費記錄預測下一季度的服裝庫存BDE3、多選題
關于“大數(shù)據(jù)分析生命周期”的論述哪些是正確的?A“大數(shù)據(jù)分析生命周期”只包括大規(guī)模數(shù)據(jù)集的分析與建模任務B“數(shù)據(jù)獲取和記錄”階段應盡量過濾掉“無用的”數(shù)據(jù)C“大數(shù)據(jù)分析生命周期”只需保留觀測數(shù)據(jù),而不用考慮元數(shù)據(jù)D“大數(shù)據(jù)分析”只要提供分析結果,而不用解釋處理過程EE.“大數(shù)據(jù)分析生命周期”的各個階段都需要人的參與BE4、
多選題關于“大數(shù)據(jù)處理技術”的論述哪些是正確的?A大數(shù)據(jù)應用只有在百分之百正確的數(shù)據(jù)集上才能實施B大數(shù)據(jù)計算平臺只能用戶獨占,而無法和其他用戶分享C主流大數(shù)據(jù)系統(tǒng)主要采用分布并行計算范型來實現(xiàn)D大數(shù)據(jù)系統(tǒng)通常是將數(shù)據(jù)“搬運”到某一個節(jié)點上集中處理EE.數(shù)據(jù)安全和隱私,是大數(shù)據(jù)領域面臨的重要技術挑戰(zhàn)CE5、多選題下面關于大數(shù)據(jù)生態(tài)系統(tǒng)論述哪些是正確的?AHadoop生態(tài)系統(tǒng)是典型的大數(shù)據(jù)生態(tài)系統(tǒng)B大數(shù)據(jù)生態(tài)系統(tǒng)是圍繞大數(shù)據(jù)分析生命周期展開的CSpark系統(tǒng)利用內存提高了計算速度,但是其應用程序代碼冗余D目前大數(shù)據(jù)生態(tài)系統(tǒng)只包括Hadoop和SparkEE.大數(shù)據(jù)系統(tǒng)參考架構中只包括數(shù)據(jù)提供者和數(shù)據(jù)消費者兩個角色AB第二講1、多選題
為什么人們從追求單個更快的計算機轉移到了追求更多的核,以及更多的機器A人們已經無法造出更快的計算機來滿足需求B通過并行化,機器更容易使用C多個機器可以更好的容錯D多個機器組成的集群要比單個大型計算機便宜ACD2、單選題
關于倉庫規(guī)模的計算機,下邊哪個說法是錯誤的:A倉庫規(guī)模的計算機通常放置于獨立的數(shù)據(jù)中心中B傳統(tǒng)的數(shù)據(jù)中心托管中心,可以很容易地升級為倉庫規(guī)模計算機C運維倉庫規(guī)模計算機的過程中,PUE是一個重要的考慮因素D運維倉庫規(guī)模計算機的過程中,節(jié)約人員成本是重要的考慮因素B3、
單選題關于虛擬機,以下說法正確的是A現(xiàn)代所有虛擬機技術的核心思想,都是讓客戶操作系統(tǒng)完全不能感知到自己運行在虛擬機當中B客戶操作系統(tǒng)可以直接訪問I/O設備C在沒有硬件支持的虛擬化環(huán)境中,客戶操作系統(tǒng)直接管理自己內部運行的應用的虛擬內存映射D虛擬機管理器(Hypervisor)是一個比操作系統(tǒng)要簡單的軟件系統(tǒng)D4、
單選題
關于網絡虛擬化,以下說法正確的是A通過VLAN進行網絡虛擬化,可以使不同的客戶感覺是運行在完全獨立的物理網絡上BVxLAN能夠帶來更高的性能,因此用戶正在逐漸從VLAN過渡到VxLANC軟件定義網絡能夠大大簡化網絡虛擬化的實現(xiàn)方式,提升靈活程度D只要我們有效地抑制廣播范圍,二層網絡可以擴展到任意大C5、
單選題關于存儲虛擬化,以下說法正確的是A、NAS的成本高于SAN,因為NAS需要額外的存儲網絡B某人提供了一種存儲系統(tǒng),允許直接在Linux中將這一設備當做/dev/sda使用,那么這一存儲系統(tǒng)提供了塊接口C對象存儲接口在現(xiàn)代云計算中很流行,主要是因為這一接口標準易用D網絡存儲系統(tǒng)一般比本地存儲可靠性高B6、
多選題
關于Openstack,以下說法正確的是AOpenstack允許不同租戶的虛擬機運行在同一臺物理服務器上BOpenstack允許同一臺物理服務器的單一網卡運行在不同的二層虛擬網絡上COpenstack的虛擬網絡有多種實現(xiàn)方式,其中VLAN是一個流行的方式DOpenstack的調度器是整個系統(tǒng)的神經中樞,所有的通訊和操作都是由調度器完成的。ABC第三講1、
多選題
以下的關于Google文件系統(tǒng)保存元數(shù)據(jù)的方法那些描述是正確的?AGoogle文件系統(tǒng)僅依靠一臺主服務器的內存來保存文件系統(tǒng)的元數(shù)據(jù)。BGoogle文件系統(tǒng)的數(shù)據(jù)服務器的負載均衡由主服務來均衡。CGoogle文件系統(tǒng)的主服務器可靠性保證分為三級:內存數(shù)據(jù)快速保存到磁盤中,單個節(jié)點失效采用影子服務器,兩個節(jié)點失效采用元數(shù)據(jù)多地備份方式進行恢復。D為了加快速度,Google文件系統(tǒng)的元數(shù)據(jù)僅采用日志的方式記錄到磁盤中。BC2、多選題
以下的關于Google文件系統(tǒng)的數(shù)據(jù)服務器的描述是正確的?A文件系統(tǒng)在刪除文件的同時,一定要將數(shù)據(jù)服務器中的數(shù)據(jù)塊一起刪除,否則會浪費磁盤空間。B某一個數(shù)據(jù)服務器失效的時候,數(shù)據(jù)副本恢復的時間與保存在這臺服務器中的數(shù)據(jù)量大小成正比。C為了保證數(shù)據(jù)塊的一致性,數(shù)據(jù)服務器采用了副本狀態(tài)機的方式保證數(shù)據(jù)塊寫入的一致性。D數(shù)據(jù)服務器在維護塊一致性的時候,需要主服務器的參與。CD3、
單選題以下的關于Google文件系統(tǒng)的可靠性的描述正確的是?A在保證元數(shù)據(jù)可靠性的時候,通過影子主服務器進行數(shù)據(jù)讀寫的流程是:客戶端發(fā)送元數(shù)據(jù)請求給主服務器,隨后主服務器同時發(fā)送請求給影子主服務器以及操作本地的數(shù)據(jù),在本地操作數(shù)據(jù)完成之后返回成功或者失敗給客戶端。B在保證數(shù)據(jù)可靠性的時候,主服務器將頒發(fā)一個租期給主塊服務器。C在保證數(shù)據(jù)可靠性的時候,并不需要對數(shù)據(jù)進行校驗,因為有三個數(shù)據(jù)副本,可以通過比較來獲知那個數(shù)據(jù)塊是正確的。D主塊服務器是固定的,因為只能由一臺服務器來確定所有的操作的順序。B4、
多選題
關于Google文件系統(tǒng)的一致性模型的描述,以下哪些描述是正確的?A同一個文件的同一個區(qū)域的所有的數(shù)據(jù)塊時時刻刻都會保持一致。B在多個客戶端進行寫入的時候,多個寫入操作并發(fā)進行,寫入的結果不一定反應多個并發(fā)寫入的結果。C在數(shù)據(jù)追加的過程中,寫入的數(shù)據(jù)可能混合了一些不一致的數(shù)據(jù)。D寫入成功的時候,總是能夠保證同一個邏輯數(shù)據(jù)塊的數(shù)據(jù)都是一樣的,與寫入操作提供的輸入數(shù)據(jù)也一致BC第四講1、
多選題關于MapReduce的冗余執(zhí)行(speculativeexecution),以下說法正確的是A通過冗余執(zhí)行,總能減少任務運行的總時間B最后剩下的幾個Map任務,如果運行時間很長,大都是因為機器故障導致C任務的冗余執(zhí)行要求Map和Reduce函數(shù)不能有副作用D冗余執(zhí)行要求Map和Reduce的操作都是冪等的CD2、
多選題
有人改進了MapReduce的架構,Map函數(shù)的輸出不寫入本地磁盤,而是直接(通過網絡)傳遞給Reduce任務,reduce任務收到所有Map的輸入后,再開始Reduce的處理。關于這種改動,以下說法正確的是A在某些情況下,整個任務的完成時間會縮短B這種改動大大降低了MapReduce的容錯性C在沒有錯誤的情況下,有時任務完成時間也會延長D經過這樣的改動,reduce就不需要對輸入進行專門的排序了,大大提升了系統(tǒng)運行效率(沒有錯誤的情況下)ABC3、多選題關于Hadoop和PigLatin的關系,以下正確的是A理論上講,PigLatin不一定要運行在MapReduce上BPigLatin會翻譯為一系列的MapReduce任務來運行CPigLatin提供了比MapReduce更豐富的操作ABC4、
多選題關于數(shù)據(jù)并行化,以下說法正確的是A不是所有數(shù)據(jù)都可以用數(shù)據(jù)平行的方法處理B數(shù)據(jù)并行需要輸入數(shù)據(jù)能夠被切分成獨立的若干塊,可以分別處理C數(shù)據(jù)并行每一塊的處理都必須是冪等的D數(shù)據(jù)并行就是使用MapReduce的另一種說法AB5、
單選題Shuffle步驟在Map進行到哪一步的時候,就可以開始執(zhí)行A至少有一個Map任務開始有輸出B至少有一個Map任務完成了C所有的Map任務都有了輸出D所有的Map任務都完成了A第五講1、單選題Spark程序容錯的主要方法是A重算B檢查點C冗余計算A2、
單選題如果Spark與MapReduce相比,主要的性能改進來源于A支持更多的算子B用內存代替硬盤存儲中間結果C使用Scala語言B3、單選題
一次機械硬盤的隨機讀寫所需的時間大致是一次內存隨機讀寫所需時間的幾倍?A100B1000C10,000D100,000D4、
判斷題對于同樣的數(shù)據(jù),持久化屬性為MEMORY_ONLY_SER的RDD比屬性為MEMORY_ONLY的RDD需要占用更多的內存錯第六講1、
單選題
關于2010年前后新一輪NoSQL運動的論述哪些是準確的?A僅否定SQL語言B否定關系模型、否定ACID、而且否定SQLC僅否定關系模型D僅否定ACIDB2、
多選題下面關于Cassandra數(shù)據(jù)模型的描述哪些是正確的?ACassandra的數(shù)據(jù)模型包括鍵空間、列族、行和列組成BCassandra的行是按照鍵值排序的CCassandra的列名會按照用戶定義比較函數(shù)來排序DCassandra的應用程序通常會有多個鍵空間和多個列族EE.Cassandra的同一個鍵空間的不同列族,可以有不同的分區(qū)策略和副本數(shù)目ABC3、
多選題下面關于Cassandra架構的論述哪些是正確的?ACassandra和Hadoop一樣都是采用Master-Slave架構BCassandra機群初始化時采用Gossip協(xié)議傳播節(jié)點信息CCassandra中是通過Gossip協(xié)議實現(xiàn)P2P架構的DGossip協(xié)議有時會交換冗余信息BCD4、
多選題關于Cassandra數(shù)據(jù)組織的論述哪些是正確的?ACassandra用同樣的哈希函數(shù)來計算數(shù)據(jù)對象和機器節(jié)點的哈希值BCassandra的客戶端決定與哪個節(jié)點連接,以完成查詢或者寫入數(shù)據(jù)C當新節(jié)點進入Cassandra系統(tǒng)時,它將被添加到哈希環(huán)中并分攤部分數(shù)據(jù)DCassandra服務器決定客戶端與哪個節(jié)點連接ABC5、多選題
下面關于Cassandra系統(tǒng)中副本管理的論述哪些是正確的?A將副本引入到分布式系統(tǒng)中,可以獲得系統(tǒng)可靠性收益BCassandra復制數(shù)據(jù)副本到協(xié)調者節(jié)點的N-1個后繼節(jié)點上,N是副本數(shù)目CCassandra中并發(fā)的更新不同的副本,可能會產生不一致的數(shù)據(jù)D在法團協(xié)議中三個參數(shù)對讀取和寫入操作一致性非常重要,即,N副本數(shù)目、NR讀操作中需要讀取的節(jié)點數(shù)、NW寫操作中需要阻塞等待的節(jié)點數(shù)ABCD第七講1、
多選題
以下計算任務比較容易使用流計算模式的是:A某社交媒體網站中用戶發(fā)布內容中的熱詞統(tǒng)計(即出現(xiàn)頻率最高的前K個熱詞)B搜索引擎中使用pagerank算法計算各個網頁的重要性C網絡監(jiān)控中識別某一種類型的數(shù)據(jù)包
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國負極凝膠劑行業(yè)市場分析及投資價值評估前景預測報告
- 歌曲 南海漁歌說課稿初中音樂粵教版八年級上冊-粵教版
- 高二新疆聯(lián)考試卷及答案
- 第五課 正確面對內疚教學設計小學心理健康人教版五年級下冊-人教版
- 五年級英語下冊 Unit 1 My day Part A第二課時說課稿1 人教PEP
- 2025年人工智能技術應用人才招聘筆試模擬題及答案解析
- Lesson 6 A Special Team說課稿初中英語北師大版2013八年級上冊-北師大版2013
- 2025年冷鏈物流中心招聘面試題詳解供銷社面試心得與答案
- 2025年醫(yī)學檢驗中級職稱考試要點解析
- 2025年縣域旅游業(yè)發(fā)展規(guī)劃與執(zhí)行經理招聘筆試模擬題集
- 2025年國網江蘇省電力有限公司校園招聘450人(提前批)筆試參考題庫附帶答案詳解
- 美甲老師教學員課件
- 2025江蘇南京棲霞區(qū)發(fā)改委編外工作人員招聘1人備考考試題庫附答案解析
- DB11∕T 1810-2020 裝配式抗震支吊架施工質量驗收規(guī)范
- 企業(yè)職業(yè)病防治培訓
- 2023年安徽職業(yè)技術學院招聘考試真題
- 工程聯(lián)系單格式
- 公司消防安全責任制規(guī)定
- 中秋節(jié)博餅規(guī)則
- 蔬菜工廠化育苗新技術課件
- 京瓷哲學78條內容
評論
0/150
提交評論