




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷18)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.a=True,b=False,c=True,以下關(guān)系表達(dá)式值為True的是?A)aandbandcB)aandnotbornotcC)notaandcorbD)bandnot(aandnotc)答案:B解析:[單選題]2.以下關(guān)于過(guò)擬合與欠擬合說(shuō)法正確的是(___)A)欠擬合無(wú)法徹底避免B)過(guò)擬合可采取的方法有:在決策樹學(xué)習(xí)中擴(kuò)展分支等C)過(guò)擬合模型表現(xiàn)為在訓(xùn)練集上具有高方差和低偏差D)泛化誤差是模型響應(yīng)訓(xùn)練數(shù)據(jù)而變化的程度答案:C解析:[單選題]3.相對(duì)于HadoopMapReduce1.0,Spark的特點(diǎn)不包括()。A)速度快B)并發(fā)多C)通用性D)易用性答案:B解析:相較于HadoopMapReduce,Spark的特點(diǎn)為速度快、通用性和易用性。[單選題]4.使用CREATETABLE語(yǔ)句的()子句,在創(chuàng)建基本表時(shí)可以啟用全文本搜索A)FULLTEXTB)ENGINEC)FROMD)WHRER答案:A解析:[單選題]5.執(zhí)行以下代碼段classA:def__init__(self):self.__i=2self.j=3defdisplay(self):print(self.__i,self.j)classB(A):def__init__(self):super().__init__()self.__i=4self.j=5c=B()c.display()時(shí),輸出為()。A)23B)43C)25D)45答案:C解析:[單選題]6.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。A)統(tǒng)計(jì)報(bào)表B)網(wǎng)絡(luò)爬蟲C)API接口D)傳感器答案:D解析:[單選題]7.在HBase的表的每個(gè)區(qū)域是由表中的()的子集構(gòu)成。A)行B)列C)單元D)塊答案:A解析:[單選題]8.依據(jù)國(guó)網(wǎng)公司數(shù)據(jù)管理辦法,堅(jiān)持(),建立公司數(shù)據(jù)共享負(fù)面清單制度。A)以共享為原則、不共享為例外B)以不共享為原則、共享為例外C)誰(shuí)主管誰(shuí)負(fù)責(zé)D)誰(shuí)使用誰(shuí)負(fù)責(zé)答案:A解析:[單選題]9.用Pyinstall工具把Python源文件打包成一個(gè)獨(dú)立的可執(zhí)行文件,使用的參數(shù)是:A)-DB)-LC)-iD)-F答案:D解析:[單選題]10.出現(xiàn)在datanode的VERSION文件格式中但不出現(xiàn)在namenode的VERSION文件格式中的是A)namespaceIDB)storageIDC)storageTypeD)layoutVersion答案:B解析:其他三項(xiàng)是公有的。layoutVersion是一個(gè)負(fù)整數(shù),保存了HDFS的持續(xù)化在硬盤上的數(shù)據(jù)結(jié)構(gòu)的格式版本號(hào);namespaceID是文件系統(tǒng)的唯一標(biāo)識(shí)符,是在文件系統(tǒng)初次格式化時(shí)生成的;storageType表示此文件夾中保存的是數(shù)據(jù)節(jié)點(diǎn)的類型[單選題]11.以下哪種機(jī)制使Flink能夠?qū)崿F(xiàn)窗口中無(wú)序數(shù)據(jù)的有序處理?A)窗口B)有狀態(tài)處理C)檢查點(diǎn)D)事件時(shí)間答案:D解析:[單選題]12.Hive中的這條命令?ALTERTABLEemployeelADDcolumns答案:columnlstring.?是什么含義?A)創(chuàng)建表B)刪除表C)添加列D)修改文件格式答案:C解析:[單選題]13.當(dāng)Hive提供的內(nèi)置函數(shù)無(wú)法滿足業(yè)務(wù)處理需要時(shí),此時(shí)就可以考慮使用用戶自定義函數(shù)。()作用于單個(gè)數(shù)據(jù)行,產(chǎn)生一個(gè)數(shù)據(jù)行作為輸出,例如:數(shù)學(xué)函數(shù),字符串函數(shù)。A)UAFB)UDFC)UDAFD)UDTF答案:B解析:[單選題]14.推進(jìn)營(yíng)配貫通優(yōu)化提升,貫通率提升()A)5%B)7%C)10%D)15%答案:A解析:[單選題]15.在fusionlnsight產(chǎn)品中,關(guān)于kafka的topic.以下描述不正確的是?A)topic的partition數(shù)量可以創(chuàng)建時(shí)配置B)每個(gè)topic只能被分成一個(gè)partition區(qū)C)每條發(fā)布到kafka的消息都有一個(gè)類別,這個(gè)類別被稱為topic.也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D)每個(gè)partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件,log文件中記錄了所有的消息數(shù)據(jù)答案:B解析:[單選題]16.在電子商務(wù)網(wǎng)站進(jìn)行網(wǎng)購(gòu)時(shí),用戶的點(diǎn)擊流數(shù)據(jù)會(huì)被實(shí)時(shí)發(fā)送到后端的大數(shù)據(jù)分析平臺(tái)進(jìn)行處理,平臺(tái)根據(jù)用戶的特征,找到與其購(gòu)買興趣匹配的其他用戶群體,再把其他用戶曾經(jīng)購(gòu)買過(guò)而該用戶還沒(méi)購(gòu)買過(guò)的相關(guān)商品推薦給該用戶。這個(gè)過(guò)程需要()A)高效率性。B)高精確性。C)明確的因果關(guān)系。D)符合用戶需求。答案:A解析:[單選題]17.大數(shù)據(jù)平臺(tái)核心分布式存儲(chǔ)與計(jì)算組件采用Hadoop技術(shù)體系中的分布式存儲(chǔ)、分布式計(jì)算框架及Spark等開源產(chǎn)品和技術(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)的安全控制和管理功能,其中分布式存儲(chǔ)不包括()。A)HDFSB)PostgresqlC)HiveD)HBase答案:B解析:Postgresql并非分布式存儲(chǔ)。[單選題]18.ApacheHadoop通過(guò)在多個(gè)主機(jī)上復(fù)制數(shù)據(jù)來(lái)達(dá)到可用性,因此不需要在主機(jī)上進(jìn)行()存儲(chǔ)A)標(biāo)準(zhǔn)RAID級(jí)別B)RAIDC)ZFSD)操作系統(tǒng)答案:B解析:[單選題]19.核矩陣是(__)的。A)沒(méi)有規(guī)律B)半正定C)正定D)樣本矩陣答案:B解析:[單選題]20.在淘寶網(wǎng)購(gòu)物時(shí),當(dāng)你購(gòu)買了?汽車防盜鎖?之后,淘寶網(wǎng)會(huì)自動(dòng)提示你與你購(gòu)買相同物品的其他客戶還購(gòu)買了汽車坐墊。這個(gè)案例體現(xiàn)了大數(shù)據(jù)思維的()A)大數(shù)據(jù)強(qiáng)調(diào)因果性B)大數(shù)據(jù)強(qiáng)調(diào)相關(guān)性C)大數(shù)據(jù)強(qiáng)調(diào)精確性D)大數(shù)據(jù)強(qiáng)調(diào)抽樣答案:B解析:[單選題]21.下面代碼的輸出結(jié)果是:forsin"HelloWorld":ifs=="W":continueprint(s,end="")A)HelloorldB)HelloC)WorldD)HelloWorld答案:A解析:[單選題]22.數(shù)據(jù)可視化的方法論基礎(chǔ)是()。A)統(tǒng)計(jì)圖表B)視覺(jué)編碼C)圖論D)圖形符號(hào)學(xué)答案:B解析:數(shù)據(jù)可視化的方法體系的方法論基礎(chǔ)主要是指"視覺(jué)編碼"。"視覺(jué)編碼"為其他數(shù)據(jù)可視化方法提供了方法論基礎(chǔ),奠定了數(shù)據(jù)可視化方法體系的根基。[單選題]23.舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中明確指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是思維方式的三種轉(zhuǎn)變,其中不包括()A)全樣而非抽樣B)效率而非精確C)相關(guān)而非因果D)務(wù)實(shí)而非務(wù)虛答案:D解析:[單選題]24.已知文件abc.txt的內(nèi)容如下:Hello,AB通過(guò)如下代碼讀取上述文件的內(nèi)容,讀取的結(jié)果為()。f=open('abc.txt','r')content=f.read(7)print(content)A)HellB)HelloC)Hello,D)Hello,A答案:D解析:[單選題]25.在Scipy中,想要生成20個(gè)服從正態(tài)分布的隨機(jī)數(shù)使用函數(shù)()。A)stats.uniform.rvs(size=20)B)stats.norm.rvs(size=20)C)stats.beta.rvs(size=20)D)stats.poisson.rvs(size=20)答案:B解析:uniform均勻分布,norm正態(tài)分布,beta貝塔分布,poisson泊松分布。[單選題]26.Spark的()組件用于支持實(shí)時(shí)計(jì)算需求。A)SparkSQLB)SparkStreamingC)SparkGraphXD)SparkMLLib答案:B解析:[單選題]27.以下哪個(gè)不屬于hadoop的核心構(gòu)成A)HDFSB)MapReduceC)SparkD)YARN答案:C解析:[單選題]28.關(guān)于字符串的說(shuō)法中,下列描述錯(cuò)誤的是()。A)字符串創(chuàng)建后可以被修改B)字符串可以使用單引號(hào)、雙引號(hào)和三引號(hào)定義C)轉(zhuǎn)義字符\n表示換行D)格式符均由%和說(shuō)明轉(zhuǎn)換類型的字符組成答案:A解析:[單選題]29.對(duì)銀行業(yè)而言,做好大數(shù)據(jù)分析應(yīng)用的前提是()A)增加統(tǒng)計(jì)種類B)增加營(yíng)業(yè)網(wǎng)點(diǎn)C)增加數(shù)據(jù)來(lái)源D)開展專項(xiàng)活動(dòng)答案:C解析:[單選題]30.表達(dá)式eval('500/10')的結(jié)果是:A)?500/10?B)500/10C)50D)50.0答案:D解析:[單選題]31.下列哪些不是ZooKeeper的特點(diǎn)()A)順序一致性B)原子性C)多樣系統(tǒng)映像D)可靠性答案:C解析:[單選題]32.查看一個(gè)分區(qū)表都有哪些分區(qū),正確的是:()(不是分區(qū)鍵,是分區(qū)內(nèi)容)。A)SHOW<table_name>B)DESC<table_name>C)SHOWPARTITIONS<table_name>D)DESCPARTITIONS<table_name>答案:C解析:[單選題]33.可視化中的組件樣式不包括()A)標(biāo)題B)自適應(yīng)顯示C)標(biāo)簽D)軸線答案:C解析:可視化的組件樣式:標(biāo)題、圖例、軸線、橫向網(wǎng)格線、縱向網(wǎng)格線、背景、自適應(yīng)提示、交互屬性[單選題]34.決策樹中的葉結(jié)點(diǎn)對(duì)應(yīng)于()A)屬性B)樣本C)決策結(jié)果D)標(biāo)簽值答案:C解析:[單選題]35.Flume將數(shù)據(jù)從產(chǎn)生、傳輸、處理并最終寫入目標(biāo)的路徑的過(guò)程抽象為()。A)文件系統(tǒng)B)數(shù)據(jù)流C)數(shù)據(jù)單元D)列表答案:B解析:[單選題]36.下列關(guān)于關(guān)鍵詞提取的說(shuō)法錯(cuò)誤的是?A)關(guān)鍵詞提取是指借用自然語(yǔ)言處理方法提取文章關(guān)鍵詞B)TF-IDF模型是關(guān)鍵詞提取的經(jīng)典方法C)文本中出現(xiàn)次數(shù)最多的詞最能代表文本的主題D)這個(gè)問(wèn)題設(shè)計(jì)數(shù)據(jù)挖掘,文本處理,信息檢索等領(lǐng)域答案:C解析:[單選題]37.運(yùn)行下面代碼,輸出結(jié)果是()。D={-2,-1,0,1,2,3}n=d.pop()Print(n)A)-2B)2C)不確定D)3答案:C解析:集合中元素是無(wú)序的。[單選題]38.進(jìn)入要操作的數(shù)據(jù)庫(kù)TEST用以下哪一項(xiàng)()A)INTESTB)SHOWTESTC)USERTESTD)USETEST答案:D解析:[單選題]39.()是指幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),但當(dāng)這些數(shù)據(jù)組組合在一起后,這種趨勢(shì)將消失或反轉(zhuǎn)。A)辛普森悖論B)大數(shù)據(jù)悖論C)大數(shù)據(jù)偏見(jiàn)D)幸存者偏差答案:A解析:辛普森悖論是概率和統(tǒng)計(jì)學(xué)中的一種現(xiàn)象,即幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),41但當(dāng)這些數(shù)據(jù)組組合在一起后,這種趨勢(shì)將消失或反轉(zhuǎn)。例如,在腎結(jié)石治療數(shù)據(jù)分析中,比較兩種腎結(jié)石治療的成功率。[單選題]40.以下()組件負(fù)責(zé)控制系統(tǒng)資源的分配,防止過(guò)量業(yè)務(wù)負(fù)載對(duì)系統(tǒng)的沖擊而導(dǎo)致業(yè)務(wù)擁塞。A)GTMB)WLMC)CND)DN答案:B解析:[單選題]41.下面不屬于NoSQL的有(__)。A)ORACLEB)RedislabsC)couchbaseD)paradigm4答案:D解析:[單選題]42.Sigmoid函數(shù)作為神經(jīng)元激活函數(shù)的特點(diǎn)是()。A)連續(xù)但不光滑B)不連續(xù)但光滑C)連續(xù)且光滑D)不連續(xù)且不光滑答案:C解析:[單選題]43.運(yùn)用機(jī)器學(xué)習(xí)的相關(guān)技術(shù)對(duì)詞語(yǔ)的情感進(jìn)行分類。機(jī)器學(xué)習(xí)的方法通常需要先讓分類模型學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的規(guī)律,然后用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)。以上描述屬于哪種類型的詞語(yǔ)級(jí)情感分析A)基于詞典的分析方法B)基于網(wǎng)絡(luò)的分析方法C)基于語(yǔ)料庫(kù)的分析方法D)其他答案:C解析:[單選題]44.創(chuàng)建Loader作業(yè)時(shí),可以在以下()步驟中設(shè)置Map數(shù)。A)輸出B)輸入設(shè)置C)轉(zhuǎn)換D)基本信息答案:A解析:[單選題]45.PageRank是一個(gè)函數(shù),它對(duì)Web中的每個(gè)網(wǎng)頁(yè)賦予一個(gè)實(shí)數(shù)值。它的意圖在于網(wǎng)頁(yè)的PageR.ank越高,那么它就()。A)相關(guān)性越高B)越不重要C)相關(guān)性越低D)越重要答案:D解析:[單選題]46.什么是大數(shù)據(jù)使用的最可靠方法?A)大數(shù)據(jù)源B)樣本數(shù)據(jù)源C)規(guī)模大D)大數(shù)據(jù)與樣本數(shù)據(jù)結(jié)合答案:D解析:[單選題]47.耦合性和內(nèi)聚性是對(duì)模塊獨(dú)立性度量的兩個(gè)標(biāo)準(zhǔn)。下面敘述中正確的是A)降低耦合性提高內(nèi)聚性有利于提高模塊的獨(dú)立性B)耦合性是指一個(gè)模塊內(nèi)部個(gè)元素間彼此結(jié)合的緊密程度C)提高耦合性降低內(nèi)聚性有利于提高模塊的獨(dú)立性D)內(nèi)聚性是模塊間相互連接的緊密程度答案:A解析:[單選題]48.FusionlnsightManager對(duì)服務(wù)的管理操作,下面說(shuō)法錯(cuò)誤酌是?A)可對(duì)服務(wù)進(jìn)行啟停重啟操作B)可以添加和卸載服務(wù)C)可設(shè)置不常用的服務(wù)隱藏或顯示D)可查看服務(wù)的當(dāng)前狀態(tài)答案:C解析:[單選題]49.Hadoop框架中最核心的設(shè)計(jì)是什么?A)為海量數(shù)據(jù)提供存儲(chǔ)的HDFS和對(duì)數(shù)據(jù)進(jìn)行計(jì)算的MapReduceB)提供整個(gè)HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務(wù)C)Hadoop不僅可以運(yùn)行在企業(yè)內(nèi)部的集群中,也可以運(yùn)行在云計(jì)算環(huán)境中D)Hadoop被視為事實(shí)上的大數(shù)據(jù)處理標(biāo)準(zhǔn)答案:A解析:[單選題]50.數(shù)據(jù)科學(xué)處于哪三大領(lǐng)域的重疊之處()。A)數(shù)學(xué)與統(tǒng)計(jì)知識(shí)、黑客精神與技能、領(lǐng)域?qū)崉?wù)知識(shí)B)數(shù)據(jù)挖掘、黑客精神與技能、領(lǐng)域?qū)崉?wù)知識(shí)C)數(shù)學(xué)與統(tǒng)計(jì)知識(shí)、數(shù)據(jù)挖掘、領(lǐng)域?qū)崉?wù)知識(shí)D)數(shù)學(xué)與統(tǒng)計(jì)知識(shí)、黑客精神與技能、數(shù)據(jù)挖掘答案:A解析:[單選題]51.泊松分布是離散型隨機(jī)變量分布中相對(duì)較難的一種,泊松頻率函數(shù)定義為(___)。A)P(X=k)=(λ^k*e^λ)/k!B)P(X=k)=e^k/k!C)p^x(1-p)^(1-x)D)(n!p^k*(1-p)^(n-k))/k!(n-k)!答案:A解析:[單選題]52.如果查詢表A(有3行數(shù)據(jù))和表B(有4行數(shù)據(jù)),使用select*froma,b,返回的查詢結(jié)果有多少行A)7B)1C)0D)12答案:D解析:[單選題]53.以下四種描述中,正確的是()A)、大數(shù)據(jù)和海量數(shù)據(jù)是同一個(gè)事物的不同描述B)、數(shù)據(jù)和數(shù)值是同一個(gè)事物的不同描述C)、數(shù)據(jù)和數(shù)字是同一個(gè)事物的不同描述D)、以上說(shuō)法均不正確答案:D解析:[單選題]54.數(shù)據(jù)湖探索(DataLakeInsight,簡(jiǎn)稱DLI)是支持以下()形式的大數(shù)據(jù)計(jì)算分析服務(wù)。A)流式處理B)批處理C)流批一體D)都不支持答案:C解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險(xiǎn)預(yù)警信號(hào)管理辦法(試行)》,在貸后風(fēng)險(xiǎn)預(yù)警信號(hào)管理階段,客戶經(jīng)理崗的主要工作包括()等。A)負(fù)責(zé)對(duì)?大數(shù)據(jù)智能風(fēng)控平臺(tái)?推送的貸后預(yù)警信號(hào)進(jìn)行風(fēng)險(xiǎn)排查;B)可采取多種方式聯(lián)系客戶完成貸后預(yù)警信號(hào)核實(shí)工作;C)對(duì)真實(shí)存在的預(yù)警信號(hào)制定并填寫貸后預(yù)警處置措施,同時(shí)上報(bào)支行預(yù)警審批崗審查審批;D)負(fù)責(zé)執(zhí)行總、分、支各級(jí)審批崗要求落實(shí)的貸后預(yù)警處置措施,并對(duì)相關(guān)情況進(jìn)行持續(xù)跟蹤監(jiān)控及報(bào)告;答案:ABCD解析:[多選題]56.數(shù)據(jù)可視化的特征有()。A)易懂性B)必然性C)片面性D)專業(yè)性答案:ABCD解析:[多選題]57.下面說(shuō)法選項(xiàng)錯(cuò)誤的是()()A)在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB)在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC)在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD)在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel答案:AD解析:[多選題]58.(__)是基于字符串匹配的分詞方法。A)正向最大匹配法B)逆向最大匹配法C)最少切分D)隱馬爾科夫模型答案:ABC解析:[多選題]59.下面關(guān)于GoogleSpanner的描述正確的是:()A)Spanner是一個(gè)可擴(kuò)展的、全布式的數(shù)據(jù)庫(kù)B)在最高抽象層面,Spanner就是一個(gè)數(shù)據(jù)庫(kù),把數(shù)片存儲(chǔ)在許多Paxos狀態(tài)機(jī)上這些機(jī)器位于遍布全球的數(shù)據(jù)中心內(nèi)C)隨著數(shù)據(jù)的變化和服務(wù)器的變化,Spanner會(huì)fl動(dòng)把數(shù)據(jù)進(jìn)行重片,從而有效應(yīng)對(duì)負(fù)載變化和處理失敗D)Spanner被設(shè)計(jì)成可以擴(kuò)展到幾百萬(wàn)個(gè)機(jī)器節(jié)點(diǎn),跨越成百上千個(gè)數(shù)據(jù)中心,具備兒萬(wàn)億數(shù)據(jù)庫(kù)行的規(guī)模答案:ABCD解析:[多選題]60.下列屬于關(guān)鍵詞提取算法的有()。A)TF-IDF算法B)TextRank算法C)LSA(潛在語(yǔ)義分析)D)LDA答案:ABCD解析:關(guān)鍵詞提取算法包括TF-IDF算法、TextRank算法、LSA(潛在語(yǔ)義分析)/LSI(潛在語(yǔ)義索引)、LDA等。[多選題]61.Hadoop由哪幾部分組成()A)CommonB)hdfsC)YarnD)MapReduce答案:ABCD解析:[多選題]62.下面關(guān)于中心極限定理的說(shuō)法,正確的是()。A)中心極限定理說(shuō)明,對(duì)于大量相互獨(dú)立的隨機(jī)變量,其均值的分布以正態(tài)分布為極限B)中心極限定理說(shuō)明,對(duì)于大量相互獨(dú)立的隨機(jī)變量,其均值的分布以t分布為極限C)中心極限定理為Z檢驗(yàn)提供了理論支持D)中心極限定理是數(shù)理統(tǒng)計(jì)學(xué)和誤差分析的基礎(chǔ)答案:ACD解析:中心極限定理說(shuō)明,對(duì)于大量相互獨(dú)立的隨機(jī)變量,其均值的分布以正態(tài)分布為極限。[多選題]63.下列關(guān)于python中變量的使用,正確的是()。A)變量不必事先聲明B)變量無(wú)須先創(chuàng)建和賦值而直接使用C)變量無(wú)須指定類型D)可以使用del釋放資源答案:ACD解析:[多選題]64.以下關(guān)于FusionInsight中CarbonData說(shuō)法正確的有?A)使用Carbon的目的是對(duì)大數(shù)據(jù)即席查詢提供超快速響應(yīng)。B)Carbon使用輕量級(jí)壓縮和重量級(jí)壓縮的組合壓縮算法壓縮數(shù)據(jù),可以減少60%-80%數(shù)據(jù)存儲(chǔ)空間,大大節(jié)省硬件存儲(chǔ)成本。C)Carbon是一種新型的ApacheHadoop本地文件格式,使用先進(jìn)的列式存儲(chǔ).索引.壓縮和編碼技術(shù),以提高計(jì)算效率,有助于加速超過(guò)PB數(shù)量級(jí)的數(shù)據(jù)查詢,可用于更換的交互查詢。D)Carbon也是一種將數(shù)據(jù)源與Spark集成的高性能分析引擎。答案:ABCD解析:[多選題]65.下面哪些是Spark的組件()。A)SparkStreamingB)MLibC)GraphXD)SparkR答案:ABC解析:Spark的組件包括SparkSQL、SparkStreaming、MLid、GraphX。[多選題]66.神經(jīng)網(wǎng)絡(luò)模型(NeuralNetwork)因受人類大腦的啟發(fā)而得名神經(jīng)網(wǎng)絡(luò)由許多神經(jīng)元(Neuron)組成,每個(gè)神經(jīng)元接受一個(gè)輸入,對(duì)輸人進(jìn)行處理后給出一個(gè)輸出下列關(guān)于神經(jīng)元的描述中,正確的是()A)每個(gè)神經(jīng)元有一個(gè)輸入和一個(gè)輸出B)每個(gè)神經(jīng)元有多個(gè)輸入和一個(gè)輸出C)每個(gè)神經(jīng)元,有一個(gè)輸入和多個(gè)輸出D)每個(gè)神經(jīng)元有多個(gè)輸入和多輸出答案:ABCD解析:[多選題]67.關(guān)于數(shù)據(jù)倉(cāng)庫(kù)Impala的描述正確的是:()A)Impala是由Oracle公司開發(fā)的查詢系統(tǒng)B)與Hive類似,Impala也可以直接與HDFS和HBase進(jìn)行交互C)Impala采用了與商用MPP并行關(guān)系數(shù)據(jù)庫(kù)類似的分布式查詢引擎,可以直接從HDFS或者HBase中用SQL語(yǔ)句查詢數(shù)據(jù),而不需要把SQL語(yǔ)句轉(zhuǎn)化成MapReduce任務(wù)來(lái)執(zhí)行D)Impala和Hive采用了不同的SQL語(yǔ)法、ODBC驅(qū)動(dòng)程序和用戶接口答案:BC解析:[多選題]68.下列說(shuō)法中,關(guān)于MapReduce性能調(diào)優(yōu)說(shuō)法正確的是()。A)在數(shù)據(jù)輸入階段,采用CombineTextInputFormat來(lái)作為輸入,可以解決輸入端大量的小文件場(chǎng)景B)在Map階段,減少溢寫次數(shù),可以減少磁盤IOC)在Map階段,減少合并次數(shù),可以縮短MapReduce處理的時(shí)間D)在Shuffle階段,盡量給Shuffle提供更多的內(nèi)存空間,以防止出現(xiàn)內(nèi)存溢出現(xiàn)象答案:ABCD解析:[多選題]69.下列關(guān)于臟數(shù)據(jù)的說(shuō)法中,正確的是()A)格式不規(guī)范B)編碼不統(tǒng)一C)意義不明確D)與實(shí)際業(yè)務(wù)關(guān)系不大答案:ABCD解析:[多選題]70.在使用Spark時(shí),通常只有()情況下考慮對(duì)RDD進(jìn)行序列化處理。A)在完成成本較高的操作之后B)在執(zhí)行容易失敗的操作之前C)當(dāng)RDD被重復(fù)使用D)當(dāng)RDD間依賴關(guān)系復(fù)雜答案:ABC解析:[多選題]71.可視化高維展示技術(shù)在展示數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)分析結(jié)果方面()。A)能夠直觀反映成對(duì)數(shù)據(jù)之間的空間關(guān)系B)能夠直觀反映多維數(shù)據(jù)之間的空間關(guān)系C)能夠靜態(tài)演化事物的變化及變化的規(guī)律D)能夠動(dòng)態(tài)演化事物的變化及變化的規(guī)律E.提供高性能并行計(jì)算技術(shù)的強(qiáng)力支撐答案:BD解析:可視化高維展示技術(shù)在展示數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)分析結(jié)果方面能夠直觀反映多維數(shù)據(jù)之間的空間關(guān)系,以及能夠動(dòng)態(tài)演化事物的變化及變化的規(guī)律。[多選題]72.云數(shù)據(jù)中心的特征A)高設(shè)備利用率B)高可用性C)綠色節(jié)能D)人工化管理答案:ABC解析:[多選題]73.創(chuàng)建視圖時(shí)可用以下()選項(xiàng)完成視圖的安全控制。--A)DEFINERB)UNDEFINEDC)WITHCHECKOPTIOND)SQLSECURITY答案:AD解析:[多選題]74.以下關(guān)于HDFS的描述正確的是A)HDFS是一種分布式文件系統(tǒng)B)HDFS是一個(gè)高度容錯(cuò)性的系統(tǒng),適合部署在廉價(jià)的機(jī)器上C)HDFS難以支持高吞吐量的數(shù)據(jù)訪問(wèn)D)HDFS可以提供一套完整的企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)解決方案答案:AB解析:[多選題]75.以下哪些算子是窄依賴?A)unionB)mapC)filterD)groupBy答案:ABCD解析:[多選題]76.大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)中關(guān)于tunnel命令行工具的說(shuō)法,正確的是:()。A)tunnel上傳到分區(qū)表時(shí),會(huì)把數(shù)據(jù)直接上傳到指定的分區(qū)中去,不保證業(yè)務(wù)邏輯B)tunnel命令上傳文件時(shí),不能進(jìn)行壓縮(注:通過(guò)-cp參數(shù)進(jìn)行壓縮)C)tunnel上傳的數(shù)據(jù)是先寫到臨時(shí)目錄,最后確定成功后才寫到結(jié)果目錄D)tunnel上傳過(guò)程中不加密,數(shù)據(jù)以明文方式在網(wǎng)絡(luò)中傳輸(注:通過(guò)https連接就是加密方式)答案:AC解析:[多選題]77.下面有關(guān)HBase的描述正確的是()。A)Hbase中每個(gè)區(qū)域由它所屬于的表中它所包含的第一行及其最后一行來(lái)表示B)在初始階段,一個(gè)表只有一個(gè)區(qū)域C)在初始階段,一個(gè)表會(huì)隨機(jī)劃分為多個(gè)區(qū)域D)Hbase中的每個(gè)區(qū)域由表中行的子集構(gòu)成答案:ABD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.無(wú)論是使用單引號(hào)或雙引號(hào)定義的字符串,使用print()輸出的結(jié)果一致。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.在任何時(shí)刻相同的值在內(nèi)存中都只保留一份A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.Flink僅支持基于時(shí)間窗口操作。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.docker已成為業(yè)界容器化的主流技術(shù),大數(shù)據(jù)組件容器化尚不成熟,目前主流的容器化技術(shù)主要用于計(jì)算資源管理。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.一般而言,分布式數(shù)據(jù)庫(kù)是指物理上分散在不同地點(diǎn),但在邏輯上是統(tǒng)一的數(shù)據(jù)庫(kù)。因此分布式數(shù)據(jù)庫(kù)具有物理上的獨(dú)立性、邏輯上的一體性、性能上的可擴(kuò)展性等特點(diǎn)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.兩個(gè)變量的Pearson相關(guān)性系數(shù)為零,但這兩個(gè)變量的值同樣可以相關(guān)A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.物聯(lián)網(wǎng)是收集大數(shù)據(jù)的重要途徑A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.移動(dòng)互聯(lián)網(wǎng)實(shí)現(xiàn)了人人相連、人物相聯(lián)、物物相連。A)正確B)錯(cuò)誤答
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 幾種常見(jiàn)的巖石課件
- 2025年餐飲管理有限公司廚師勞務(wù)派遣合同樣本
- 2025年專業(yè)資料員團(tuán)隊(duì)業(yè)務(wù)外包服務(wù)合作協(xié)議
- 汽車業(yè)界洞悉與突圍
- 減肥知識(shí)課程培訓(xùn)課件
- 新冠肺炎基本知識(shí)培訓(xùn)課件
- 區(qū)位因素講解課件
- 園藝主題咖啡館創(chuàng)新創(chuàng)業(yè)項(xiàng)目商業(yè)計(jì)劃書
- 自動(dòng)駕駛路線軟件創(chuàng)新創(chuàng)業(yè)項(xiàng)目商業(yè)計(jì)劃書
- 水產(chǎn)品共享經(jīng)濟(jì)創(chuàng)新創(chuàng)業(yè)項(xiàng)目商業(yè)計(jì)劃書
- GB/T 27703-2011信息與文獻(xiàn)圖書館和檔案館的文獻(xiàn)保存要求
- GB/T 27065-2004產(chǎn)品認(rèn)證機(jī)構(gòu)通用要求
- 鈷領(lǐng)域:華友鈷業(yè)企業(yè)組織結(jié)構(gòu)及部門職責(zé)
- 血小板聚集功能測(cè)定及臨床意義課件
- 工程質(zhì)量通病防治措施專項(xiàng)施工方案
- 設(shè)備檢修管理流程圖
- 最新《心衰指南》課件
- DB4401-T 43-2020 反恐怖防范管理+防沖撞設(shè)施-(高清現(xiàn)行)
- 建筑節(jié)能工程竣工驗(yàn)收?qǐng)?bào)告3篇(施工單位節(jié)能驗(yàn)收?qǐng)?bào)告)
- 堤防工程重點(diǎn)難點(diǎn)
- 卸料平臺(tái)(落地搭設(shè))驗(yàn)收記錄表
評(píng)論
0/150
提交評(píng)論