能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)_第1頁
能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)_第2頁
能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)_第3頁
能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)_第4頁
能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)_第5頁
已閱讀5頁,還剩217頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE1能源大數據應用開發(fā)技能競賽理論考試題庫-上(單選題匯總)一、單選題1.下列()不是神經網絡的代表。A、卷積神經網絡B、遞歸神經網絡C、殘差網絡D、xgboost算法E、nan答案:D2.以下哪個不是Spark的組件()A、DriverB、SparkContextC、ClusterManagerD、ResourceManagerE、nan答案:D3.階躍函數與sigmoid函數均為典型激活函數()。A、正確B、錯誤C、nanD、nanE、nan答案:A4.離散程度的測度值愈大,則()。A、映變量值愈分散,算術平均數代表性愈差B、映變量值愈集中,算術平均數代表性愈差C、映變量值愈分散,算術平均數代表性愈好D、映變量值愈集中,算術平均數代表性愈好E、nan答案:A5.()的層結構主要有:輸入層、卷積層、池化層(匯聚層、下采樣層)、輸出層等,其他的還可以有全連接層,歸一化層之類的層結構。A、卷積神經網絡B、網絡神經C、識別神經D、圖像神經E、nan答案:A6.加強公司大數據應用項目化管理,建立全生命周期管理機制,運用數字化技術,強化()等關鍵環(huán)節(jié)和關鍵要素的在線管控力度,提升公司大數據應用管理規(guī)范性。A、職責、流程、制度、標準、評價B、職責、制度、流程、標準、評價C、職責、流程、標準、制度、評價D、職責、標準、制度、流程、評價E、nan答案:A7.以下關于語言類型的描述中,錯誤的是______。A、解釋是將源代碼逐條轉換成目標代碼同時逐條運行目標代碼的過程B、靜態(tài)語言采用解釋方式執(zhí)行,腳本語言采用編譯方式執(zhí)行C、C語言是靜態(tài)編譯語言,Python語言是腳本語言D、編譯是將源代碼轉換成目標代碼的過程E、nan答案:B8.下面代碼的輸出結果是foriinrange(10):ifi%2==0:continueelse:print(i,end=",")A、1,3,5,7,9,B、2,4,6,8,C、0,2,4,6,8,D、0,2,4,6,8,10,E、nan答案:A9.神經網絡建模步驟一般是()。1模型評估;2網絡配置;3模型訓練;4數據準備;5模型預測A、12345B、32154C、54321D、42315E、nan答案:D10.卷積神經網絡的第一層中有10個卷積核,每個卷積核尺寸為5*5,步長為1,不補零,該層的輸入圖片的維度是224x224x3,那么該層輸出的維度是()A、220x220x10B、220x220x5C、224x224x10D、224x224x5E、nan答案:A11.下面哪個屬于映射數據到新的空間的方法?A、傅立葉變換B、特征加權C、漸進抽樣D、維歸約E、nan答案:A12.數據資源主要是指能夠被企業(yè)及組織訪問和使用的所有數據信息的集合,通常表現為數據庫、文檔、圖片、()等形式。A、腳本B、視頻C、壓縮文件D、備份文件E、nan答案:B13.以下哪種不是常用的數據選擇方法()A、留一法B、留出法C、十則交叉驗證法D、互助法E、nan答案:D14.Ndarray是一個通用的()數據容器A、單維同類B、單維多類C、多維同類D、多維多類E、nan答案:C15.大數據的最顯著特征是()。A、數據規(guī)模大B、數據類型多樣C、數據處理速度快D、數據價值密度高E、nan答案:A16.()負責數據合規(guī)歸口管理,負責數據合規(guī)技術審查,持續(xù)提升數據合規(guī)管理水平。A、互聯網部B、信通公司C、辦公室D、安監(jiān)部E、nan答案:A17.下列關于Hadoop組件的說法,正確的有()①HDFS是基于流數據模式訪問和處理超大文件的需求而開發(fā)的,可以運行于廉價的商用服務器上;②Hive是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數據的機制;③Flume采用了Agent、Gossip和Storage三層架構;④Sqoop主要設計目的是在Hadoop與傳統(tǒng)數據庫之間進行數據的ETL操作A、①②③B、①②④C、②③④D、①③④E、nan答案:B18.以下關于Python的控制結構,錯誤的是:A、每個B、在C、PythonD、elifE、nan答案:D19.()是一種處理時序數據的神經網絡,常用語語音識別、機器翻譯等領域。A、前饋卷神經網絡B、卷積神經網絡C、循環(huán)神經網絡D、對抗神經網絡E、nan答案:C20.合作單位和供應商的開發(fā)測試環(huán)境與公司()應做好隔離。A、內網環(huán)境B、測試環(huán)境C、生產環(huán)境D、業(yè)務環(huán)境E、nan答案:C21.下列哪個不屬于常用的文本分類的特征選擇算法()。A、卡方檢驗值B、互信息C、信息增益D、主成分分析E、nan答案:D22.數據存儲環(huán)節(jié),企業(yè)重要數據原則上應存儲于管理信息大區(qū),在互聯網大區(qū)存儲企業(yè)重要數據時應____。A、本地儲存B、云上儲存C、加密儲存D、線下儲存E、nan答案:C23.()負責公司數據保密工作歸口管理,開展數據活動保密工作的指導和檢查。A、互聯網部B、法律部C、辦公室D、安監(jiān)部E、nan答案:C24.各地區(qū)、各部門應當按照數據()保護制度,確定本地區(qū)、本部門以及相關行業(yè)、領域的重要數據具體目錄,對列入目錄的數據進行重點保護。A、分類分級B、分級分域C、分層分級D、分類分域E、nan答案:A25.關于SOM神經網絡描述錯誤的是:(__)。A、一種競爭學習型的無監(jiān)督神經網絡B、將高維輸入數據映射到低維空間,保持輸入數據在高維空間的拓撲結構C、SOM尋優(yōu)目標為每個輸出神經元找到合適的權重D、輸出層神經元以矩陣方式排列在二維空間E、nan答案:C26.在實際生產環(huán)境中獲取的數據可能存在缺失值。為了更好地進行數據分析,通常需要對缺失數據進行識別和處理。下列關于DataFrame.dropna()方法說法正確的是()。A、DataFrame.dropna(axis=1,B、DataFrame.dropna(axis=0,C、DataFrame.dropna(axis=0,D、DataFrame.dropna(axis=1,E、nan答案:C27.下列哪一項在神經網絡中引入了非線性()A、隨機梯度下降修B、正線性單元(ReLU)C、卷積函數D、以上答案都不正確E、nan答案:B28.以下哪些CNN模型不是在imagenet比賽中興起的?()A、AlexNetB、VGG19C、ResNetD、Mask-RCNNE、nan答案:D29.從網絡的原理上來看,結構最復雜的神經網絡是()。A、卷積神經網絡B、長短時記憶神經網絡C、GRUD、BP神經網絡E、nan答案:B30.()計算框架源自一種分布式計算模型,其輸入和輸出值均為“鍵-值對”結構。A、MahoutB、MapReduceC、SparkD、SqoopE、nan答案:B31.對于一個圖像識別問題(在一張照片里找出一只貓),()可以更好地解決這個問題。A、循環(huán)神經網絡B、感知機C、多層感知機D、卷積神經網絡E、nan答案:D32.按照《國家電網有限公司數據共享負面清單管理細則》,納入公司負面清單的數據主要有()。A、商業(yè)秘密和工作秘密B、個人隱私C、相關敏感事項D、以上都是E、nan答案:D33.涉及個人信息處理的部門和單位,在制定相關制度時應明確(),建立體系化、多層次的告知同意機制,并采取必要的技術措施確保收集的個人信息安全。A、信息加工方式B、數據使用目的C、收集信息處理D、個人信息處理規(guī)則E、nan答案:D34.Python運算符中用來計算集合并集的是()A、|B、&C、||D、+E、nan答案:A35.假設一個具有3個神經元和輸入為[1,2,3]的簡單MLP模型。輸入神經元的權重分別為4,5和6。假設激活函數是一個線性常數值3(激活函數為:y=3x)。輸出是什么?A、32B、643C、96D、48E、nan答案:C36.業(yè)務中臺從管理上突破了系統(tǒng)建設的()壁壘A、部門級B、地市C、專業(yè)D、公司級E、nan答案:A37.熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是()。A、1B、3.2C、2.6D、3.8E、nan答案:C38.關系國家安全、國民經濟命脈、重要民生、重大公共利益等數據屬于國家()數據,實行更加嚴格的管理制度A、核心B、重要C、公共D、敏感E、nan答案:A39.現階段的大數據技術體系主要類型不包括()。A、數據源與APPB、基礎設施C、HadoopD、數據資源E、nan答案:C40.Hive的計算引擎是()。A、SparkB、MapReduceC、HDFSD、HBaseE、nan答案:B41.以下程序的輸出結果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A、['z',B、['j',C、['j',D、['j',E、nan答案:B42.以下哪種不是自適應學習率方法?A、Mini-batchB、AdagradC、RMSpropD、AdadeltaE、nan答案:A43.下列算法在sklearn中未提及的是()A、K-means聚類算法B、LogisticC、KNN算法D、Apriori關聯規(guī)則算法E、nan答案:D44.下面關于聚類分析說法錯誤的是(?)A、一定存在一個最優(yōu)的分類B、聚類分析是無監(jiān)督學習C、聚類分析可以用于判斷異常值D、聚類分析即:物以類聚,人以群分E、nan答案:A45.下列哪個不是RDD的緩存方法()A、persist()B、Cache()C、Memory()D、以上答案都正確E、nan答案:C46.進行主成分分析的前提條件是,各變量間()。A、高度相關B、低度相關C、相互獨立D、完全相關E、nan答案:B47.需加強國家秘密、企業(yè)秘密、個人信息、()等重點領域的數據合規(guī)管理A、他人信息B、個人秘密C、知識產權D、公共信息E、nan答案:C48.機房動力環(huán)境監(jiān)控系統(tǒng)不包含(___)A、電源狀態(tài)監(jiān)測B、煙霧檢測報警C、漏水檢測報警D、新風系統(tǒng)E、nan答案:D49.卷積神經網絡可以對一個輸入進行多種變換(旋轉、平移、縮放),這個表述正確嗎()A、對的B、不知道C、看情況D、不對E、nan答案:D50.用onehot對某個只有一個屬性的樣本進行編碼,下面可能是編碼結果的是()。A、1010B、1100C、1111D、1000E、nan答案:D51.AlexNet使用ReLU激活函數的好處不包括以下哪個方面?()A、梯度為0時神經元難以正常工作B、開銷小、計算快C、提高了網絡訓練速度D、緩解了梯度消失問題E、nan答案:A52.下列對于sigmoid函數的說法,錯誤的是()A、存在梯度爆炸的問題B、不是關于原點對稱C、計算exp比較耗時D、存在梯度消失的問題E、nan答案:A53.常用的圖像去噪方法有()。A、高斯濾波B、中值濾波C、P-M方程去噪D、以上答案都正確E、nan答案:D54.服務(),提供多模式電力交易大數據分析服務,開展電力交易市場化配置和風險預警數據應用,提高交易輔助決策和資源優(yōu)化配置能力。A、電力供用電市場B、電力客戶C、電力市場用戶D、電力資源市場化配置E、nan答案:D55.假設我們有一個使用ReLU激活函數(ReLUactivationfunction)的神經網絡,假如我們把ReLU激活替換為線性激活,那么這個神經網絡能夠模擬出同或函數(XNORfunction)嗎A、可以B、不好說C、不一定D、不能E、nan答案:D56.有關聚類分析說法錯誤的是()A、無須有標記的樣本B、可以用于提取一些基本特征C、可以解釋觀察數據的一些內部結構和規(guī)律D、聚類分析一個簇中的數據之間具有高差異性E、nan答案:D57.防止()發(fā)布或交互企業(yè)重要數據以及個人信息,擾亂互聯網秩序等違法違規(guī)活動。A、非法B、擅自C、負面信息D、非授權E、nan答案:D58.倒傳遞神經網絡(BP神經網絡)的訓練順序為何?(A:調整權重;B:計算誤差值;C:利用隨機的權重產生輸出的結果)?A、BCB、CAC、BAD、CBAE、nan答案:D59.數據全生命周期安全防護,不包括()。A、數據采集環(huán)節(jié)B、數據傳輸環(huán)節(jié)C、數據存儲環(huán)節(jié)D、數據建模分析節(jié)E、nan答案:D60.關于神經網絡結構的權重共享現象,下面哪個選項是正確的()A、只有全連接神經網絡會出現B、只有卷積神經網絡(CNN)會出現C、只有循環(huán)神經網絡(RNN)會出現D、卷積神經網絡和循環(huán)神經網絡都會出現E、nan答案:D61.數據分析思維模式主要從()入手,最終改變()A、數據;業(yè)務B、業(yè)務;數據C、數據;項目D、項目;數據E、nan答案:A62.個人信息數據收集應遵循不包括____的原則A、合法B、正當C、必要D、可溯源E、nan答案:D63.數據庫設計中的概念結構設計的主要工具是()A、數據模型B、E-R模型C、新奧爾良模型D、概念模型E、nan答案:B64.人工智能平臺總體架構由()組成A、平臺層B、應用層C、服務層D、全部E、nan答案:D65.Apriori算法的計算復雜度受()影響。①支持度閥值②項數(維度)③事務數④事務平均寬度A、①②③④B、②③④C、①③④D、①②③E、nan答案:A66.下列關于隨機森林和GBDT的書法正確的是()A、在隨機森林的單個樹中,樹和樹之間是有依賴的,而GBDT中的單個樹之間是沒有依賴的B、這兩個模型都使用隨機特征子集,來生成許多單個的樹C、我們可以并行地生成GBDT單個樹,因為它們之間是沒有依賴的D、GBDT訓練模型的表現總是比隨機森林好E、nan答案:B67.()要加強對涉及企業(yè)秘密的數據保護工作的組織、指導A、業(yè)務部門B、數字化部C、公司保密辦D、安全部門E、nan答案:C68.關于Python的全局變量和局部變量,以下選項中描述錯誤的是()A、使用global保留字聲明簡單數據類型變量后,該變量作為全局變量使用B、局部變量指在函數內部使用的變量,當函數退出時,變量依然存在,下次函數調用可以繼續(xù)使用C、簡單數據類型變量無論是否與全局變量重名,僅在函數內部創(chuàng)建和使用,函數退出后變量被釋放D、全局變量指在函數之外定義的變量,一般沒有縮進,在程序執(zhí)行全過程有效E、nan答案:B69.下列哪一項在神經網絡中引入了非線性()A、SGDB、激活函數C、卷積函數D、都不正確E、nan答案:B70.下面選項不正確的是()。importnumpyasnpx=np.array([[1,2],[3,4]])y=np.linalg.inv(x)print(y)A、[[1B、[[-2.C、[[1.D、以上答案均不正確E、nan答案:B71.()是一個開放源代碼的對象關系映射框架,它對JDBC進行了非常輕量級的對象封裝。A、hbaseB、hiveC、HibernateD、mapreduceE、nan答案:C72.下列程序段執(zhí)行后,輸出結果是()。n=1s=1whilen<5:s=s*nn=n+1Print(s)A、24B、10C、120D、15E、nan答案:A73.公司對外提供數據時,應根據《國家電網有限公司關于數據對外開放的指導意見》(國家電網互聯〔2020〕675號)有關要求,執(zhí)行()的數據開放策略。A、差異化B、一致化C、最大化D、最小化E、nan答案:A74.基于Bagging的集成學習代表算法有()。A、AdaboostB、GBDTC、XGBOOSTD、隨機森林E、nan答案:D75.以下統(tǒng)計學知識,數據科學中不常用的是()。A、歸納分析法B、描述統(tǒng)計C、推斷統(tǒng)計D、基本分析法E、nan答案:A76.若a=np.array([5,1,2,3]),a.sort(),則數組a的結果是()。A、[5,1,2,3];B、[1,2,3,5];C、[3,2,1,5];D、11;E、nan答案:B77.公司企業(yè)中臺基于()構建,是企業(yè)級能力共享平臺。A、華為云B、國網云C、阿里云D、百度云E、nan答案:B78.通過數據盤點理清數據狀況,建立數據目錄,以()為基礎梳理形成數據共享負面清單,結合負面清單明細進行數據安全分級,識別數據保護對象A、資產目錄B、個人信息C、商業(yè)秘密D、數據目錄E、nan答案:D79.業(yè)務中臺從管理上破除了系統(tǒng)建設的()壁壘,形成靈活、輕量、便捷的共享能力中心A、部門級B、管理級C、公司級D、企業(yè)級E、nan答案:A80.Hive是基于Hadoop的數據倉庫軟件,最大可以查詢有管理()級別的分布式數據。A、PBB、GBC、MBD、TBE、nan答案:A81.HDFS是Hadoop體系中定位是()。A、為數據倉庫的管理提供功能B、對大型數據集進行分析和評估C、日志收集分析D、數據存儲管理的基礎E、nan答案:D82.以下哪個是有關數據科學研究目的的原則?()A、DIKUW原則B、5W1H原則C、6S原則D、PDCA原則E、nan答案:A83.當閔可夫斯基距離公式中的系數p值為2時,可得到(__)的公式。A、歐氏距離B、曼哈頓距離C、街區(qū)距離D、切比雪夫距離E、nan答案:A84.《國家電網公司信息網絡運行管理規(guī)程》對進出機房的人員進行詳細登記,有關的登記記錄應保存的最短日期是()。A、1年B、2年C、3年D、半年E、nan答案:A85.屬于卷積神經網絡應用方向的是()。A、圖像分類B、目標檢測C、圖像語義分割D、以上答案都正確E、nan答案:D86.numpy中用于改變數組形狀的函數為()。A、np.ones()B、np.shape()C、np.reshape()D、np.dot()E、nan答案:C87.公司()要加強對涉及企業(yè)秘密的數據保護工作的組織、指導。A、互聯網部B、信通公司C、保密辦D、安監(jiān)部E、nan答案:C88.大數據應用專業(yè)支撐單位應落實大數據應用相關數據安全策略和(),加強數據安全前沿技術研究應用,提升數據安全感知、監(jiān)測、追溯和控制等能力,為大數據應用工作做好數據安全技術保障。A、安全措施B、技術措施C、防范措施D、管控措施E、nan答案:D89.下面算法屬于局部處理的是()。A、灰度線性變換B、二值化C、傅里葉變換D、中值濾波E、nan答案:D90.樸素貝葉斯分類器的樸素之處在于:A、只能處理低維屬性B、只能處理離散型屬性C、分類效果一般D、屬性之間的條件獨立性假設E、nan答案:D91.在梯度下降算法中,通常采用多種策略避免()A、全局最小B、局部最小C、全局最大D、局部最大E、nan答案:B92.一個HDFS集群是由一個()和多個數據節(jié)點組成。A、索引節(jié)點B、根節(jié)點C、名字節(jié)點D、數據節(jié)點E、nan答案:C93.下列關于模型能力(modelcapacity,指神經網絡模型能擬合復雜函數的能力)的描述正確的是()。A、隱藏層層數增加,模型能力增加B、DropoutC、學習率增加,模型能力增加D、以上都不正確E、nan答案:A94.數據科學項目應遵循一般項目管理的原則和方法,涉及()。A、整體、范圍、時間、成本、質量、溝通、風險、宣傳、消費B、整體、范圍、時間、成本、質量、人力資源、溝通、風險、采購C、整體、范圍、時間、成本、質量、人力資源、運維、采購、宣傳D、整體、范圍、時間、成本、質量、人力資源、采購、宣傳、運維E、nan答案:B95.國家提倡誠實守信,()的網絡行為,推動傳播社會注意核心價值觀,實行措施提高全社會的網絡安全意識和水平,形成全社會共同參加促進網絡安全的良好環(huán)境。A、自由公平B、健康文明C、團結互助D、和平友愛E、nan答案:B96.以下關于神經網絡的說法錯誤的是()A、遞歸神經網絡不允許網絡中出現環(huán)形結構B、減少神經網絡層數,可能會降低測試集分類錯誤率C、循環(huán)神經網絡適合處理序列數據D、卷積神經網絡可以應用于圖像分類E、nan答案:A97.在回歸分析中,代表了數據點和它在回歸直線上相應位置的差異的是:()。A、總偏差平方和B、殘差平方和C、回歸平方和D、相關指數R2E、nan答案:B98.下面算法中屬于圖像銳化處理的是()。A、低通濾波B、加權平均法C、高通濾波D、中值濾波E、nan答案:C99.當前人工智能算力持續(xù)突破,面向訓練用和推斷用的芯片仍在快速推進,基于___的訓練芯片持續(xù)增多A、CPUB、GPUC、FPGAD、5G通訊E、nan答案:B100.Hive的數據最終存儲在()A、HDFSB、HBaseC、RDBMSD、MetastoreE、nan答案:A101.在選擇神經網絡的深度時,下面哪些參數需要考慮?1神經網絡的類型(如MLP,CNN);2輸入數據;3計算能?(硬件和軟件能?決定);4學習速率;5映射的輸出函數。A、1,2,4,5B、2,3,4,5C、都需要考慮D、1,3,4,5E、nan答案:C102.當總體為正態(tài)總體,方差已知,樣本量為40,此時進行均值檢驗,應采用()統(tǒng)計量進行檢驗。A、卡方檢驗B、t檢驗C、F檢驗D、Z檢驗E、nan答案:D103.標準循環(huán)神經網絡隱含層的輸入對于網絡輸出的影響隨時間A、不斷遞歸而衰退B、不斷遞歸而增強C、先增強后減弱D、先減弱后增強E、nan答案:A104.scipy.stats模塊中隨機變量的殘存函數是()。A、cdfB、rvsC、pdfD、sfE、nan答案:D105.Spark的()組件用于支持實時計算需求。A、SparkSQLB、SparkStreamingC、SparkGraphXD、SparkMLLibE、nan答案:B106.回溯“深度學習”領域的學術脈絡,2017年-2020年間研究量最多的主題是A、特征提取B、卷積神經網絡C、人工智能D、遷移學習E、nan答案:B107.下面代碼的執(zhí)行結果是>>>1.23e-4+5.67e+8j.realA、1.23E+4B、1.23C、5.67E+8D、0.000123E、nan答案:D108.下列哪項關于模型能力(modelcapacity指神經網絡模型能擬合復雜函數的能力)的描述是正確的()A、隱藏層層數增加,模型能力增加B、Dropout的比例增加,模型能力增加C、學習率增加,模型能力增加D、都不正確E、nan答案:A109.以下哪些是通用逼近器?A、KernelB、NeuralC、BoosteD、以上所有E、nan答案:D110.大數據計算服務(Maxpute,原ODPS)tunnel命令?供了豐富的參數,可以通過參數設置,對上傳或者下載操作進行控制,現在有一個大文件要上傳至odps某表中,想先檢查一下該文件內容是否和表的定義匹配,并不實際上傳,以免文件中有錯誤記錄會導致上傳出錯。可以使用哪個參數實現這個功能?A、錯誤記錄丟棄:-dbrB、字段分隔符:-fC、掃瞄選項:-sD、空字符串顯示:-niE、nan答案:C111.聚焦()經濟發(fā)展新趨勢,堅持維護數據安全合規(guī)和促進數據開發(fā)利用并重,持續(xù)優(yōu)化數據合規(guī)管理機制與策略,支撐、賦能公司高質量發(fā)展。A、新能源B、社會科技C、信息技術D、能源數字E、nan答案:D112.以下關于函數的描述,錯誤的是A、使用函數的目的只是為了增加代碼復用B、函數是一種功能抽象C、使用函數后,代碼的維護難度降低了D、函數名可以是任何有效的Python標識符E、nan答案:A113.以下說法錯誤的是:(__)。A、當目標函數是凸函數時,梯度下降的解時全局最優(yōu)解B、進行PCA降維時需要計算協方差矩陣C、沿負梯度下降的方向一定是最優(yōu)的方向D、利用拉格朗日函數能解帶約束的優(yōu)化問題E、nan答案:C114.給出如下代碼:s='Pythonisbeautiful!'可以輸出"python"的語句是()A、print(s[0:6])B、print(s[0:6].lower())C、print(s[-21:-14].lower)D、print(s[:-14])E、nan答案:B115.假設數據集中有100條數據,設置batch_size為4,那么跑完一輪模型會迭代多少次()。A、400B、100C、25D、4E、nan答案:C116.下列關于線性回歸分析中的殘差說法正確是A、殘差均值總是為零B、殘差均值總是小于零C、殘差均值總是大于零D、以上說法都不對E、nan答案:A117.大數據的4V特性中,哪一個是錯誤的:()。A、數據量大B、價值密度高C、增長快D、維度高E、nan答案:B118.機器學習和深度學習的關系是(__)。A、深度學習包含機器學習B、機器學習包含深度學習C、二者是獨立的D、二者相互促進E、nan答案:B119.()不僅可用于多層前饋神經網絡,還可用于其他類型的神經網絡。A、感知機B、神經元C、神經系統(tǒng)D、誤差逆?zhèn)鞑、nan答案:D120.在實現前向傳播和反向傳播中使用的“cache”是什么A、它用于跟蹤我們正在搜索的超參數,以加速計算B、用于在訓練期間緩存代價函數的中間值C、我們使用它傳遞反向傳播中計算的變量到相應的前向傳播步驟,它包含對于前向傳播計算導數有用的變量D、我們使用它傳遞前向傳播中計算的變量到相應的反向傳播步驟,它包含對于反向傳播計算導數有用的變量E、nan答案:D121.綜合類大數據應用管理,主要包括(),由互聯網部統(tǒng)一組織開展。A、應用需求B、分析應用C、成果管理D、以上都是E、nan答案:D122.除非獲得()明確授權,未經脫敏處理的原始用戶隱私數據等敏感數據限于公司內網傳輸、存儲。A、安全機構B、企業(yè)C、上級D、用戶E、nan答案:D123.()模塊是Python標準庫中最常用的模塊之一。通過它可以獲取命令行參數,從而實現從程序外部向程序內部傳遞參數的功能,也可以獲取程序路徑和當前系統(tǒng)平臺等信息。A、sysB、platformC、mathD、D,參數是組合類型(可變對象)時,改變原參數的值E、nan答案:A124.依據《國家電網有限公司數據管理辦法》,建立基于()的公司對內數據共享機制。A、負面清單B、層層審批C、一事一議D、數據應用E、nan答案:A125.子集搜索中,逐漸增加相關特征的策略稱為()。A、前向搜索B、后向搜索C、雙向搜索D、不定向搜索E、nan答案:A126.下列關于LSTM說法錯誤的是(__)。A、LSTM中存在sigmoid函數B、LSTM中存在tanh函數C、LSTM又稱長短時記憶網絡D、RNN是LSTM的變種E、nan答案:D127.下列關于循環(huán)神經網絡說法錯誤的是()。A、長短期記憶網絡是進行優(yōu)化過后的循環(huán)神經網絡B、RNN是一類可用于處理序列數據的神經網絡C、循環(huán)神經網絡廣泛應用于自然語言處理領域,例如語音識別、語言建模和機器翻譯等D、LSTM引入了一個基于循環(huán)神經網絡(RNN)的架構后,梯度消失問題得以解決E、nan答案:D128.下列代碼:deffoo():print("starting...")whileTrue:res=yield4print("res:",res)foo()返回的是A、resB、4C、starting...D、以上都不對E、nan答案:D129.安全巡檢屬于信息系統(tǒng)安全過程管理的()階段。A、運行B、測試C、科研D、上線E、nan答案:A130.以下哪種參數是用*來接收,不是必傳的?A、位置參數B、默認值參數C、可變參數D、關鍵字參數E、nan答案:C131.MapReduce框架中中間有一步叫shuffle,把同樣的()運輸到同一個()上面去。A、value,B、value,C、key,D、key,E、nan答案:C132.數據使用是指需要某一專業(yè)數據的部門或單位(以下簡稱“需求方”)向數據歸口管理部門或單位(以下簡稱“提供方”)申請使用數據的過程。需求方根據專業(yè)管理需要,填寫(),并提供相關需求文檔至提供方。A、《業(yè)務數據需求申請表》B、《數據使用需求清單》C、《全業(yè)務統(tǒng)一數據中心數據使用備案表》D、《業(yè)務數據使用申請表》E、nan答案:D133.重視能力建設,加強大數據應用關鍵技術研究、軟硬件環(huán)境建設,推動技術、資源和管理的有機融合,建立常態(tài)化人才培養(yǎng)機制,持續(xù)提升公司大數據(),為公司數字化轉型注入強大動力。A、分析挖掘能力B、應用開發(fā)能力C、特征處理能力D、安全管理能力E、nan答案:B134.受到治安管理處罰的人員,()不得從事網絡安全管理和網絡運營關鍵崗位的工作;受到刑事處罰的人員,()不得從事網絡安全管理和運營關鍵崗位的工作。A、五年內,十年內B、三年內,終身C、三年內,十年內D、五年內,終身E、nan答案:D135.深度學習方法不適用的數據集為以下哪種情況?A、樣本量充足B、樣本量多樣化C、數據集具有局部相關性D、特征之間不具有局部相關性E、nan答案:D136.random庫中用于生成隨機小數的函數是()。A、random()B、randint()C、getrandbits()D、randrange()E、nan答案:A137.長短時記憶神經網絡被設計用來解決什么問題?()A、傳統(tǒng)RNN存在的梯度消失/爆炸問題B、傳統(tǒng)RNN計算量大的問題C、傳統(tǒng)RNN速度較慢的問題D、傳統(tǒng)RNN容易過過擬合的問題E、nan答案:A138.下面關于Hive各個格式使用場景描述錯誤的是()A、Parquet對于大型查詢的類型是高效的,對于掃描特定表格中的特定列的查詢,Parquet特別有用B、目前Parquet默認使用gzip壓縮格式C、ORC可以支持復雜的數據結構(比如Map等)D、RCFile是一種行列存儲相結合的存儲方式E、nan答案:B139.下面關于循環(huán)神經網絡說法錯誤的是()A、循環(huán)神經網絡用于靜態(tài)輸出B、循環(huán)神經網絡通過使用帶自反饋的神經元,能夠處理任意長度的時序數據C、循環(huán)神經網絡具有短期記憶能力,相當于存儲裝置,因此其計算能力十分強大D、循環(huán)神經網絡時間擴展,神經元與多個時間輸出計算E、nan答案:A140.下列關于網絡用戶行為的說法中,錯誤的是()。A、網絡公司能夠捕捉到用戶在其網站上的所有行為B、用戶離散的交互痕跡能夠為企業(yè)提升服務質量提供參考C、數字軌跡用完即自動刪除D、用戶的隱私安全很難得以規(guī)范保護E、nan答案:C141.按照共享能力中心設計原則,不包括()。A、獨立性B、高內聚C、完整性D、強拆分E、nan答案:A142.關于OLAP和OLTP的區(qū)別描述,不正確的是()。A、OLAP主要是關于如何理解聚集的大量不同的數據.它與OTAP應用程序不同。B、與OLAP應用程序不同,OLTP應用程序包含大量相對簡單的事務。C、OLAP的特點在于事務量大,但事務內容比較簡單且重復率高。D、OLAP是以數據倉庫為基礎的,但其最終數據來源與OLTP一樣均來自底層的數據庫系統(tǒng),兩者面對的用戶是相同的E、nan答案:C143.在Spark中,()是指RDD的每個分區(qū)都只被子RDD的一個分區(qū)所依賴。A、子分區(qū)B、父分區(qū)C、寬依賴D、窄依賴E、nan答案:D144.下列哪個不是專門用于可視化時間空間數據的技術:()。A、等高線圖B、餅圖C、曲面圖D、矢量場圖E、nan答案:B145.plt.plot()函數的功能是(__)。A、展現變量的趨勢變化B、尋找變量之間的關系C、設置x軸的數值顯示范圍D、設置x軸的標簽文本E、nan答案:A146.分析應用計算后的分析主題數據存儲在:()。A、貼源層B、共享層C、分析層D、整合明細層E、nan答案:C147.下面哪種說法有關機器學習的認識是錯誤的?()A、高質量的數據、算力和算法對一個機器學習項目是必不可少的。B、深度學習是機器學習的一類高級算法,可以處理圖像、聲音和文本等復雜數據。C、機器學習算法很多,后期出現的算法比早期出現的算法性能好。D、機器學習可以在一定程度上模仿人的學習,并能增強人的決策能力。E、nan答案:C148.()算法可以較好的避免樣本的不平衡問題。A、KNNB、SVMC、BayesD、神經網絡E、nan答案:A149.高斯核也稱為(__)。A、多項式核B、拉普拉斯核C、RBF核D、Sigmoid核E、nan答案:C150.下列關于長短時神經網絡的敘述錯誤的是()。A、引用自循環(huán)思想B、產生梯度長時間持續(xù)流動的路徑C、積累的時間尺度不可以因輸入序列而改變D、可應用于語音識別和機器翻譯E、nan答案:C151.關于Python語言的浮點數類型,以下選項中描述錯誤的是A、浮點數類型與數學中實數的概念一致B、浮點數類型表示帶有小數的類型C、Python語言要求所有浮點數必須帶有小數部分D、小數部分不可以為0E、nan答案:D152.面向政府機構或非營利性組織等,從服務中央決策部署落地實施、社會治理現代化等方面,提供的公益性數據服務為()。A、政府監(jiān)管類B、公益服務類C、商務增值類D、公共開放類E、nan答案:B153.由于業(yè)務系統(tǒng)原因影響數據質量,需修改、優(yōu)化應用系統(tǒng)功能的,按照公司()進行。A、信息系統(tǒng)安全規(guī)定B、信息系統(tǒng)運維規(guī)定C、信息系統(tǒng)檢修管理規(guī)定D、信息系統(tǒng)使用規(guī)定E、nan答案:B154.()負責HDFS數據存儲。A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNodeE、nan答案:C155.由于不同類別的關鍵詞對排序的貢獻不同,檢索算法一般把查詢關鍵詞分為幾類,以下哪一類不屬于此關鍵詞類型的是()。A、引用詞B、普通關鍵詞C、高頻詞匯D、擴展關鍵詞E、nan答案:C156.數據分類應結合數據在挖掘、計算、分析、處理后()動態(tài)變化的特點識別、調整數據分級和保護要求。A、業(yè)務屬性B、管理屬性C、安全屬性D、基礎屬性E、nan答案:C157.以下不屬于大數據應用業(yè)務規(guī)劃五大核心領域的是()。A、電網運營B、經營管理C、對內服務D、業(yè)務創(chuàng)新E、nan答案:C158.國家電網公司各單位推廣后對新技術試運行情況進行技術總結和評價,包括新技術的運行性能、設計符合度、技術先進性、()、電網安全影響、推廣應用難度等方面內容,并將評價報告報送相關主管部門。A、應用效果及成熟程度B、經濟適宜性C、實用價值D、信息化的標準符合度E、nan答案:B159.需要生成一個[a,b]之間的整數,采用下列哪個代碼()A、random.randomB、random.uniform(a,b)C、random.randint(a,b)D、random.ranrange(a,b)E、nan答案:C160.關于MaxputeMR,說法正確的是:()。A、Map和Reduce前都需要對數據進行分片;B、進入reduce前,數據需要進行合并操作(biner),然后按照key排序;C、MapD、Reducer的個數和Mapper的個數一致;E、nan答案:C161.關于基本數據的元數據是指:A、基本元數據與數據源,數據倉庫,數據集市和應用程序等結構相關的信息B、基本元數據包括與企業(yè)相關的管理方面的數據和信息C、基本元數據包括日志文件和簡歷執(zhí)行處理的時序調度信息D、基本元數據包括關于裝載和更新處理,分析處理以及管理方面的信息E、nan答案:D162.及時將數據活動中產生的()納入公司知識產權體系進行保護,妥善處理好數據內部共享、對外開放與知識產權保護的關系。A、智力成果B、軟件著作權C、各類專利D、發(fā)表的論文E、nan答案:A163.在MySQL中,通常使用()語句來進行數據的檢索、輸出操作。A、SELECTB、INSERTC、DELETED、UPDATEE、nan答案:A164.構建一個神經網絡,將前一層的輸出和它自身作為輸入,則有反饋連接的是()。A、循環(huán)神經網絡B、卷積神經網絡C、限制玻爾茲曼機D、都不是E、nan答案:A165.考察一個由三個卷積層組成的CNN:kernel=3B3,stride=2,padding=SAME。最低層輸出100個特征映射(featuremap),中間層200個特征映射,最高層400個特征映射。輸入是200B300的RGB圖片,總參數的數量是多少()A、903400B、2800C、180200D、720400E、nan答案:A166.長短時記憶網絡屬于一種()。A、全連接神經網絡B、門控RNNC、BP神經網絡D、雙向RNNE、nan答案:B167.以下哪一個是ResNet-18的網絡結構?()A、4個殘差塊各有4個卷積層(不包括恒等映射的1x1卷積層),B、3個殘差塊各有5個卷積層(不包括恒等映射的1x1卷積層),加上最后一個全連接層C、4個殘差塊各有3個卷積層(不包括恒等映射的1x1卷積層),D、5個殘差塊各有3個卷積層(不包括恒等映射的1x1卷積層),E、nan答案:A168.公司()委員會負責數據合規(guī)管理工作統(tǒng)籌領導。A、信息安全B、網絡安全C、安全領導D、合規(guī)管理E、nan答案:D169.Maxpute執(zhí)行某個SQL時返回信息中包括“J3_1_2_Stg1”,以下說法中正確的是:()。A、當前Task(ID為3)依賴于ID為1的任務,該Task的WorkerB、當前Task(ID為3)依賴于ID為1的任務,同時觸發(fā)ID為2的任務C、當前Task(ID為3)有2個Reducer,1個mapperD、當前Task(ID為3)依賴于ID為1和ID為2的兩個TaskE、nan答案:D170.下列哪個程序通常與NameNode在一個節(jié)點啟動()A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、JobtrackerE、nan答案:D171.()在訓練的每一輪都要檢查當前生成的基學習器是否滿足基本條件。A、支持向量機B、Boosting算法C、貝葉斯分類器D、Bagging算法E、nan答案:B172.在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是()。A、有放回的簡單隨機抽樣B、無放回的簡單隨機抽樣C、分層抽樣D、漸進抽樣E、nan答案:D173.關于pandas庫的文本操作,下列說法錯誤的是()。A、Replace方法用于替換字符串B、Slice方法不是通過截取字符實現文本索引操作的C、Upper方法可將Series各元素轉換為大寫D、存在一些特殊的方法是Python原生str類型所沒有的E、nan答案:B174.AI芯片也被稱為AI加速器,是專門用于處理人工智能應用中的大量計算任務的功能模塊。A、TRUEB、FALSEC、nanD、nanE、nan答案:A175.因業(yè)務需要,確需向境外提供的,應經公司保密辦與業(yè)務部門審批,根據國家相關規(guī)定做好()等工作,視情況向國家有關部門報備。A、匯報審批B、安全評估C、安全測評D、安全報備E、nan答案:B176.從數據到智慧的轉換依次遞進過程是()。A、數據、知識、信息、理解、智慧B、數據、信息、理解、知識、智慧C、數據、信息、知識、理解、智慧D、數據、理解、信息、知識、智慧E、nan答案:C177.公司大數據應用建設應按照電網數字化建設要求,遵循公司大叔蘇劇應用統(tǒng)一技術架構與標準,充分利用()等各類企業(yè)級大數據應用公共服務能力平臺進行開發(fā)和實施。A、電網資源業(yè)務中臺B、全業(yè)務數據中心C、數據中臺D、數字化能力開放平臺E、nan答案:C178.下列屬于卷積網絡類型分類的是(__)。A、普通卷積B、擴張卷積C、轉置卷積D、以上答案都正確E、nan答案:D179.大數據和算法關系以下描述正確的是:A、數據跟算法沒有關系B、算法比數據更重要C、數據比算法更重要D、沒有數據的算法沒有意義,失去了算法的數據無法應用E、nan答案:D180.一般情況下,整數用十進制表示,如果用其他進制表示一個數,錯誤的描述選項是:A、0o1010表示一個八進制數B、1010b表示一個二進制數C、0b1010表示一個二進制數D、0x1010表示一個十六進制數E、nan答案:B181.加強數據合規(guī)管理頂層設計,強化跨專業(yè)、跨層級統(tǒng)籌協調,建立健全()工作機制,確保公司數據合規(guī)管理工作有力、有序、有效推進。A、閉環(huán)B、協同C、安全D、監(jiān)控E、nan答案:B182.考慮某個具體問題時,你可能只有少量數據來解決這個問題。不過幸運的是你有一個類似問題已經預先訓練好的神經網絡??梢杂孟旅婺姆N方法來利用這個預先訓練好的網絡()A、把除了最后一層外所有的層都凍住,重新訓練最后一層B、對新數據重新訓練整個模型C、只對最后幾層進行調參(fineD、對每一層模型進行評估,選擇其中的少數來用E、nan答案:C183.公司大數據應用需求與立項管理遵循()管理規(guī)范,嚴格落實項目制管理要求,主要包括需求征集、評審、儲備、立項和計劃編制與調整等工作。A、技術服務項目B、科技項目C、信息化項目D、數字化項目E、nan答案:D184.以下哪種卷積神經網絡的設計引入了殘差網絡結構()A、LeNetB、AlexNetC、GoogLeNetD、ResNetsE、nan答案:D185.健全安全管理機制,擔起關鍵信息基礎設施和數據安全保護責任,應堅持“()、分類分級、依法合規(guī)”的防護原則,以法規(guī)監(jiān)管、業(yè)務需求、標準指引為出發(fā)點,統(tǒng)籌規(guī)劃,構建覆蓋組織、策略、流程和工具的安全管理體系,既防內又防外,對關鍵信息基礎設施實施重點保護。A、安全監(jiān)測B、攻防驗證C、安全分區(qū)D、安全保護E、nan答案:C186.CNN神經網絡對圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級到數據驅動的自動特征提取,在CNN中,起到特征提取作用的網絡層是:(__)。A、convolution層B、fullC、maxD、norm層E、nan答案:A187.多義現象可以被定義為在文本對象中一個單詞或短語的多種含義共存。下列哪一種方法可能是解決此問題的最好選擇?A、隨機森林分類器B、卷積神經網絡C、梯度爆炸D、上述所有方法E、nan答案:B188.在其他條件不變的前提下,以下哪種做法容易引起機器學習中的過擬合問題A、增加訓練集量B、減少神經網絡隱藏層節(jié)點數C、刪除稀疏的特征D、SVM算法中使用高斯核/RBF核代替線性核E、nan答案:D189.電力線和信號線應分別敷設在()、()或橋架內,走線應整齊美觀安全。A、走線架B、強電線槽,弱電線槽C、弱電線槽,強電線槽D、槽鋼E、nan答案:B190.DB2在數據存儲劃分中屬于RDBMS系統(tǒng),對外可以提供()數據查詢接口。A、順序一致性B、最終一致性C、弱一致性D、強一致性E、nan答案:D191.googlenet提出的Inception結構優(yōu)勢有()。A、保證每一層的感受野不變,網絡深度加深,使得網絡的精度更高B、使得每一層的感受野增大,學習小特征的能力變大C、有效提取高層語義信息,且對高層語義進行加工,有效提高網絡準確度D、利用該結構有效減輕網絡的權重E、nan答案:D192.如果增加神經網絡的寬度,精確度會增加到一個閾值,然后開始降低。造成這一現象的原因可能是()。A、只有一部分核被用于預測B、當核數量增加,神經網絡的預測能力降低C、當核數量增加,其相關性增加,導致過擬合D、以上都不對E、nan答案:C193.以下()不屬于開源數據湖解決方案。A、DLIB、IcebergC、HudiD、OpenE、nan答案:A194.若訓練過程的目標是預測連續(xù)值,此類學習任務稱為()。A、回歸B、分類C、測試D、學習E、nan答案:A195.下列關于集成學習方法的說法錯誤的是()A、Boosting是一族可將弱學習器提升為強學習器的算法B、隨機森林是Bagging的一個擴展變體C、隨機森林簡單、容易實現、計算開銷小D、Boosting是個體學習器間不存在強依賴關系、可同時生成的并行化方法E、nan答案:D196.在反向傳播的過程中,首先被計算的是變量()的梯度,之后將其反向傳播。A、連接權重B、損失函數C、激活函數D、特征映射E、nan答案:C197.隨機森林與Bagging中基學習器"多樣性"的區(qū)別是()。A、都來自樣本擾動B、都來自屬性擾動C、來自樣本擾動和自屬性擾動D、多樣本集結合E、nan答案:C198.已知:(1)大腦是有很多個叫做神經元的東西構成,神經網絡是對大腦的簡單的數學表達。(2)每一個神經元都有輸入、處理函數和輸出。(3)神經元組合起來形成了網絡,可以擬合任何函數。(4)為了得到最佳的神經網絡,我們用梯度下降方法不斷更新模型。給定上述關于神經網絡的描述,什么情況下神經網絡模型被稱為深度學習模型?A、加入更多層,使神經網絡的深度增加B、有維度更高的數據C、當這是一個圖形識別的問題時D、以上都不正確E、nan答案:A199.以下程序的輸出結果是:L2=[1,2,3,4]L3=L2.reverse()print(L3)A、NoneB、[4,C、[3,D、[1,2,3,]E、nan答案:A200.()的主要目標是提供可擴展的機器學習算法及其實現,旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應用程序。A、MahoutB、FlumeC、SqoopD、HBaseE、nan答案:A201.Dropout技術在下列哪種神經層中將無法發(fā)揮顯著優(yōu)勢?A、仿射層B、卷積層C、RNN層D、均不對E、nan答案:C202.助力()戰(zhàn)略落地,依托電力大數據準確刻畫鄉(xiāng)村生產、生活、生態(tài)等發(fā)展現狀,分析農業(yè)產業(yè)發(fā)展現狀及成效,優(yōu)化鄉(xiāng)村基礎設施及公共服務資源布局,服務農業(yè)農村發(fā)展。A、鄉(xiāng)村建設B、鄉(xiāng)村振興C、三農政策D、服務農村E、nan答案:B203.下列哪一項在神經網絡中引入了非線性?A、隨機梯度下降B、修正線性單元(ReLU)C、卷積函數D、以上都不正確E、nan答案:B204.下列描述中不屬于數據治理內容的是()A、理解自己的數據B、行為規(guī)范的制定C、崗位職責的定義D、獲得更多的數據E、nan答案:D205.從電網科技發(fā)展戰(zhàn)略和國家科技發(fā)展戰(zhàn)略結合、推進基礎支撐技術與電網發(fā)展的全面融合的角度來看,國家電網公司提出“需要利用先進計算與()成果,探索先進計算體系及高性能計算技術,研究電力大數據分析挖掘算法、優(yōu)化策略和可視化展現技術,以及電力大數據仿真、測試與評價技術;開展面向智能電網的各業(yè)務領域大數據典型應用?!盇、新能源技術B、電網安全與控制技術C、大數據技術D、重點跨領域技術E、nan答案:C206.組織開展公司數據特別是電力數據的()管理研究與應用,確保數據加工、使用行為合法合規(guī)。A、分級分類B、安全防護C、運維審計D、數據處理E、nan答案:A207.下列關于數據轉換,正確的是()。A、json內的取值只能有統(tǒng)一格式B、pdf文件在不同平臺上打開顯示不同C、可以通過python將csv文件轉換成Excel格式D、excel存儲數據的量無限制E、nan答案:C208.下列哪個聚類算法中需要設定半徑ε的是()A、K-means算法B、DBSCAN算法C、BIRCH算法D、STING算法E、nan答案:B209.大數據應用是指綜合應用公司內部電力生產運行、經營管理、客戶服務等業(yè)務活動所產生的數據資源,以及獲取的外部數據資源,通過(),釋放數據資源價值,發(fā)現新知識、創(chuàng)造新價值、提升新能力,賦能公司提質增效,支撐行業(yè)高質量發(fā)展,服務國家治理現代化。A、大云物智移B、數據分析挖掘C、深度學習應用D、數據質量治理E、nan答案:B210.相關關系是一種與函數關系區(qū)別的非確定性關系,而相關分析就是研究事物或現象之間是否存在這種非確定性關系的統(tǒng)計方法,以下不屬于相關性分析方法的是()。A、Pearson相關系數B、Spearman秩相關系數C、Kendall相關系數D、傅里葉系數E、nan答案:D211.以下關于最大似然估計MLE的說法正確的是A、MLE中加入了模型參數本身的概率分布B、MLE認為模型參數本身概率是不均勻的C、MLE體現了貝葉斯認為參數也是隨機變量的觀點D、MLE是指找出一組參數,使得模型產生出觀測數據的概率最大E、nan答案:D212.下列哪種業(yè)務場景中,不能直接使用Reducer充當biner使用()A、sum求和B、max求最大值C、count求計數D、avg求平均E、nan答案:D213.提升卷積核(convolutionalkernel)的大小會顯著提升卷積神經網絡的性能,這種說法是A、正確的B、錯誤的C、nanD、nanE、nan答案:B214.如果要將讀寫位置移動到文件開頭,需要使用的命令是()。A、closeB、seek(0)C、truncateD、write('stuff')E、nan答案:B215.在InceptionNet中,使用()和單層的全連接層替換掉了VCG的三層全連接層。A、全局最大池化層B、全局最小池化層C、卷積層D、全局平均池化層E、nan答案:D216.下列哪些不是目前機器學習所面臨的問題是()。A、測試集的規(guī)模B、維度災難C、特征工程D、過擬合E、nan答案:A217.預訓練模型是指()。A、先訓練一個模型作為基準B、在正式訓練之前,做一次試驗訓練C、已經在大數據集上訓練好的一個模型D、預先根據任務特點,對模型結構進行調整E、nan答案:C218.下面有關線性判別分析錯誤的說法是哪個?A、通過對原始的數據進行線性變換,使得不同類的樣本盡量分開B、線性變換可以使同類樣本的方差變大C、線性變換可以使不同類別樣本的距離加大D、提高不同類樣本的可分性E、nan答案:B219.現實中往往會遇到“不完整”的訓練樣本,在這種存在屬性變量值未知的情形下,可用(__)。A、邊際似然B、EM算法C、貝葉斯決策D、貝葉斯分類器E、nan答案:B220.以下有關國網鏈平臺的說法錯誤的是()A、以公有鏈架構為基礎B、總體架構為“一主兩側多從”C、為公司各類區(qū)塊鏈業(yè)務提供安全可信的底層區(qū)塊鏈基礎設施D、支持電網及上下游企業(yè)、外部機構間的信息可信共享與協同共用E、nan答案:A221.公司數據質量管理主要包括()A、數據質量規(guī)則管理B、數據質量核查C、數據問題整改與質量評估D、以上都是E、nan答案:D222.數據對外提供應遵守國家有關政策法規(guī)和公司管理規(guī)定要求,除國家機關依法調取數據外,原則上公司明細業(yè)務數據____。A、不對內提供B、不對外提供C、限制提供D、nanE、nan答案:B223.假定在神經網絡中的隱藏層中使用激活函數X。在特定神經元給定任意輸入,得到輸出「-0.0001」。X可能是以下哪一個激活函數?A、ReLUB、tanhC、SIGMOIDD、以上都不是E、nan答案:B224.數據清洗的方法不包括()。A、缺失值處理B、噪聲數據清除C、一致性檢查D、重復數據記錄處理E、nan答案:D225.將python中的.py文件轉換為.pyc文件的組件為()。A、編輯器B、編譯器C、虛擬機D、解釋器E、nan答案:B226.假設給定一個長度為n的不完整單詞序列,希望預測下一個字母是什么,如輸入是predictio(9個字母組成),希望預測第十個字母是什么。適用于解決這個工作的是()。A、循環(huán)神經網絡B、全連接神經網絡C、受限波爾茲曼機D、卷積神經網絡E、nan答案:A227.下面關于查看Hive表信息描述正確的是()A、DESC查看表的描述是以建表語句的形式展示的B、SHOWC、TABLD、查看表的描述是以表格的形式展示的E、使用DESC查看表table1:DESF、table1;G、SHOWH、TABLE可以查看表的數據答案:C228.人工智能平臺的三種應用模式不包含()A、云模式B、邊模式C、端模式D、鏈模式E、nan答案:D229.()是公司大數據應用工作的歸口管理部門。A、互聯網部B、信息化部C、數字化工作部D、科技信息部E、nan答案:C230.Hadoop中MapReduce組件擅長處理()場景的計算任務。A、迭代計算B、離線計算C、實時交互計算D、流式計算E、nan答案:B231.《中華人民共和國數據安全法》規(guī)定,違反國家核心數據管理制度,危害國家主權、安全和發(fā)展利益的,由有關主管部門處()萬元以上()萬元以下罰款;構成犯罪的,依法追究刑事責任。A、100,200B、200,500C、2,001,000D、5,001,000E、nan答案:C232.至十四五末,公司全面建成企業(yè)中臺,企業(yè)中臺公共服務共享使用率達到()A、70%B、80%C、90%D、100%E、nan答案:D233.關于長短時神經網絡的敘述中錯誤的是()。A、引用自循環(huán)思想B、產生梯度長時間持續(xù)流動的路徑C、積累的時間尺度不可以因輸入序列而改變D、可應用于語音識別和機器翻譯E、nan答案:C234.Keras中想要引入Dropout,每次只讓四分之三的神經元參與訓練,相應的Python語句是()。A、model.add(Dropout(0.25))B、model.add(Dropout(0.75))C、model.add(Dropout(0.5))D、model.add(Dropout(0.333))E、nan答案:A235.給出如下代碼,可以輸出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:E、nan答案:B236.數據中臺是企業(yè)級數據能力共享平臺。數據通過分層與水平分解,經過匯聚、存儲、整合、分析、加工,沉淀公共的數據能力,根據業(yè)務場景進行服務封裝,形成企業(yè)級數據服務,支撐前端應用敏捷迭代和快速構建,實現數據價值共享A、匯聚、存儲、整合、分析、加工B、匯聚、整合、分析、存儲、加工C、匯聚、整合、分析、加工、存儲D、匯聚、存儲、整合、分析、加工E、nan答案:A237.下列哪一種情況被稱為過學習現象:A、在訓練集上A優(yōu)于B,在測試集上A也優(yōu)于BB、在訓練集上A優(yōu)于B,在測試集上B優(yōu)于AC、相對于分類數據集,決策樹過于簡單D、在訓練集上決策樹的誤差很小E、nan答案:B238.對以下程序描述錯誤的是()。try:A、改程序對異常處理了,因此一定不會終止程序B、改程序對異常處理了,不一定不會因異常引發(fā)終止C、語句塊1,如果拋出IndexErrorD、語句塊2E、nan答案:A239.構建從公司總部到各級單位協調一致、符合實際的合規(guī)管理架構,確保數據在各層級、各單位、各板塊之間合法合規(guī)流轉,推動()共享應用。A、數據融合B、數據治理C、數據統(tǒng)計D、數據維護E、nan答案:A240.卷積核大小是4*4,則其步長不能是()。A、0B、1C、2D、3E、nan答案:A241.在其他條件不變的前提下,以下哪些做法容易引起機器學習中的過擬合問題。A、增加訓練集量B、減少神經網絡隱藏節(jié)點數C、在損失函數中增加正則項D、SVM算法中使用高斯核/RBF核代替核性核E、nan答案:D242.《國家電網公司信息安全與運維管理制度和技術標準》第二條規(guī)定計算機病毒防治工作按照“安全第一、預防為主,(),綜合防范”的工作原則規(guī)范地開展。A、誰主管、誰負責B、誰運營、誰負責C、管理和技術并重D、抓防并舉E、nan答案:C243.以下哪個分類方法可以較好地避免樣本的不平衡問題()。A、KNNB、SVMC、BayesD、神經網絡E、nan答案:A244.下列關于深度學習中優(yōu)化問題說法錯誤的是()。A、當優(yōu)化問題的數值解接近局部最優(yōu)值時,隨著目標函數解的梯度接近或變?yōu)榱?,通過最終迭代獲得的數值解可能僅使目標函數局部最優(yōu),而不是全局最優(yōu)B、在深度學習優(yōu)化問題中,經常遇到的是梯度爆炸或梯度消失C、優(yōu)化問題中設置的學習率決定目標函數能否收斂到局部最小值,以及何時收斂到最小值D、一般來說,小批量隨機梯度下降比隨機梯度下降和梯度下降的速度慢,收斂風險較大E、nan答案:D245.LSTM中,(__)的作用是確定哪些新的信息留在細胞狀態(tài)中,并更新細胞狀態(tài)。A、輸入門B、遺忘門C、輸出門D、更新門E、nan答案:A246.在下列哪些應用中,可以使用深度學習來解決問題?A、蛋白質結構預測B、化學反應的預測C、外來粒子的檢測D、nanE、nan答案:C247.按照公司戰(zhàn)略實施要求,立足數據發(fā)展需要,以“可管、()、可信”為核心,建立健全數據合規(guī)管理體系A、可控B、可查C、可見D、可防E、nan答案:A248.以下代碼的輸出結果為()。importnumpyasnpa=np.arange(9)b=np.split(a,3)print(b)A、[0B、[array([0,1,2]),array([3,4,5]),array([6,7,8])]C、[array([0,1,2,3]),array([4,5,6]),array([7,8])]D、沒有正確答案E、nan答案:B249.Scikit-Learn中StandardScaler是將特征數據的分布調整成(),也就是使得數據的均值為0,方差為1。A、正態(tài)分布B、泊松分布C、均勻分布D、二項分布E、nan答案:A250.以下哪種不是Hive支持的數據類型()A、StructB、IntC、MapD、LongE、nan答案:D251.HBase依靠()提供強大的計算能力。A、ZooKeeperB、ChubbyC、RPD、MapReduceE、nan答案:D252.以下哪項工作屬于數據應用優(yōu)化生產運行,提升電網質效。A、優(yōu)化設備運維策略B、優(yōu)化能源配置C、提升電網防災抗災能力D、優(yōu)化設備物資供應鏈E、nan答案:C253.在SQL查詢時,使用WHERE子句指出的是(?)A、查詢目標B、查詢結果C、查詢條件D、查詢視圖E、nan答案:C254.在Adaboost算法的訓練過程中,根據每個基分類器的分類結果對其表決權賦予一個權重,下列說法正確的是()A、基分類器錯誤率越低,表決權重越小B、基分類器錯誤率越低,表決權越大C、每個基分類器的權重一樣大D、所有基分類器的權重都不相同E、nan答案:B255.()管理主要包括數據目錄、數據共享需求清單、數據共享負面清單和數據歸集管理。A、數據共享B、數據存儲C、數據使用D、數據傳輸E、nan答案:A256.為了提高系統(tǒng)性能,Spark采取“惰性計算模式”,具體為()。A、執(zhí)行Transformation操作時不會提交,只有執(zhí)行Action操作時才會被提交到集群中開始被執(zhí)行B、執(zhí)行Action操作時不會提交,只有執(zhí)行Transformation操作時才會被提交到集群中開始被執(zhí)行C、只有執(zhí)行完Action操作和Transformation操作時,所有操作才會被提交到集群中開始被執(zhí)行D、執(zhí)行完Action操作或Transformation操作時都不會提交到集群E、nan答案:A257.下面哪個程序負責HDFS數據存儲()A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNodeE、nan答案:C258.關于DataFrame與RDD在結構上的區(qū)別,以下描述錯誤的是()A、DataFrame可以看作是分布式的Row對象的集合,在二維表數據集的每一列都帶有名稱和類型。B、RDD是分布式的Java對象的集合C、RDD在轉換數據形式時效率相對較高D、DataFrame提供了比RDD更豐富的算子E、nan答案:C259.神經網絡模型(NeuralNetwork)因受?類大腦的啟發(fā)而得名。神經網絡由許多神經元(Neuron)組成,每個神經元接受一個輸入,對輸入進行處理后給出一個輸出,請問下列關于神經元的描述中,哪一項是正確的?A、每個神經元可以有一個輸入和一個輸出B、每個神經元可以有多個輸入和一個輸出C、每個神經元可以有一個輸入和多個輸出D、上述都正確E、nan答案:D260.以下哪些方法不能用于處理過擬合?A、減少特征維度,防止維災難B、增大數據的訓練量C、利用正則化技術D、增加特征維度E、nan答案:D261.以下選項,不屬于程序流程圖基本元素的是:A、循環(huán)框B、起始框C、判斷框D、連接點E、nan答案:A262.互聯網數據中心的設立應當遠離()干擾。A、110kV以上超高壓變電站B、電氣化軌道C、醫(yī)用射頻設備D、以上都是E、nan答案:D263.使用pivot_table函數制作透視表時,要用下列()參數設置行分組鍵。A、datB、valuesC、columnsD、IndexE、nan答案:D264.以下屬于淺層學習模型的是()。A、DBNB、CNNC、SVMD、RNNE、nan答案:C265.年度大數據應用需求由()重抽組織開展儲備與立項工作。A、數字化部B、財務部C、大數據中心D、發(fā)展部E、nan答案:A266.以()為導向,發(fā)揮電力數據覆蓋廣優(yōu)勢,提供智能、精準、高效、便捷的公共服務。A、民生需求B、社會發(fā)展C、公共需求D、經濟發(fā)展E、nan答案:A267.國網公司堅持數據“一處生成、多處使用”,明確權威數據源引用規(guī)范,開展權威數據源中臺標注,推進權威數據源在中臺的落地應用,常態(tài)推進()治理。A、數據源頭B、數據中臺C、業(yè)務中臺D、數據應用E、nan答案:A268.Hadoop生態(tài)系統(tǒng)中,HBase是一種()。A、分布式文件系統(tǒng)B、數據倉庢C、實時分布式數據庫D、分布式計算系統(tǒng)E、nan答案:C269.數據產品和服務提供方與使用方應簽署相關使用協議,明確約束()等雙方權利義務。A、使用范圍B、安全規(guī)則C、使用規(guī)則D、保密規(guī)則E、nan答案:C270.鼓勵各部門、各單位結合實際應用需求對已發(fā)布成果進行適應性改造,避免低水平的重復開發(fā)。改造后的成果可按照成果發(fā)布流程,重新發(fā)布到____。A、數字化能力開放平臺B、全業(yè)務中臺C、公共服務能力平臺D、公司門戶網站E、nan答案:A271.從安全屬性對各種網絡攻擊進行分類,截獲攻擊是針對()的攻擊。A、機密性B、可用性C、完整性D、真實性E、nan答案:A272.數據活動涉及公司商業(yè)秘密、工作秘密的,應該嚴格執(zhí)行《國家電網有限公司保密工作管理辦法》等有關規(guī)定,按照()實行分類管理。A、工作需要B、涉密程度C、歸口部門D、數據類型E、nan答案:B273.主成分分析(PCA)降維的步驟為()①保留前N個最大的特征值對應的特征向量;②去除平均值;③計算協方差矩陣;④將特征值排序;⑤協方差矩陣的特征值和特征向量⑥將原始特征轉換到上述N個特征向量構建的新空間中,實現特征壓縮A、③②⑤④①⑥B、②③⑤④①⑥C、②③⑤①④⑥D、③②⑤①④⑥E、nan答案:B274.?下列關于隨機森林和Adaboost說法不正確的是()A、和Adaboost相比,隨機森林對錯誤和離群點更魯棒B、隨機森林準確率不依賴于個體分類器的實例和他們之間的依賴性C、隨機森林對每次劃分所考慮的屬性數很偏感D、Adaboost初始時每個訓練元組被賦予相等的權重E、nan答案:B275.將原始數據進行集成、變換、維度規(guī)約、數值規(guī)約是在以下哪個步驟的任務:()。A、頻繁模式挖掘B、分類和預測C、數據預處理D、數據流挖掘E、nan答案:C276.對于?連續(xù)目標在深度神經網絡的優(yōu)化過程中,下面哪種梯度下降方法是最好的?A、SGDB、AdaGradC、l-BFGSD、拉格朗日松弛SubgradientE、nan答案:D277.語音識別的應用場景包括()A、語音轉文本B、語音合成C、人機交互D、以上都對E、nan答案:D278.下列關于RBM說法錯誤的是(__)。A、學習過程很快B、RBM訓練可以看作對一個深層BP網絡的網絡權值參數的初始化C、RBM不用人工選擇特征D、RBM有標簽樣本集E、nan答案:A279.批規(guī)范化(BatchNormalization)的好處都有()?A、讓每一層的輸入的范圍都大致固定B、它將權重的歸一化平均值和標準差C、它是一種?常有效的反向傳播(BP)方法D、這些均不是E、nan答案:A280.為保證數據應用安全,對涉及負面清單敏感數據的共享應用,應采取的措施不包括()A、數據脫敏B、禁止訪問C、訪問授權D、安全審計E、nan答案:B281.各單位應遵循()原則,優(yōu)化數據安全防護架構,推進數據保護技術研究與應用,強化數據全生命周期的安全保護。A、“B、“不共享”C、“三同步”D、“兩同步”E、nan答案:C282.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發(fā)生的地點。這體現了大數據分析理念中的()。A、在數據基礎上傾向于全體數據而不是抽樣數據B、在分析方法上更注重相關分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數據規(guī)模上強調相對數據而不是絕對數據E、nan答案:B283.使用交叉驗證法,我們可以()。A、幫助我們更好的進行模型選擇,并在一定程度上減少過擬合B、C、增加模型復雜度D、更好進行特征選擇,使得模型效果更好E、nan答案:A解析:減少模型計算量284.大數據時代,數據使用的關鍵是()。A、數據收集B、數據存儲C、數據分析D、數據再利用E、nan答案:D285.運行下面的代碼,輸出結果是()。importnumpyasnpn=np.array([[1,2,3],[4,5,6]])print(n.size)A、2B、6C、(2,3)D、(3,2)E、nan答案:B286.下列關于凝聚層次聚類技術的描述中,合適的是()。A、抗噪聲和異常值B、MAX(全鏈)聚類中合并距離最遠的兩個簇C、兩個簇合并后,只保留一個簇D、沒有可以直接最小化的目標函數E、nan答案:D287.以下關于traintestsplit函數的說法正確的是()。A、train_test_splitB、train_test_split的輸入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論