關(guān)聯(lián)分析考試題及答案_第1頁
關(guān)聯(lián)分析考試題及答案_第2頁
關(guān)聯(lián)分析考試題及答案_第3頁
關(guān)聯(lián)分析考試題及答案_第4頁
關(guān)聯(lián)分析考試題及答案_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)聯(lián)分析考試題及答案試題:單項選擇題(每題2分,共20分)1.在關(guān)聯(lián)分析中,用于衡量項集之間關(guān)聯(lián)程度的指標(biāo)是?A.支持度B.置信度C.提升度D.余弦相似度2.Apriori算法的核心思想是?

A.從頻繁項集生成候選項集

B.使用哈希表存儲數(shù)據(jù)C.通過遞歸方式生成頻繁項集D.利用FP樹進(jìn)行頻繁項集挖掘3.提升度(Lift)大于1意味著?A.項集A和項集B相互獨立B.項集A的發(fā)生對項集B的發(fā)生有負(fù)影響

C.項集A的發(fā)生對項集B的發(fā)生有正影響

D.項集A和項集B是互斥的4.在關(guān)聯(lián)規(guī)則挖掘中,如果一條規(guī)則的支持度很低,那么這條規(guī)則?A.可能是有趣的B.一定是有趣的C.可能是冗余的D.不可能是頻繁項集的一部分5.下列哪個不是關(guān)聯(lián)分析中的常用算法?A.Apriori

B.FP-Growth

C.K-Means

D.Eclat6.支持度閾值的作用是?A.控制挖掘出的規(guī)則數(shù)量B.確定頻繁項集的最小出現(xiàn)次數(shù)C.衡量規(guī)則的有效性D.提高算法的運行效率7.在FP-Growth算法中,F(xiàn)P樹的作用是?A.存儲所有事務(wù)數(shù)據(jù)B.存儲頻繁項集C.快速挖掘頻繁項集D.計算支持度和置信度8.如果一條關(guān)聯(lián)規(guī)則的置信度為1,這意味著?A.規(guī)則的前件和后件完全相同B.規(guī)則的前件發(fā)生時,后件一定發(fā)生C.規(guī)則的后件發(fā)生時,前件一定發(fā)生D.規(guī)則的前件和后件互不影響9.在進(jìn)行關(guān)聯(lián)分析時,我們通常需要先對數(shù)據(jù)進(jìn)行?A.歸一化處理B.離散化處理C.聚類處理D.降維處理10.下列哪個不是關(guān)聯(lián)規(guī)則挖掘的步驟?A.數(shù)據(jù)預(yù)處理B.生成頻繁項集C.生成關(guān)聯(lián)規(guī)則D.數(shù)據(jù)可視化多項選擇題(每題4分,共40分)1.關(guān)聯(lián)分析可以應(yīng)用于哪些領(lǐng)域?A.零售市場分析B.生物信息學(xué)C.網(wǎng)絡(luò)日志分析D.推薦系統(tǒng)2.在Apriori算法中,候選項集的生成依賴于?A.支持度閾值B.置信度閾值C.前一個頻繁項集D.事務(wù)數(shù)據(jù)庫3.提升度(Lift)的值可能有哪些?A.小于1B.等于1C.大于1D.小于04.下列哪些因素會影響關(guān)聯(lián)規(guī)則挖掘的結(jié)果?A.數(shù)據(jù)集的大小B.支持度閾值C.置信度閾值D.數(shù)據(jù)預(yù)處理的方式5.FP-Growth算法相比Apriori算法的優(yōu)勢包括?A.無需多次掃描數(shù)據(jù)庫B.可以處理更大規(guī)模的數(shù)據(jù)集C.能夠生成更精確的關(guān)聯(lián)規(guī)則D.算法復(fù)雜度更低6.在進(jìn)行關(guān)聯(lián)分析時,數(shù)據(jù)預(yù)處理可能包括哪些步驟?A.數(shù)據(jù)清洗B.數(shù)據(jù)集成C.數(shù)據(jù)變換D.數(shù)據(jù)規(guī)約7.下列哪些指標(biāo)可以用來評估關(guān)聯(lián)規(guī)則的質(zhì)量?A.支持度B.置信度C.提升度D.準(zhǔn)確率8.關(guān)聯(lián)規(guī)則挖掘中的“項集”可以是指?A.單個商品B.商品組合C.用戶行為D.時間段9.在使用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘時,為了提高效率,可以采取哪些措施?A.使用哈希表存儲候選項集B.利用先驗知識減少候選項集數(shù)量C.增加支持度閾值D.使用并行計算10.下列哪些說法是正確的?A.支持度越高的項集越可能是頻繁的B.置信度越高的規(guī)則越可能是有趣的C.提升度大于1的規(guī)則表示正關(guān)聯(lián)D.所有頻繁項集都可以生成關(guān)聯(lián)規(guī)則判斷題(每題2分,共20分)1.關(guān)聯(lián)分析只能用于挖掘二元關(guān)系。()2.支持度閾值越高,挖掘出的頻繁項集數(shù)量越少。()3.在Apriori算法中,候選項集的支持度是通過逐個計算得到的。()4.FP-Growth算法在構(gòu)建FP樹時,需要按照項的出現(xiàn)頻率進(jìn)行排序。()5.置信度越高的關(guān)聯(lián)規(guī)則,其在實際應(yīng)用中的價值一定越高。()6.提升度等于1時,表示兩個項集是獨立的。()7.數(shù)據(jù)預(yù)處理是關(guān)聯(lián)分析不可或缺的一步。()8.關(guān)聯(lián)規(guī)則挖掘只能發(fā)現(xiàn)正關(guān)聯(lián),不能發(fā)現(xiàn)負(fù)關(guān)聯(lián)。()9.Apriori算法和FP-Growth算法都是基于頻繁項集的關(guān)聯(lián)規(guī)則挖掘算法。()10.在進(jìn)行關(guān)聯(lián)分析時,數(shù)據(jù)集的大小對挖掘結(jié)果沒有影響。()填空題(每題2分,共20分)1.在關(guān)聯(lián)分析中,用于衡量項集出現(xiàn)頻率的指標(biāo)是_________。2.Apriori算法通過_________和_________兩個步驟交替進(jìn)行,以發(fā)現(xiàn)所有頻繁項集。3.提升度(Lift)是用來衡量關(guān)聯(lián)規(guī)則中前件和后件之間_________關(guān)系的指標(biāo)。4.在FP-Growth算法中,_________樹用于存儲壓縮后的頻繁模式。5.關(guān)聯(lián)規(guī)則挖掘的結(jié)果通常表示為形如“A=>B”的規(guī)則,其中A是規(guī)則的_________,B是規(guī)則的_________。6.數(shù)據(jù)預(yù)處理階段的主要任務(wù)包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和_________。7.在進(jìn)行關(guān)聯(lián)分析時,為了提高挖掘效率,通常會設(shè)置_________和_________兩個閾值。8.當(dāng)一條關(guān)聯(lián)規(guī)則的置信度為1時,意味著前件發(fā)生時,后件_________發(fā)生。9.除了Apriori算法和FP-Growth算法外,_________也是關(guān)聯(lián)規(guī)則挖掘中的一種常用算法。10.關(guān)聯(lián)分析可以應(yīng)用于多個領(lǐng)域,如零售、金融、生物信息學(xué)和_________等。答案:單項選擇題:1.A2.A3.C4.D5.C6.B7.C8.B9.B10.D多項選擇題:1.ABCD2.AC3.ABC4.ABCD5.AB6.ABCD7.ABC8.AB9.ABD10.AC判斷題:1.錯2.對3.錯4.對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論