數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評價_第1頁
數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評價_第2頁
數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評價_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評價 術(shù)多 種進(jìn)行了評價,并對研究結(jié)果進(jìn)行了思考。關(guān)鍵詞:數(shù)據(jù)挖掘;技術(shù)分析;應(yīng)用評價1 前言 越緊密,從而讓世界經(jīng)濟(jì)、貿(mào)易、政治、教育等多種領(lǐng)域業(yè)務(wù)的發(fā)展都開始受到由先進(jìn)互聯(lián) 這些信息如何獲取、這些數(shù)據(jù)如何挖掘已經(jīng)開始成為當(dāng)代信息收集者所要思考的重要問題。 通過利用數(shù)據(jù)挖掘工具從日?;顒印⒐ぷ?、行為當(dāng)中收集信息、匯總信息、整理信息、篩選 信息、分析信息,從而達(dá)到獲取真正有用信息的整個過程。2 數(shù)據(jù)挖掘技術(shù)分析研究2.1 數(shù)據(jù)挖掘的概念2.2 統(tǒng)計技術(shù) 模型方式,然后依據(jù)這種假定的分布以及其概率模型進(jìn)行數(shù)據(jù)挖掘。2.3 關(guān)聯(lián)規(guī)則 大魚發(fā)覺問題背后潛在的信息,從而實(shí)現(xiàn)將這

2、種數(shù)據(jù)挖掘技術(shù)切切實(shí)實(shí)的用到實(shí)際當(dāng)中。2.4 基于歷史的分析 所獲得信息的來源再重新整個對同一個問題或者其他領(lǐng)域可以適用的問題進(jìn)行研究。通過這 進(jìn)展。使用這種方法通常尋在著的主要的問題是這些歷史數(shù)據(jù)是否能成為這種問題分析的依 2.5 遺傳算法 制、相互影響、相互變化,并且結(jié)合現(xiàn)有分析方法選擇能夠相互遺傳、相互復(fù)制、影響、變 據(jù)和要素,最終能夠提高整個樣本的適配比率,讓研究的整個過程更具有效率。2.6 聚集檢測 每一個聚類,數(shù)量一般都是要保持一定比率的,從而保持每個樣本之間的可比性。最后,通 過比較每一個聚集之間的數(shù)據(jù)差異就能夠找出最終研究的目標(biāo),從而解決了成本和時間問題。2.7 連接分析圖論是

3、這種連接分析方法的核心思想,它旨為這種方式找到最為可靠、最為便利的方法, 來 不完美卻能夠?qū)栴}解決的方法。2.8 決策樹分析法 進(jìn)行相乘得到最后的結(jié)果,選擇最大幾率的方法作為這個問題的能夠最終得到解決的方法。2.9 神經(jīng)網(wǎng)絡(luò)分析法神經(jīng)分析法在其結(jié)構(gòu)上是將一個神經(jīng)的網(wǎng)絡(luò)組成部分劃分成輸入層和輸出層以及隱含層 一個隱含層,將其作為一種潛在影響因素,也可以說是誤差變量、影響變量。這個隱含層的 總層數(shù)以及每層與每層交點(diǎn)之間的個數(shù)就會決定整個神經(jīng)網(wǎng)絡(luò)總體復(fù)雜的程度。2.10 粗糙和模糊集方法這兩種數(shù)據(jù)挖掘的方法都是為了讓數(shù)據(jù)所收集的范圍更加廣泛,通過引入一種模糊性的邊 界,讓整個數(shù)據(jù)含量更加的充分,

4、從而讓整個研究過程更加具有科學(xué)性。其具體設(shè)計的方 進(jìn) 行隨即篩選,為總體目標(biāo)的證明和解釋提供有力的依據(jù)。2.11 回歸分析法 也是在所有領(lǐng)域的實(shí)證研究當(dāng)中都會用到的,現(xiàn)階段比較規(guī)范性的實(shí)證分析都會采用線性回 歸和穩(wěn)健性檢驗的方式,從而證明數(shù)據(jù)之間的關(guān)系假設(shè)的存在。這種方法易于操作,例如:最簡單的線性回歸模型就是大眾從小學(xué)學(xué)到的一元一次方程。 2.12 差別分析 數(shù)據(jù),欺詐的數(shù)據(jù)等等這些異常的數(shù)據(jù),通過對立面問題研究解決正面問題。2.13 概念描述這種方法是一種對某類對象的潛在的內(nèi)涵進(jìn)行基本的描述,然后通過概括這類對象一些明 顯的相關(guān)聯(lián)的特征的方法。現(xiàn)階段,理論界用到的概念描述可以分為:第一,特征性描述; 在的區(qū)別,從而對相同類和不同類對象的整個對象集總結(jié)出他們的共性,得到研究結(jié)論。3 數(shù)據(jù)挖掘技術(shù)應(yīng)用評價 研究方法當(dāng)中如何選取合適的方法就成為一項技術(shù)是否能發(fā)揮其優(yōu)勢、一個問題能否得到有 3.1 數(shù)據(jù)挖掘技術(shù)的應(yīng)用選擇3.2 數(shù)據(jù)挖掘技術(shù)應(yīng)用的思考 種叫做描述型的模式。這些模式又能夠根據(jù)其具有的相關(guān)的功能以及其在實(shí)際運(yùn)用當(dāng)中發(fā)揮 的作用分為以下幾種類別:數(shù)據(jù)分類,數(shù)據(jù)估值,數(shù)據(jù)預(yù)測,變量之間的相關(guān)性分析,變量 式。那么, 正確的方法并不等同于最好的方法,在實(shí)際進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論