基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦_第1頁
基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦_第2頁
基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦_第3頁
基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦_第4頁
基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于WEB挖掘的個性化教學(xué)推薦系統(tǒng)_個性化推薦    論文導(dǎo)讀::本文提出通過心理學(xué)量表對學(xué)習(xí)風(fēng)格進(jìn)行測試。提出了許多個性化推薦系統(tǒng)。通過AprioriAll算法求解頻繁訪問序列2。 論文關(guān)鍵詞:學(xué)習(xí)風(fēng)格,Web挖掘,個性化推薦,AprioriAll算法    一、引言 基于Internet技術(shù)的教育網(wǎng)絡(luò)化趨勢不僅為學(xué)生提供了便利的學(xué)習(xí)方式和廣泛的選擇,也為學(xué)校提供了更加深入地了解學(xué)生需求信息和學(xué)生行為特征的可能性。但隨著Web上信息量的爆炸式增長,網(wǎng)上的資源得到極大豐富的同時也充斥著大量的垃圾信息,當(dāng)學(xué)生們面對這

2、些龐大蕪雜的信息海洋時變得無所適從,因而迫切需要能從這些紛繁蕪雜的信息海洋中主動過濾并推薦給學(xué)生他們所需信息的個性化輔助教學(xué)推薦工具,本文就是針對這個問題而提出的。 目前人們利用數(shù)據(jù)挖掘技術(shù),提出了許多個性化推薦系統(tǒng)。本文提出通過心理學(xué)量表對學(xué)習(xí)風(fēng)格進(jìn)行測試,并針對實際收集到數(shù)據(jù)的稀疏特點,采用項目評分預(yù)測的協(xié)同過濾算法1(Item-Based Top-N推薦算法),盡可能準(zhǔn)確地測試出學(xué)生的學(xué)習(xí)風(fēng)格。然后結(jié)合Web日志挖掘技術(shù),收集不同風(fēng)格學(xué)生瀏覽網(wǎng)頁的特點,通過AprioriAll算法求解頻繁訪問序列2,得到不同風(fēng)格學(xué)生的Web使用習(xí)慣,然后依據(jù)當(dāng)前學(xué)生瀏覽頁面向?qū)W生實時推薦下一步可能會訪問

3、的部分網(wǎng)頁個性化推薦,提高學(xué)習(xí)效率。 二、個性化教學(xué)系統(tǒng)結(jié)構(gòu)設(shè)計 根據(jù)WWW體系結(jié)構(gòu)和網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的特點,需要采用一種新的設(shè)計框架來處理挖掘過程。作者采用挖掘?qū)W生歷史瀏覽行為(記錄在服務(wù)器日志中)和分析學(xué)生學(xué)習(xí)風(fēng)格這兩類特征來構(gòu)建學(xué)生模型。 首次登陸系統(tǒng)時需對學(xué)生的學(xué)習(xí)風(fēng)格進(jìn)行測試,首先利用項目評分預(yù)測協(xié)同過濾算法(Item-Based Top-N)對未評分的項目進(jìn)行評分,然后統(tǒng)計總分即可得到學(xué)生的學(xué)習(xí)風(fēng)格類型這一特征值;對于己注冊的學(xué)生則提取MFR路徑(最大前引用)對Web服務(wù)器中的Web日志進(jìn)行預(yù)處理,可得到學(xué)生最大向前向訪問的路徑,再用AprioriAll算法挖掘?qū)W生訪問網(wǎng)頁的頻繁序列,

4、把這一頻繁序列作為特征值連同學(xué)生風(fēng)格這一特征值進(jìn)行數(shù)據(jù)預(yù)處理,即可得到學(xué)生個體興趣模型,然后對其進(jìn)行訪問模式挖掘即可得到學(xué)習(xí)風(fēng)格類型相同的學(xué)生所具有的訪問模式,最后根據(jù)這一訪問模式利用個性化推薦算法進(jìn)行學(xué)習(xí)內(nèi)容推薦。本文的系統(tǒng)結(jié)構(gòu)設(shè)計如圖1 所示。 圖1個性化挖掘和推薦模塊 三、 實現(xiàn)個性化教學(xué)推薦系統(tǒng)的關(guān)鍵步驟 1 構(gòu)建學(xué)習(xí)風(fēng)格及興趣模型 學(xué)習(xí)風(fēng)格是學(xué)生對學(xué)習(xí)方法的定向或偏愛,是學(xué)習(xí)者特有的認(rèn)知、情感和生理行為,是學(xué)生持續(xù)一貫帶有個性特征的學(xué)習(xí)方式。因此本文結(jié)合學(xué)習(xí)風(fēng)格構(gòu)建能代表學(xué)生特征的學(xué)生學(xué)習(xí)風(fēng)格及興趣模型。為了更加準(zhǔn)確的測試出學(xué)生的學(xué)習(xí)風(fēng)格類型,本文采用了所羅門風(fēng)格量表和Kolb風(fēng)格量

5、表進(jìn)行測試,由于學(xué)生數(shù)目的急劇增加和項目眾多的風(fēng)格量表導(dǎo)致學(xué)生評分?jǐn)?shù)據(jù)的不完善,而產(chǎn)生了數(shù)據(jù)的稀疏性,這使得計算目標(biāo)用戶的項目評分后不能準(zhǔn)確的測試出學(xué)生的學(xué)習(xí)風(fēng)格。本文來采用基于項目評分預(yù)測的協(xié)同過濾推薦算法1計算項目間的相似性,預(yù)測學(xué)生對未評分項目的評分,就可以有效地解決數(shù)據(jù)稀疏情況下的學(xué)習(xí)風(fēng)格的測試問題,能更加準(zhǔn)確的測試出學(xué)生的學(xué)的風(fēng)格畢業(yè)論文范文。具體實現(xiàn)如圖2所示。 圖2學(xué)習(xí)風(fēng)格的測試流程 首先可以得到學(xué)生學(xué)習(xí)風(fēng)格測評數(shù)據(jù)矩陣,假設(shè)用戶為User-1,User-2,,User-n,心理學(xué)量表的測量相目為Item-1,Item-2,Item-m,這樣矩陣的形式如圖3所示。 顯然當(dāng)缺少學(xué)生

6、對某一些項目的評分時,量表就無法完成對學(xué)習(xí)風(fēng)格的評價,在自主學(xué)習(xí)的環(huán)境產(chǎn)生這種現(xiàn)象中是很常見的。為此有必要填補學(xué)生未評分的部分,完成對學(xué)習(xí)風(fēng)格的評價。作者通過兩步來完成對未評分項目的填充:          用戶項目        Item-1        Item-2       &#

7、160;        Item-j                Item-m             User-1        R11 

8、0;      R12                R1j                /          

9、60;  User-2        R21        /                R2j              &

10、#160; R2m                                     /           &#

11、160;                       User-i        Ri1        Ri2          

12、      /                /             User-n        /      &#

13、160; Rn2                Rnj                Rnm     圖3學(xué)習(xí)風(fēng)格測評數(shù)據(jù)矩陣 (1)計算各項目之間的相似性。對于所有用戶U,假設(shè)他對項目Item-j1和Item-j2同時作了評價,

14、這樣它們之間的相似性可以用多種方法計算3,其中本文采用Pearson-r相關(guān)計算個性化推薦,其公式如下: 其中表示用戶U在項目j1上的評分,表示第j1項目的平均評分。 (2)根據(jù)第一步,可以求得與Item-j最相似的N個項目,假設(shè)用戶i還沒對Item-j的進(jìn)行評分,可以采用如下公式計算: 最后,計算已評分的項目和預(yù)測到項目的評分的和,即可得到學(xué)生對量表的總評分,也就得出了學(xué)生的學(xué)習(xí)風(fēng)格類型。 3.2 模式發(fā)現(xiàn)與個性化推薦 作者進(jìn)行的模式發(fā)現(xiàn)是從大量的學(xué)習(xí)者訪問事務(wù)中找出所有的頻繁序列集,這一過程也稱為Web使用習(xí)慣發(fā)現(xiàn),其中也包含了用戶興趣的因素。本文在設(shè)計中采用AprioriAll挖掘算法,

15、具體的實現(xiàn)過程如下。 (1)尋找頻繁序列 首先從服務(wù)器的Web日志文件中提取用戶訪問序列,經(jīng)過預(yù)處理(MFR)以后可以得到Web訪問事務(wù)子集如表1所示,其中Tid代表事務(wù)編號,Sid代表學(xué)習(xí)風(fēng)格類型,Tp代表該事務(wù)中的內(nèi)容頁面,F(xiàn)p代表頻繁訪問序列集。根據(jù)AprioriAll挖掘算法進(jìn)行挖掘,得出學(xué)習(xí)風(fēng)格類型所對應(yīng)的頻繁訪問項集,如表2中的頻繁訪問項集。 (2)AprioriAll算法 第一步;尋找大序列。算法的基本思想是對數(shù)據(jù)進(jìn)行多次遍歷,在每次的遍歷過程中從一個大序列組成的種子集開始,利用這個種子集,可以產(chǎn)生新的潛在大序列。在遍歷過程中,計算這些候選序列的支持度,經(jīng)過這樣一次遍歷的之后,就

16、可以決定哪些候選集是真正的大序列,這些序列構(gòu)成了下一次遍歷的種子集。 第二步:連接步。進(jìn)行與 的連接運算;如<1,2,3>與<1,2,4>連接成為<1,2,3,4>。要注意的是<1,2,3,4>和<1,2,4,3>是兩個序列。 第三步:剪枝步。即進(jìn)行修剪;對于一個連接過后的序列,如果它的任意一個子列不在中,那么刪除該序列,這個過程稱為修剪。 (3)個性化推薦 由于不同學(xué)習(xí)風(fēng)格類型學(xué)生的在學(xué)習(xí)中具有不同的頻繁序列集個性化推薦,可以根據(jù)這一些頻繁集合進(jìn)行推薦。具體實現(xiàn)如下: 第一步:根據(jù)用戶的當(dāng)前訪問操作生成相匹配的推薦集,推薦集是由與當(dāng)

17、前用戶訪問操作相匹配的訪問操作模式組成,每一個訪問操作模式都 是根據(jù)用戶當(dāng)前訪問站點的方式,分析發(fā)現(xiàn)潛在有用的、相鏈接的Web頁。 第二步:利用固定大小的滑動窗口滑動覆蓋當(dāng)前的用戶訪問操作序列進(jìn)行推薦。滑動窗口內(nèi)的當(dāng)前用戶訪問操作序列隨著訪問進(jìn)程的進(jìn)展,不斷地向前更新。如設(shè)滑動窗口大小為4,當(dāng)前滑窗內(nèi)的用戶訪問操作序列為(A,B,C,D),當(dāng)用戶訪問了E之后,新的滑窗內(nèi)的用戶訪問操作序列變成了(B,C,D,E)。這樣的處理對于個性化推薦是非常有意義的,因為采用過長的當(dāng)前用戶服務(wù)操作序列,在與頻繁項匹配操作時,很難獲取非常多的信息,即相匹配的項很少。而短序列能獲得非常多相匹配的項,從推薦服務(wù)意義

18、上,這是很有價值的畢業(yè)論文范文。 4. 實驗結(jié)果分析 為了驗證本文建立的數(shù)據(jù)模型的性能和效率,本文利用該數(shù)據(jù)模型在真實的環(huán)境進(jìn)行了一系列的實驗。實驗系統(tǒng)以我們開發(fā)的大學(xué)計算機原理精品課程網(wǎng)站為原型,參加實驗人員為計算機專業(yè)的二年級兩個班學(xué)生共63 人,實驗要求在2個月時間內(nèi),按照自己的興趣瀏覽完網(wǎng)站內(nèi)容,瀏覽時間共計不得少于60 小時。選取這63名學(xué)生的數(shù)據(jù)進(jìn)行分析。 本文采用測試學(xué)習(xí)風(fēng)格類型結(jié)合挖掘用戶訪問序列的方法所開發(fā)的模型,首先利用測試數(shù)據(jù)集對該模型進(jìn)行測試,其對相同的學(xué)生進(jìn)行推薦后所取得的效果,和僅根據(jù)用戶訪問序列推薦方法進(jìn)行測試的模型相比個性化推薦,其結(jié)果如圖4 所示。由于本文在對

19、訪問序列挖掘前又對學(xué)生的學(xué)習(xí)風(fēng)格進(jìn)行了測試,既根據(jù)學(xué)習(xí)風(fēng)格推薦又根據(jù)這類學(xué)習(xí)風(fēng)格類型學(xué)習(xí)所采用的頻繁訪問序列推薦,這樣既能提高推薦的效率又能提高推薦的精確度。又因為學(xué)生的學(xué)習(xí)風(fēng)格不是被限定為唯一類型的,可能會偏向某一類型更多一些,所以本系統(tǒng)提供對學(xué)生的學(xué)習(xí)風(fēng)格進(jìn)行多次測試,更新了學(xué)習(xí)風(fēng)格類型后,那么推薦信息也隨之更新,而僅根據(jù)訪問序列挖掘進(jìn)行推薦的系統(tǒng)的推薦內(nèi)容不會馬上發(fā)生更新,所以本系統(tǒng)的推薦更新速度也比僅用訪問序列挖掘更新的快。 圖4 推薦的滿意度比較 從以上的比較可見,系統(tǒng)的實際測試結(jié)果還是比較滿意的,說明本文的方法確實可行。 5. 結(jié)束語 本文提出一個結(jié)合檢測學(xué)生學(xué)習(xí)風(fēng)格和挖掘頻繁訪問序列的個性化推薦系統(tǒng)。本系統(tǒng)與過去研究最大的不同在于挖掘了兩個代表學(xué)生學(xué)習(xí)偏好的特征向量。一個推薦系統(tǒng)推薦效果的好壞不僅取決于采用推薦的算法,更取決于對使用者興趣愛好的挖掘,本文通過對學(xué)生學(xué)習(xí)風(fēng)格和頻繁訪問序列這兩個特征值的采集,能更加深入地挖掘用戶的真正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論