8本小組開題報告_第1頁
8本小組開題報告_第2頁
8本小組開題報告_第3頁
8本小組開題報告_第4頁
免費預覽已結(jié)束,剩余9頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

lucene學院 專業(yè) 學 學號 近年來我國電子商務發(fā)展迅猛不僅創(chuàng)造了新的消費需求, 了新的投資熱潮如今 類發(fā)展很迅猛,人們喜歡在網(wǎng)上購物lucene學院 專業(yè) 學 學號 近年來我國電子商務發(fā)展迅猛不僅創(chuàng)造了新的消費需求, 了新的投資熱潮如今 類發(fā)展很迅猛,人們喜歡在網(wǎng)上購物,可以足不出戶,瀏覽大量商品.而且電子商務正加速發(fā)展,成為經(jīng)濟發(fā)展新的原動力。 品與文章評測 目前在市場上是一個空缺,效仿”今日頭條”,從網(wǎng)上抓取評測 的一個重要環(huán)節(jié)用戶在龐大的類目下,往往會束手無策,如何能讓用戶快速找到自己最想要的內(nèi)容,這就是搜索引擎的目的與目標了.同時,如何能讓用戶高質(zhì)量的找到自己所想要的文章與商品信息呢?這就需要一個優(yōu)秀的搜索引擎了.比如用戶一個很簡單的需求,想要看某件商品的相關評測類文章和這個商品的網(wǎng)上較的價格,完整的,這樣他可以一邊去查看由真實的用戶寫的評測文章去更深入的了解這款商品,一邊去類 類與評測 的發(fā)展現(xiàn) 章,經(jīng) 的處理,并使的基礎商 以優(yōu)化,形成一個龐大的商品今日頭條:它誕生時狐、網(wǎng) 客戶端的用戶規(guī)模更是已經(jīng)接近4000萬用戶,但是今日頭條卻從對手那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發(fā)的精準.同今日頭條:它誕生時狐、網(wǎng) 客戶端的用戶規(guī)模更是已經(jīng)接近4000萬用戶,但是今日頭條卻從對手那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發(fā)的精準.同時,它也有強大的搜索功能,為用戶提供了良好的的的類三.項目與實習的關我在公司的內(nèi)容,之前是對抓取到的文章進行轉(zhuǎn)碼處理,使用jsoup,分類等接口.做這些分類接口時候使用的是springbootjavawebsvnmaven三.項目與實習的關我在公司的內(nèi)容,之前是對抓取到的文章進行轉(zhuǎn)碼處理,使用jsoup,分類等接口.做這些分類接口時候使用的是springbootjavawebsvnmavenlucene4.0svnmaven四.項目開發(fā)的內(nèi)公司一個商品文章評測web?;緮?shù)據(jù)然后緩存本地,定時更新。redis五.項目的難點與特1.難點研(1)對項目架構(gòu)基礎研究,java+servlethttpweb(2)五.項目的難點與特1.難點研(1)對項目架構(gòu)基礎研究,java+servlethttpweb(2)redis,提(3)索引創(chuàng)建問題:Index(4)Luccene4.0用戶最想看到的信息,TokenStream,CharTermAttribute(6)svn,mavenlinux2.linux2.特色介結(jié)合海量的商品庫與文章庫精確內(nèi)容匹配e數(shù)據(jù)的高速,緩存使用讓響應時間更快;redis要求的price信息.其他信息本地緩存起來.通過BackgroundUpdater,自定義的DaemonThread守護進程,定時更新數(shù)據(jù).Lucene4.0)索引的選擇與創(chuàng)建,空間與時間消耗的衡量;索引創(chuàng)建時候Field,StringField等的選擇,Store.NO或Yes的選擇,用于處理是索引不.luceneComplexyzer搜索結(jié)果排序與,讓用戶更大概率的看到自己想要看到的內(nèi)容.優(yōu)化yzerQuery,如 類發(fā)展很迅猛,人們喜歡在網(wǎng)上購物,可以足不出戶,瀏覽大量商品.而且電,購物相 太多.所網(wǎng)單的需求,想要看某如 類發(fā)展很迅猛,人們喜歡在網(wǎng)上購物,可以足不出戶,瀏覽大量商品.而且電,購物相 太多.所網(wǎng)單的需求,想要看某件商品的相關評測類文章和這個商品的網(wǎng)上 的價格,完整 邊 上查看該商品的具體信息的今日頭條:它誕生時4000缺,效仿”今日頭條”,從網(wǎng)上抓取評測文章,經(jīng) 的處理,并使那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發(fā)的精準.同時,它也有強大的搜索功能,為用戶提供了良好的那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發(fā)的精準.同時,它也有強大的搜索功能,為用戶提供了良好的的 的相似之. 數(shù)據(jù)后使用本地緩存,BackgroundUpdater(1) 更 數(shù)據(jù)(3)Index索引創(chuàng)建問題 的 Field,Store的選擇與使得想要搜索的內(nèi)容,提高用戶體驗。使用 yzer加載本地分詞庫(5)搜索部分 yzerQuery的擴展與使用,獲取TokenStream,注入CharTermAttribute屬性,結(jié)果通過 e方法組合(6)使用 項目,并使用maven管理jar包,部署項目.項目部署在(7)java+servletweb(8)java.1(1)ContextServletcontextInitialized.priceredisGoods,Article,DatadataManager.init();ownManager,viewManager,commentManager,categoryManager,favoriteManager.BackgroundUpdater, 數(shù)據(jù)(8)java.1(1)ContextServletcontextInitialized.priceredisGoods,Article,DatadataManager.init();ownManager,viewManager,commentManager,categoryManager,favoriteManager.BackgroundUpdater, 數(shù)據(jù)article,goodsindex,index()Field四Query yzer,brands,s,series,catesyzeryzerdictyzeryzerTokenStream,Query yzer,brands,s,series,catesyzeryzerdictyzeryzerTokenStream,CharTermAttributeTokenStreameyzerQuery些cid2Score,(6)mavenjarLinux,redis緩存數(shù),redis緩存數(shù)索引創(chuàng)建,分詞系統(tǒng)數(shù)據(jù)緩存系定時更新數(shù)據(jù)域索引Web搜索接口的提用返回搜素結(jié)發(fā)送請求數(shù)2.系統(tǒng)運行2.系統(tǒng)運行的軟硬件環(huán) 環(huán)境:java環(huán)境, (2)硬件環(huán)境:linux服務器3.系統(tǒng)的部(1)linuxhttpweb四.預期成標準,能穩(wěn) 上實現(xiàn)高穩(wěn)定性,高吞吐量。項目的完成同時需要做好監(jiān)測,實五.主要參考文獻胡鵬飛, Lucene與中文分詞技術的研究及應用 Lucene,符滔滔 編著開發(fā)自己的搜索引擎:Lucene+Heritrix 清JavaWeb胡鵬飛, Lucene與中文分詞技術的研究及應用 Lucene,符滔滔 編著開發(fā)自己的搜索引擎:Lucene+Heritrix 清JavaWeb,張利國JavaWeb著Redis設計與實 JosiahL.Carlson著 Redis實 Ajax+Lucene編 搜索引擎技術實 Lucene&Java精華 ,Lucene搜索引擎開發(fā)進階實 ,沈家立Lucene分析與應 薛軍超等 網(wǎng)絡數(shù)據(jù)庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論