




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信息與引擎搜索第一頁,共一百二十二頁,2022年,8月28日第一節(jié)信息素質(zhì)
一、信息素質(zhì)
1、定義:信息素質(zhì)是人們?cè)诠ぷ髦羞\(yùn)用信息、學(xué)習(xí)信息技術(shù)、利用信息解決問題的能力。
第二頁,共一百二十二頁,2022年,8月28日2、信息素質(zhì)構(gòu)成要素:
信息意識(shí):強(qiáng)烈的信息意識(shí)——對(duì)信息敏感。
信息能力:信息的搜集獲取能力主要包括信息接受能力力;信息捕捉能力;信息吸收能力;信息檢索能力等。其中信息檢索能力指熟悉各種信息源,掌握信息檢索的基礎(chǔ)理論和基本技術(shù),熟練地利用各種手工檢索工具和計(jì)算機(jī)檢索系統(tǒng)查找所需信息的能力。信息道德:在信息領(lǐng)域中用以規(guī)范人們相互關(guān)系的思想觀念與行為準(zhǔn)則。
第三頁,共一百二十二頁,2022年,8月28日3、信息素質(zhì)可分為:工具素質(zhì):能用印刷和電子信息資源的有關(guān)工具,如計(jì)算機(jī)、軟件等;資源素質(zhì):了解信息資源的種類、形式和查找、檢索方法;社會(huì)結(jié)構(gòu)素質(zhì):掌握信息的社會(huì)地位、作用、影響;研究素質(zhì):掌握利用信息進(jìn)行有關(guān)學(xué)科研究的技能;出版和傳播信息素質(zhì):能利用文本或多媒體報(bào)告研究結(jié)果。第四頁,共一百二十二頁,2022年,8月28日
4、美國(guó)信息素質(zhì)評(píng)價(jià)1999年1月,美國(guó)大學(xué)與圖書館協(xié)會(huì)通過了“美國(guó)高等教育中學(xué)生信息素質(zhì)能力標(biāo)準(zhǔn)”,共5條,每條附有具體的操作說明,為教師或圖書館對(duì)學(xué)生、用戶、讀者的信息素質(zhì)評(píng)價(jià)提供了依據(jù)。這5條主要內(nèi)容如下:(1)能確定信息資源的特點(diǎn)和范圍;(2)能有效地獲取所需信息;(3)能評(píng)價(jià)信息及其來源,(4)利用其知識(shí)基礎(chǔ)和價(jià)值系統(tǒng)選擇適當(dāng)?shù)男畔?;?)能有效利用所獲得的信息實(shí)現(xiàn)特定的目標(biāo);第五頁,共一百二十二頁,2022年,8月28日美國(guó)信息素質(zhì)評(píng)價(jià)要點(diǎn):(1)能運(yùn)用新的和以前的信息開發(fā)新產(chǎn)品或項(xiàng)目;(2)能調(diào)整開發(fā)產(chǎn)品或項(xiàng)目的過程;(3)能與別人就產(chǎn)品或項(xiàng)目情況進(jìn)行有效的溝通(4)了解信息使用的經(jīng)濟(jì)、法律和社會(huì)問題,在信息獲取和利用時(shí)自覺遵守道德規(guī)范和有關(guān)的法律。(即在產(chǎn)品或項(xiàng)目開發(fā)中能正確使用有關(guān)信息資源,如合理使用或引用等)第六頁,共一百二十二頁,2022年,8月28日第二節(jié)信息與科研一、學(xué)術(shù)研究中的時(shí)間分配據(jù)美國(guó)科學(xué)基金會(huì)統(tǒng)計(jì),一個(gè)科研人員花費(fèi)在查找和消化科技資料上的時(shí)間需占全部科研時(shí)間的51%,計(jì)劃思考占8%,實(shí)驗(yàn)研究占32%,書面總結(jié)占9%。由上述統(tǒng)計(jì)數(shù)字可以看出,科研人員花費(fèi)在科研文獻(xiàn)查詢的時(shí)間為全部科研時(shí)間一半還要多。第七頁,共一百二十二頁,2022年,8月28日信息檢索、分析。。。SynthesisofAminoAcids1JACS19952JOC1987SynthesisofAminoAcids問題?創(chuàng)意?試驗(yàn)、計(jì)算。。。發(fā)表:口頭報(bào)告、論文、專利。。。1JACS19952JOC1987SynthesisofAminoAcidsSynthesisofAminoAcids新的問題?發(fā)展、延伸。。。同行評(píng)價(jià)、引用、應(yīng)用。。。二、科研流程圖第八頁,共一百二十二頁,2022年,8月28日三、科研選題和文獻(xiàn)檢索科技信息是知識(shí)創(chuàng)新的源泉:世界上任何一項(xiàng)科研成果或創(chuàng)新都是在吸取和借鑒前人或他人研究成果的基礎(chǔ)上,再加上自己的鉆研和創(chuàng)新所獲得的??萍夹畔⑹强蒲械南葲Q條件。第九頁,共一百二十二頁,2022年,8月28日四、科研選題及其步驟課題是為了實(shí)現(xiàn)某個(gè)特定目標(biāo)所需要研究的一個(gè)或一組科學(xué)問題。
科研選題就是形成、選擇和確定所要研究和解決的課題??蒲羞x題的步驟一般是:文獻(xiàn)調(diào)研和實(shí)際考察——提出選題——初步論證——評(píng)議和確定課題。第十頁,共一百二十二頁,2022年,8月28日第十一頁,共一百二十二頁,2022年,8月28日第三節(jié)、Internet概論
一、Internet簡(jiǎn)介
INTERNET中文譯為因特網(wǎng),它是由眾多計(jì)算機(jī)網(wǎng)絡(luò)互聯(lián)而成的,也稱網(wǎng)間網(wǎng)(NetworkofNetworks),是覆蓋全球的信息交流與共享網(wǎng)絡(luò)。計(jì)算機(jī)網(wǎng)絡(luò)是一個(gè)數(shù)據(jù)通信系統(tǒng),是由相互獨(dú)立的計(jì)算機(jī)相互連接在一起的計(jì)算機(jī)集合,它跨越了時(shí)空的限制,最大限度地實(shí)現(xiàn)了信息資源的共享。計(jì)算機(jī)網(wǎng)絡(luò)經(jīng)過了由最簡(jiǎn)單的兩臺(tái)計(jì)算機(jī)通過諸如電纜連接而成,發(fā)展到今天的由全世界上億臺(tái)計(jì)算機(jī)通過電纜、光纜和無線等方式連通的全球Internet。第十二頁,共一百二十二頁,2022年,8月28日二、計(jì)算機(jī)網(wǎng)絡(luò)的分類:(按分布距離的長(zhǎng)短)1、局域網(wǎng)(LAN):將有限范圍內(nèi)的各計(jì)算機(jī)、終端和外部設(shè)備互聯(lián)成網(wǎng)。可分為共享式和交換式兩種。最大距離不超過10KM。特點(diǎn)是容易管理與配置,拓?fù)浣Y(jié)構(gòu)簡(jiǎn)潔整齊,傳輸速率高、延遲短、成本低、應(yīng)用廣、級(jí)網(wǎng)方便、使用靈活。例如圖書館網(wǎng)絡(luò)。2、城域網(wǎng)(MAN):將現(xiàn)有的局域網(wǎng)互連起來的一種規(guī)模較大的城市范圍內(nèi)的網(wǎng)絡(luò)。范圍為幾十公里。3、廣域網(wǎng)(WAN):一種跨城市、地區(qū)甚至國(guó)家的遠(yuǎn)程網(wǎng)絡(luò)。采用分組交換技術(shù),點(diǎn)對(duì)點(diǎn)通信技術(shù)。4、互聯(lián)網(wǎng)(Internet):將不同的物理網(wǎng)絡(luò)技術(shù)按某種協(xié)議統(tǒng)一起來的一種高層技術(shù)。第十三頁,共一百二十二頁,2022年,8月28日三、Internet在中國(guó)的發(fā)展1986年撥號(hào)到歐洲一些國(guó)家,1994年4月正式接入Internet網(wǎng)。四個(gè)骨干網(wǎng):中國(guó)公用計(jì)算機(jī)互聯(lián)網(wǎng)(Chinanet)中國(guó)教育與科研計(jì)算機(jī)網(wǎng)(Cernet)中國(guó)科技計(jì)算機(jī)網(wǎng)(Cstnet)中國(guó)金橋互聯(lián)網(wǎng)(ChinaGBN)第十四頁,共一百二十二頁,2022年,8月28日四、Internet相關(guān)概念1、傳輸控制協(xié)議/網(wǎng)間協(xié)議(TCP/IP)傳輸控制協(xié)議/網(wǎng)間協(xié)議:(TransmissionControlProtocol/InternetProtocol/TCP/IP)是Internet的基礎(chǔ)協(xié)議。是不同型號(hào)的計(jì)算機(jī)和操作系統(tǒng)進(jìn)行數(shù)據(jù)傳輸?shù)囊环N規(guī)則。TCP/IP協(xié)議好比因特網(wǎng)上一種公共語言,使來自各個(gè)不同國(guó)家和地區(qū)的人們可以相互交流和建立聯(lián)系。第十五頁,共一百二十二頁,2022年,8月28日2、IP地址為了保證Internet上的計(jì)算機(jī)(主機(jī))在通信時(shí)能相互識(shí)別,TCP/IP協(xié)議要求Internet上任何一臺(tái)計(jì)算機(jī)都有一個(gè)不允許重復(fù)的地址,這個(gè)地址就是IP地址(InternetProtocolAddress)。IP地址由四組數(shù)字組成,每組數(shù)字中間用點(diǎn)隔開,如:是的主機(jī)在Internet上的IP地址。圖書館購(gòu)買的數(shù)據(jù)庫的使用權(quán)限絕大多數(shù)通過IP控制。第十六頁,共一百二十二頁,2022年,8月28日3、WWWWWW(WorldWideWeb),譯為萬維網(wǎng)。是一種基于超文本(Hypertext)方式的信息查詢工具。
WWW通過這種超文本的方式,把世界各地服務(wù)器上的信息連接在一起,圖文并茂地顯示在用戶面前。
WWW基于以下幾個(gè)基本概念:
超文本標(biāo)記語言(HTML)超文本傳輸協(xié)議(HTTP)統(tǒng)一資源定位符(URL)瀏覽器(BROWSER)WEB服務(wù)器(WEBSERVER)第十七頁,共一百二十二頁,2022年,8月28日4、瀏覽器(Browser)瀏覽器是用戶訪問WWW的工具。與其它瀏覽器不同的是WWW瀏覽器不僅可以瀏覽簡(jiǎn)單的二進(jìn)制文件,還可以瀏覽超文本標(biāo)記語言中所能描述的圖形、圖像、聲音、動(dòng)畫、表格以及進(jìn)一步的連接信息。目前流行的瀏覽器主要有:NetscapeNavigator和MicrosoftInternetExplorer(簡(jiǎn)稱IE)。第十八頁,共一百二十二頁,2022年,8月28日IE瀏覽器是目前應(yīng)用最普遍的瀏覽器。通常計(jì)算機(jī)WINDOWS桌面上,可以找到上面的圖標(biāo),這就是IE瀏覽器的標(biāo)示。雙擊它可打開瀏覽器。第十九頁,共一百二十二頁,2022年,8月28日五、Internet的主要服務(wù)功能(1)電子郵件服務(wù)(E-mail)(2)文件傳輸服務(wù)(Ftp)(3)遠(yuǎn)程登錄服務(wù)(4)萬維網(wǎng)(5)電子論壇(BBS、Blog)第二十頁,共一百二十二頁,2022年,8月28日第四節(jié)網(wǎng)絡(luò)信息資源一、網(wǎng)絡(luò)信息資源定義(NetworkInformationResource)
指以電子數(shù)據(jù)的形式將文字、圖像、聲音、動(dòng)畫等多種形式的信息存放在光磁等非印刷質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計(jì)算機(jī)或終端等方式再現(xiàn)出來的信息資源。隨著因特網(wǎng)的迅速發(fā)展和普及,網(wǎng)絡(luò)信息資源主要指放置在因特網(wǎng)上的信息集合,但并非包含所有因特網(wǎng)信息,而只是指其中能滿足人們信息需求的那一部分。第二十一頁,共一百二十二頁,2022年,8月28日二、網(wǎng)絡(luò)信息資源的類型1、依據(jù)信息源的信息內(nèi)容則可將網(wǎng)絡(luò)信息源分為以下類型:
(1)聯(lián)機(jī)數(shù)據(jù)庫各類數(shù)據(jù)庫是聯(lián)機(jī)存儲(chǔ)電子信息源的主體,據(jù)統(tǒng)計(jì),僅至1991年中期,世界上就有數(shù)據(jù)庫7600個(gè)。目前,很多重要的數(shù)據(jù)庫都已經(jīng)聯(lián)入Internet,僅DIALOG就有400多個(gè)。這些數(shù)據(jù)庫包括各個(gè)學(xué)科,涉及各種文獻(xiàn)的信息。第二十二頁,共一百二十二頁,2022年,8月28日(2)聯(lián)機(jī)館藏目錄庫目前Internet上的電子圖書館很多,國(guó)內(nèi)外的許多圖書館都已經(jīng)在網(wǎng)上提供服務(wù)。包括美國(guó)國(guó)會(huì)圖書館在內(nèi)的許多著名公共圖書館、大學(xué)圖書館及學(xué)術(shù)機(jī)構(gòu)的圖書館的館藏機(jī)讀目錄庫,通過網(wǎng)絡(luò)對(duì)外開放,提供OPAC(圖書館聯(lián)機(jī)公共目錄查詢系統(tǒng))服務(wù)。第二十三頁,共一百二十二頁,2022年,8月28日(3)網(wǎng)絡(luò)圖書電子圖書在Internet上越來越多,電子圖書涉及的領(lǐng)域特別廣泛,包括文學(xué)、藝術(shù)、科學(xué)、人文等各個(gè)領(lǐng)域。其中網(wǎng)上的電子詞典、百科全書更是獨(dú)樹一幟。(4)網(wǎng)絡(luò)報(bào)刊在Internet上,已有很多的電子期刊對(duì)用戶提供服務(wù)。世界著名的《Times》、《Forbes》、《Science》、《Nature》等都有網(wǎng)絡(luò)電子版。我國(guó)的很多刊物報(bào)紙也都已經(jīng)上網(wǎng)提供服務(wù)。如:《人民時(shí)報(bào)》、《經(jīng)濟(jì)日?qǐng)?bào)》第二十四頁,共一百二十二頁,2022年,8月28日(5)軟件與娛樂游戲類網(wǎng)上的這類資源也很多,且大都是免費(fèi)的。如Internet上有搜索引擎的介紹、語言幫助、幼兒教育之類的培訓(xùn)信息。而且隨著遠(yuǎn)程教育的發(fā)展,這類信息的數(shù)量將大量增加。(6)動(dòng)態(tài)性信息在Internet上有許多動(dòng)態(tài)性信息,如BBS、廣告、新聞時(shí)事等。第二十五頁,共一百二十二頁,2022年,8月28日三、文獻(xiàn)信息網(wǎng)絡(luò)檢索工具網(wǎng)絡(luò)檢索工具,是指在因特網(wǎng)上提供信息檢索服務(wù)的計(jì)算機(jī)系統(tǒng),其檢索的對(duì)象是存在于因特網(wǎng)信息空間中各種類型的網(wǎng)絡(luò)信息資源。
科研文獻(xiàn)信息網(wǎng)絡(luò)檢索主要分為兩種方式:
網(wǎng)絡(luò)資源檢索
專業(yè)數(shù)據(jù)庫檢索第二十六頁,共一百二十二頁,2022年,8月28日第五節(jié)網(wǎng)絡(luò)資源檢索方法
網(wǎng)絡(luò)資源檢索和數(shù)據(jù)庫檢索有相同之處,也有不同點(diǎn),總的來講,網(wǎng)絡(luò)資源檢索的目標(biāo)是檢索與要求相關(guān)的網(wǎng)站或網(wǎng)頁,通過這些網(wǎng)站或網(wǎng)頁所提供的信息來決定檢索的最終選擇。網(wǎng)絡(luò)資源檢索的方法主要有以下幾種:
一、布爾邏輯檢索大多數(shù)網(wǎng)絡(luò)檢索工具都支持布爾邏輯檢索,即:用布爾邏輯算符來表達(dá)檢索詞之間的邏輯關(guān)系。
第二十七頁,共一百二十二頁,2022年,8月28日常用的布爾邏輯算符有:邏輯或(+,OR)邏輯與(*,AND)邏輯非(--,NOT)邏輯或(+,OR):表達(dá)檢索詞間的并列關(guān)系??蓴U(kuò)大檢索范圍,提高查全率。如:A+B,表明結(jié)果中含有A或B都為檢索命中邏輯與(*,AND):表達(dá)檢索詞間的交叉關(guān)系??煽s小檢索范圍,提高查準(zhǔn)率。如:A*B,表明結(jié)果必須同時(shí)含有A和B才為命中
邏輯非(-,NOT):表達(dá)檢索詞間的排除關(guān)系。可縮小檢索范圍,提高查準(zhǔn)率,但要慎用。如:A—B,表明結(jié)果是A中不包含B的那部分。第二十八頁,共一百二十二頁,2022年,8月28日邏輯或邏輯與邏輯非ABABAB第二十九頁,共一百二十二頁,2022年,8月28日第三十頁,共一百二十二頁,2022年,8月28日第三十一頁,共一百二十二頁,2022年,8月28日第三十二頁,共一百二十二頁,2022年,8月28日二、截詞檢索(通配符檢索)又稱詞干檢索、模糊檢索。檢索時(shí),只需用詞干加截詞符號(hào),凡是含有與該詞干相同的文獻(xiàn)均能被檢出。該方法能很好避免漏檢現(xiàn)象的出現(xiàn)。
檢索系統(tǒng)不同,截詞符也不同,常用的有:#,?,*等。
截詞檢索也是一般數(shù)據(jù)庫檢索中常用的方法。
截詞的方式有多種,按截?cái)嗖课豢煞譃橛医財(cái)?、左截?cái)?、中間截?cái)唷?fù)合截?cái)嗟?;按截?cái)嚅L(zhǎng)度可以分為有限截?cái)嗪蜔o限截?cái)?。第三十三頁,共一百二十二頁?022年,8月28日
1.右截?cái)啵航厝ツ硞€(gè)詞的尾部,是詞的前方一致比較,也稱前方一致檢索。例如:輸入geolog?(?為截?cái)喾?hào)),將會(huì)把含有g(shù)eological、geologic、geologist、geologize、geology等詞的記錄檢索出來。而在搜索引擎中,目前多只提供右截法。而且搜索引擎中的截詞符則通常采用星號(hào)*。如educat*。相當(dāng)于education+educational+educator。
若輸入PY=199?,會(huì)把90年代的記錄全部查出來。
第三十四頁,共一百二十二頁,2022年,8月28日2.左截?cái)啵航厝ツ硞€(gè)詞的前部,是詞的后方一致比較,也稱后方一致檢索。例如:輸入?magnetic能夠檢出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等詞的記錄。
3.中間截?cái)啵航厝ツ硞€(gè)詞的中間部分,是詞的兩邊一致比較,也稱兩邊一致檢索。例如:輸入organi?ation可以檢出organization、organisation;輸入f??t可查出foot、feet。
第三十五頁,共一百二十二頁,2022年,8月28日4.復(fù)合截?cái)啵菏侵竿瑫r(shí)采用兩種以上的截?cái)喾绞?。例?chemi?可以檢出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。第三十六頁,共一百二十二頁,2022年,8月28日按截?cái)嚅L(zhǎng)度可以分為有限截?cái)嗪蜔o限截?cái)唷?、.有限截?cái)啵菏侵冈试S截去有限個(gè)字符。例如“acid??”表示截去一個(gè)字符,它可檢出acid、acids,但不能檢出acidic、acidicity、acidity等詞。又如comput????可檢出compute、computer、computers、computing等詞,不能檢出computable、computation、computerize等詞。
注意:詞干后面連續(xù)的數(shù)個(gè)問號(hào)是截?cái)喾硎驹试S截去字符的個(gè)數(shù),最后一個(gè)問號(hào)是終止符,它與截?cái)喾g要有一個(gè)空格,輸入時(shí)一定要注意。
第三十七頁,共一百二十二頁,2022年,8月28日2、無限截?cái)啵菏侵冈试S截去的字符數(shù)量不限,也稱開放式截?cái)?。上面右截?cái)唷⒆蠼財(cái)嗨e的例子均屬此類型。
任何一種截詞檢索,都隱含著布爾邏輯檢索的“或”運(yùn)算。采用截詞檢索時(shí),既要靈活、又要謹(jǐn)慎,截詞的部位要適當(dāng),如果截得太短(輸入的字符不得少于3個(gè)),將增加檢索噪聲,影響查準(zhǔn)率。
第三十八頁,共一百二十二頁,2022年,8月28日另外,不同的機(jī)檢系統(tǒng)使用的截詞符不同、各數(shù)據(jù)庫所支持的截?cái)囝愋鸵膊煌鏒IALOG系統(tǒng)和STN系統(tǒng)用?、ORBIT系統(tǒng)用:、BRS系統(tǒng)用$、ESA-IRS系統(tǒng)用+等。并不是所有檢索工具都能使用通配符檢索,有些檢索工具可以自動(dòng)截詞,如:Yahoo。第三十九頁,共一百二十二頁,2022年,8月28日第四十頁,共一百二十二頁,2022年,8月28日三、詞組檢索詞組檢索是將一個(gè)詞組(通常用雙引號(hào)“”括起)當(dāng)作一個(gè)獨(dú)立運(yùn)算單元,進(jìn)行嚴(yán)格匹配,以提高檢索的精度和準(zhǔn)確度,它也是一般數(shù)據(jù)庫檢索中常用的方法。
如:要檢索“計(jì)算機(jī)網(wǎng)絡(luò)”方面的網(wǎng)站或網(wǎng)頁,可輸入“computernetwork”。詞組檢索實(shí)際上體現(xiàn)了臨近位置運(yùn)算(Near運(yùn)算)的功能,即它不僅規(guī)定了檢索式中各個(gè)具體的檢索詞及其相互間的邏輯關(guān)系,而且規(guī)定了檢索詞之間的臨近位置關(guān)系。第四十一頁,共一百二十二頁,2022年,8月28日幾乎所有的搜索引擎都支持詞組檢索,并且都采用雙引號(hào)來代表詞組,如“信息教育”。但在Infoseek中,除了用雙引號(hào)外,還使用了短橫線“-”來代表詞組,如digital-library-definition,區(qū)別在于以“-”表示的詞組不區(qū)分大小寫。
InfoSeek是1995年2月由InfoSeek公司推出的搜索引擎。2001年2月InfoSeek改用Overture的搜索結(jié)果。
InfoSeek公司后被Disney公司兼并,InfoSeek搜索引擎成為G的一部分,并采用Google的引擎技術(shù)。其網(wǎng)址是::
第四十二頁,共一百二十二頁,2022年,8月28日第四十三頁,共一百二十二頁,2022年,8月28日第四十四頁,共一百二十二頁,2022年,8月28日四、限制檢索
限制檢索(Range)是通過限制檢索范圍,達(dá)到優(yōu)化檢索結(jié)果的方法。限制檢索的方式有多種,例如進(jìn)行字段檢索、使用限制符、采用限制檢索命令等。
1.字段檢索:是把檢索詞限定在某個(gè)/些字段中,如果記錄的相應(yīng)字段中含有輸入的檢索詞則為命中記錄,否則檢不中。
在搜索引擎中,字段檢索多表現(xiàn)為限制前綴符的形式。第四十五頁,共一百二十二頁,2022年,8月28日屬于主題字段限制的有:Title,Subject,Keywords,Summary等。
屬于非主題字段限制的有:Image,Text等。字段限制也可以用縮寫:
TI(題名)AU(作者)AB(文摘)JN(刊名)PY(年代)LA(語種)……如:information/TILA=english文摘=網(wǎng)絡(luò)信息資源
第四十六頁,共一百二十二頁,2022年,8月28日作為一種網(wǎng)絡(luò)檢索工具,搜索引擎提供了許多帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型,如主機(jī)名(host);域名(domain);鏈接(link);URL(site);新聞組(newsgroup)和E-mail限制等。這些字段限制功能限定了檢索詞在數(shù)據(jù)庫記錄中出現(xiàn)的區(qū)域。由于檢索詞出現(xiàn)的區(qū)域?qū)z索結(jié)果的相關(guān)性有一定的影響,因此,字段限制檢索可以用來控制檢索結(jié)果的相關(guān)性,以提高檢索效果。在著名的搜索引擎中,目前能提供較豐富的限制檢索功能的有AltaVista,Lycos和Hotbot等。第四十七頁,共一百二十二頁,2022年,8月28日
如:用標(biāo)題字段檢索時(shí)可輸入標(biāo)題字段的標(biāo)示符,通常是英文詞“title”加“:”構(gòu)成。用URL字段檢索時(shí)用輸入“url”加“:”,冒號(hào)后面跟上檢索式。如:檢索標(biāo)題為運(yùn)動(dòng)與健康方面的網(wǎng)頁,可以輸入:title:sportandhealth,冒號(hào)后不能有空格。并不是所有檢索工具的標(biāo)題字段檢索都使用titlt,如:Yahoo的標(biāo)題字段檢索可使用“title”也可使用“t”。因此,要根據(jù)不同的檢索工具的檢索功能使用檢索詞或標(biāo)示符。除常用的標(biāo)題字段以外,還有域名字段、主機(jī)字段及出版物字段等。第四十八頁,共一百二十二頁,2022年,8月28日第四十九頁,共一百二十二頁,2022年,8月28日
2.使用限制符:用表示語種、文獻(xiàn)類型、出版國(guó)家、出版年代等的字段標(biāo)識(shí)符來限制檢索范圍。例如要查找1999年出版的英文或法文的微型機(jī)或個(gè)人計(jì)算機(jī)方面的期刊,則檢索式為:(microcomputer??/de,ti,abORpersonalcomputer/ti,ab)ANDPY=1999AND(LA=ENORFR)ANDDT=Serial
第五十頁,共一百二十二頁,2022年,8月28日
3.使用范圍符號(hào):
如:、Lessthan、Greaterthan、Fromto等,如查找1989~1999年的文獻(xiàn),可表示為:PY=1989:1999或者PY=1989toPY=1999
又如查找2000年以來的計(jì)算機(jī)方面的文獻(xiàn),可表示為computer??AndGreaterthan1999查找在指定的文摘號(hào)范圍內(nèi)有關(guān)地震方面的文獻(xiàn),可表示為earthquake?/635000-800000第五十一頁,共一百二十二頁,2022年,8月28日
4.使用限制指令:限制指令可以分為:一般限制指令(Limit,它對(duì)事先生成的檢索集合進(jìn)行限制)、全限制指令(Limitall,它是在輸入檢索式之前向系統(tǒng)發(fā)出的,它把檢索的全過程限制在某些指定的字段內(nèi))。
例如:LimitS5/328000-560000表示把先前生成的第5個(gè)檢索集合限定在指定的文摘號(hào)內(nèi)。又如:Limitall/de,ti表示將后續(xù)檢索限定在敘詞和題名字段。
上述幾種限制檢索方法既可獨(dú)立使用,也可以混合使用。第五十二頁,共一百二十二頁,2022年,8月28日五、位置算符通過位置算符對(duì)復(fù)合檢索詞進(jìn)行加工,限定詞與詞之間的位置關(guān)系,提高檢準(zhǔn)率。
(W)算符:表示該算符兩邊的檢索詞順序排列,不能顛倒,且除空格和標(biāo)點(diǎn)符號(hào)外,不能插入其他詞或字母。
例:High(w)Strength結(jié)果:HighStrengthHigh_Strength在google,yahoo,baidu中,檢索“產(chǎn)品(W)蒸餾”,都沒有得到理想結(jié)果。第五十三頁,共一百二十二頁,2022年,8月28日
(nW)算符:允許兩詞間最多插入n個(gè)詞例:Heat(1W)Combustion結(jié)果:HeatofCombustion
(N)算符:除空格和標(biāo)點(diǎn)符號(hào)外,不得插入其它詞或字母,但兩詞順序可以顛倒。例:money(N)supply結(jié)果:moneysupplysupplymoney
(nN)算符:兩詞順序可以顛倒,中間可以插入最多n個(gè)詞。例:number(2N)theory結(jié)果:numbertheorytheoryofnumbertheoryofthenumber第五十四頁,共一百二十二頁,2022年,8月28日
六、加權(quán)檢索加權(quán)檢索:用專門符號(hào)規(guī)定某個(gè)檢索詞在檢索結(jié)果中的權(quán)值
例:+environment表示關(guān)鍵詞environment必須出現(xiàn)在結(jié)果中例:-truck表示關(guān)鍵詞truck一定不能出現(xiàn)在結(jié)果中第五十五頁,共一百二十二頁,2022年,8月28日第六節(jié)網(wǎng)絡(luò)資源檢索工具搜索引擎一、搜索引擎的定義:
搜索引擎(SearchEngine)是INTERNET上完成各種信息檢索任務(wù)的一種工具。廣義上是指一種基于INTERNET的信息查詢系統(tǒng),包括信息抓取、信息管理和信息檢索;狹義上是指一種為搜集INTERNET上的網(wǎng)頁信息而設(shè)計(jì)的檢索軟件。它通過分析Web頁面的標(biāo)題并跟蹤它們所含的具體信息,整理成含有站點(diǎn)及Web頁的URL、關(guān)鍵字等信息的龐大數(shù)據(jù)庫,并根據(jù)用戶的檢索請(qǐng)求,返回其需要的信息。第五十六頁,共一百二十二頁,2022年,8月28日二、搜索引擎的主要功能:1、在INTERNET上搜集信息;2、對(duì)搜集到的信息進(jìn)行標(biāo)引和分類等處理,并以此來建立或更新數(shù)據(jù)庫;3、接受用戶的訪問,提供實(shí)時(shí)的檢索服務(wù)。作為因特網(wǎng)上專門提供網(wǎng)上信息查詢服務(wù)的網(wǎng)站,搜索引擎可以在浩如煙海的網(wǎng)站中迅速查找有效信息,具有強(qiáng)大的導(dǎo)航作用,已經(jīng)成為人們上網(wǎng)時(shí)必備的工具。第五十七頁,共一百二十二頁,2022年,8月28日中文雅虎若比鄰中文搜索引擎天網(wǎng)百度搜索客1.AltaVista()2.Excite()3.Webcrawler()4.Lycos()5.Opentext()6.Infoseek()7.Yahoo!()8.HotBot()10.Magellan()第五十八頁,共一百二十二頁,2022年,8月28日三、典型搜索引擎Yahoo
1、Yahoo簡(jiǎn)介
Yahoo!是世界上第一個(gè)搜索引擎,也是Internet最著名的查詢系統(tǒng),提供免費(fèi)查詢服務(wù)。
Yahoo!是由兩名斯坦福大學(xué)電機(jī)工程博士生DavidFilo和JerryYang(楊致遠(yuǎn),華人)于1994年開發(fā)的,并于1995年成立Yahoo!公司。
Yahoo!擁有第一流的Web目錄和最佳的新聞鏈接以及許多附加服務(wù),因而Yahoo擁有許多用戶,每天約有400萬人次訪問,在短短的幾年里,Yahoo就成為網(wǎng)上最熱門的搜索工具,而且還為Internet增添了無窮魅力。第五十九頁,共一百二十二頁,2022年,8月28日Yahoo!對(duì)收集到的信息都進(jìn)行嚴(yán)格的審核和分類,從而保證了內(nèi)容饋乏的網(wǎng)站不會(huì)在Yahoo!中找到。如果用戶的檢索要求沒有滿足,Yahoo會(huì)自動(dòng)將用戶的檢索要求轉(zhuǎn)到Google進(jìn)行查尋。在瀏覽器地址框鍵入即進(jìn)入Yahoo!世界。第六十頁,共一百二十二頁,2022年,8月28日第六十一頁,共一百二十二頁,2022年,8月28日第六十二頁,共一百二十二頁,2022年,8月28日2、Yahoo搜索功能:
Yahoo!提供一些操作符用以對(duì)檢索項(xiàng)的限定,主要包括以下幾種:
(1)+:表示結(jié)果中必須包含這個(gè)詞,如:+market檢索表示檢索結(jié)果中必須含有market一詞。(2)-:表示限定檢索字串一定不要出現(xiàn)在結(jié)果中,如:+market-survey表示檢索結(jié)果中一定不包含有survey一詞。注意“-”與詞之間不能有空格。第六十三頁,共一百二十二頁,2022年,8月28日(3)詞組檢索:把檢索詞放在雙引號(hào)“”中,則此檢索詞作為短語檢索,如“AmericanMarketingAssociation”。若沒有雙引號(hào)則表示各單詞為“或”的關(guān)系,即“+”功能。
(4)截詞檢索:通配符號(hào)用“*”,但詞干部分必須有3個(gè)字母。
(5)字段檢索:Yahoo允許兩種類型的字段檢索,title和url。
t:表示只查網(wǎng)站名稱,如t:football,在網(wǎng)站名稱中查football。u:表示只查詢網(wǎng)址(url),u:football網(wǎng)址中含football。第六十四頁,共一百二十二頁,2022年,8月28日3、Yahoo搜索方式:
目錄查詢
普通搜索
高級(jí)搜索第六十五頁,共一百二十二頁,2022年,8月28日(1)Yahoo目錄查詢Yahoo的真正優(yōu)勢(shì)在于其分類目錄的內(nèi)容組織,其目錄和分類系統(tǒng)比其它搜索引擎詳細(xì)。Yahoo數(shù)據(jù)庫有65,000篇HTML文獻(xiàn)和其它Internet資源,共20多萬個(gè)條目,提供優(yōu)秀的主題瀏覽工具,對(duì)網(wǎng)站信息按主題建立分類索引,按字母順序列出14個(gè)大類,每個(gè)大類所包含的子類有精煉的描述,每個(gè)子類有數(shù)以千計(jì)的相關(guān)Internet網(wǎng)站信息。
Yahoo的目錄查詢使用很簡(jiǎn)單,只要進(jìn)入其主題分類界面,選定所查主題,逐級(jí)進(jìn)入即可。如查科學(xué)技術(shù),鏈接科學(xué)技術(shù)選項(xiàng)即可。第六十六頁,共一百二十二頁,2022年,8月28日第六十七頁,共一百二十二頁,2022年,8月28日(2)Yahoo普通搜索打開Yahoo!主頁進(jìn)入普通搜索界面,在窗口的對(duì)話框中直接輸入關(guān)鍵詞進(jìn)行檢索,此時(shí)將在Categories(類目);WebSites(網(wǎng)站);WebPages(網(wǎng)頁);NewsStories(新聞故事);NetEvents(網(wǎng)絡(luò)新聞);Images(圖像);Products(產(chǎn)品)中進(jìn)行。Yahoo!會(huì)從其數(shù)據(jù)庫里檢索符合條件的主題目錄的Web站點(diǎn),其結(jié)果依次為站點(diǎn)(TheWeb),目錄(Directory),新聞(News),Products(產(chǎn)品),要想查看檢索到的目錄、站點(diǎn)和新聞,直接點(diǎn)擊即可。第六十八頁,共一百二十二頁,2022年,8月28日第六十九頁,共一百二十二頁,2022年,8月28日第七十頁,共一百二十二頁,2022年,8月28日第七十一頁,共一百二十二頁,2022年,8月28日(3)Yahoo高級(jí)搜索(AdvancedSearch):高級(jí)搜索界面提供多種選擇,包括搜索方式、搜索范圍、時(shí)間范圍以及顯示結(jié)果數(shù)等,同時(shí),還提供了檢索詞的邏輯組配方式,包括
邏輯與(includeallofthewords)詞組檢索(includethisexactphrase)邏輯或(includeatleastoneofthesewords)邏輯非(excludethesewords)第七十二頁,共一百二十二頁,2022年,8月28日第七十三頁,共一百二十二頁,2022年,8月28日第七十四頁,共一百二十二頁,2022年,8月28日第七十五頁,共一百二十二頁,2022年,8月28日第七十六頁,共一百二十二頁,2022年,8月28日第七十七頁,共一百二十二頁,2022年,8月28日4、Yahoo搜索結(jié)果:Yahoo!搜尋引擎會(huì)根據(jù)分類類目網(wǎng)站信息與關(guān)鍵字的相關(guān)程度來排列出相關(guān)的Yahoo!類目和網(wǎng)站。影響相關(guān)程度的因素有:與關(guān)鍵詞相同的詞的多少,相同的詞愈多,表示相關(guān)程度愈高。(2)與關(guān)鍵詞完全符合(ExactMatch),相關(guān)程度高于部分符合。(3)與關(guān)鍵詞符合的詞的位置。網(wǎng)站名稱(或新聞標(biāo)題)符合關(guān)鍵詞的相關(guān)程度高于網(wǎng)址(或新聞內(nèi)文)符合關(guān)鍵詞的網(wǎng)站。(4)對(duì)新聞檢索而言,新聞更新的時(shí)間也是搜尋結(jié)果排序的考慮要素,最新更新的新聞將優(yōu)先列出。第七十八頁,共一百二十二頁,2022年,8月28日四、典型搜索引擎Google()1、Google簡(jiǎn)介Google由兩位斯坦福大學(xué)的博士生LarryPage和SergeyBrin于1998年創(chuàng)立。GoogleInc.于1999年創(chuàng)立。Google通過自己的公共站點(diǎn)提供服務(wù)。Google收錄的網(wǎng)站內(nèi)容豐富,在主頁中使用“I`mfeelinglucky”,“手氣不錯(cuò)”按鈕,可以使檢索直達(dá)與關(guān)鍵詞最相關(guān)的網(wǎng)站中,這是該搜索引擎的一個(gè)特色。Google包含20多億網(wǎng)頁,搜索速度快?,F(xiàn)在,Google每天提供1.5億次查詢服務(wù)。第七十九頁,共一百二十二頁,2022年,8月28日第八十頁,共一百二十二頁,2022年,8月28日
2、Google搜索功能:自動(dòng)使用“and”進(jìn)行查詢:不需在關(guān)鍵詞之間加上邏輯算符“and”或“*”,關(guān)鍵詞之間“空格”表示邏輯關(guān)系與。忽略詞:Google會(huì)忽略最常用的詞和字符,這些詞和字符稱為忽略詞。Google自動(dòng)忽略“http”,“.com”和“的”等字符以及數(shù)字和單字,這類字詞不僅無助于縮小查詢范圍,而且會(huì)大大降低搜索速度。
使用英文雙引號(hào)可將這些忽略詞強(qiáng)加于搜索項(xiàng)。第八十一頁,共一百二十二頁,2022年,8月28日截詞檢索:為提供最準(zhǔn)確的資料,Google不支持截詞(通配符*)搜索,即Google只搜索與輸入的關(guān)鍵詞完全一樣的字詞。
忽略大小寫:Google搜索不區(qū)分英文字母大小寫,所有的字母均當(dāng)做小寫處理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的結(jié)果都一樣第八十二頁,共一百二十二頁,2022年,8月28日搜索方式-目錄搜索
Google目錄搜索,按照主題分為若干類,其搜索方法與Yahoo!基本相似。第八十三頁,共一百二十二頁,2022年,8月28日搜索方式-基本搜索:進(jìn)入Google的查詢界面即為基本搜索,其搜索簡(jiǎn)潔方便,僅需輸入關(guān)鍵詞并按回車鍵(Enter),或單擊“Google搜索”按鈕即可得到最相關(guān)的內(nèi)容。第八十四頁,共一百二十二頁,2022年,8月28日第八十五頁,共一百二十二頁,2022年,8月28日第八十六頁,共一百二十二頁,2022年,8月28日第八十七頁,共一百二十二頁,2022年,8月28日第八十八頁,共一百二十二頁,2022年,8月28日搜索方式-高級(jí)搜索(AdvancedSearch):點(diǎn)擊“高級(jí)搜索”即可進(jìn)入高級(jí)搜索界面,高級(jí)搜索界面提供多種選擇,包括搜索方式、搜索范圍、時(shí)間范圍以及顯示結(jié)果數(shù)等。同時(shí),還提供了檢索詞的邏輯組配方式包括:邏輯與(包含以下全部的字詞)詞組檢索(包含以下的完整字句)邏輯或(包含以下任何一個(gè)字詞)邏輯非(不包括以下字詞)第八十九頁,共一百二十二頁,2022年,8月28日第九十頁,共一百二十二頁,2022年,8月28日第九十一頁,共一百二十二頁,2022年,8月28日Google的特殊功能:查找PDF文件:除一般網(wǎng)頁外,Google現(xiàn)在還可以查找文檔格式為PDF的文件。如果某個(gè)搜索結(jié)果是PDF文件而不是網(wǎng)頁,它的標(biāo)題前面會(huì)出現(xiàn)以藍(lán)色字體標(biāo)明的[PDF]。這樣,用戶就知道需要啟動(dòng)AcrobatReader程序才能瀏覽該文件。單擊[PDF]右側(cè)的標(biāo)題鏈接就可以訪問這個(gè)PDF文檔。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 摩托機(jī)車基本知識(shí)培訓(xùn)課件
- 攝影機(jī)器基礎(chǔ)知識(shí)培訓(xùn)課件
- 攝影師基本知識(shí)培訓(xùn)內(nèi)容課件
- 塑鋼窗技術(shù)試題及答案
- 2025餐館轉(zhuǎn)讓經(jīng)營(yíng)合同示例
- 2025年高二【數(shù)學(xué)(人教A版)】?jī)蓷l直線的交點(diǎn)坐標(biāo)-學(xué)習(xí)任務(wù)單
- 公司財(cái)務(wù)知識(shí)培訓(xùn)宣傳稿課件
- 大數(shù)據(jù)行業(yè)編程面試題及答案解析
- 2025終止房屋租賃合同通知模板
- 2025茶葉銷售合同范文
- 透水磚改瀝青施工方案
- 南京科遠(yuǎn)KD200變頻器使用手冊(cè)
- 副校長(zhǎng)申請(qǐng)書
- 一飛再飛(2024年貴州中考語文試卷記敘文閱讀試題)
- 應(yīng)急通信網(wǎng)絡(luò)建設(shè)方案
- 八段錦考試題及答案
- DB11-T 806-2022 地面輻射供暖技術(shù)規(guī)范
- 純英文初三數(shù)學(xué)試卷
- 壓縮空氣流量及管徑計(jì)算
- 起重吊裝作業(yè)安全培訓(xùn)題庫
- 鋁合金技術(shù)服務(wù)協(xié)議
評(píng)論
0/150
提交評(píng)論