信息檢索的基本原理_第1頁
信息檢索的基本原理_第2頁
信息檢索的基本原理_第3頁
信息檢索的基本原理_第4頁
信息檢索的基本原理_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息檢索的基本原理第1頁,課件共71頁,創(chuàng)作于2023年2月文獻(xiàn)信息檢索課

第二章

信息檢索的基本原理圖書館胡小莉

第2頁,課件共71頁,創(chuàng)作于2023年2月目錄第一節(jié)信息檢索的涵義及類型第二節(jié)信息與信息源第三節(jié)信息檢索途徑與步驟第四節(jié)信息檢索效果的評價4123第3頁,課件共71頁,創(chuàng)作于2023年2月學(xué)習(xí)目的和要求1、掌握信息檢索的基本概念和類別2、掌握常用的布爾邏輯、截詞、位置檢索等檢索技術(shù)3、了解信息檢索的基本流程第4頁,課件共71頁,創(chuàng)作于2023年2月第一節(jié)信息檢索的涵義及類型信息檢索的涵義

廣義:是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)信息的過程和技術(shù)。全稱為“信息存儲與檢索”。狹義:是指該過程的后半部分,即從信息集合中找出所需要的信息的過程,相當(dāng)于人們通常所說的信息查尋。

信息檢索的原理:就是將讀者(用戶)的信息需求與存貯在信息集合體中的信息進(jìn)行比較和選擇,即匹配(match)的過程。即對信息集合與需求的匹配與選擇。第5頁,課件共71頁,創(chuàng)作于2023年2月檢索與查找的區(qū)別檢索查找、搜索、搜尋英文Retrival或Retrievalsearch過程和方法有一定的策略,是系統(tǒng)的查找資料隨機(jī)或更隨意一些。技能需要一定的專門知識和技能簡單,任意詞用途課題或?qū)n}日常生活結(jié)果檢索前通常不知道會有什么結(jié)果通常知道結(jié)果效率迅速、準(zhǔn)確一般如果不刻意區(qū)分:你完全可以認(rèn)為它們沒有區(qū)別!第6頁,課件共71頁,創(chuàng)作于2023年2月信息檢索的類型根據(jù)信息檢索對象形式不同,分為:分類檢索內(nèi)容書目檢索以文獻(xiàn)線索為檢索對象的文獻(xiàn)檢索;信息用戶通過檢索獲得的是與檢索課題有關(guān)的一系列文獻(xiàn)線索,然后再通過閱讀決定取舍。全文檢索以文獻(xiàn)所含的全部信息作為檢索內(nèi)容的;可以查找到原文或相關(guān)的句、段、節(jié)、章等文字。計算機(jī)檢索發(fā)展趨勢之一數(shù)據(jù)檢索以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對象;數(shù)據(jù)檢索是一種確定性檢索,用戶檢索到的各種數(shù)據(jù)是經(jīng)過專家測試、評價、篩選過的,可直接用來進(jìn)行定量分析。事實檢索以從文獻(xiàn)中抽取的事項為檢索內(nèi)容;包括事實、概念等非數(shù)值信息和數(shù)據(jù)信息;確定性檢索,用戶獲得的是有關(guān)某一事物的具體答案第7頁,課件共71頁,創(chuàng)作于2023年2月問答:下面這些圖片所示屬于什么類型的信息檢索?第8頁,課件共71頁,創(chuàng)作于2023年2月第9頁,課件共71頁,創(chuàng)作于2023年2月信息檢索的類型根據(jù)信息儲存媒體和檢索手段不同,分為:分類檢索工具利弊應(yīng)用備注手工檢索(手檢)書本式和卡片式的書目、索引、文摘和各類工具書優(yōu)點:方便、靈活、直觀,查準(zhǔn)率較高,回溯查找的年份不受限制缺點:檢索效率低,漏檢現(xiàn)象比較嚴(yán)重,不利于進(jìn)行復(fù)雜概念課題的檢索。查找數(shù)據(jù)庫中通常沒有收錄的文獻(xiàn)依靠印刷載體,由人腦進(jìn)行篩選計算機(jī)檢索(機(jī)檢)計算機(jī)設(shè)備、終端、通信設(shè)施、數(shù)據(jù)庫和檢索應(yīng)用軟件等優(yōu)點:速度快、效率高、查全率高。缺點:成本高、費用大、回溯年份有限。光盤檢索系統(tǒng)、聯(lián)機(jī)系統(tǒng)和互聯(lián)網(wǎng)信息檢索系統(tǒng)利用計算機(jī)存儲和檢索信息第10頁,課件共71頁,創(chuàng)作于2023年2月信息檢索的類型

根據(jù)信息檢索信息形式不同,分為:分類檢索內(nèi)容文本檢索(自然語言檢索)不對文獻(xiàn)進(jìn)行任何標(biāo)引,直接通過計算機(jī)以自然語言中的詞語匹配查找的系統(tǒng)。多媒體檢索能夠支持兩種以上媒體的數(shù)據(jù)庫檢索,查找含有特定信息的多媒體文獻(xiàn)的檢索。超文本檢索用超鏈接的方法,將各種不同空間的文字信息組織在一起的網(wǎng)狀文本。我們?nèi)粘g覽的網(wǎng)頁上的鏈接都屬于超文本。第11頁,課件共71頁,創(chuàng)作于2023年2月1、信息檢索是獲取新知識的捷徑,節(jié)省學(xué)習(xí)者的時間。信息檢索的意義及目的

據(jù)估計,現(xiàn)在全世界每年出版的圖書有80萬種以上,科技期刊8萬種以上;發(fā)表期刊論文大于600萬篇以上;公開的專利說明書100多萬件;國際會議文獻(xiàn)1萬多件;美、英、德、日等國產(chǎn)生的科技報告達(dá)20萬件左右??萍嘉墨I(xiàn)浩如煙海,具備一定的信息檢索能力才能查找出有用的科技信息。第12頁,課件共71頁,創(chuàng)作于2023年2月美國在實施“阿波羅登月計劃”中,對阿波羅飛船的燃料箱進(jìn)行壓力實驗時,發(fā)現(xiàn)甲醇會引起鈦應(yīng)力腐蝕,為此付出了數(shù)百萬美元來研究解決這一問題,事后查明,早在十多年前,就有人研究出來了,方法非常簡單,只需在甲醇中加入2%的水即可,檢索這篇文獻(xiàn)的時間是10多分鐘。在科研開發(fā)領(lǐng)域里,重復(fù)勞動在世界各國都不同程度地存在。據(jù)統(tǒng)計,美國每年由于重復(fù)研究造成的損失,約占全年研究經(jīng)費的38%,達(dá)20億美元之巨。日本有關(guān)化學(xué)化工方面的研究課題與國外重復(fù)的,大學(xué)占40%、民間占47%、國家研究機(jī)構(gòu)占40%,平均重復(fù)率在40%以上;我國的重復(fù)率則更高。信息檢索的意義及目的

2、信息檢索是科學(xué)研究的向?qū)В苊庵貜?fù)研究或走彎路。第13頁,課件共71頁,創(chuàng)作于2023年2月信息檢索的意義及目的

2、信息檢索是終身教育的基礎(chǔ)學(xué)校培養(yǎng)學(xué)生的目標(biāo)是學(xué)生的智能:包括自學(xué)能力、研究能力、思維能力、表達(dá)能力和組織管理能力。聯(lián)合國教科文組織提出,教育已擴(kuò)大到一個人的整個一生,認(rèn)為唯有全面的終身教育才能夠培養(yǎng)完善的人,可以防止知識老化,不斷更新知識,適應(yīng)當(dāng)代信息社會發(fā)展的需求。第14頁,課件共71頁,創(chuàng)作于2023年2月第二節(jié)信息與信息源一、信息(一)什么是信息?(Information)信息論的奠基人,美國數(shù)學(xué)家克勞德·香農(nóng)(ClaudeE.Shannon):“信息是用來消除不確定性的東西?!笨刂普摰膭?chuàng)始人,美國科學(xué)家維納(N.Wiener):“信息是人們在適應(yīng)外部世界并使這種適應(yīng)反作用于外部世界的過程中,同外部世界進(jìn)行相互交換的內(nèi)容的名稱?!敝袊鴮W(xué)者鐘義信:“信息是事物運動的狀態(tài)與方式,是物質(zhì)的一種屬性?!钡?5頁,課件共71頁,創(chuàng)作于2023年2月信息爆炸第16頁,課件共71頁,創(chuàng)作于2023年2月客觀性載體性傳遞性

可塑性時效性信息的使用周期越來越短可以進(jìn)行加工和處理必須依附于一定的載體才能流通和傳遞是實現(xiàn)信息資源共享的基礎(chǔ)共享性可被多個用戶使用信息可被感知、獲取、傳遞和利用(二)信息的特征第17頁,課件共71頁,創(chuàng)作于2023年2月二、信息源信息源,顧名思義,就是信息的來源。聯(lián)合國教科文組織出版的《文獻(xiàn)術(shù)語》將其定義為:個人為滿足其信息需要而獲得信息的來源。類型存在方式特點口語信息源交談、聊天、授課、討論等方式傳遞快、互動性強(qiáng)、但稍縱即逝、久傳易出差異體語信息源手勢、表情、姿態(tài)等方式直觀性強(qiáng)、生動豐富、印象深刻、富有感染力實物信息源以實物如文物、產(chǎn)品樣本、模型、碑刻、雕塑等形式表示直觀性強(qiáng)、感受實在、信息量大,但需要通過知識、智慧、經(jīng)驗和工具挖掘大量隱含的信息文獻(xiàn)信息源以文字、圖形、符號、聲頻、視頻等方式記錄在各種載體上的知識和信息經(jīng)過加工、整理,較為系統(tǒng)、準(zhǔn)確、可靠,便于保存與利用,但也存在信息相對滯后、部分信息尚待證實的情況。第18頁,課件共71頁,創(chuàng)作于2023年2月

(一)零次信息源

不借助實物媒體,通過直接交流所獲得的的信息來源。包括口頭交談、參觀、現(xiàn)場交流、聽演講、聽報告會等。第19頁,課件共71頁,創(chuàng)作于2023年2月(二)一次信息源已出版的原始文獻(xiàn)、科研人員根據(jù)科研成果撰寫的文稿、第一手資料就是一次信息源。它包括:專著、期刊論文、科技報告、會議論文、專利說明書、學(xué)位論文等,是人們檢索和利用的主要對象。第20頁,課件共71頁,創(chuàng)作于2023年2月(三)二次信息源通過對大量分散、無序的一次信息源進(jìn)行加工、提煉、濃縮和組織,成為系統(tǒng)的、便于查找一次信息的工具,如收錄目錄、索引、文摘等的數(shù)據(jù)庫與網(wǎng)絡(luò)檢索工具。它不產(chǎn)生新的知識,但提供了一次信息源的線索。信息檢索主要講的就是二次信息的編排體系和使用方法。第21頁,課件共71頁,創(chuàng)作于2023年2月(四)三次信息源在利用二次信息的基礎(chǔ)上,對檢索到的一次信息進(jìn)行廣泛、深入的分析研究之后,再次加工出來的成果,如專題報告、綜述,以及詞典、手冊、百科全書、年鑒等工具書。具有綜合性強(qiáng)、針對性強(qiáng)、系統(tǒng)性好的特點。第22頁,課件共71頁,創(chuàng)作于2023年2月課堂討論:我們是否需要了解多種文獻(xiàn)信息源類型呢?你平時使用比較多的是哪種類型的信息源?一、了解一種就可以了;二、了解幾種常用的和常見的就可以了;三、各種類型都需要了解;第23頁,課件共71頁,創(chuàng)作于2023年2月第三節(jié)信息檢索途徑與步驟(一)信息檢索的途徑1、文獻(xiàn)外部特征的檢索途徑(1)責(zé)任者途徑(著者姓名途徑)(2)題名途徑(書名途徑)(3)文獻(xiàn)類型途徑(4)代碼途徑(序號途徑)

以文獻(xiàn)的編號為特征,檢索文獻(xiàn)的途徑。根據(jù)一些文獻(xiàn)類型的特有標(biāo)識,如科技報告的報告號;專利文獻(xiàn)的專利號、入藏號,合同號,技術(shù)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)號;ISSN,ISBN等作為檢索點。第24頁,課件共71頁,創(chuàng)作于2023年2月第25頁,課件共71頁,創(chuàng)作于2023年2月2、文獻(xiàn)內(nèi)容特征的檢索途徑(1)分類途徑

是一種按照文獻(xiàn)信息所屬學(xué)科(專業(yè))屬性(類別)進(jìn)行檢索的途徑。一般檢索系統(tǒng)均提供數(shù)據(jù)庫所使用的分類表的分類號索引。如:《中國圖書館分類法》(2)主題途徑

是根據(jù)表達(dá)文獻(xiàn)主題內(nèi)容的主題詞及其派生出的關(guān)鍵詞為標(biāo)識查找文獻(xiàn)信息的途徑。(3)分類主題途徑是分類途徑與主題途徑的結(jié)合,能夠盡量避免兩者的不足,取其多長。(4)其他檢索途徑①出處途徑

②時間途徑③任意詞途徑

④專門術(shù)語途徑第26頁,課件共71頁,創(chuàng)作于2023年2月分類途徑分類途徑主題途徑第27頁,課件共71頁,創(chuàng)作于2023年2月(二)計算機(jī)檢索技術(shù)1、布爾邏輯檢索是應(yīng)用布爾邏輯代數(shù)的原理設(shè)計的、應(yīng)用于計算機(jī)信息檢索系統(tǒng)的一種主流檢索技術(shù)與方法。三種類型:

邏輯與(AND)邏輯或(OR)邏輯非(NOT)布爾邏輯得名于GeorgeBoole,他是考克大學(xué)(現(xiàn)愛爾蘭國立考克大學(xué))的英國數(shù)學(xué)家,他在十九世紀(jì)中葉首次定義了邏輯的代數(shù)系統(tǒng)?,F(xiàn)在,布爾邏輯在電子學(xué)、計算機(jī)硬件和軟件中有很多應(yīng)用。第28頁,課件共71頁,創(chuàng)作于2023年2月布爾邏輯檢索1)

邏輯“與”運算符:AND或*檢索式:AANDB或A*B含義:檢出的信息中必須同時含有“A”和“B”兩個檢索詞。提高查準(zhǔn)率,增強(qiáng)檢索專指性。BA第29頁,課件共71頁,創(chuàng)作于2023年2月例:邏輯與(AND或*)計算機(jī)在圖書館的應(yīng)用計算機(jī)圖書館計算機(jī)AND圖書館第30頁,課件共71頁,創(chuàng)作于2023年2月人類活動對群落多樣性的影響檢索概念:人類活動群落多樣性影響檢索式人類活動AND群落多樣性人類活動AND群落多樣性AND影響第31頁,課件共71頁,創(chuàng)作于2023年2月人類活動AND群落多樣性AND影響第32頁,課件共71頁,創(chuàng)作于2023年2月布爾邏輯檢索2)邏輯“或”運算符:OR或+檢索式:AORB或A+B含義:數(shù)據(jù)庫記錄中任何一條記錄,只要含有“A”或“B”中任何一個檢索詞即為命中的文獻(xiàn)。提高查全率,擴(kuò)大檢索范圍如:“微機(jī)+電腦+PC機(jī)”“微機(jī)or電腦orPC機(jī)”BA第33頁,課件共71頁,創(chuàng)作于2023年2月布爾邏輯檢索3)邏輯“非”運算符:NOT或-檢索式:ANOTB或A-B在含檢索詞A的記錄中,去掉含檢索詞B的記錄例1查“玉米但不是甜玉米”方面的文獻(xiàn)。檢索式=玉米-甜玉米例2查“國外有關(guān)數(shù)字圖書館方面”的文獻(xiàn)檢索式=數(shù)字圖書館-國內(nèi)BA第34頁,課件共71頁,創(chuàng)作于2023年2月布爾邏輯檢索布爾邏輯運算符的運算順序優(yōu)先級高優(yōu)先級低NOTANDOR第35頁,課件共71頁,創(chuàng)作于2023年2月布爾邏輯運算符號在baidu、google搜索引擎中的運用1、百度搜索引擎三種邏輯運算符的使用方法:邏輯與為空格,例如“中國最長公路橋”可以用這樣的檢索式進(jìn)行檢索:“中國最長公路橋”;邏輯或為“︱”,例如“番茄︱西紅柿”;邏輯非為“-”【注意:“-”前必須輸入一個空格】,例如“馬鈴薯晚疫病-番茄”;2、Google搜索引擎三種邏輯運算符的使用方法:AND:有優(yōu)先,邏輯與為空格(使用方法同百度);邏輯或為OR【注意:OR必須用大寫】,例如:“番茄OR西紅柿”邏輯非為“-”【注意:“-”前必須輸入一個空格】,(使用方法同百度)。第36頁,課件共71頁,創(chuàng)作于2023年2月百度搜索引擎邏輯或的使用方法:第37頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索2、截詞檢索截詞檢索是在詞干的不同位置添加截詞符,以此代表詞的可變部位,從而減少相同詞干的檢索詞的輸入數(shù)量,提高查全率的一種常用檢索方法。主要用于檢索詞的單復(fù)數(shù)、詞性的詞尾變化、詞根相同的一類詞,以及同一詞的拼法變異等。在不同的檢索系統(tǒng)里用不同的符號,一般為:*、?、!提高查全率,防止漏檢的有力手段第38頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索1)

按截詞的數(shù)量劃分●有限截斷:即一個截詞符只代表0或1個字符。如:apple?可檢出apple、applet等結(jié)果●無限截斷:一個截詞符可代表多個字符。如:comput!可檢出:computer、 computers,computering等結(jié)果注:不同的數(shù)據(jù)庫所用的截詞符不一樣,使用時應(yīng)先查一下各數(shù)據(jù)庫的幫助加以確認(rèn)。第39頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索2)按截詞的位置劃分1.把截詞符號置放在一個檢索詞的中間;2.中截斷不允許有限截斷1.將截詞符號放在一個字符串左方,表示其左的有限或無限個字符不影響該字符串的檢索;2.實質(zhì):后方一致檢索1.最常用的截詞檢索技術(shù);2.放在字符串右方,表示其右有限或無限個字符不影響該字符串的檢索;3.實質(zhì):后截斷是前方一致檢索后截斷前截斷中截斷第40頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索●后截斷主要使用于如下幾種情況:檢索詞的單復(fù)數(shù)的描述;如:book?

同根詞的表達(dá);

如:chemi*可以檢索出chemical、

chemistry、chemist等同根詞年代的表達(dá);

如:20??(21世紀(jì)),199?(20世紀(jì)90年代)作者

如:Moyer*可以檢索出所有姓Moyer的作者第41頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索●前截斷:又稱左截斷,截詞符在詞的左邊如:輸入*computer檢索結(jié)果

microcomputer

minicomputer第42頁,課件共71頁,創(chuàng)作于2023年2月截詞檢索●中截斷:截詞符在檢索詞的中間輸入:

organi?ation檢索結(jié)果

organization

organisation中截斷主要使用于如下幾種情況:檢索詞的拼寫方式存在美式、英式之分;檢索詞在某個元音位置出現(xiàn)的單復(fù)數(shù)不同;

如:man與men作用

擴(kuò)大檢索范圍,提高查全率,減少檢索詞的輸入量第43頁,課件共71頁,創(chuàng)作于2023年2月位置檢索3、位置檢索

(1)詞級位置檢索指在檢索詞之間使用位置算符來規(guī)定算符兩邊的檢索詞出現(xiàn)在記錄中的位置,用以檢索出含有檢索詞且檢索詞之間的位置也符合特定要求的記錄。位置算符包括(W)、(N)算符,表示檢索詞之間的順序關(guān)系

(W):W是with的縮寫,表示兩個詞必須緊挨著,且詞序不可顛倒,(W)算符也可用空括號()代替。例:?Ssolar()energy

(nw):表示兩個詞之間可插入n個詞,且詞序不可顛倒。例:?Ssolar(3w)energy(N):N是near的縮寫,表示兩個詞之間必須緊挨著,但詞序任意。例:?Sfiber(N)optic(nN)表示兩個詞之間最多可插入n個詞,詞序任意。例:?Sfiber(4N)optic第44頁,課件共71頁,創(chuàng)作于2023年2月位置檢索

(2)子字段級或自然句級算符,用于限定檢索詞出現(xiàn)在同一子字段或自然句中,用(S)表示,S為subfield或sentence的縮寫,表示其兩側(cè)的檢索詞必須出現(xiàn)在同一子字段中,即一個句子或一個短語中。例如:rapid(S)transit,即rapid與transit在同一個子字段或一個句子中第45頁,課件共71頁,創(chuàng)作于2023年2月位置檢索(3)字段級算符字段級算符用于限定檢索詞出現(xiàn)在數(shù)據(jù)庫記錄中的某個字段。算符用(F)表示,F(xiàn)為field的縮寫。例如:air(F)pollution,表示air與pollution必須在同一字段中出現(xiàn)。第46頁,課件共71頁,創(chuàng)作于2023年2月討論:1、查詢高波教授的文章。發(fā)表(作者)、指導(dǎo)(導(dǎo)師)2、檢索關(guān)于研究老舍的論文。輸入“老舍”時必須選擇途徑為“標(biāo)題”或“關(guān)鍵詞”3、研究“法律與經(jīng)濟(jì)和政治的關(guān)系”的課題。檢索的信息是法律與經(jīng)濟(jì)和法律與政治之間的關(guān)系,因此“經(jīng)濟(jì)”與“政治”的關(guān)系是邏輯“或”,不是“與”,檢索式“法律﹡(經(jīng)濟(jì)+政治)”比“法律﹡經(jīng)濟(jì)﹡政治”檢索的范圍大得多。第47頁,課件共71頁,創(chuàng)作于2023年2月(三)信息檢索的步驟1.信息需求分析2.選擇檢索工具(或數(shù)據(jù)庫)與檢索手段3.確定檢索途徑與擬定檢索式4.實施試檢索操作5.檢索結(jié)果的評價與獲取原始文獻(xiàn)第48頁,課件共71頁,創(chuàng)作于2023年2月1.信息需求分析

只有對信息需求真正了解,才能獲得正確的檢索結(jié)果。需求分析是在問題及其最終解決方案之間架設(shè)橋梁的第一步。分析清楚需求間的邏輯關(guān)系包括因果關(guān)系、依賴關(guān)系、主次關(guān)系等,需求優(yōu)先級的排列,就能探索出描述這些需求的多種解決方案第49頁,課件共71頁,創(chuàng)作于2023年2月信息需求所涉及的通用問題第50頁,課件共71頁,創(chuàng)作于2023年2月信息需求差異

每個人的知識結(jié)構(gòu)、所處環(huán)境和面臨的問題都有所不同,由此而產(chǎn)生的信息需求也千差萬別的。即使面對同一課題,不同身份的人需求的內(nèi)容也不相同。在學(xué)術(shù)研究過程中,研究人員在課題設(shè)計、課題實驗(試驗)、成果發(fā)表、論文寫作等不同階段的信息需求也會不同第51頁,課件共71頁,創(chuàng)作于2023年2月信息需求類型和文獻(xiàn)類型的對應(yīng)關(guān)系信息需求的類型解決需求的文獻(xiàn)類型大眾化、常識性報紙、雜志、搜索引擎新聞、娛樂、財經(jīng)各種門戶網(wǎng)站尖端技術(shù)科技報告基礎(chǔ)理論性探討期刊論文、會議論文技術(shù)革新專利文獻(xiàn)產(chǎn)品定型設(shè)計標(biāo)準(zhǔn)文獻(xiàn)及產(chǎn)品樣本第52頁,課件共71頁,創(chuàng)作于2023年2月2.檢索流程

檢索流程是從確立信息需求到信息需求滿足的全過程。對于不同的檢索系統(tǒng)、不同的課題、不同的用戶來說,其具體檢索流程有所不同。通用信息檢索流程一般包括:分析檢索課題、選擇檢索工具、確定檢索策略、調(diào)整檢索策略及獲取原始文獻(xiàn)等流程。第53頁,課件共71頁,創(chuàng)作于2023年2月第54頁,課件共71頁,創(chuàng)作于2023年2月(1)分析檢索課題,進(jìn)行信息需求分析課題分析確定檢索主題確定檢索的范圍:地理、時間段、文獻(xiàn)類型等預(yù)期所需文獻(xiàn)信息數(shù)量第55頁,課件共71頁,創(chuàng)作于2023年2月①分析課題的主題內(nèi)容分析課題的主題內(nèi)容、所屬學(xué)科性質(zhì),明確研究課題所需的信息內(nèi)容,從而提出能準(zhǔn)確反映課題核心內(nèi)容的主題概念。②確定檢索時間范圍根據(jù)課題研究的起始年代和研究的高峰期確定檢索的時間范圍。第56頁,課件共71頁,創(chuàng)作于2023年2月③

確定課題的文獻(xiàn)類型通過對課題進(jìn)行主題分析后,確定所需信息的文獻(xiàn)類型。如果屬于基礎(chǔ)理論性探討,要側(cè)重于查找期刊論文、會議論文。如果是尖端技術(shù),應(yīng)側(cè)重于科技報告。如屬于發(fā)明創(chuàng)造,技術(shù)革新,則應(yīng)側(cè)重于專利文獻(xiàn)。如為產(chǎn)品定型設(shè)計,則需利用標(biāo)準(zhǔn)文獻(xiàn)及產(chǎn)品樣本。明確課題對檢索深度的要求,弄清用戶是需要提供題錄、文摘還是原始文獻(xiàn)。第57頁,課件共71頁,創(chuàng)作于2023年2月④分析用戶的檢索評價要求分析用戶對檢索評介指標(biāo)是查新、查準(zhǔn)還是查全。一般來說,若要了解某學(xué)科、理論、課題、工藝過程等最新進(jìn)展和動態(tài),則要檢索最近的文獻(xiàn)信息,強(qiáng)調(diào)一個“新”字,若要解決研究中某具體問題,找出技術(shù)方案,則要檢索有針對性、能解決實際問題的文獻(xiàn)信息,強(qiáng)調(diào)一個“準(zhǔn)”字;若要撰寫綜述、述評或?qū)V?,?qiáng)調(diào)一個“全”字。第58頁,課件共71頁,創(chuàng)作于2023年2月⑤分析用戶的檢索是否有特殊要求是否對特定的研究機(jī)構(gòu)感興趣?

是否對特定的作者的研究感興趣?

是否有特定的出版機(jī)構(gòu)的文獻(xiàn)與你的研究主題相關(guān)?其它?第59頁,課件共71頁,創(chuàng)作于2023年2月(2)選擇檢索工具掌握數(shù)據(jù)庫資源所覆蓋的學(xué)科范圍掌握各種數(shù)據(jù)收錄文獻(xiàn)的類型查看數(shù)據(jù)庫的詳細(xì)介紹和說明請教圖書館員要求介紹檢索的最佳數(shù)據(jù)庫第60頁,課件共71頁,創(chuàng)作于2023年2月從內(nèi)容上和時間上,考慮檢索工具對課題的覆蓋和一致性,比如就綜合考慮數(shù)據(jù)庫收錄的齊全、編制的質(zhì)量、使用的方便等因素。。在手段上和技術(shù)上,有機(jī)檢條件一般就不選擇手檢工具,機(jī)檢無疑有較高的效率。考慮價格和可獲性,選擇手工容易獲得的檢索工具,注意數(shù)據(jù)庫的價格,權(quán)衡價格效益比。第61頁,課件共71頁,創(chuàng)作于2023年2月(3)確定檢索策略根據(jù)待查課題的已知條件、課題檢索的深度,以及檢索工具本身可能提供的檢索途徑,選擇檢索途徑、建立檢索式并實施檢索。第62頁,課件共71頁,創(chuàng)作于2023年2月(4)調(diào)整檢索策略

檢索調(diào)整的基本目的,就是為了提高檢索結(jié)果與用戶需求的一致度。(這里的需求既可以是用戶開始檢索時明確表達(dá)的需求,也可以是檢索過程中的動態(tài)需求)。如果檢索結(jié)果過多或者過少甚至為零,就需要根據(jù)命中文獻(xiàn)量的多少、命中文獻(xiàn)的切題情況等,來決定是擴(kuò)大檢索范圍還是縮小檢索范圍。

第63頁,課件共71頁,創(chuàng)作于2023年2月不滿意

–非目標(biāo)性結(jié)果

檢查檢索詞的拼寫

檢查檢索詞的準(zhǔn)確性-查閱詞典、字典、詞表,刪除錯誤名詞

調(diào)查被檢索的數(shù)據(jù)庫–數(shù)據(jù)庫說明、期刊列表確定是否覆蓋你所需要檢索的主題第64頁,課件共71頁,創(chuàng)作于2023年2月擴(kuò)大檢索范圍可采用以下方法:(1)降低檢索詞的專指度,可選一些上位詞或相關(guān)詞補充到檢索式;(2)減少檢索詞,刪去某個不甚重要的檢索詞;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論