數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu) 課件ch04 詞法和詞義_第1頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu) 課件ch04 詞法和詞義_第2頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu) 課件ch04 詞法和詞義_第3頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu) 課件ch04 詞法和詞義_第4頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu) 課件ch04 詞法和詞義_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四章詞法和詞義數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu)01詞與詞處理PARTONE正如前面的定義,詞匯是一種語言或一個領(lǐng)域詞和固定語的總和,可以根據(jù)語言將其分為“漢語詞匯”“西班牙語詞匯”“斯瓦希里語詞匯”等,在一種語言內(nèi)部自然有“通用語詞匯”和“方言詞匯”、“書面語詞匯”和“口語詞匯”、“基本詞匯”和“一般詞匯”、“現(xiàn)代詞匯”和“古代詞匯”之分。詞匯所屬的領(lǐng)域可以是一個專業(yè)領(lǐng)域(如“汽車詞匯”“計算機詞匯”“文學(xué)詞匯”等)、某個人(如“魯迅詞匯”“郭沫若詞匯”“茅盾詞匯”等)或某部作品(如“詩經(jīng)詞匯”“毛選詞匯”“紅樓夢詞匯”等)。還有兩個和固定語相關(guān)的概念,分別叫“短語”(phrase)和“語塊”(chunk)。短語是由詞和詞組合形成的語義固定片段,也叫詞組,它和詞都表示一定的意義,也是造句成分,可以單獨使用,但不是“最小的”能夠獨立運用的單位。它是可以分離的,中間往往能插入其他造句成分,而詞是不能分離的,分離之后就不表示原來的意義了。語塊則更多在詞的認(rèn)知領(lǐng)域被研究,是人的腦神經(jīng)在進行語言信號處理過程中整體存取和處理的單位。大多數(shù)語塊和詞相同,也有很多高頻的組合意義不等于成分意義之和的詞組成為語塊(如“說曹操曹操就到”其實與曹操這個人物并無關(guān)系)。不論是“短語”還是“語塊”,它們和詞匯都不是涇渭分明的,有很多模糊的地方,這就給語言智能中的漢語詞處理帶來不小的困擾。詞與詞處理所有語言的詞匯都是開放系統(tǒng),因此很難說一種語言的詞匯究竟有多少。即便可以測量,這一數(shù)值也隨著時間不斷變化。我們通常只能估計一種語言詞匯規(guī)模的范圍。對于漢語而言,《現(xiàn)代漢語詞典》(第6版)收錄詞條6.9萬個,《辭海》(第6版)收錄詞條12.7萬個。在線新華字典目前已經(jīng)收錄20959個漢字、52萬個詞語。各個領(lǐng)域的專業(yè)術(shù)語和地名、組織機構(gòu)名等浩如煙海,難以窮盡。這也是在語言智能中詞處理面臨的一個挑戰(zhàn)。在語言智能文本處理解決了文字進入計算機這一難關(guān)(詳見第3章)之后,詞處理是在語言智能中最基礎(chǔ)而關(guān)鍵的任務(wù)。詞處理最主要的任務(wù)是分詞、命名實體識別和詞性標(biāo)注。詞與詞處理印歐語系單詞之間是以空格作為自然分界符的(這是中世紀(jì)甚至更晚出現(xiàn)的現(xiàn)象),而漢語的詞語之間沒有明顯的分隔標(biāo)記。因此,中文分詞是中文信息處理的一個重要任務(wù)。簡單地講,中文分詞就是利用計算機將待處理的文字串進行處理,輸出中文單詞和數(shù)字串等一系列分割好的字符串。這一步驟稱為分詞(wordsegmentation或tokenization)。例1展示了一個中文句子分詞前后的差異。當(dāng)然,該例句含有歧義,因而有兩種分詞結(jié)果。分詞例1分詞前:自動化研究所取得的成就。分詞后:自動化研究所取得的成就。分詞后:自動化研究所取得的成就。中文分詞是其他中文信息處理的基礎(chǔ)與關(guān)鍵,機器翻譯、語音合成、自動分類、自動摘要、自動校對、信息檢索、語料庫語言信息標(biāo)注等,都需要用到分詞技術(shù)。常見的分詞方法主要有以下三種。這種方法的優(yōu)點是算法簡單、易于實現(xiàn),缺點是匹配速度慢、存在歧義切分問題、缺乏自學(xué)習(xí)的智能性。該方法又稱為機械式分詞方法或基于詞典的分詞方法,它是按照一定策略將待分析的漢字串與一個機器詞典中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功。根據(jù)掃描方向的不同,匹配又可分為正向匹配、逆向匹配和雙向匹配。常見的匹配原則有逐詞匹配、最大匹配、最小匹配和最佳匹配。分詞1基于字符串匹配的分詞方法該方法使用多種統(tǒng)計機器學(xué)習(xí)模型,在大規(guī)模訓(xùn)練數(shù)據(jù)(已分好詞的數(shù)據(jù))中統(tǒng)計詞成分和非詞成分的差異,并以此對分詞數(shù)據(jù)進行標(biāo)記和判斷。分詞2基于統(tǒng)計的分詞方法該方法的基本思想是模擬人腦對語言和句子的理解,以深度神經(jīng)網(wǎng)絡(luò)模型捕捉大規(guī)模訓(xùn)練數(shù)據(jù)中的詞語分布信息,以達到識別詞匯單位的效果。這類方法需要使用大量的語言知識和信息。分詞3基于深度神經(jīng)網(wǎng)絡(luò)的分詞方法中文分詞算法的難點主要是未登錄詞的識別問題和歧義問題。未登錄詞主要包括中外人名、中國地名、機構(gòu)組織名、貨幣名(以上幾類也稱為命名實體)和事件名、縮略語、派生詞、各種專業(yè)術(shù)語,以及在不斷發(fā)展和約定俗成的一些新詞語。例2[自動化研究所]nt取得的成就[錢學(xué)森]nr是[國防部第五研究院]nt的創(chuàng)始人。顯然有些詞比其他詞更能幫助我們了解文本內(nèi)容,如人名和組織機構(gòu)名可以幫我們把握文本是關(guān)于“誰”的,地名可以讓我們快速定位事件發(fā)生的地點。在分詞的基礎(chǔ)上,把這些“實體”標(biāo)注出來就顯得格外重要。這類實體通常不是普通的名詞,如“山”“河”“人”,而是命名的,如“岳麓山”“拒馬河”“李政道”。這類詞稱為命名實體。命名實體識別又稱為專名識別,是指識別文本中具有特定意義的實體,主要包括人名、地名、機構(gòu)名、專有名詞等,如例2所示。命名實體識別有的命名實體顯然超出了詞的范圍,更像一個短語,但在使用中整體使用,在人腦里也是整體加工存儲的;在計算機的處理過程中也是如此。命名實體識別的步驟通常包括兩部分:一是實體邊界識別,二是確定實體類別(人名、地名、機構(gòu)名或其他)。英語中的命名實體具有比較明顯的形式標(biāo)志(實體中的每個詞的第一個字母要大寫),所以實體邊界識別相對容易,任務(wù)的重點是確定實體的類別。和英語相比,漢語命名實體識別任務(wù)更加復(fù)雜,而且相對于實體類別標(biāo)注子任務(wù),實體邊界的識別更加困難。命名實體識別這一工作,將詞分成了命名實體和非命名實體兩類。但是,在非命名實體中,詞匯仍有很大的差別,并且具有不同的功能。給定一個切好詞的句子,詞性標(biāo)注的目的是給每個詞賦予一個類別,這個類別稱為詞性標(biāo)記,如名詞、動詞、形容詞等。一般來說,屬于相同詞性的詞,在句法或語義中擔(dān)任類似的角色。分詞和詞性標(biāo)注目前所采用的主流技術(shù)路線都是將句子視作字符序列,在其上對詞邊界和詞性進行標(biāo)注;通過對大量標(biāo)注數(shù)據(jù)進行統(tǒng)計分析,設(shè)計自動標(biāo)注器,實現(xiàn)自然文本的分詞與詞性標(biāo)注。目前主流的分詞和詞性標(biāo)注的符號形式如例3所示。例3原始句子:北京大學(xué)師生參加義務(wù)勞動。分詞標(biāo)注:BIIEBEBEBIIE詞性標(biāo)注:[北京/ns大學(xué)/n]nt師生/n參加/v義務(wù)勞動/l詞性標(biāo)注在本質(zhì)上是詞的分類問題,將語料庫中的單詞按詞性分類。一個詞的詞性由其在所屬語言的含義、形態(tài)和語法功能決定。以漢語為例,漢語的詞類系統(tǒng)有18個子類(按照北京大學(xué)CCL語料庫的劃分標(biāo)準(zhǔn)),包括7類體詞、4類謂詞、5類虛詞,以及代詞和感嘆詞。詞類不是閉合集,而是有兼詞現(xiàn)象。例如,“制服”在作為“服裝”和作為“動作”時會被歸入不同的詞類,因此詞性標(biāo)注與上下文有關(guān)。對詞類的理論研究可以得到基于人工規(guī)則的詞性標(biāo)注方法,這類方法對句子的形態(tài)進行分析并按預(yù)先給定的規(guī)則為相應(yīng)的詞賦予詞類。詞性標(biāo)注02詞匯的結(jié)構(gòu)PARTTWO現(xiàn)代漢語的語素絕大部分是單音節(jié),如“天”“地”“河”“農(nóng)”“土”“啥”“而”“嗎”;也有兩個音節(jié)的,如“躊躇”“葡萄”“牢騷”“參差”“尼龍”等;還有三個或三個以上音節(jié)的,如“法西斯”“辛迪加”“巧克力”“吐魯番”“烏魯木齊”“布爾什維克”等。雙音節(jié)語素有一部分來自其他語言,三音節(jié)和三音節(jié)以上的語素大多數(shù)來自其他語言。這一特性給語言信息處理中的詞內(nèi)分析帶來了很大的便利。語素是最小的有音有意義的語言單位。一般來說,意義分兩種:表示事物、現(xiàn)象的意義叫詞匯意義,只表示語法作用的意義叫語法意義。例如,“書”是語素,它的語音形式是“shū”,它的詞匯意義是“成本的著作”,語法意義是名詞。“馬虎”也是一個語素,它的語音形式是“mǎhu”,詞匯意義是“不認(rèn)真”,語法意義是形容詞?!皢帷钡恼Z音形式是“ma”,語法意義是表示疑問語氣,沒有詞匯意義??傊?,既有詞匯意義,又有語法意義的語素叫實語素;只有語法意義,沒有詞匯意義的語素叫虛語素。詞匯的結(jié)構(gòu)單元1語素詞匯的結(jié)構(gòu)單元1語素確定語素可以采用替代法,用已知語素替代有待確定是否為語素的語言單位?!白闱颉敝械摹白恪焙汀扒颉笨梢詾槠渌阎Z素替代。例如:足—足底、足部、足下球—球體、球鞋、球迷由此可見,“足”和“球”各是一個語素。需要注意的是,兩種替代缺一不可。例如,雖然“蝴蝶”中的“蝴”可以為其他語素替代,如“鳳蝶”“閃蝶”等,“蝶”卻不能為其他已知語素代替,即“蝴~”不能替換為其他語素。因此,“蝴蝶”只是一個語素,“蝶”有時作為“蝴蝶”的代表或簡稱,“蝶”可叫簡稱語素,“蝴蝶”就是全稱語素。在其他組合中,如“鳳蝶”“閃蝶”分別是兩個語素組成的詞,“駱駝”也是如此。采用替代法還要注意在替代中保持意義基本一致。例如,“馬虎”,如果按下面的方式替代便是錯誤的:馬—馬虎、老虎、東北虎、虎鯨虎—馬虎、馬棚、馬尾、馬掌詞匯的結(jié)構(gòu)單元1語素因為“馬虎”中的“馬”與“虎”同“馬棚”“老虎”中的“馬”與“虎”在意義上毫無關(guān)系。實際上“馬虎”中的“馬”與“虎”都不能為其他已知語素替代,所以都不是語素,“馬虎”只能合起來算一個語素。從詞匯材料角度考慮,以語素的構(gòu)詞能力為標(biāo)準(zhǔn),可以把語素分為以下兩種。(1)成詞語素。能夠獨立成詞的語素叫成詞語素。例如:天、地、牛、馬、跑、遠(yuǎn)、重、二、大我、你、誰、不、又、葡萄、橄欖成詞語素能夠單獨成詞,大多數(shù)也能夠跟其他語素組合成詞,如葡萄糖、橄欖油。(2)不成詞語素。不能單獨成詞的語素叫不成詞語素,必須跟其他語素組合成詞。不成詞語素又可分為以下兩類。①可以承擔(dān)所組成的詞的全部或部分意義,位置一般是自由的。例如:民、語、偉、類、境、豐、型奮、衛(wèi)、榮、羽、固、闡、瞰詞匯的結(jié)構(gòu)單元1語素②不成詞語素只表示附加的意義,在詞的結(jié)構(gòu)中位置是固定的,就是詞綴。例如:老、阿、子、性、者、家(姑娘家、孩子家)兒(花兒、魚兒)、化(綠化、現(xiàn)代化)表示詞的基本意義的語素叫“詞根”,包括不定位不成詞語素、成詞語素。表示詞的附加意義和起語法作用的語素叫“詞綴”,為定位不成詞語素。在詞根前的詞綴叫“前綴”,如“老”“阿”;在詞根后的詞綴叫“后綴”,如“子”“頭”。語素與詞根、詞綴的關(guān)系如圖4-1所示。“他”“來”“喝”“水”都能夠單說,即單獨回答問題,可以單獨充當(dāng)句法成分,充當(dāng)主語等;余下的“又”能單獨充當(dāng)句法成分,“了”能單獨起語法作用,即可以單用。這種區(qū)別詞和語素的方法就是剩余法。所以,句子中的成詞語素只要不與別的語素組詞,就都是能獨立運用的單位—詞。不論成詞語素還是不成詞語素,都可以與其他語素組合成詞。詞由語素構(gòu)成,兩者都是詞匯單位,也是語法單位。詞是語言中最小的能獨立運用的有音有意義的語言單位。“獨立運用”是指能夠“單說”(單獨成句)或“單用”(單獨充當(dāng)句法成分或單獨起語法作用,但不能單獨成句)。例如:他又來喝水了。詞匯的結(jié)構(gòu)單元2詞詞匯的結(jié)構(gòu)單元“最小的”是說詞是不能擴展的,即在詞中間一般不能再插入其他成分,即使兩個成詞語素組成的詞也是不能分開的,如“新娘”“信件”“山水”“土地”“摔打”“開放”“舉報”“美好”“優(yōu)良”等。這就要注意詞與短語的區(qū)別。短語是由詞逐層組成的、沒有語調(diào)的語言單位,它和詞一樣,也表示一定的意義,也是造句成分,可以單用,多數(shù)能單說。和詞不同的是,短語不是“最小的”能夠獨立運用的單位,它是可以分離的,中間往往能插入其他成分(擴展),而詞一般是不能分離的,分離之后就不表示原來的意思了。例如,“騎兵”不能擴展,是一個詞;“騎馬”可以擴展(騎了一匹馬),便是短語?!邦^痛”,在“這件事,我頭痛”中不能擴展,是一個詞;在“我今天頭痛”中,可以擴展成“我今天頭真痛”,便是短語。這種區(qū)別詞和短語的方法叫擴展法,或插入法。我們可以用“的”“得”“和”等作為探測手段。例如,偏正結(jié)構(gòu)“冰箱”不是“冰的箱子”,“熱心”不是“熱的心”;補充結(jié)構(gòu)“改進”不能說“改得進”“改不進”,“指正”不是“指得正”;聯(lián)合結(jié)構(gòu)“子女”不是“子和女”,“買賣”不是“又買又賣”;它們都是詞,不是短語。還有一種離合詞,如“洗澡”“理發(fā)”,合起來算一個詞;分開用時,如“我洗了澡”,“我這個月理了兩次發(fā)”,算兩個詞。2詞詞匯的結(jié)構(gòu)單元“誰喜歡巧克力糖”7個字,記錄了5個語素,5個語素構(gòu)成3個詞?!罢l”一個字記錄一個語素、一個詞;“喜歡”兩個字記錄兩個語素、一個詞;“巧克力糖”四個字記錄兩個語素、一個詞。有的字不是語素,也不是詞,只是一個音節(jié),如“玻、璃”“巧、克、力”。由此可見,詞、語素和字并不是一一對應(yīng)的關(guān)系。2詞詞匯的結(jié)構(gòu)單元固定短語是詞與詞的固定組合,一般不能任意增減、更換其中的成分,與之相對的叫臨時短語。臨時短語是詞與詞的臨時組合(如“看報”“撰寫論文”等),一般稱為“短語”,不屬于詞匯,屬于語法的研究范圍。固定短語可分為專名(專有名稱)和熟語兩類。專名絕大多數(shù)是企事業(yè)單位的名標(biāo)。成立機關(guān),開辦工廠、商店、學(xué)校等,都要取個專名,以別于其他單位。例如,“發(fā)展和改革委員會”“聯(lián)合國世界糧農(nóng)組織”“華為電子科技有限公司”“常州大學(xué)”等。召集會議,舉辦活動,也可以用固定短語作為專名,如“世界數(shù)學(xué)大會”“北京奧林匹克運動會”。短語一旦用作書名、文章名、雜志名、電影名等,就會成為固定短語,如《老舍集》《我的父親母親》《流浪地球》等;如不是書名、文章名、雜志名、電影名等,就只是一般短語。熟語包括成語(如“顛三倒四”“鞭長莫及”)、慣用語(如“太歲頭上動土”)歇后語[如“老夫子搬家—全是書(輸)”]、諺語(如“瓜菜半年糧”)。熟語在結(jié)構(gòu)上比較固定,在功能上相當(dāng)于一個詞。3固定短語①雙聲詞指兩個音節(jié)聲母相同的聯(lián)綿詞。例如:參差、仿佛、忐忑、伶俐、崎嶇、玻璃玲瓏、蜘蛛、枇杷、吩咐、尷尬、慷慨②疊韻詞指兩個音節(jié)的“韻”相同的聯(lián)綿詞。例如:彷徨、窈窕、爛漫、從容、纏綿、崢嶸逍遙、蟑螂、哆嗦、翩躚、叮嚀、須臾③非雙聲疊韻詞指兩個音節(jié)聲韻都不同的聯(lián)綿詞。例如:蝴蝶、芙蓉、蝙蝠、鴛鴦、蛤蚧由一個語素構(gòu)成的詞,叫作單純詞。由兩個或兩個以上的語素構(gòu)成的詞,叫作合成詞。1.單純詞(單語素詞)單音節(jié)的單純詞如“火”“水”等,多音節(jié)的單純詞有以下幾類。(1)聯(lián)綿詞。聯(lián)綿詞指兩個不同的音節(jié)連綴成一個語素,表示一個意義的詞。聯(lián)綿詞多由古代傳承下來(也包含古代進入漢語的外來詞)。其中有雙聲詞、疊韻詞、非雙聲疊韻詞。詞語的類型(3)音譯外來詞。葡萄、咖啡、巴士、沙發(fā)、巧克力、阿司匹林、歇斯底里擬聲詞也是單純詞,多音節(jié)的擬聲詞如“呼呼”“嘩啦啦”“咚咚”“稀里嘩啦”“嘰里咕?!钡?。(2)疊音詞。疊音詞由不成詞語素的音節(jié)重疊構(gòu)成,重疊后仍只是一個雙音語素,是單語素詞,不是詞的形態(tài)變化。例如:潺潺、皚皚、猩猩、姥姥、餑餑、瑟瑟詞語的類型2.合成詞(多語素詞)合成詞有復(fù)合式、重疊式、附加式三種構(gòu)詞方式。(1)復(fù)合式。復(fù)合式合成詞由多個不同的詞根結(jié)合在一起構(gòu)成。從詞根和詞根之間的關(guān)系看,主要有五種類型。①聯(lián)合型又叫并列式。由兩個意義相同、相近、相關(guān)或相反的詞根并列組合而成。例如:a.途徑、渠道、價值、關(guān)閉、朋友、開啟b.骨肉、分寸、領(lǐng)袖、眉目、手腕、矛盾c.國家、質(zhì)量、窗戶、人物、始終a組合成詞,兩個詞根的意義并列,可以互相說明。b組合成詞,兩個詞根結(jié)合起來產(chǎn)生新的意義,如“骨肉”是至親的意思,“眉目”是頭緒、條理的意思。c組合成詞,兩個詞根組合成詞后只有一個詞根的意義在起作用,另一個詞根的意義完全消失,如“忘記”只有“忘”的意思,“動靜”只有“動”的意思。c組合成詞又稱偏義詞。②偏正型。前一個詞根修飾、限制后一個詞根。例如:a.主流、氣流、冰箱、熱水、散文、冰花b.密植、游擊、騰飛、傾倒、篩選、輕視a組為定中關(guān)系,即修飾語修飾名詞性的中心語。b組為狀中關(guān)系,修飾語修飾動詞或表動作的中心語。詞語的類型③中補型。后一個詞根補充說明前一個詞根。例如:a.降低、說服、建立、立正、誤導(dǎo)、分解b.車輛、書本、馬匹、槍支、人口、機群c.早上、夜里、地下、國外、鄉(xiāng)下a組合成詞,前一個詞根表示動作,后一個詞根補充說明動作的結(jié)果。b組合成詞,前一個詞根表示事物,后一個詞根表示事物的單位。c組合成詞前一個語素表示時間或處所,后一個語素表示位置或方向。(2)重疊式。重疊式合成詞由相同的詞根語素重疊構(gòu)成。例如:弟弟、妹妹、媽媽、剛剛、常常(3)附加式。附加式合成詞由詞根和詞綴構(gòu)成。此類詞又叫派生詞。詞綴在詞根前的叫前綴,在詞根后的叫后綴。①前加式(前綴+詞根)。例如:老—老虎、老鄉(xiāng)小—小張、小常第—第七、第六阿—阿姨、阿毛④動賓型又叫支配式。前一個詞根表示動作、行為,后一個詞根表示動作、行為所支配關(guān)涉的事物。例如:司機、管家、司令、站崗、美容、投資⑤主謂型又叫陳述式。前一個詞根表示被陳述的事物,后一個詞根是陳述前一個詞根的。例如:地震、日食、霜降、海嘯、氣喘詞語的類型在形式上,有的詞綴和詞根相同,需注意區(qū)別?!袄匣ⅰ钡摹袄稀辈煌凇袄先恕钡摹袄稀保氨印钡摹白印辈煌凇吧徸印钡摹白印保皠?chuàng)造性”的“性”不同于“男性”的“性”,“綠化”的“化”不同于“變化”的“化”?!袄稀薄鞍ⅰ钡仍~綴附加在指人的詞根前面,往往帶有親昵或喜愛的感情色彩。詞綴“子”“兒”“頭”是名詞的標(biāo)志(帶“兒”的詞有少數(shù)例外,如“火兒”“玩兒”“顛兒”等是動詞),其他一般動詞或形容詞加上它們便轉(zhuǎn)為名詞?!靶浴薄罢摺币彩菢?gòu)成名詞的詞綴?!盎笔菢?gòu)成動詞的詞綴?!霸谟凇薄坝掠凇薄案矣凇钡榷际莿釉~,這時“于”也是構(gòu)成動詞的詞綴。②后加式(詞根+后綴)。例如:—子刀子、瓶子、扳子、本子、胖子—頭石頭、木頭、由頭、來頭、甜頭—兒鳥兒、歌兒、花兒、尖兒、亮兒—性柔性、創(chuàng)造性、充實性、彈性—者死者、讀者、馬克思主義者、藝術(shù)工作者—化催化、標(biāo)準(zhǔn)化、現(xiàn)代化、智能化、大眾化—于在于、勇于、敢于此處,還有由詞根和一個疊音后綴組成的三音節(jié)合成詞。例如:綠油油(的)、紅通通(的)、濕漉漉(的)詞語的類型特殊類型的詞命名實體是指文本中具有特定意義的實體,主要包括人名、地名、機構(gòu)名等。一般來說,命名實體分為三大類(實體類、時間類及數(shù)字類)和七小類(人名、機構(gòu)名、地名、時間、日期、貨幣及百分比)。命名實體識別與翻譯是跨語言信息檢索、問答系統(tǒng)、句法分析、機器翻譯、面向語義網(wǎng)的元數(shù)據(jù)標(biāo)注等應(yīng)用領(lǐng)域的重要基礎(chǔ)工具,在自然語言處理技術(shù)走向?qū)嵱没倪^程中占有重要地位。命名實體已大量存在,同時人們每天又在創(chuàng)造新的命名實體,從而形成了一個動態(tài)集。命名實體是文本中承載信息的重要語言單位,實體概念在文本中的引用(也可稱為指稱項)可以有三種形式:命名性指稱、名詞性指稱和代詞性指稱。例如,在句子“[中國乒乓球男隊主教練][劉國梁]出席了會議,[他]指出了當(dāng)前工作的重點”中,實體概念“劉國梁”的指稱項有三個,其中“中國乒乓球男隊主教練”是名詞性指稱,“劉國梁”是命名性指稱,“他”是代詞性指稱。在跨語言信息檢索中,對命名實體的處理通常包括兩部分,即命名實體的識別與翻譯。命名實體的識別方法通常包括兩部分:一是實體邊界識別,二是實體類別(人名、地名、機構(gòu)名或其他)識別。1命名實體特殊類型的詞方言詞是指在某一地域方言中使用的詞語。方言詞有廣義和狹義之分。廣義方言詞是特定方言中所有的詞和固定用語的總和。狹義方言詞是指某個或某些方言中比較特殊的、與共同語不同的詞語的匯集,如山東方言的“日頭”(太陽)、“材壞”(殘疾)、“蹦跶”(跳動);還有固定用語,如長沙方言的“麗格爛”(情人)、“鼻斗龍”(鼻涕)。漢語各方言的詞語有一部分在詞形與詞義上與普通話是基本相同的,只是語音不同,如風(fēng)、魚、書、水、摸、聽、坐、大、慢、近、一、三。另外,各方言都有一定數(shù)量的詞語在詞形、詞義及語音上與普通話不同,這些方言詞可以反映方言的特色。例如,“丈夫的母親”官話多稱“婆婆”,成都話(西南官話)稱“老人婆”,吳語蘇州話稱“阿婆”,溫州話稱“地家婆”,湘語多稱“家娘”,客家梅縣話也稱“家娘”,贛語南昌話稱“婆(子)”,等等。這些能反映方言特色的詞語是方言詞調(diào)查研究的重點。漢語有不同的方言,每一種方言都有屬于自己的方言詞,從大方言來看,如官話方言詞、湘方言詞、粵方言詞;從小的方言點來看,如蘭州方言詞、福州方言詞、濟南方言詞、青州方言詞。2方言詞特殊類型的詞外來詞也叫“借詞”,指的是從外族語言里借來的詞。例如,德意志、模特兒、摩托、馬達、幽默、浪漫、取締、哈達等。引進外族有、本族無的詞語的方法,不外乎是采用或交叉采用音譯、意譯和借形三種方法。例如,外語詞“science”,漢語沒有相當(dāng)?shù)脑~,最早曾譯為“賽恩思”,這是用漢語的同音字對譯外語音節(jié)的純粹音譯法,每個字的原意與外來詞不相干,從字面上看不出其表達的意義;后來改譯成“科學(xué)”,這種照外語詞的意義用漢語表示相關(guān)語素的字來翻譯的方法,叫意譯法。借用外文字母不進行翻譯的方法叫借用法,如VCD(影音光碟)。純粹意譯構(gòu)成的新詞一般不算外來詞,因為是根據(jù)外語詞所反映的事物或用語的語素按漢語的構(gòu)詞法造出來的。根據(jù)外來詞的吸收方式和構(gòu)造,大致可將其分為以下四類。3外來詞(1)音譯。按照外語詞的聲音用漢語的同音字對譯過來的,一般叫音譯詞。其中有純音譯的,例如:蓋世太保(Gestapo,德)、巴士(bus,英)沙發(fā)(sofa,英)、盧布(рубль,俄)有選用與外語的音節(jié)相同而且意義相同或相似的漢字來翻譯的,例如:苦力、邏輯、幽默、模特兒、維他命特殊類型的詞3外來詞(2)半音譯半意譯或音意兼譯。把一個外語詞分成前后兩部分,音譯一部分,意譯一部分,兩部分合成一個漢語詞。例如,把外語的“romanticism”的前半部分譯成“浪漫”,把后半部分意譯成“主義”,合成“浪漫主義”。也有反過來先意譯后音譯的,如“ice-cream”(冰激凌)。(3)音譯前加注漢語語素。去掉音譯詞中的一個音節(jié),在其前面加注漢語語素。例如,“的士”(taxi)去掉“士”,在前面分別加注漢語語素“打”“面”“貨”,構(gòu)成“打的”“面的”“貨的”?!鞍褪俊保╞us)去掉“士”,在前面分別加注漢語語素“大”“中”,構(gòu)成“大巴”“中巴”。將外來詞音譯之后,外加一個表示義類的漢語語素。例如,“卡車”的“卡”是“car”(英語“貨車”)的音譯,“車”是后加上去的;卡介苗中的“卡介”是法國人AlbertCalmelle和CamilleGuerin兩人名字的縮略語;沙皇中的“沙”為俄國皇帝的音譯;芭蕾舞中的“芭蕾”為法語“ballet”的音譯;啤酒中的“啤”為英語“Beer”和德語“Bier”的音譯。在音譯詞之后加上表示意義類的漢語詞也屬此類。例如,“丁克家庭”(丁克夫妻),“丁克”(DINK)是英語“doubleincomenokids”的音譯縮寫,意思是“雙倍收入,不要孩子”,“家庭”是后加的漢語詞。特殊類型的詞3外來詞(4)借形。一種是字母式借形詞,又叫字母詞。直接用外文縮略字母或與漢字組合而成的詞,不是音譯而是原形借詞,是漢語外來詞的新形式。例如:MRI(英語“magneticresonanceimaging”的縮略,磁共振成像)WTO(英語“WorldTradeOrganization”的縮略,世界貿(mào)易組織)STEM(英語“science、technology、engineering、mathematics”的縮略,科學(xué)、技術(shù)、工程、數(shù)學(xué)學(xué)科群)有的在字母后加上漢語相關(guān)語素,例如:B超(“B型超聲診斷”的簡稱)ATM機(英語“automatedtellermachine”的縮略,自動柜員機)有的在音譯詞前加拉丁字母形狀,再加注漢語語素。例如,“T恤衫”,“T”是字母形狀,“恤”是英文單詞“shirt”的音譯,“衫”是漢語語素。還有一種是借用日語中的漢字詞,是日本人直接借用漢字創(chuàng)造的,漢語將其借回來,不讀日語讀音,而讀漢字音,叫漢字式借形。例如:景氣、引渡、體操、取締、茶道、俳句、元素、資本、瓦斯、直接、主觀這種現(xiàn)象也少量出現(xiàn)在漢字文化圈的其他國家,如韓國、朝鮮、越南等。術(shù)語也稱為“行業(yè)語”,指在特定行業(yè)或領(lǐng)域內(nèi)使用的詞語。行業(yè)語是普通話的一部分,包括專業(yè)術(shù)語和行業(yè)用語。(1)專業(yè)術(shù)語。專業(yè)術(shù)語指各種學(xué)科所用的專門用語。例如:語言學(xué):主語、動詞、生成語法、語料庫物理學(xué):引力、黑洞、流體、激發(fā)態(tài)地質(zhì)學(xué):地層、化石、褶皺、侏羅紀(jì)生物學(xué):基因、細(xì)胞、胚胎、脫氧核糖核酸(2)行業(yè)用語。行業(yè)用語指社會中各種行業(yè)所用的詞語。例如:戰(zhàn)爭:游擊、空襲、破交戰(zhàn)商業(yè):買手、回扣、掛賬、返點工業(yè):3D打印、仿真、開模、加料4術(shù)語特殊類型的詞行業(yè)用語具有專業(yè)性,通常只通行于某個學(xué)科或行業(yè)范圍之內(nèi),一般不為非專門人員所熟悉。但隨著專業(yè)知識的普及,有些行業(yè)用語可能逐漸為人們所熟悉,如信息網(wǎng)絡(luò)用語“死機”“網(wǎng)站”“網(wǎng)址”“版主”“黑客”等。如果行業(yè)用語進一步為全民所掌握,就有可能成為通用詞語;隨著互聯(lián)網(wǎng)的發(fā)展和普及,許多信息網(wǎng)絡(luò)用語已經(jīng)為全民熟知并使用。行業(yè)用語在向日常交際滲透的過程中,常常引申出一般的意義。例如:資本、價值、封頂、滑坡、斷層、低谷、高峰、硬件、共鳴、折射、細(xì)胞、比重這些詞都已引申出專門意義之外的意義(有時詞典并未及時收集和整理)。4術(shù)語特殊類型的詞普通詞語有時也會有黑話含義。例如,“做”在《現(xiàn)代漢語詞典》(第6版)中列有8個義項:①制造;②寫作;③從事某種工作或活動;④舉行慶?;蚣o(jì)念活動;⑤充當(dāng),擔(dān)任;⑥當(dāng)作;⑦結(jié)成(某種關(guān)系);⑧假裝出(某種模樣)。但是,在影視劇“黑道”人物嘴里,“把他做掉”卻是“把他殺掉”的意思,因此“做”實際上還應(yīng)有一個隱語(黑話)義—殺死。我們可以認(rèn)為黑話也是一種特殊的術(shù)語。例如,2010年7月22日,中國新聞網(wǎng)刊登一篇題為《抗日名將劉桂五曾參與西安事變蔣介石為其寫挽聯(lián)》的文章,說:“當(dāng)年追隨白風(fēng)翔時,劉桂五學(xué)到一手‘掏老窯’的好身手。”該文解釋:“所謂掏老窯,是東北綠林土話,就是綁票?!痹撐挠终f:“此次會面僅半個小時,劉桂五就將蔣本人居住環(huán)境及警衛(wèi)情況熟記于心,用東北綠林土話,此稱‘踩盤子’?!彼^踩盤子,就是探路的意思。5黑話特殊類型的詞縮略語是經(jīng)過壓縮和省略的詞語。為了稱說簡便,人們常把形式較長的名稱或習(xí)用的短語化簡,成為縮略語??s略語可分為以下兩類。(1)簡稱。簡稱是較復(fù)雜的名稱的簡化形式,與全稱相對。把全稱化為簡稱,大多數(shù)是選取名稱中有代表性的語素或詞,大體有下列六種方式。6縮略語特殊類型的詞6縮略語特殊類型的詞前后詞均取前一個語素。

科學(xué)技術(shù)—科技公共關(guān)系—公關(guān)蘇州大學(xué)—蘇大前詞取一個語素,后詞取一個語素。國防部長—防長擺脫貧困—脫貧省略并列詞中相同的語素。中學(xué)、小學(xué)—中小學(xué)陸軍、海軍、空軍—陸海空軍截取原來名稱的前段或后段。南開大學(xué)—南開中國人民解放軍—解放軍包含外來詞的名稱可以只取外來詞的頭一個音節(jié)(字)。

奧林匹克運動會—奧運會得克薩斯州—得州010203040506其他。國家語言文字工作委員會—國家語委全國人民代表大會—全國人大(2)數(shù)詞略語。為了使話語簡短,使用數(shù)字將并列詞語的語素或義素概括出來的略語叫數(shù)詞略語。例如:百花齊放、百家爭鳴—雙百農(nóng)村、農(nóng)業(yè)、農(nóng)民—三農(nóng)工業(yè)現(xiàn)代化、農(nóng)業(yè)現(xiàn)代化、國防現(xiàn)代化、科學(xué)技術(shù)現(xiàn)代化—四化還有一些是由共同的義素加上列舉的項數(shù)構(gòu)成的,叫義素略語。例如:酸、甜、苦、辣、咸—五味金、銀、銅、鐵、錫—五金馬、牛、羊、雞、犬、豕—六畜這類略語古已有之,也可指人,如“竹林七賢”“揚州八怪”等。它不需要共同義素,內(nèi)容也可改變。例如,20世紀(jì)60年代,中國人的“三大件”指自行車、手表、縫紉機,隨著人民生活水平的提高,現(xiàn)在它們更多地指代掃地機、洗碗機、投影儀這樣的物品。6縮略語特殊類型的詞數(shù)詞略語稱說簡便,有可能取得詞的資格,這時反而不能用全稱代替,如“三好學(xué)生”“三峽工程”等,其中的數(shù)詞略語是不能還原為全稱的。但是,數(shù)詞略語容易使原來的具體內(nèi)容落空,數(shù)字越大,內(nèi)容落空的可能性越大,如“十八層地獄”“三教九流”都成了熟語,一般人只了解整體意思,具體指哪些“層”“教”或“流”,并不了解。6縮略語特殊類型的詞03詞匯的語法功能:詞性PARTTHREE實詞的語法功能還指詞與詞的組合能力,有兩種表現(xiàn):第一,實詞與其他實詞的組合能力,包括這類實詞能不能跟另一類實詞組合,用什么方式組合,組合后發(fā)生什么關(guān)系,等等。例如,“太陽”(名詞)不能跟副詞“不”組合,“開來”(動詞)能跟副詞“不”組合。第二,虛詞沒有充當(dāng)句法成分的功能,但有依附實詞表示語法意義的能力,即與什么實詞結(jié)合,表示什么語法意義。例如,“的”用在偏正短語里表示修飾和被修飾的關(guān)系,“嗎”用在句末表示疑問語氣。詞的語法功能,即詞的分布功能,主要是指實詞在語句里充當(dāng)句法成分的能力,即詞的職位。能充當(dāng)主語、賓語,就是能居主(主語的位置)、賓(賓語的位置)。實詞都能充當(dāng)句法成分,只是不同類的詞會充當(dāng)不同的句法成分。例如,在句子“坦克開來了”中,“坦克”充當(dāng)主語,“開來”充當(dāng)謂語,而虛詞“了”等不充當(dāng)句法成分。1詞的語法功能詞匯的語法功能:詞性詞的形態(tài)分兩種:一是構(gòu)形形態(tài),如重疊,“琢磨”重疊為“琢磨琢磨”,“舒服”重疊為“舒舒服服”,這是動詞和形容詞在形式和語法意義兩方面都不同的形態(tài)變化。二是構(gòu)詞形態(tài),如加詞綴,“鑿”這個語素,可單獨成為動詞,加詞綴“子”就構(gòu)成另一個意義不同的詞—“鑿子”(名詞),后綴“子”就是構(gòu)成名詞的構(gòu)詞形態(tài)。2詞的形態(tài)詞匯的語法功能:詞性2詞的意義詞匯的語法功能:詞性詞的意義,這里指語法上同類詞的概括意義或意義類別,名詞表示人或事物的名稱,動詞表示動作、行為等,形容詞表示性質(zhì)、狀態(tài)等。例如,“雞”“鴨”“魚”等詞匯意義各不相同,但可以概括出“事物”的共同意義。按照漢語語法的傳統(tǒng),可將詞粗略分為實詞和虛詞?,F(xiàn)在,人們把功能作為主要依據(jù),認(rèn)為能夠單獨充當(dāng)句法成分,意義實在的詞匯,即有詞匯意義和語法意義的是實詞,不能充當(dāng)句法成分,只有語法意義的就是虛詞。1名詞實詞專有名詞(大部分是命名實體)老舍、德國、財政部普通名詞

坦克、同志、畫家、教師、猴、橘子、飛機(個體名詞)敵人、人口、群眾、物品、羊群(集合名詞)秩序、思想、懺悔、經(jīng)濟、欲望(抽象名詞)風(fēng)、石、油、聲音、沙子、菜(物質(zhì)名詞)時間名詞

春天、晚上、去年、剛才處所名詞

岸邊、西郊、旁邊、外頭河南、貴陽、捷克、亞洲等地名同時屬于專屬名詞和處所名詞。方位名詞

前、后、左、右、之上、以下、以南01020304052動詞實詞20%30%40%50%動作動詞讀、跑、看、打擊、述說、保衛(wèi)、懲罰心理活動動詞愛、嫉妒、懼怕、沉迷、羨慕、煩躁存在、變化、消失動詞在、存在、有、發(fā)生、演變、發(fā)展、生長、死亡、消失判斷動詞是2動詞實詞20%30%40%能愿動詞會、愿意、能、敢、要、應(yīng)該趨向動詞來、去、上、下、進、出、回、開、過去、上來、下去、起來形式動詞予以、進行、加以區(qū)別詞表示人和事物的屬性或區(qū)別性特征,有區(qū)分事物的分類作用。區(qū)別詞往往是成對或成組的。例如:男—女雄—雌單—雙金—銀西式—中式陰性—陽性國有—私有有期—無期宏觀—中觀—微觀民用—軍用—警用大型—中型—小型—微型形容詞表示形狀、性質(zhì)和狀態(tài)。形容詞分為以下兩類。(1)性質(zhì)形容詞。例如:好、壞、怯懦、勇敢、聰明、笨拙、大、小、高、低、長、短、肥、瘦(2)狀態(tài)形容詞。例如:雪白、墨綠、火熱、血紅、筆直、綠油油、水靈靈、黑不溜秋3形容詞實詞4區(qū)別詞數(shù)詞表示數(shù)目或次序,分為基數(shù)詞和序數(shù)詞。(1)基數(shù)詞。基數(shù)詞表示數(shù)目的多少,可分為系數(shù)詞(零或0、一至九)和位數(shù)詞(十、百、千、萬、億、萬億、兆)。兩種基數(shù)可以組成復(fù)合數(shù)詞,如七百五十二、四十九等。基數(shù)詞可以組成表示倍數(shù)、小數(shù)、分?jǐn)?shù)、概數(shù)的短語。①倍數(shù)由基數(shù)加“倍”組成。例如:一倍、十倍、百倍②小數(shù)。例如:零點五(0.5)、三點一四(3.14)③分?jǐn)?shù)用“X成”“X分”等固定格式表示。例如:八成、百分之八十、十分之八數(shù)目減少可用分?jǐn)?shù)表示,不用倍數(shù)。5數(shù)詞實詞④概數(shù)有幾種表示方法。將“來”“把”“左右”“上下”放在數(shù)詞或數(shù)量短語的后面。例如:十來個人、四十來噸重、二十來里地、百把條槍、千多輛坦克、十多丈長、一千左右、五里來地、三個多星期、五十米左右、三百斤上下、里把路、丈把長、千把人、萬把塊磚相鄰兩個基數(shù)詞連用也表示概數(shù)。例如:一兩個、三四條、五六斤5數(shù)詞實詞(2)序數(shù)詞。序數(shù)詞表示次序前后。一般是在基數(shù)前加前綴“第”或“初”組成。例如:第一、初一、初五有時可用“甲”“乙”“丙”“丁或“子”“丑”“寅”“卯”等表示序數(shù)。量詞表示計算單位,可分為名量詞和動量詞兩大類。名量詞表示人和事物的計算單位。例如:一個人動量詞表示動作次數(shù)和發(fā)生的時間總量。例如:看三次、看三天由兩三個不同的量詞復(fù)合而成的詞,叫復(fù)合量詞。例如,“人次”表示活動的若干次人數(shù)的總和。10個人參觀一次是10人次,兩個人參觀5次也是10人次?!皣嵑@铩北硎具\輸量中的重量和里程的乘積?!爸г嚧?50輛艘次”中的“輛艘次”,表示出動若干次車和船的總和。6量詞實詞實詞20%30%40%50%表示程度很、最、極、挺、太、非常、十分、極其、格外、分外、更、更加、越、越發(fā)、有點兒、稍、稍微、略微、幾乎、過于、尤其、倍加、不大、比較、差不多表示范圍都、大都、均、總、共、總共、統(tǒng)共、只、僅僅、單、凈、光、一齊、一概、一律、單單、不單、就、全、通通、皆表示時間、頻率。已、已經(jīng)、曾、曾經(jīng)、剛、剛剛、正、在、正在、將、將要、就、就要、馬上、立刻、頓時、終于、常、常常、時常、時時、往往、漸漸、早晚、一向、向來、總是、始終、永、趕緊、仍然、還是、屢次、依然、重新、還、再、每每、偶爾表示處所四處、隨處7副詞實詞20%30%40%50%表示肯定、否定必、必須、必定、準(zhǔn)、的確、不、不必、沒有、沒、未、未必、莫、勿、是、是否、不必、不用(甭)、不曾、未曾、未嘗、無須、毋庸表示方式、情態(tài)大肆、肆意、特意、猛然、忽然、公然、連忙、趕緊、悄悄、暗暗、大力、穩(wěn)、闊步、單獨表示語氣難道、豈、究竟、偏偏、索性、簡直、就、可、也許、難怪、大約、幸而、幸虧、反倒、反正、果然、居然、竟然、必然、必須、確實、何嘗、何必、明明、恰恰、未免、只好、不妨、根本表示關(guān)聯(lián)便、也、又、卻、再、就7副詞同一小類的詞,語義和用法不一定都相同,有的差別還相當(dāng)大。例如,“都”“只”都表示范圍,但“都”表示總括全部,一般是總括它前面的詞語,而“只”表示限制,限制它后面的詞語的范圍。例如,“他們都只睡了四個小時?!边@句話的“都”,所指向的對象是前面的“他們”,而“只”所指向的是后面的“四個小時”。“不”“沒有”“別”都表示否定,而語義和用法也不相同?!叭ゲ唬坎蝗ァ钡摹安弧?,否定動作或性狀的將要發(fā)生(未然),表明說話人不愿意或不能去?!皼]有”否定動作或性狀的已經(jīng)發(fā)生(已然),例如,“去了沒有?沒(有)去”是對“去了”的否定,表明這種行為沒有成為事實;“別去”的“別”表示禁止或勸阻,表明說話人不希望對方有某種行為。同一個詞形也可能屬于不同的小類。以“就”為例,“春天很快就到了”,表示事情短期內(nèi)即將發(fā)生;“他十五歲就去了延安”,表示事情早已發(fā)生;“學(xué)了就用”,表示后一事緊接著前一事發(fā)生,相當(dāng)于“立刻”;“老虎屁股摸不得,我就要摸”,表示與前一情況相反的做法,帶有一種故意的語氣,相當(dāng)于“偏”;“我就有一個名字”,表示范圍,相當(dāng)于“只”。一個副詞究竟表示什么意思,往往需要結(jié)合全句語境仔細(xì)體會。實詞7副詞代詞能起代替和指示的作用。它跟所代替、所指示的語言單位的語法功能大致相當(dāng),也就是說,所代替的詞語能充當(dāng)什么句法成分,代詞就充當(dāng)什么成分。按語法功能劃分,代詞可以分為代名詞、代謂詞、代數(shù)詞、代副詞。代名詞的功能與名詞大體相同。代名詞分為四種:一般代詞,包括人稱代詞、指示代詞、疑問代詞;處所代詞;時間代詞;數(shù)量代詞。代謂詞的功能與謂詞大體相當(dāng),如“怎么”“這樣”“那樣”等。代數(shù)詞的功能與數(shù)詞大體相當(dāng),如“多少”“幾”。代副詞的功能與副詞大體相同,如“這么”“那么”。以下重點講述一般代詞。實詞8代詞(1)人稱代詞。人稱代詞可以分為第一人稱代詞、第二人稱代詞、第三人稱代詞和其他代詞。第一人稱代詞指說話人一方,其中,“我們”和“咱們”的用法有別。“咱們包括說話人和聽話人雙方,稱為包括式用法,用于口語;“我們”和“咱們”在同一場合出現(xiàn)時,“我們”只包括說話人一方的群體,排除聽話人一方,稱為排除式用法。例如,“我們走了,咱們再見吧”,其中“我們”是排除式,“咱們”是包括式。談話或文章里只用“我們”時,它既可以用于排除式,也可以用于包括式。例如:“我們都是大學(xué)生,就該有大學(xué)生的風(fēng)貌”(包括式);“你快出發(fā)吧,我們也要回去了”(排除式)。實詞第二人稱代詞“你”“你們”指聽話人一方。敬稱用“您”,如果用于不止一人的場合,書面語中可以出現(xiàn)“您們”的說法,但口語中一般用“您幾位”“您諸位”。第三人稱代詞“他”“他們”指對話雙方以外的第三方,還可以稱代事物,書面上為了分清人的性別和事物,稱代男性用“他”,稱代女性用“她”,稱代事物用“它”。如果指稱有男有女的一群,則一概用“他們”,不應(yīng)寫成“他(她)們”?!八币话阌脕矸Q代個體事物,也可以用來稱代事物群體。同時指稱人和事物時,使用“他們”,不必寫成“他(它)們”。8代詞一些人稱代詞,如“你”“我”等,有時不確指哪一個人,而用于虛指,例如:“大家你看看我,我看看你,最后誰都沒言語。”反身代詞“自己”“自個兒”,用來復(fù)指前面的名詞或代詞,例如:“他自己吃,從不招呼別人。”反身代詞甚至可以泛指任何一個,例如:“自己的事自己做?!薄皠e人”“人家”是跟“自己”相對的,泛指對話雙方以外的人,例如:“不遵守交通規(guī)則,會威脅自己的安全,也會威脅別人。”“人家”有時具體指第三個人,例如:“人家是杰出青年,咱哪行啊?”“人家”有時也指說話人自己,例如:“你少加點兒班行不行,人家比不上??!”“大家”指一定范圍內(nèi)所有的人,也常常用于復(fù)指,例如:“大家的事大家做主!”“你們大家都吃嘛!”。實詞8代詞“每”“各”“某”“另”等指示代詞,各有不同的含義?!懊俊薄案鳌笔欠种福溉w中的任何個體:“每”側(cè)重于個體的相同一面;“各”側(cè)重于不同一面。例如:“每人都有使用母語的權(quán)利?!薄案魅擞懈魅说碾y處?!薄澳场笔遣欢ㄖ?;“另”是旁指,指所說范圍之外的?!澳场薄傲怼眱蓚€詞都是指不確定的人或事物。例如:“我們中間某個隊員掉隊了,另一個會馬上把他找回來。”(2)指示代詞。指示代詞用來指代人,也用來指代事物?!斑@”為近指,“那”為遠(yuǎn)指?!斑@”“那”等有指示和代替的作用。指示作用,例如:“這孩子(那放羊的)剛過來?!贝孀饔茫纾骸斑@可是最好的瞄準(zhǔn)手?!庇袝r“這”“那”對舉著用,指代眾多的人或事物,這是虛指用法,即不確指任何事物,例如:“你這不吃,那不吃,怎么長大個兒?”實詞8代詞(3)疑問代詞。疑問代詞的主要用途是表示有疑而問(詢問)或無疑而問(反問、設(shè)問)。疑問代詞“哪”(nǎ)和指示代詞“那”(nà)以前都寫作“那”,容易相混。“哪”表疑問,不確指,要求在所指代的人或事物中選定;指示代詞“那”一般所指是確定的。例如,比較下面兩個句子:你找哪一家?你找那一家。“哪里,哪里”,兩個“哪里”連著用可以表示否定,不表示問處所。在別人夸獎自己時用它比用“不,不”委婉一些。疑問代詞可不表疑,引申為任指和虛指兩種用法。①任指,表示任何人或任何事物,說明在所說的范圍內(nèi)沒有例外。例如:誰也不知道他在干什么。(誰=任何人)這孩子,什么都好,就是不好好吃飯。(什么=任何方面)怎么哪兒都有你呢?(哪兒=任何地方)他多會兒都忘不了打游戲。(多會兒=任何時候)愛怎么辦就怎么辦唄。[怎么(辦)=用任何方式(辦)]表示任指的代詞后面常出現(xiàn)“都”“也”等副詞,表示周遍性。②虛指,指代不能肯定的人或事物,包括不知道、說不出或不想說出的。例如:我好像在哪兒見過這個人。(哪兒=某個地方)實詞8代詞窗外啪地響了一聲。北風(fēng)呼呼叫,大雪紛紛飄。有人把擬聲詞劃為虛詞,但擬聲詞能充當(dāng)句法成分和獨立成句,虛詞不能這樣用。從前曾有人把它歸入形容詞,因其與形容詞有相似的功能,但不受程度副詞修飾,又能充當(dāng)獨立語或獨立成句,意義上也與形容詞差別大。所以,擬聲詞是比較特殊的一類實詞。擬聲詞是模擬聲音的詞,又叫“象聲詞”。例如:咣、啪、叮當(dāng)、嘩啦、嘰嘰喳喳、轟隆隆、噼里啪啦、嘰里咕嚕擬聲詞描摹聲音時,給人一種如聞其聲的音響效果。它有修辭作用,能使語言具體、形象,給人以身臨其境的真實感。擬聲詞經(jīng)常在口語和文學(xué)作品中使用。擬聲詞可以充當(dāng)狀語、定語、謂語、補語、獨立語等,也可以單獨成句。擬聲詞充當(dāng)狀語最常見,有時要后加“地”,有時后加“一聲”。例如:實詞9擬聲詞嘆詞是表示感嘆和呼喚、應(yīng)答的詞。例如:唉、啊、哼、哦、哎喲、喂、嗯咦,她怎么就走了呢!哎,哎,趕緊過來量體溫!哎呀,什么風(fēng)把您老吹來了?嘆詞的寫法不十分固定,同一聲音,往往可以用不同的漢字表示,寫作時要盡量采用通行的寫法?!鞍 弊x不同的聲調(diào),便是不同的嘆詞,表示不同的意義。例如:實詞?。è。?!真好哇?。ū硎举潎@)啊(á)!這么快呀?(表示驚訝或不知道)啊(ǎ)!這么回事?。。ū硎咎貏e驚訝兼醒悟)啊(à)!好吧。(表示應(yīng)諾或知道了)嘆詞模擬人的感情呼聲,擬聲詞模擬人與自然的聲響,兩者有共同的意義和功能,可以合稱“聲詞”。它們的寫法和意義都不很固定,是實詞里的特類。10嘆詞介詞依附在實詞或短語前面,共同構(gòu)成“介詞短語”,主要用于修飾、補充謂詞性詞語。介詞常常充當(dāng)語義成分(格)的標(biāo)記,標(biāo)明跟動作、性狀有關(guān)的時間、處所、方式、原因、目的、施事、受事、對象等。(1)表示時間、處所、方向。例如:從、自、自從、打、到、往、在、由、向、于、至、趁、當(dāng)、沿著、順著(2)表示依據(jù)、方式、方法、工具、比較。例如:按、遵照、按照、依照、據(jù)、根據(jù)、靠、本著、用、通過、拿、比(3)表示原因、目的。例如:因、因為、由于、為、為了、為著(4)表示施事、受事。例如:被、給、讓、叫、歸、由、把(將)、管虛詞1介詞(5)表示關(guān)涉對象。例如:對、對于、關(guān)于、跟、和、同、給、替、向、除了介詞短語常充當(dāng)狀語,少數(shù)可以充當(dāng)定語。例如:[從演唱會現(xiàn)場]拍攝的照片。(表示處所)[為養(yǎng)家糊口]而常常加班。(表示目的)[用幽默的演講]逗樂了聽眾。(表示工具、方式)[從凌晨]工作到正午。(表示時間的起點)[在圖書館]看書。(表示處所)尼羅河發(fā)源于[維多利亞湖]。(表示處所)[關(guān)于治安整肅運動]的通知。(表示有關(guān)事物)介詞大都是由及物動詞虛化而來的,有的完全虛化,如“從”“被”“對于”“關(guān)于”等,但不少介詞還處于過渡狀態(tài)。例如:他比我家境好。(介詞)他和我比家境。(動詞)他給我買飯。(介詞)他給我一份飯。(動詞)這樣的詞還有“到”“跟”“由”“拿”“讓”“向”“朝”“對”“往”“用”“靠”“通過”“在”等。介詞與動詞的區(qū)別,只能在具體的語境中看“是否單獨充當(dāng)謂語或謂語中心,是否能加動態(tài)助詞或重疊”,如果能是動詞,反之是介詞。虛詞1介詞“及”只能連接名詞性詞語?!耙约啊边€可以連接動詞性詞語,不過這樣的聯(lián)合短語一般不充當(dāng)謂語,而是充當(dāng)主語、賓語或定語。這兩個詞連接的并列成分在意思上常常可以分出主次,次要的、從屬的放在后面。有時無所謂主次,前后一樣。例如:a.資本家總是力圖通過軍事、政治、法律等顯性方法以及無聲無息的輿論引導(dǎo)來控制無產(chǎn)階級。b.掌握數(shù)據(jù)的多少以及是否完整,是成敗的關(guān)鍵。c.呼吁改革的聲音已經(jīng)廣泛觸及農(nóng)民、工人、學(xué)生及知識分子。連詞起連接作用,連接詞、短語、分句和句子等,表示并列、選擇、遞進、轉(zhuǎn)折、條件、因果關(guān)系。例如:和、跟、同、與、及、或(主要連接詞、短語)而、而且、并、并且、或者(連接詞語或分句)不但、不僅、雖然、但是、然而、如果、與其、因為、所以(主要連接復(fù)句中的分句)“和”“跟”“與”“及”“以及”等都表示聯(lián)合關(guān)系,它們的風(fēng)格色彩和用法略有不同,“跟”有北方口語色彩,“同”有南方口語色彩,“與”“及”“以及”有書面語色彩。它們主要用來連接名詞性詞語?!昂汀币部梢赃B接雙音節(jié)謂詞性詞語,共同充當(dāng)多種語法成分。虛詞2連詞我不但要如此教導(dǎo)你,并且行動上也這么示范給你看!有的連詞與介詞同形,存在劃界問題,如“和”“跟”“同”“由于”“因”“因為”等。試以“和”類連詞為例:劉連長和宣傳干事要去看望病號。(連詞)團長和團部參謀們商量下一步的行動方案。(介詞)和新來的年輕人相比,他實在顯得老氣橫秋。(介詞)連詞“和”與介詞“和”的區(qū)別:連詞“和”連接的兩個詞語是聯(lián)合關(guān)系,一般可以互換位置,句子的基本意思不變;介詞“和”的前后兩個名詞詞語沒有直接的語法關(guān)系,不能互換位置。介詞“和”前面可以出現(xiàn)狀語,連詞“和”前面不能出現(xiàn)狀語。連詞“和”有的可以略去,介詞“和”不能略去或改用頓號。為了準(zhǔn)確地表達思想,避免歧義,在公文用語中,用“和”做連詞,用“同”做介詞。例如:我國根據(jù)平等、互利、互相尊重主權(quán)和領(lǐng)土完整的原則同其他國家建立和發(fā)展外交關(guān)系。例a所連接的兩部分,重點在“以及”的前面部分;例b、c中“以及”“及”的前后兩部分,從意思上看沒有主次之分?!岸摇边B接謂詞性詞語,表示意思更進一層。例如:博學(xué)而且謙虛。“并”“并且”連接動詞性詞語或分句,表示并列關(guān)系或遞進關(guān)系。例如:繼承并發(fā)展。牢固掌握并且活學(xué)活用。虛詞2連詞助詞的作用是附著在實詞、短語或句子后面表示結(jié)構(gòu)關(guān)系或動態(tài)等語法意義。助詞可以分為以下幾類:(1)結(jié)構(gòu)助詞。例如:的(威武的坦克)、地(坦克快速地行進)、得(坦克開得快)、之(世紀(jì)之交)、者(榮獲一等功者)(2)動態(tài)助詞。例如:著(坦克行進著)、了(坦克抵達了)、過(坦克維修過)(3)嘗試助詞。例如:看(讓坦克連打打看?)(4)時間助詞。例如:的(六點鐘到的靶場)、來著(上午剛擦過炮彈來著)(5)約數(shù)助詞。例如:來(十來米)、把(個把鐘頭)、多(三米多)、左右(五分鐘左右)、上下(七十人上下)(6)比況助詞。例如:似的(剛打過雞血似的)、一樣(和剛吃完飯一樣)、(一)般(如下山猛虎一般)(7)其他助詞。例如:所(為實踐所證明)、給(彈藥給用光了)、連(連小學(xué)生都懂)虛詞3助詞虛詞3助詞助詞必須附著在其他詞語的后面或前面,凡是后附的(的、著、似的)都讀輕聲,前附的(所、連)不讀輕聲。助詞中使用最多的無疑是結(jié)構(gòu)助詞。它主要表示附加成分和中心語之間的結(jié)構(gòu)關(guān)系?!暗摹币彩墙^大多數(shù)現(xiàn)代漢語數(shù)據(jù)中詞頻排名第一的詞。但是,關(guān)于“的”,有一些需要注意的地方。助詞“de”在習(xí)慣上寫成三個字:在定語后面寫成“的”,在狀語后面寫成“地”,在補語前面寫成“得”。這樣寫可以在書面語中成為三種成分的標(biāo)記。例如:一位戴眼鏡的中年男子默默地眺望遠(yuǎn)處的景色,一位眉清目秀的女人把啤酒喝得暢快?!暗摹边€可以用來組成名詞性的“的字短語”。例如:吃的、紅色的、彩色的、這樣的、先進的、打魚的。“的”字短語用在句子里意義很具體,離開了句子,就有比較大的概括性,需要在具體的句子中加以分析。語氣詞的作用在于表示語氣,主要用在句子的末尾,也可以用在句中主語、狀語的后面有停頓的地方。語氣詞本身念輕聲。下面列出四種語氣及其語氣詞。(1)陳述語氣。例如:的、了、吧、呢、啊、嘛、唄、罷了(而已)、也罷、也好、啦、嘞、嘍、著呢(2)疑問語氣。例如:嗎(么)、呢、吧、?。?)祈使語氣。例如:吧、了、?。?)感嘆語氣。例如:啊語氣詞,一是附著在全句后面或句中詞語的后面有停頓的地方(附著性),二是常常跟句調(diào)一起共同表達語氣。有的語氣詞可以表達多種語氣,如“啊”。反之,有的語氣可以用多個語氣詞表達,內(nèi)部有細(xì)微的區(qū)別,如陳述語氣。上面列舉了許多語氣詞,普通話里基本的語氣詞實際上只有六個—的、了、呢、吧、嗎、啊。其他語氣詞,有的用得較少,有的因為語氣詞連用而產(chǎn)生連讀合音的結(jié)果,如“啦”是“了啊”的合音。虛詞4語氣詞04詞匯的語義PARTFOUR(1)詞的理性意義。在日常生活中,人們總是通過詞語來表現(xiàn)對主觀、客觀世界各類事物的認(rèn)識,這就涉及詞語的理性意義。例如,世界上形形色色的坦克型號不下數(shù)千種,沒有哪兩個型號的坦克是一樣的,但是不管它們的差異有多大,它們都具有“射擊”“越野”“裝甲”等共同特征,正是共同特征使“坦克”這類事物可以與其他事物相互區(qū)別。因此,“一種武器,具有直射火力、越野能力和裝甲防護力的履帶式裝甲戰(zhàn)斗車輛”可以看作“坦克”的理性意義。詞的理性意義可以表現(xiàn)人們對客觀世界各類事物和現(xiàn)象的認(rèn)識,如“天”“地”“貓”“狗”“花”“草”“太陽”“銀河系”等詞反映的就都是物質(zhì)世界中的對象。同時,詞的理性意義也可以表現(xiàn)人們對主觀世界各類事物和現(xiàn)象的認(rèn)識,如“鬼”“仙女”“嫦娥”等詞反映的就都是精神世界中的對象。理性意義可以表達人們對主觀、客觀世界的事物和現(xiàn)象的認(rèn)識,與概念相關(guān)聯(lián);非理性意義表達的是人們的主觀情感、態(tài)度及語體風(fēng)格等,是附著在特定的理性意義之上的。詞義的構(gòu)成1理性意義和非理性意義(2)詞的非理性意義。詞的非理性意義是附著在詞的理性意義之上的,又叫作詞義的“附加色彩”,主要包括感情色彩、語體色彩和形象色彩三個方面。詞義的感情色彩是指人們在反映現(xiàn)實現(xiàn)象的同時會一并表現(xiàn)出對該現(xiàn)象的主觀態(tài)度。人們常說的褒義詞和貶義詞就是帶有感情色彩的詞語。褒義詞帶有褒義色彩,表現(xiàn)出人們對詞義所反映的對象的肯定、贊許和喜愛的態(tài)度;貶義詞帶有貶義色彩,表現(xiàn)出人們對詞義所反映的對象的否定、貶斥和厭惡的態(tài)度。當(dāng)然,還有不帶有任何感情色彩的中性詞,如“成果”“結(jié)果”“后果”三個詞的理性意義相近,但所具有的感情色彩不同:“成果”是褒義詞,可以說“成果卓著”;“結(jié)果”是中性詞,可以說“結(jié)果很好”,也可以說“結(jié)果不好”;“后果”是貶義詞,只能說“后果嚴(yán)重”。詞義的構(gòu)成1理性意義和非理性意義詞義的語體色彩是指人們在交際中會根據(jù)不同的交際環(huán)境使用不同的表達形式,從而為詞義帶來不同的非理性意義??谡Z和書面語是人們常說的兩種最基本的語體??谡Z語體常見于人們的日常交談或文學(xué)作品中的對話描寫等,如果一個詞語經(jīng)常在這些交際環(huán)境中出現(xiàn),就會具有“口語色彩”;書面語體常見于書面寫作或比較莊重、正式的交際場合,如果一個詞語經(jīng)常在這些交際環(huán)境中出現(xiàn),就會具有“書面語色彩”。當(dāng)然,非常多的詞語是通用的,既可以用于口語語體,也可以用于書面語語體。關(guān)于語體和體裁的問題,本書將在第6章進行詳細(xì)介紹。詞義的形象色彩是指由詞內(nèi)部的組成成分所引起的對事物視覺形象或聽覺形象等的聯(lián)想。例如,同樣是描寫黃色,“土黃”就會使人聯(lián)想到土的顏色,“蠟黃”就會使人聯(lián)想到蠟的顏色,這些詞使人聯(lián)想到具體事物的形象,是詞語的形象色彩。又如,我們常用作例子的“坦克”,一些商家把它當(dāng)作越野車的名字,顯得十分恰當(dāng)。而如果有人將一款電動自行車命名為“坦克”,如果不是嘩眾取寵或出于幽默的話,就顯得十分不恰當(dāng)了。而造成這種現(xiàn)象的原因,就是詞語的形象色彩。詞義的構(gòu)成1理性意義和非理性意義詞是由語素構(gòu)成的,由一個語素構(gòu)成的詞叫作單純詞,由兩個或兩個以上的語素構(gòu)成的詞叫作合成詞。語素也是有意義的語言單位,既然詞是由語素構(gòu)成的,那么詞義是不是就等于語素義,或者說詞義就是語素義的簡單相加呢?對于單純詞來講,詞義就等于語素義。因為單純詞是由一個語素構(gòu)成的,所以這個語素的意義也就是詞的意義。例如,“?!笔且粋€單純詞,由“?!边@個語素直接構(gòu)成,那么語素“?!庇惺裁匆饬x,作為詞的“?!本陀惺裁匆饬x。再如,“巴士”是一個單純詞,由“巴士”這個語素直接構(gòu)成,那么語素“巴士”有什么意義,作為詞的“巴士”就有什么意義。對于合成詞來講,語素義和詞義的關(guān)系并非那么簡單。這是因為合成詞是由兩個或兩個以上的語素構(gòu)成的,涉及組合成詞的語素之間的關(guān)系。合成詞大致有以下兩種情況。詞義的構(gòu)成2語素義第一,詞義幾乎就是語素義的簡單相加。例如,“美麗”是一個合成詞,由語素“美”和語素“麗”組合而成,語素“美”有“好看”的意思,語素“麗”有“好看”的意思,組合而成的詞“美麗”同樣有“好看”的意思。再如,“布鞋”是一個合成詞,由語素“布”和語素“鞋”組合而成,語素“布”有“布料”的意思,語素“鞋”有“鞋子”的意思,組合而成的“布鞋”就具有“用布料制成的鞋子”的意思。這些都可以看作語素義相加而得到詞義的合成詞。第二,詞義并不能從其構(gòu)成語素的意義推導(dǎo)而來。例如,“針線”由語素“針”和語素“線”組合而成,語素“針”和“線”都具有“縫衣服的工具”的意義,但作為一個詞,“針線”的意義卻是“縫紉刺繡等工作的總稱”,而不僅僅是兩樣“縫衣服的工具”。例如,“勺子”由語素“勺”和語素“子”組合而成,但詞“勺子”的意思只是語素“勺”的意思,而與語素“子”無關(guān),“子”在這里是名詞性的詞綴,只為補足雙音節(jié)。這些詞的意義都不能簡單地從語素的意義推導(dǎo)而來。詞義的構(gòu)成2語素義詞典里面每個詞語至少有一條解釋,有些詞語會有好幾條解釋,這一條條對詞義的解釋就是詞語的“義項”。也就是說,義項是一個詞語包含的一個或多個意義。如果一個詞語只反映一類事物或一個對象,那么這個詞語就只有一個義項,如“幼兒園”只有一個義項,即“實施幼兒教育的機構(gòu)”。如果一個詞語反映的對象不止一個,那么這個詞語就有多個義項。例如,“學(xué)院”有兩個義項:一個是“高等學(xué)校的一種,以某一學(xué)科教育為主,如外交學(xué)院、電影學(xué)院等”;另一個是“大學(xué)中按學(xué)科分設(shè)的教學(xué)行政單位,介于大學(xué)和系之間,如文學(xué)院、外國語學(xué)院等”。義項既可以包含理性意義,也可以包含非理性意義。義項是從詞語的各種用例中概括出來的共同的、一般的、穩(wěn)定的意義,不包括詞語在特定的語言環(huán)境里顯現(xiàn)的個別的、具體的、臨時的意義。例如,“水”在不同的具體語言環(huán)境里可以指熱水、涼水、開水、茶水、自來水、礦泉水、純凈水等,但這些都是“水”這個詞在特定的語言環(huán)境中顯現(xiàn)出來的個別的、具體的意義,而不是在各種語言環(huán)境中都適用的共同意義,因而這些個別意義不能算作“水”的義項。詞義的構(gòu)成3義項如果一個詞有多個義項,那么這些義項之間應(yīng)該是有聯(lián)系的,如果沒有聯(lián)系,則不能看作一個詞的多個義項,而應(yīng)該看作不同的詞。例如,前面說的“學(xué)院”的兩個義項之間是有聯(lián)系的,都是與高校有關(guān)的教學(xué)行政單位,只不過是高一級或低一級而已。而像“蘑菇”“制服”這樣的詞則不同,可以說“我喜歡吃蘑菇”和“他穿著制服”,此處的“蘑菇”“制服”都是名詞;但在“你別蘑菇了,時間來不及了”和“制服了敵人”中的“蘑菇”“制服”都是動詞。兩個“蘑菇”和兩個“制服”之間的意思毫無關(guān)聯(lián),因而它們不能算是一個詞,也不能算是同一個“蘑菇”和“制服”的義項,而只能看作兩個都讀作和寫作“蘑菇”和“制服”的不同的詞。一個詞雖然可能有多個義項,但在特定的交際場合中,每次只能使用其中的一個義項,不可能多個義項同時使用。例如,“吃”有許多義項,其中一個是“食用”,如“吃蘋果”;另一個是“吸收”,如“宣紙吃墨”。出現(xiàn)在這兩個詞組中的“吃”不可能同時包含兩個義項。詞義的構(gòu)成3義項詞義可以分解為一個一個的義項,義項還可以進一步分解為“義素”。例如,“母親”的詞義是“有子女的女子,是子女的母親”,那么這個義項可以再分解為“+女性/+有子女/+長輩”。再如,“灌木”的詞義是“矮小而叢生的木本植物”,這個義項可以再分解為“+矮小/+叢生/+木本”。這種由義項分解出來的詞義的區(qū)別特征就叫作義素。需要注意的是,與語素、詞、詞組、句子等音義結(jié)合的單位不同,義素是一種不與語音形式相聯(lián)系的抽象的語義單位。例如,“母親”的義素“女性”“有子女”“長輩”與“母親”的讀音沒有任何關(guān)系,“灌木”的義素“矮小”“叢生”“木本”與“灌木”的讀音也沒有任何關(guān)系。因此,在語言研究中,義素并不是那么直觀的,需要運用一定的方法進行對比分析才能得出。這種把詞語的義項進一步分析為若干義素的方法叫作義素分析。運用義素分析可以說明詞義之間的異同,以及詞義之間的各種關(guān)系。義素分析通常可以按三個步驟來進行。(1)確定對比的范圍。義素分析的第一步是列出要對比的詞語,這組詞語在意義上往往是相關(guān)聯(lián)的。例如,“父親”“母親”“祖父”“祖母”可以放在一起進行對比分析,因為這些都屬于親屬稱謂,在詞義上有相關(guān)性。詞義的構(gòu)成3義素(2)比較詞義的異同。確定對比范圍后,就要運用對比的方法找出不同詞義在語義元素上的共同點和不同點,也就是提取不同詞語的共同義素和區(qū)別義素。要分析“父親”“母親”“祖父”“祖母”的義素,可以先從中提取出共同義素“長輩”,然后比較“父親、母親”與“祖父、祖母”,提取出區(qū)別義素“有親生子女”和“有隔代子孫”,再比較“父親、祖父”與“母親、祖母”,提取出區(qū)別義素“男性”和“女性”。利用這些共同義素和區(qū)別義素,不僅可以使這些詞的意義互相區(qū)別開來,還可以使它們同其他詞語區(qū)別開來。(3)整理和描寫義素。找出不同詞語的共同義素和區(qū)別義素之后,還需要運用一定的方式加以整理,使最后分析結(jié)果能準(zhǔn)確反映詞義之間的聯(lián)系和區(qū)別。義素分析結(jié)果的整理工作至少包括兩個方面。一是要加進某些符號來表示分析結(jié)果。一般在每個義素外加方括號,義素前加“+/-”表示是否具備這個義素。“父親”的義素就可以寫作[+男性+有親生子女/+長輩]。二是要檢查義素分析的結(jié)果是否包容而且只包容詞義反映的那類對象。一方面是義素分析的結(jié)果不能過寬或過窄?!芭恕钡牧x素若分析為[+女性+人]就太寬泛,本來不屬于此類的“女孩”也被包括進去了。另一方面是義素分析結(jié)果還應(yīng)力求簡明?!芭恕钡牧x素分析為[+女性/+成年/+人]就足夠了,如果再加上[+體內(nèi)能產(chǎn)生卵細(xì)胞/+會說話/+有思維能力]三個義素,雖不能說有錯誤,但其中一些是多余的,因為在這三個義素中,前一個已可以從[+女性]中推知,后兩個已可以從[+人]中推知。詞義的構(gòu)成3義素義素分析在語義研究中有重要的作用。首先,義素分析可以清楚、簡潔地說明詞義的異同,有利于學(xué)習(xí)、掌握和研究詞義。例如,前面提到的對“祖父”“祖母”“父親”“母親”的比較就可以用下面例句中的方式加以描寫。祖父:[+男性/+有隔代子孫/+長輩]祖母:[+女性/+有隔代子孫/+長輩]父親:[+男性/+有親生子女/+長輩]母親:[+女性/+有親生子女/+長輩]其次,在比較同義詞或反義詞時,義素分析也可以起到很重要的作用。在下面的例句中,“邊疆”和“邊境”的詞義相近,但有所不同,義素分析可以清楚地把兩者的異同揭示出來。邊疆:[+國土/+靠近國界/+范圍大]邊境:[+國土/+靠近國界/-范圍大]義素分析能夠幫助我們較為精確地描寫詞語的義項,進而描寫詞語的語義。然而,義素也有很大的局限性:第一,義素在本質(zhì)上是一個特征集合,而且是開放的,即有哪些、有多少特征是不確定的。第二,不夠形式化。在分析“父親”和“母親”的語義差異時,“男性”和“男”是同樣的義素嗎?似乎很模糊。這些局限都給義素分析法投入語言智能應(yīng)用、自動處理詞語的語義帶來了挑戰(zhàn)。詞義的構(gòu)成3義素我們可以設(shè)想所有的詞語在剛產(chǎn)生時都是單義的,也就是說,一個詞語只對應(yīng)一個意義。隨著語言的發(fā)展,詞語的用法不斷擴大,一個詞語表達的意義也就逐漸多了起來,這就形成了多義詞。多義詞就是反映互相有聯(lián)系的幾類事物或多個對象,包含多個互相聯(lián)系的義項的詞語。多義詞在任何語言中都比單義詞多得多,用處也更大。前面說過,有的詞語只反映一類事物或一個對象,也就是只有一個義項,這類詞可以叫作“單義詞”。語匯系統(tǒng)中有不少詞是單義詞,如科學(xué)術(shù)語“癌癥”“氧氣”“射線”“浮力”“纖維化”等,鳥獸、草木、器物的名稱也多是單義詞,如“計算機”“筆”“墨”“紙”“硯”“哈巴狗”“金魚”等。詞義的聚合關(guān)系1單義詞和多義詞詞義的聚合關(guān)系1單義詞和多義詞詞義由單義向多義發(fā)展的原因是十分多樣的,但其基礎(chǔ)都是事物之間存在的聯(lián)系。人們在使用詞語時就有可能根據(jù)客觀對象之間的某種聯(lián)系,用指稱甲類對象的詞去指稱(或比喻)乙類對象,從而產(chǎn)生出與原來的詞語意義有聯(lián)系的新的意義。例如,“抓手”本來指“手可以持握的結(jié)構(gòu)”,由于這一意思與“開展工作的機會”具有一種隱喻上的關(guān)系,因此人們便用“抓手”來指稱開展工作的機會。隱喻是一種非常重要的語言、認(rèn)知現(xiàn)象,在認(rèn)知語言學(xué)中對此有非常深入的研究,本書不做深入介紹。顯然“抓手”就由單義詞發(fā)展為了多義詞。此外,隨著社會的發(fā)展和人們認(rèn)識的深化,有越來越多的意義需要表達出來,而一種語言中的語音形式是有限的,因而用有限的語音形式去表達數(shù)量龐大且不斷增加的意義,就必然會出現(xiàn)一個語音形式表達多個意義的現(xiàn)象。一些古語如今因難以預(yù)測的原因被賦予了新的含義,如“萌”。既然多義詞是由單義詞發(fā)展而來的,那么在多義詞的多個義項之中必然會有一個是“本義”,也就是一個詞最初的意義,或者說是這個詞最早在文獻中出現(xiàn)時的意義。除本義以外,直接或間接從本義衍生出來的其他所有意義都是一個詞的“引申義”。例如,“兵”最早在文獻中出現(xiàn)時表示的意義是“兵器”“武器”,這是“兵”的本義。“兵”的本義至今還保留在一些成語之中,像“短兵相接”“秣馬厲兵”“兵不血刃”等。詞義的聚合關(guān)系1單義詞和多義詞詞義由單義向多義發(fā)展的原因是十分多樣的,但其基礎(chǔ)都是事物之間存在的聯(lián)系。人們在使用詞語時就有可能根據(jù)客觀對象之間的某種聯(lián)系,用指稱甲類對象的詞去指稱(或比喻)乙類對象,從而產(chǎn)生出與原來的詞語意義有聯(lián)系的新的意義。例如,“抓手”本來指“手可以持握的結(jié)構(gòu)”,由于這一意思與“開展工作的機會”具有一種隱喻上的關(guān)系,因此人們便用“抓手”來指稱開展工作的機會。隱喻是一種非常重要的語言、認(rèn)知現(xiàn)象,在認(rèn)知語言學(xué)中對此有非常深入的研究,本書不做深入介紹。顯然“抓手”就由單義詞發(fā)展為了多義詞。此外,隨著社會的發(fā)展和人們認(rèn)識的深化,有越來越多的意義需要表達出來,而一種語言中的語音形式是有限的,因而用有限的語音形式去表達數(shù)量龐大且不斷增加的意義,就必然會出現(xiàn)一個語音形式表達多個意義的現(xiàn)象。一些古語如今因難以預(yù)測的原因被賦予了新的含義,如“萌”。既然多義詞是由單義詞發(fā)展而來的,那么在多義詞的多個義項之中必然會有一個是“本義”,也就是一個詞最初的意義,或者說是這個詞最早在文獻中出現(xiàn)時的意義。除本義以外,直接或間接從本義衍生出來的其他所有意義都是一個詞的“引申義”。例如,“兵”最早在文獻中出現(xiàn)時表示的意義是“兵器”“武器”,這是“兵”的本義。“兵”的本義至今還保留在一些成語之中,像“短兵相接”“秣馬厲兵”“兵不血刃”等。詞義的聚合關(guān)系1單義詞和多義詞我們要特別注意多義詞和同音詞的區(qū)別。多義詞的各個義項之間必須是有聯(lián)系的,也就是說,多義詞是一個詞語包含多個義項;而同音詞則是詞形和讀音恰好相同而意義上無關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論