標(biāo)準(zhǔn)解讀
《GB/T 20532-2006 信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范》是一項(xiàng)由中國國家標(biāo)準(zhǔn)局發(fā)布的技術(shù)標(biāo)準(zhǔn),旨在為自然語言處理、信息檢索、機(jī)器翻譯等領(lǐng)域的計算機(jī)信息系統(tǒng)提供一套統(tǒng)一的現(xiàn)代漢語詞匯分類及標(biāo)記方法。該標(biāo)準(zhǔn)詳細(xì)定義了現(xiàn)代漢語中各類詞的類別和相應(yīng)的標(biāo)記符號,以便于計算機(jī)程序能夠準(zhǔn)確理解和處理中文文本數(shù)據(jù)。以下是該標(biāo)準(zhǔn)的主要內(nèi)容概述:
-
范圍:標(biāo)準(zhǔn)明確了其適用范圍,即針對信息處理領(lǐng)域中的現(xiàn)代漢語詞匯進(jìn)行分類和標(biāo)記,不涉及古漢語或其他漢語變體。
-
術(shù)語和定義:首先對基本術(shù)語如“詞類”、“標(biāo)記”等進(jìn)行了界定,為后續(xù)內(nèi)容奠定基礎(chǔ)。
-
詞類劃分原則:標(biāo)準(zhǔn)基于現(xiàn)代漢語語法特點(diǎn),將詞匯分為實(shí)詞和虛詞兩大類,并進(jìn)一步細(xì)分為若干小類。實(shí)詞包括名詞、動詞、形容詞、數(shù)詞、量詞、代詞、區(qū)別詞、副詞、嘆詞;虛詞則涵蓋介詞、連詞、助詞、語氣詞。每一類別都有明確的定義和特征描述。
-
詞類標(biāo)記符號:為每個詞類分配了一個或多個簡短的字母標(biāo)記,例如名詞用“n”表示,動詞用“v”,形容詞用“a”等。這些標(biāo)記簡潔明了,便于計算機(jī)程序識別和處理。
-
特殊詞和未登錄詞處理:標(biāo)準(zhǔn)還涉及了特殊詞匯(如專名、成語)和未在詞庫中登錄的新詞、外來詞的處理規(guī)則,確保信息處理系統(tǒng)的靈活性和適應(yīng)性。
-
標(biāo)記規(guī)則與示例:提供了詳細(xì)的標(biāo)記規(guī)則說明,并通過具體實(shí)例演示如何將文本中的詞語正確歸類并標(biāo)注。這有助于開發(fā)者和研究人員準(zhǔn)確執(zhí)行標(biāo)準(zhǔn),保持?jǐn)?shù)據(jù)處理的一致性。
-
附錄:可能包含一些補(bǔ)充信息或參考詞匯表,以幫助使用者更好地理解和應(yīng)用標(biāo)準(zhǔn)中的規(guī)定。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2006-09-18 頒布
- 2007-03-01 實(shí)施




下載本文檔
GB/T 20532-2006信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范-免費(fèi)下載試讀頁文檔簡介
ICS01.040.01A22中華人民共和國國家標(biāo)準(zhǔn)GB/T20532—2006信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范StandardofPOStagofcontemporaryChineseforCiP2006-09-18發(fā)布2007-03-01實(shí)施中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局發(fā)布中國國家標(biāo)準(zhǔn)化管理委員會
GB/T20532—2006三次前言:::·范圍2術(shù)語和定義3總則4詞類及其他切分單位分類5詞類及其他切分單位標(biāo)記代碼表
GB/T20532—2006前本標(biāo)準(zhǔn)由教育部語言文字信息管理司提出本標(biāo)準(zhǔn)由教育部語言文字信息管理司歸口。本標(biāo)準(zhǔn)起草單位:教育部語言文字應(yīng)用研究所。本標(biāo)準(zhǔn)主要起草人:靳光璜、肖航、郭曙倫、富麗、章云帆、于桂英、陳玉泉、王立.
GB/T20532-2006信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范范范圍本標(biāo)準(zhǔn)規(guī)定了信息處理中現(xiàn)代漢語詞類及其他切分單位的標(biāo)記代碼本標(biāo)準(zhǔn)適用于漢語信息處理.也可供現(xiàn)代漢語教學(xué)與研究參考。術(shù)語和定義下列術(shù)語和定義適用于本標(biāo)準(zhǔn)漢語信息處理Chineseinformationprocessing;CIP用計算機(jī)對漢語形、音、義等信息進(jìn)行輸入、排序、存儲、輸出、統(tǒng)計、提取等。2.2切分單位Segmentunit漢語信息處理使用的、具有確定語法功能的基本單位。它包括本標(biāo)準(zhǔn)的規(guī)則所限定的詞、短語及其地單位。2.3詞類spartsorspeech:POS詞的語法分類,主要是根據(jù)語法功能劃分出來的類2.4標(biāo)記t對文本中切分單位的類別進(jìn)行標(biāo)注的代碼3總則3.1切切分單位的范圍本標(biāo)準(zhǔn)的切分單位包括詞、短語和其他切分單位,如習(xí)用語、縮略語、前接成分、后接成分、語素字非語素字、標(biāo)點(diǎn)符號、非漢字符號等3.2詞類劃分的原則本標(biāo)準(zhǔn)的詞類分類體系參考了呂叔湘、朱德熙、胡裕樹等先生的語法體系和《中學(xué)教學(xué)語法系統(tǒng)提本標(biāo)準(zhǔn)根據(jù)漢語信息處理的特點(diǎn)和要求.主要依據(jù)語法功能原則劃分詞類。3.3標(biāo)記代碼的制定原則依據(jù)國際通常做法,標(biāo)記代碼主要采用英文術(shù)語的字母。例如.名詞”.采用英文術(shù)語"noun2的首字母"n”作為標(biāo)記代碼;“數(shù)詞”,采用英文術(shù)語"numeral”的第三個字母"m”作為標(biāo)記代碼。漢語獨(dú)有的,或使用英文術(shù)語字母不便的,依據(jù)國內(nèi)通常做法,標(biāo)記代碼采用漢語拼音字母。如“縮略語".采用漢字“簡“漢語拼音的首字母“作為標(biāo)記代碼:語素字”.采用漢字“根“漢語拼音的首字母“g”作為標(biāo)記代碼。詞類及其他切分單位分類本標(biāo)準(zhǔn)
溫馨提示
- 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。驍?shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
- 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。
最新文檔
- 精英人才甄選:潛質(zhì)干部面試題庫精 編版
- 企業(yè)運(yùn)營戰(zhàn)略下的奇葩面試題目解讀
- 保研面試經(jīng)驗(yàn)分享:專業(yè)領(lǐng)域的求職策略與題目
- 2026屆黑龍江省大慶市化學(xué)高一上期末復(fù)習(xí)檢測試題含解析
- 納米技術(shù)教學(xué)講解
- 配套制度案例講解
- 新疆烏魯木齊市2026屆化學(xué)高二上期末教學(xué)質(zhì)量檢測試題含答案
- 詳解紀(jì)念辛亥革命110周年全文解讀
- 數(shù)學(xué)年齡倍數(shù)講解
- 新醫(yī)院發(fā)展規(guī)劃
- 深圳市失業(yè)人員停止領(lǐng)取失業(yè)保險待遇申請表樣表
- 信任五環(huán)書籍讀書提綱課件
- 江蘇居住建筑標(biāo)準(zhǔn)化外窗系統(tǒng)應(yīng)用技術(shù)規(guī)程157-2017
- (完整版)內(nèi)孔數(shù)控車削加工(編程)教案
- 道亨鐵塔長短腿基礎(chǔ)配置系統(tǒng)-操作說明
- 皮瓣移植術(shù)后移植(再植)組織的局部觀察課件
- DB11-T 1764.42-2020用水定額 第42部分:居民生活
- 蒂森克虜伯電梯 MC2-B控制系統(tǒng)用戶手冊
- 醫(yī)療器械嵌入式軟件注冊描述文檔
- 工程認(rèn)證《機(jī)械設(shè)計》課程教學(xué)大綱
- 建設(shè)工程五方責(zé)任主體法定代表人授權(quán)書、項(xiàng)目負(fù)責(zé)人質(zhì)量終身責(zé)任承諾書
評論
0/150
提交評論