數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu)-習(xí)題及解答 ch01 語言和語言數(shù)據(jù)_第1頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu)-習(xí)題及解答 ch01 語言和語言數(shù)據(jù)_第2頁
數(shù)據(jù)標(biāo)注工程-語言數(shù)據(jù)與結(jié)構(gòu)-習(xí)題及解答 ch01 語言和語言數(shù)據(jù)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章語言和語言數(shù)據(jù)一、選擇題1.下列屬于自然語言的是()

A.編程語言

B.旗語

C.漢語

D.密碼答案:C

解析:文檔中提到,人類在生活、交際中使用的語言稱為“自然語言”,“編程語言”“旗語”等屬于“人工語言”,漢語是人類在生活交際中使用的語言,屬于自然語言,所以選C。世界上使用人口最多的語系是()

A.漢藏語系

B.印歐語系

C.閃-含語系

D.烏拉爾語系答案:B

解析:文中明確指出“人類語言中分布最廣、使用人口最多、影響力最大的是印歐語系”,所以選B。下列不屬于語言智能常見任務(wù)和應(yīng)用的是()

A.語音識(shí)別

B.機(jī)器翻譯

C.文字書寫

D.智能問答答案:C

解析:語言智能的常見任務(wù)和應(yīng)用包括語音處理、文字處理、詞法句法語義分析、機(jī)器翻譯、知識(shí)圖譜、智能問答等,文字書寫是人類的行為,不屬于語言智能應(yīng)用,所以選C。語言數(shù)據(jù)分為兩種,其中第一性的是()

A.書面語

B.口語

C.文字

D.符號(hào)答案:B

解析:文檔中提到“任何一種語言總是先有口語,后有書面語,書面語只能在口語的基礎(chǔ)上產(chǎn)生……從這個(gè)意義上說,口語是第一性的,書面語是第二性的”,所以選B。下列關(guān)于語言資源的說法錯(cuò)誤的是()

A.廣義的語言資源包括語言數(shù)據(jù)、具有特定語言能力的人等

B.狹義的語言資源指大規(guī)模的可使用的語言數(shù)據(jù)

C.按照存儲(chǔ)媒介,語言資源只分為文本類

D.多語資源按照對齊方式可分為詞對齊、句對齊等答案:C

解析:按照存儲(chǔ)媒介,語言資源分為語音、圖像和文本三大類,C選項(xiàng)說只分為文本類,說法錯(cuò)誤,所以選C。圖靈測試主要用于判斷機(jī)器是否具有()

A.計(jì)算能力

B.語言能力

C.智能

D.學(xué)習(xí)能力答案:C

解析:文中提到“阿蘭?圖靈提出判斷機(jī)器是否具有智能的方法,便是進(jìn)行長時(shí)間語言交互(對話)來進(jìn)行測試,即著名的圖靈測試”,所以選C。二、判斷題語言是人類特有的用來表達(dá)意思、交流信息的工具,動(dòng)物也擁有和人類一樣的語言。()答案:錯(cuò)

解析:文檔中明確說明“只有人類擁有語言。動(dòng)物之間雖然具有使用音響信號(hào)進(jìn)行溝通的方式……但這些行為都是由外界刺激引起的,表達(dá)的意義種類極其有限……無法做到像人類語言一樣描述抽象的、過去的、未來的和虛構(gòu)的事物”。書面語是口語絕對忠實(shí)的記錄。()答案:錯(cuò)

解析:文中提到“盡管如此,書面語并不是口語絕對忠實(shí)的記錄??陬^交際總是在一定的語境中進(jìn)行的,常常伴隨說話人的各種表情、手勢、體態(tài)和語調(diào),而書面語一般不記錄這些成分;另外,寫作書面語有比較充裕的時(shí)間推敲,書面語可以比口語更精練、更精確”。語言智能的發(fā)展在很大程度上依賴語言數(shù)據(jù)。()答案:對

解析:文檔中指出“語言智能的發(fā)展在很大程度上依賴語言數(shù)據(jù)。大規(guī)模高質(zhì)量的語言數(shù)據(jù)是各種語言智能應(yīng)用……性能提升的基石和助推器”。三、問答題語言的三種基本功能是什么?

答案:語言的三種基本功能分別是:①思維功能,從人與自己的關(guān)系看,語言是人認(rèn)識(shí)世界的工具,人類既用語言進(jìn)行思維,又用語言調(diào)節(jié)行為;②交際功能,從人與人的關(guān)系看,語言是交際方式和交流思想的手段;③文化功能,從人與社會(huì)的關(guān)系看,語言是文化信息的載體,是人類保存、傳遞、領(lǐng)會(huì)人類社會(huì)歷史經(jīng)驗(yàn)和科學(xué)、文化、藝術(shù)成就的手段。語言智能的技術(shù)路線主要分為哪三種?

答案:語言智能應(yīng)用在研究和開發(fā)中的技術(shù)路線可以分為基于規(guī)則、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)和基于深度神經(jīng)網(wǎng)絡(luò)三種。為什么說語言資源是語言智能的基礎(chǔ)?

答案:語言智能的目標(biāo)是讓機(jī)器掌握語言,而機(jī)器必須獲得充足的語言知識(shí),這些語言知識(shí)正蘊(yùn)含在語言資源之中。對于特定的語言智能任務(wù)和應(yīng)用,研發(fā)人員需要制備大規(guī)模、高質(zhì)量的語言資源,從中抽取或總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論