《現(xiàn)代大學(xué)計(jì)算機(jī)基礎(chǔ)》課件第8章_第1頁(yè)
《現(xiàn)代大學(xué)計(jì)算機(jī)基礎(chǔ)》課件第8章_第2頁(yè)
《現(xiàn)代大學(xué)計(jì)算機(jī)基礎(chǔ)》課件第8章_第3頁(yè)
《現(xiàn)代大學(xué)計(jì)算機(jī)基礎(chǔ)》課件第8章_第4頁(yè)
《現(xiàn)代大學(xué)計(jì)算機(jī)基礎(chǔ)》課件第8章_第5頁(yè)
已閱讀5頁(yè),還剩188頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第8章多媒體信息技術(shù)8.1夢(mèng)幻帝國(guó)—多媒體技術(shù)概論

8.2音像王國(guó)的基石—多媒體技術(shù)基礎(chǔ)

8.3創(chuàng)建媒體帝國(guó)的利刃—經(jīng)典媒體處理工具

8.1夢(mèng)幻帝國(guó)—多媒體技術(shù)概論

8.1.1多媒體和多媒體技術(shù)

1.什么是多媒體(Multimedia)

媒體又稱媒介、媒質(zhì),它的英文是medium(單數(shù))和media(復(fù)數(shù))的復(fù)合詞,指的是用于分發(fā)信息和展現(xiàn)信息的手段、方法、工具、設(shè)備或裝置。

多媒體指將文字、聲音、圖形、圖像、視頻等多種媒體集成進(jìn)計(jì)算機(jī),使信息表現(xiàn)聲、圖、文并茂。

2.什么是多媒體技術(shù)

多媒體技術(shù)是指以數(shù)字化為基礎(chǔ),能夠?qū)Χ喾N媒體信息進(jìn)行采集、加工處理、存儲(chǔ)和傳遞,并能使各種媒體信息之間建立起邏輯聯(lián)系,集成為一個(gè)具有良好交互性的系統(tǒng)技術(shù)。8.1.2多媒體技術(shù)的基本特性

多媒體技術(shù)除信息載體的多樣化以外,還具有以下的關(guān)鍵特性:

(1)集成性。采用了數(shù)字信號(hào),可以綜合處理文字、聲音、圖形、動(dòng)畫、圖像、視頻等多種信息,并將這些不同類型的信息有機(jī)地結(jié)合在一起。

(2)交互性。信息以超媒體結(jié)構(gòu)進(jìn)行組織,可以方便地實(shí)現(xiàn)人機(jī)交互。換言之,人可以按照自己的思維習(xí)慣、按照自己的意愿主動(dòng)地選擇和接受信息,擬定觀看內(nèi)容的路徑。

(3)智能性。提供了易于操作、十分友好的界面,使計(jì)算機(jī)更直觀、更方便、更親切、更人性化。

(4)易擴(kuò)展性。可方便地與各種外部設(shè)備掛接,實(shí)現(xiàn)數(shù)據(jù)交換、監(jiān)視控制等多種功能。此外,采用數(shù)字化信息有效地解決了數(shù)據(jù)在處理傳輸過(guò)程中的失真問題。

8.1.3多媒體技術(shù)的應(yīng)用與發(fā)展

1.多媒體技術(shù)的應(yīng)用

多媒體技術(shù)集文字、聲音、圖像、視頻、通信等多項(xiàng)技術(shù)于一體,采用計(jì)算機(jī)的數(shù)字記錄和傳輸傳送方式,對(duì)各種媒體進(jìn)行處理,具有廣泛的用途。

(1)教育與培訓(xùn)。

世界各國(guó)的教育學(xué)家們正努力研究用先進(jìn)的多媒體技術(shù)改進(jìn)教學(xué)與培訓(xùn)。以多媒體計(jì)算機(jī)為核心的現(xiàn)代教育技術(shù)使教學(xué)手段豐富多彩,使計(jì)算機(jī)輔助教學(xué)(CAI)如虎添翼。實(shí)踐已證明,多媒體教學(xué)系統(tǒng)有如下效果:①學(xué)習(xí)效果好;②說(shuō)服力強(qiáng);③教學(xué)信息的集成使教學(xué)內(nèi)容豐富,信息量大;④各種媒體與計(jì)算機(jī)結(jié)合可以使人類的感官與想象力相互配合,產(chǎn)生前所未有的思維空間與創(chuàng)造資源。

(2)桌面出版(DesktopPublishing)與辦公自動(dòng)化。

桌面出版物主要包括表格、布告、宣傳品、市場(chǎng)圖表、藍(lán)圖及商品圖等。多媒體技術(shù)為辦公室增加了控制信息的能力和充分表達(dá)思想的機(jī)會(huì),許多應(yīng)用程序都是為提高工作人員的工作效率而設(shè)計(jì)的,從而產(chǎn)生了許多新型的辦公自動(dòng)化系統(tǒng)。由于采用了先進(jìn)的數(shù)字影像和多媒體計(jì)算機(jī)技術(shù),把文件掃描儀、圖文傳真機(jī)、文件資料微縮系統(tǒng)等和通信網(wǎng)絡(luò)等現(xiàn)代化辦公設(shè)備綜合管理起來(lái),將構(gòu)成全新的辦公自動(dòng)化系統(tǒng)。

(3)多媒體通信。

在通信工程中的多媒體終端和多媒體通信也是多媒體技術(shù)的重要應(yīng)用領(lǐng)域之一。當(dāng)前計(jì)算機(jī)網(wǎng)絡(luò)已在人類社會(huì)進(jìn)步中發(fā)揮著重大作用。隨著“信息高速公路”開通,電子郵件已被普遍采用。多媒體通信有著極其廣泛的內(nèi)容,對(duì)人類生活、學(xué)習(xí)和工作將產(chǎn)生深刻影響的當(dāng)屬信息點(diǎn)播(InformationDemand)和計(jì)算機(jī)協(xié)同工作CSCW系統(tǒng)(ComputerSupportedCooperativeWork)。

信息點(diǎn)播有桌上多媒體通信系統(tǒng)和交互電視ITV。通過(guò)桌上多媒體通信系統(tǒng),人們可以遠(yuǎn)距離點(diǎn)播所需信息,而交互式電視和傳統(tǒng)電視不同之處在于用戶在電視機(jī)前可對(duì)電視臺(tái)節(jié)目庫(kù)中的信息按需選取,即用戶主動(dòng)與電視進(jìn)行交互式獲取信息。計(jì)算機(jī)協(xié)同工作CSCW是指在計(jì)算機(jī)支持的環(huán)境中,一個(gè)群體協(xié)同工作以完成一項(xiàng)共同的任務(wù),其應(yīng)用于工業(yè)產(chǎn)品的協(xié)同設(shè)計(jì)制造、遠(yuǎn)程會(huì)診、不同地域位置的同行們進(jìn)行學(xué)術(shù)交流、師生間的協(xié)同式學(xué)習(xí)等。

多媒體計(jì)算機(jī)+電視+網(wǎng)絡(luò)將形成一個(gè)極大的多媒體通信環(huán)境,它不僅改變了信息傳遞的面貌,帶來(lái)通信技術(shù)的大變革,而且計(jì)算機(jī)的交互性、通信的分布性和多媒體的現(xiàn)實(shí)性相結(jié)合,構(gòu)成了繼電報(bào)、電話、傳真之后的第四代通信手段,向社會(huì)提供全新的信息服務(wù)。

(4)多媒體電子出版物。

國(guó)家新聞出版署對(duì)電子出版物定義為“電子出版物,是指以數(shù)字代碼方式將圖、文、聲、像等信息存儲(chǔ)在磁、光、電介質(zhì)上,通過(guò)計(jì)算機(jī)或類似設(shè)備閱讀使用,并可復(fù)制發(fā)行的大眾傳播媒體?!痹摱x明確了電子出版物的重要特點(diǎn)。電子出版物的內(nèi)容可分為電子圖書、辭書手冊(cè)、文檔資料、報(bào)刊雜志、教育培訓(xùn)、娛樂游戲、宣傳廣告、信息咨詢、簡(jiǎn)報(bào)等,許多作品是多種類型的混合。電子出版物的特點(diǎn)主要表現(xiàn)在集成性和交互性,即使用媒體種類多、表現(xiàn)力強(qiáng)、信息的檢索和使用方式更加靈活方便,特別是信息的交互性不僅能向讀者提供信息,而且能接收讀者的反饋。電子出版物的出版形式有電子網(wǎng)絡(luò)出版和單行電子書刊兩大類。

電子網(wǎng)絡(luò)出版是以數(shù)據(jù)庫(kù)和通信網(wǎng)絡(luò)為基礎(chǔ)的新出版形式,在計(jì)算機(jī)管理和控制下,向讀者提供網(wǎng)絡(luò)聯(lián)機(jī)服務(wù)、傳真出版、電子報(bào)刊、電子郵件、教學(xué)及影視等多種服務(wù)。而單行電子書刊載體有軟磁盤(FD)、只讀光盤(CD-ROM)、交互式光盤(CD-I)、圖文光盤(CD-G)、照片光盤(Photo-D)、集成電路卡(IC)和新聞出版者認(rèn)定的其他載體。

(5)多媒體聲光藝術(shù)品的創(chuàng)作。

專業(yè)的聲光藝術(shù)作品包括影片剪接、文本編排、音響、畫面等特殊效果的制作等。

專業(yè)藝術(shù)家也可以通過(guò)多媒體系統(tǒng)的幫助增進(jìn)其作品的品質(zhì),MIDI的數(shù)字樂器合成接口可以讓設(shè)計(jì)者利用音樂器材、鍵盤等合成音響輸入,然后進(jìn)行剪接、編輯、制作出許多特殊效果。

電視工作者可以用媒體系統(tǒng)制作電視節(jié)目,美術(shù)工作者可以制作卡通和動(dòng)畫的特殊效果。制作的節(jié)目存儲(chǔ)到VCD視頻光盤上,不僅便于保存,圖像質(zhì)量好,價(jià)格也已為人們所接受。應(yīng)用多媒體技術(shù)具有以下意義:

(1)使計(jì)算機(jī)可以處理人類生活中最直接、最普遍的信息,從而使得計(jì)算機(jī)應(yīng)用領(lǐng)域及功能得到了極大的擴(kuò)展。

(2)使計(jì)算機(jī)系統(tǒng)的人機(jī)交互界面和手段更加友好和方便,非專業(yè)人員也可以方便地使用和操作計(jì)算機(jī)。

(3)多媒體技術(shù)使音像技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)三大信息處理技術(shù)緊密地結(jié)合起來(lái),為信息處理技術(shù)發(fā)展奠定了新的基石。

多媒體技術(shù)發(fā)展已經(jīng)有多年的歷史了,到目前為止,聲音、視頻、圖像壓縮方面的基礎(chǔ)技術(shù)已逐步成熟,并形成了產(chǎn)品進(jìn)入市場(chǎng),現(xiàn)在熱門的技術(shù)如模式識(shí)別、MPEG壓縮技術(shù)、虛擬現(xiàn)實(shí)技術(shù)正在逐步走向成熟,相信不久也會(huì)進(jìn)入市場(chǎng)。

2.多媒體技術(shù)的發(fā)展趨勢(shì)

伴隨著社會(huì)信息化步伐的加快,特別是近年來(lái)興起的全球范圍“信息高速公路”熱潮的推動(dòng),多媒體的發(fā)展和應(yīng)用前景將更加廣闊。

(1)分布式、網(wǎng)絡(luò)化、協(xié)同工作的多媒體系統(tǒng)。在當(dāng)前形式下,有線電視網(wǎng)、通信網(wǎng)和因特網(wǎng)這三網(wǎng)正在日趨統(tǒng)一,各種多媒體系統(tǒng)尤其是基于網(wǎng)絡(luò)的多媒體系統(tǒng),如可視電話系統(tǒng)、點(diǎn)播系統(tǒng)、電子商務(wù)、遠(yuǎn)程教學(xué)和醫(yī)療等將會(huì)得到迅速發(fā)展。一個(gè)多點(diǎn)分布、網(wǎng)絡(luò)連接、協(xié)同工作的信息資源環(huán)境正在日益完善和成熟。

(2)三電(電信、電腦、電器)通過(guò)多媒體數(shù)字技術(shù)將相互滲透融合。多媒體技術(shù)的進(jìn)一步發(fā)展將會(huì)充分地體現(xiàn)出多領(lǐng)域應(yīng)用的特點(diǎn),各種多媒體技術(shù)手段將不僅僅是科研工作的工具,而且還可以是生產(chǎn)管理的工具、生活?yuàn)蕵返姆绞健H缧蕾p聲像圖書館的各種資料、閱讀電子雜志、向綜合信息中心咨詢、電子購(gòu)物等。另外,還可以采用多媒體信息形式的遠(yuǎn)程通信,在這種狀態(tài)下,雖然相距遙遠(yuǎn),但其交談和合作的感受卻如同相聚一室。

(3)以用戶為中心,充分發(fā)展交互多媒體和智能多媒體技術(shù)與設(shè)備。對(duì)于未來(lái)的多媒體系統(tǒng),人類可用日常的感知和表達(dá)技能與其進(jìn)行自然的交互,系統(tǒng)本身不僅能主動(dòng)感知用戶的意圖,而且還可以根據(jù)用戶的需求做出相應(yīng)的反應(yīng),系統(tǒng)本身會(huì)具有越來(lái)越高的智能性。8.1.4多媒體系統(tǒng)平臺(tái)

1.什么是多媒體計(jì)算機(jī)系統(tǒng)

多媒體計(jì)算機(jī)系統(tǒng)是能對(duì)文本、聲音、圖形、圖像等多種媒體進(jìn)行獲取、編輯、存儲(chǔ)、處理、加工和表現(xiàn)(輸出)的一種計(jì)算機(jī)系統(tǒng),包括多媒體硬件系統(tǒng)、多媒體操作系統(tǒng)、媒體處理系統(tǒng)工具和用戶應(yīng)用軟件。

(1)多媒體硬件系統(tǒng):該系統(tǒng)包括計(jì)算機(jī)硬件、聲音/視頻處理器、多種媒體輸入/輸出設(shè)備及信號(hào)轉(zhuǎn)換裝置、通信傳輸設(shè)備及接口裝置等。其中,最重要的是根據(jù)多媒體技術(shù)標(biāo)準(zhǔn)而研制生成的多媒體信息處理芯片和板卡、光盤驅(qū)動(dòng)器等。

(2)多媒體操作系統(tǒng):或稱為多媒體核心系統(tǒng)(Multimediakernelsystem),具有實(shí)時(shí)任務(wù)調(diào)度、多媒體數(shù)據(jù)轉(zhuǎn)換、多媒體設(shè)備的驅(qū)動(dòng)和同步控制,以及圖形界面管理等。

(3)媒體處理系統(tǒng)工具:或稱為多媒體系統(tǒng)開發(fā)工具軟件,是多媒體系統(tǒng)的重要組成部分。

(4)用戶應(yīng)用軟件:根據(jù)多媒體系統(tǒng)終端用戶要求而定制的應(yīng)用軟件,或面向某一領(lǐng)域的用戶應(yīng)用軟件系統(tǒng),是面向大規(guī)模用戶的系統(tǒng)產(chǎn)品。

2.多媒體系統(tǒng)構(gòu)成

(1)專門設(shè)計(jì)的多媒體計(jì)算機(jī)系統(tǒng)。

(2)普通PC機(jī)+聲卡等多媒體配件=多媒體個(gè)人計(jì)算機(jī)MPC(MultimediaPersonalComputer),如圖8.1所示。圖8.1多媒體個(gè)人計(jì)算機(jī)

8.2音像王國(guó)的基石—多媒體技術(shù)基礎(chǔ)

8.2.1音頻信息處理

1.聲音的物理特征

聲音一般可通過(guò)連續(xù)的波形來(lái)表示,波形的最大位移也就是振幅反映音量(音高、響度或強(qiáng)度)。波形中連續(xù)兩個(gè)波峰或波谷之間的時(shí)間距離稱為周期,周期的倒數(shù)稱為頻率。頻率用Hz(赫茲)表示,用來(lái)反映聲音的音調(diào)。另外,由于不同材質(zhì),不同的環(huán)境,所產(chǎn)生的聲音所伴隨的泛音也不同,所以也就產(chǎn)生了聲音的音色特征。響度的大小決定于發(fā)聲體振動(dòng)的振幅,音調(diào)的高低決定于發(fā)聲體振動(dòng)的頻率,音色的不同取決于不同的泛音,每一種樂器、不同的人以及所有能發(fā)聲的物體發(fā)出的聲音,除了一個(gè)基音外,還有許多不同頻率的泛音伴隨,正是這些泛音決定了其不同的音色,使人能辨別出是不同的樂器甚至不同的人發(fā)出的聲音。

人的發(fā)音器官發(fā)出的聲音頻段在80Hz到3400Hz之間,人說(shuō)話的信號(hào)頻率范圍為300~3000Hz,有的人將該頻段的信號(hào)稱為語(yǔ)音信號(hào)。音質(zhì)是指聲音的品質(zhì),主要是衡量聲音的上述三方面是否達(dá)到一定的水準(zhǔn)。即相對(duì)于某一頻率或頻段的音高是否具有一定的強(qiáng)度,并且在要求的頻率范圍內(nèi)、同一音量下,各頻點(diǎn)的幅度是否均勻、均衡、飽滿,頻率響應(yīng)曲線是否平直,聲音的音準(zhǔn)是否準(zhǔn)確,既忠實(shí)地呈現(xiàn)了音源頻率或成分的原來(lái)面目,頻率的畸變和相移又符合要求。聲音的泛音適中,諧波較豐富,聽起來(lái)音色就優(yōu)美動(dòng)聽。

2.音頻

1)音頻等級(jí)

音頻(Audio)是指頻率在20Hz~20kHz范圍內(nèi)的可聽聲音,是多媒體信息中的一種媒體類型—聽覺類媒體。目前多媒體計(jì)算機(jī)中的音頻主要有波形音頻、CD音頻和MIDI音樂三種形式(這三種形式全部都是數(shù)字音頻,因?yàn)橛?jì)算機(jī)所能處理的只有數(shù)字信號(hào),所以只能以數(shù)字化的方式存儲(chǔ)音頻數(shù)據(jù),如果是模擬式的聲音,要首先經(jīng)過(guò)抽樣、量化和壓縮編碼等過(guò)程形成數(shù)字化音頻,再由計(jì)算機(jī)進(jìn)行存儲(chǔ)及其他操作等)。反映數(shù)字化音頻的質(zhì)量的因素由采樣頻率、量化位數(shù)和聲道數(shù)3個(gè)參數(shù)決定。聲道數(shù)是指記錄聲音時(shí),如果每次生成1個(gè)聲波的數(shù)據(jù),稱為單聲道;每次生成2個(gè)聲波數(shù)據(jù),稱為雙聲道(立體聲);每次生成2個(gè)以上聲波數(shù)據(jù),稱為多聲道(環(huán)繞立體聲)。

數(shù)字音頻等級(jí)如表8-1所示。表8-1數(shù)字音頻等級(jí)

2)聲音的數(shù)字化和編碼

計(jì)算機(jī)處理音頻信號(hào)之前,必須將模擬的聲音信號(hào)數(shù)字化,產(chǎn)生數(shù)字音頻,具體過(guò)程包括采樣、量化、編碼。圖8.2所示為模擬聲音信號(hào)數(shù)字化過(guò)程。圖8.2模擬聲音信號(hào)數(shù)字化過(guò)程如圖8.2(b)所示,采樣是每間隔一段時(shí)間讀取一次聲音信號(hào)幅度,使聲音信號(hào)在時(shí)間上被離散化。

采樣頻率:指將模擬聲音波形數(shù)字化時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù),其計(jì)算單位是kHz(千赫茲)。一般來(lái)講,采樣頻率越高聲音失真越小,用于存儲(chǔ)數(shù)字音頻的數(shù)據(jù)量也越大。

奈奎斯特(Nyquist)采樣定律:采樣頻率應(yīng)大于等于聲音信號(hào)最高頻率的兩倍,就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音。例如,電話話音的信號(hào)頻率約為3.4kHz,采樣頻率就選為8kHz;高質(zhì)量聲音采樣頻率為44.1kHz。量化:就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換為數(shù)字值,是聲音信號(hào)在幅度上被離散化,如圖8.2(c)所示,量化位數(shù)是每個(gè)采樣點(diǎn)能夠表示的數(shù)據(jù)范圍,常用的有8位、12位和

16位。

編碼:音頻數(shù)據(jù)壓縮編碼的方法有多種,可分為無(wú)損壓縮和有損壓縮兩大類。無(wú)損壓縮主要包含各種熵編碼;而有損壓縮則可分為波形編碼、參數(shù)編碼、感知編碼和同時(shí)利用多種技術(shù)的混合編碼,圖8.3給出了音頻數(shù)據(jù)壓縮編碼的主要方法。圖8.3音頻數(shù)據(jù)壓縮方法分類波形編碼是在模擬音頻數(shù)字化(抽樣和量化)的過(guò)程中,根據(jù)人耳的聽覺特性進(jìn)行編碼,并使編碼后的音頻信號(hào)與原始信號(hào)的波形盡可能匹配,實(shí)現(xiàn)數(shù)據(jù)的壓縮。

參數(shù)編碼把音頻信號(hào)表示成某種模型的輸出,利用特征提取的方法抽取必要的模型參數(shù)和激勵(lì)信號(hào)的信息,且對(duì)這些信息編碼,最后在輸出端合成原始信號(hào)。

混合編碼介于波形編碼和參數(shù)編碼之間,集中了這兩種方法的優(yōu)點(diǎn),可在較低的碼率上得到較高的音質(zhì)。

音頻采樣的數(shù)據(jù)量由兩方面因素決定:

(1)音質(zhì)因素:由采樣頻率、量化位數(shù)和聲道數(shù)3個(gè)參數(shù)決定。

(2)時(shí)間因素:采樣時(shí)間越長(zhǎng),數(shù)據(jù)量越大。

3.音頻卡

多媒體計(jì)算機(jī)系統(tǒng)中都有音頻信號(hào)處理功能,但實(shí)現(xiàn)方法各不相同。美國(guó)蘋果公司的Macintosh計(jì)算機(jī)一開始就被設(shè)計(jì)成具有音頻處理能力的多媒體計(jì)算機(jī),而使用Windows平臺(tái)的PC系列機(jī),起初沒有聲音處理能力,而是通過(guò)擴(kuò)充一個(gè)專門的音頻處理部件—音頻卡來(lái)實(shí)現(xiàn)其聲音處理的。

音頻卡的功能:

(1)錄制和播放數(shù)字聲音文件;

(2)控制音量和混音效果;

(3)聲音文件的壓縮與解壓縮;

(4)MIDI接口與音樂合成。

音頻卡的組成和外圍接口連接如圖8.4、圖8.5所示。圖8.4音頻卡的組成框圖圖8.5音頻卡的外圍接口連接示意圖有的音頻卡不再提供Line-Out插孔,一些新的音頻卡產(chǎn)品追求功能的簡(jiǎn)單和較好的音效,所以簡(jiǎn)化了原來(lái)聲卡上的MIDI和游戲桿功能,使之成為專門的聲音處理部件。

4.音頻采集

在Windows2000系統(tǒng)中,提供了錄音參數(shù)的選擇設(shè)置功能,其中的音質(zhì)選擇分為CD音質(zhì)、電話質(zhì)量、收音質(zhì)量和DefaultQuality四種,還可以選擇不同的采樣頻率、位寬和聲道。為了防止錄音過(guò)程中出現(xiàn)失真,可通過(guò)“音量控制”對(duì)話框來(lái)檢測(cè)、調(diào)節(jié)進(jìn)入計(jì)算機(jī)的音源強(qiáng)度。WindowsXP的錄音機(jī)只能錄60s的音頻數(shù)據(jù),可以借助專業(yè)的音頻處理軟件進(jìn)行音頻錄入,不但能夠提供不限時(shí)長(zhǎng)的錄入功能,還可以使用不同的編碼進(jìn)行壓縮存儲(chǔ)。獲取音頻數(shù)據(jù)的另外一個(gè)方法是從不同的多媒體產(chǎn)品中直接抓取音軌信息,轉(zhuǎn)換并壓縮成自己所需的音頻格式。一般的音頻工具軟件都具有直接抓取音樂CD的能力,而另一些軟件則可以從更多媒體格式中抓取音軌。

音頻編輯一般包括音頻內(nèi)容剪切、合成以及音質(zhì)和效果的編輯等方面。

(1)多音軌(MultipleTracks);

(2)切邊(Trimming);

(3)拼接和組合(SplicingandAssembly;

(4)音量調(diào)節(jié)(VolumeAdjustments);

(5)格式轉(zhuǎn)換(FormatConversion);

(6)重采樣或降低采樣率(ResamplingorDownsampling);

(7)漸出和漸隱(Fade-insandFade-outs);

(8)均衡(Equalization);

(9)時(shí)間拉伸(TimeStretching);

(10)數(shù)字信號(hào)處理(DigitalSignalProcessing,DSP)。

5.MIDI

MIDI是MusicalInstrumentDigitalInterface的縮寫,譯為樂器數(shù)字化接口。它規(guī)定了電子樂器和多媒體計(jì)算機(jī)之間進(jìn)行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計(jì)算機(jī)所支持的又一種聲音產(chǎn)生方法—MIDI方法。

MIDI格式的數(shù)字化文件可以看做是樂譜的數(shù)字化描述,它記錄的是樂器的種類,音階的高低、長(zhǎng)短、強(qiáng)弱、速度等因素,這些被稱為MIDI消息,存儲(chǔ)為MIDI文件。當(dāng)需要播放時(shí),從相應(yīng)的MIDI文件中讀出MIDI消息,通過(guò)音樂合成器產(chǎn)生相應(yīng)的聲音波形,經(jīng)過(guò)放大后,再由揚(yáng)聲器輸出。因?yàn)镸IDI文件保存的是一系列由MIDI消息組成的“樂譜”,因此MIDI的播放音質(zhì)是與設(shè)備有關(guān)的。兩臺(tái)MIDI設(shè)備之間可以通過(guò)接口發(fā)送信息而進(jìn)行相互通信。一臺(tái)MIDI設(shè)備可以有1~3個(gè)端口:

(1)?MIDIIn接口—接收來(lái)自其他MIDI設(shè)備上的MIDI信息。

(2)?MIDIOut接口—用來(lái)輸出本設(shè)備生成的MIDI信息。

(3)?MIDIThru接口—將從MIDIIn端口傳來(lái)的信息發(fā)送到另一臺(tái)相連的MIDI設(shè)備上。

在進(jìn)行MIDI通信時(shí),用戶可以通過(guò)標(biāo)準(zhǔn)的MIDI電纜來(lái)相互連接各端口。MIDI電纜由一根屏蔽的雙絞線和兩端帶有插入式的5針D型插頭組成,如圖8.6所示。圖8.6MIDI電纜

MIDI設(shè)備還可以配備電子鍵盤、合成器、音序器(MIDI軟件)以及揚(yáng)聲器或音箱等。多媒體計(jì)算機(jī)與MIDI設(shè)備的連接方法如圖8.7所示。圖8.7多媒體計(jì)算機(jī)與MIDI設(shè)備的連接

MIDI軟件(音序器)是用于記錄、編輯和播放MIDI文件的一種軟件,其作用相當(dāng)于是MIDI樂器的一臺(tái)多軌磁帶錄音機(jī)。

聲卡播放MIDI音樂最常用的方法有兩種,就是FM合成與波表合成。FM是運(yùn)用聲音振蕩的原理對(duì)MIDI進(jìn)行合成處理的,但由于技術(shù)本身的局限,加上這類聲卡大多采用廉價(jià)的YAMAHAOPI系列芯片,效果較差。波表(WaveTable)合成的效果較好,它是將各種真實(shí)樂器所能發(fā)出的所有聲音(包括各個(gè)音域、聲調(diào))錄制下來(lái),存儲(chǔ)在聲卡的ROM中,稱為硬波表,播放時(shí),根據(jù)MIDI文件記錄的樂曲信息向波表發(fā)出指令,從表格中逐一找出對(duì)應(yīng)的聲音信息,經(jīng)過(guò)合成、加工后回放出來(lái)。由于波表采用的是真實(shí)樂器的采樣,所以效果自然要好于FM。從技術(shù)上講,創(chuàng)作MIDI音樂的過(guò)程與將現(xiàn)有的音頻數(shù)字化的過(guò)程完全不同。如果把數(shù)字化音頻比成位圖圖像,那么MIDI就可以類比為矢量圖形。為了制作MIDI音樂,需要按圖8.7的示意構(gòu)成系統(tǒng),即多媒體計(jì)算機(jī)中的聲卡需要帶一個(gè)聲音合成器,還要一個(gè)作曲軟件及一個(gè)MIDI鍵盤,這樣才具備創(chuàng)作MIDI樂譜的基礎(chǔ)條件。樂譜創(chuàng)作軟件能夠錄制、編輯、打印MIDI樂譜,并播放MIDI音樂。另外,一些樂譜創(chuàng)作軟件還能對(duì)樂譜進(jìn)行量化來(lái)調(diào)節(jié)節(jié)拍的不一致問題。MIDI編輯中很重要的是選擇MIDI樂器,MIDI標(biāo)準(zhǔn)規(guī)定了不同的演奏樂器,用0到127之間的編號(hào)加以區(qū)分。目前,MIDI是為多媒體項(xiàng)目創(chuàng)建原始音樂素材的最佳途徑,使用MIDI能夠帶來(lái)您所希望得到的靈活性和創(chuàng)新。手機(jī)彩玲就是通過(guò)MIDI制作的。

Musitek公司開發(fā)的SmartSore軟件不僅是一個(gè)樂譜創(chuàng)作軟件,而且可以用來(lái)掃描識(shí)別樂譜。SmartSore的基本思想與文字的OCR技術(shù)類似:首先通過(guò)掃描儀,將樂譜以圖像的方式掃描成數(shù)字圖像,注意掃描參數(shù)的選擇與設(shè)置,分辨率一般選擇150~300dpi,圖像類型為黑白二值或OCR,掃描后的圖片以TIF格式存儲(chǔ);然后通過(guò)樂譜識(shí)別功能識(shí)別出可編輯的數(shù)字樂譜,并進(jìn)行校對(duì)、編輯。識(shí)別完成后會(huì)提示將識(shí)別的結(jié)果保存為SmartScore專用格式的?.enf文件。

6.MIDI和數(shù)字音頻的比較

MIDI數(shù)據(jù)本身并非數(shù)字化的聲音,它只是利用數(shù)字形式對(duì)樂譜的速記符號(hào)。MIDI文件比數(shù)字音頻文件尺寸更小,MIDI文檔的大小與播放質(zhì)量完全無(wú)關(guān)。由于MIDI文件非常小,可以嵌入到網(wǎng)頁(yè)中,因此下載和播放要比相當(dāng)?shù)臄?shù)字音頻速度快。在有些情況下,如果使用的MIDI聲源質(zhì)量很高,MIDI將會(huì)比數(shù)字音頻文件聽起來(lái)更好。MIDI數(shù)據(jù)是完全可編輯的,可對(duì)MIDI音樂的音符、音高、輸出設(shè)備等很小的樂譜單元作精確編輯和修改。MIDI數(shù)據(jù)是與設(shè)備有關(guān),MIDI音樂文件制作的聲音也依賴于特定的回放設(shè)備。數(shù)字音頻與播放設(shè)備無(wú)關(guān),需要較大的數(shù)據(jù)存儲(chǔ)空間。由于MIDI數(shù)據(jù)并不表示實(shí)際的聲音,而是音樂設(shè)備的聲音,因此只要MIDI的播放設(shè)備與制作MIDI時(shí)使用的設(shè)備不一樣,就無(wú)法保證播放的最佳效果。采用MIDI無(wú)法表示語(yǔ)音信號(hào)。

采用數(shù)字音頻還有兩個(gè)經(jīng)常起決定性作用的原因:

(1)?Macintosh和Windows平臺(tái)為數(shù)字音頻提供了更多的應(yīng)用軟件和系統(tǒng)支持。

(2)創(chuàng)建數(shù)字音頻的準(zhǔn)備和編程并不需要具備音樂理論的專業(yè)知識(shí),但是處理MIDI數(shù)據(jù)不但需要了解音頻制作,而且需要對(duì)音樂樂譜、鍵盤和音符有所了解。

7.相關(guān)工具介紹

(1)音頻制作軟件。

音頻制作軟件主要完成MIDI樂譜的制作、編輯等功能。常見的有CakewalkSonar、LogicAudio、BandinaBox、GuitarPro等。

①CakewalkSonar:具備MIDI、音頻、音源(合成器)的一體化制作能力。

②LogicAudio:提供多項(xiàng)高級(jí)MIDI和音頻的錄制和編輯、專業(yè)品質(zhì)的采樣音源(EXS24)和模擬合成器(ESI)。

③BandinaBox:“傻瓜式”MIDI制作軟件,適合于缺乏系統(tǒng)的作曲、配器訓(xùn)練、非專業(yè)、要求不高的電腦音樂愛好者和入門者選用。④GuitarPro:MIDI制作、吉他六線譜、BASS四線譜繪制、打印軟件。在用MIDI制作吉他、BASS等彈撥樂器的滑音、推弦等方面,具有絕對(duì)的優(yōu)勢(shì)。這款軟件操作簡(jiǎn)單、容易上手,可作為計(jì)算機(jī)音樂、MIDI制作時(shí)的輔助軟件來(lái)使用。

(2)音頻處理類軟件。

音頻處理類軟件主要完成對(duì)數(shù)字音頻的錄音采集、剪輯、效果處理以及格式轉(zhuǎn)換等功能。常見的有CoolEditPro、SoundForge、Samplitude、T-RackS、Nuendo、VegasAudio、WaveLab、UleadAudioEditor等。①CoolEditPro

可以在普通聲卡上同時(shí)處理64軌的音頻信號(hào),具有極豐富的音頻處理效果,并能進(jìn)行實(shí)時(shí)預(yù)覽和多軌音頻的混縮合成,是個(gè)人音樂工作室的音頻處理首選

軟件。

②SoundForge:一款音頻錄制、處理軟件。

③Samplitude:專業(yè)級(jí)別的多軌音頻錄制、處理、混縮軟件,支持24bit、96kHz的高采樣率,支持無(wú)限軌超級(jí)縮混,更重要的是采用了精確獨(dú)特的內(nèi)部算法。

④T-RackS:一款處理成品音頻的音頻修飾類軟件,可以將“粗制濫造”的音頻修飾的煥然一新,極具專業(yè)水準(zhǔn)。⑤Nuendo:一款集MIDI、音頻、混音等功能于一體的音樂軟件,支持視頻5.1環(huán)繞立體聲的制作,功能強(qiáng)大,品質(zhì)超群。

⑥VegasAudio:一款多軌音頻處理軟件。該軟件操作簡(jiǎn)便,極易上手。

此外,音樂制作、音頻處理類軟件還有很多,比如自動(dòng)伴奏(編曲)軟件、鼓機(jī)軟件、打譜軟件、舞曲軟件、音色采樣軟件、音色拼接軟件、識(shí)別、轉(zhuǎn)換軟件等。

(3)音頻剪輯軟件。

音頻剪輯軟件主要用在裁剪空白和拼接組合等方面,主要的處理方法與文本內(nèi)容處理類似,即使用選擇(定義區(qū)域)、復(fù)制(或剪裁)、粘貼的基本方法。操作過(guò)程為,先用不同的方法選擇一段要復(fù)制或裁剪的音頻,然后選中主菜單Edit的Cut或Copy進(jìn)行剪切或復(fù)制。最后,選定要粘貼的準(zhǔn)確位置,再選擇Edit菜單中的Paste完成粘貼工作。

(4)放大、縮減、去噪類軟件。

該類工具軟件用于對(duì)數(shù)字音頻的播放效果進(jìn)行處理。當(dāng)需要縮放音量時(shí),首先選定一段音頻,然后選擇Effect菜單中的Amplify命令,適當(dāng)調(diào)整音量放大百分?jǐn)?shù),就可以實(shí)現(xiàn)音量的放大與減小。去噪是通過(guò)拖動(dòng)滾動(dòng)條來(lái)實(shí)現(xiàn)的,范圍為1%~100%。數(shù)值越小表示去噪越精細(xì);調(diào)整到100%,則表示把選定的一段音頻靜音。

(5)漸變效果處理軟件。

淡入、淡出是數(shù)字音頻處理最常見的效果,它是通過(guò)音量的逐漸增強(qiáng)和逐漸減小來(lái)實(shí)現(xiàn)的。當(dāng)需要對(duì)某段音頻添加漸變效果時(shí),可首先選定這段音頻,然后打開Effect菜單中的Fade菜單項(xiàng),選擇(淡入、淡出)或自定義一種漸變效果,同時(shí)選擇、調(diào)整漸變關(guān)系,就可得到滿意的漸變效果。

(6)其他效果處理。

在AudioEditor中提供了比如Reverse(反向)、Invert(倒轉(zhuǎn)波形)、Speed(調(diào)整音頻播放速度)、Echo(回聲效果)以及DirectXAudio和AudioEffectDMO等效果處理功能。其中,DirectXAudio包含了一組由SONY和Cakewalk提供的約40多種不同效果,而AudioEffectDMO則包含了微軟提供的9種效果。

(7)聲音格式轉(zhuǎn)換。

聲音格式轉(zhuǎn)換指在編輯過(guò)程中,對(duì)音頻采樣參數(shù)的改變。AudioEditor中提供了這種改變聲音采樣參數(shù)的功能。當(dāng)需要時(shí)可以選擇Edit菜單中的ConvertTo命令,通過(guò)在ConvertTo對(duì)話框中選擇合適的采樣參數(shù)來(lái)實(shí)現(xiàn)聲音格式的改變。

(8)合并與混合處理。

合并是指將不同的單聲道信息合并成時(shí)間上重疊的多聲道音頻,最后可用一個(gè)多聲道文件保存。合并的對(duì)象必須是對(duì)兩個(gè)單聲道的音頻文件。混合是將兩個(gè)文件的聲音混合成一個(gè)文件,混合前文件為單聲道,混合后的文件仍然是單聲道。混合時(shí)需要調(diào)節(jié)音量比例。

8.音頻編/解碼詳述

數(shù)字音頻信息的壓縮主要是依據(jù)音頻信息自身的相關(guān)性以及人耳對(duì)音頻信息的聽覺冗余度。音頻信息在編碼技術(shù)中通常分成兩類來(lái)處理,分別是語(yǔ)音和音樂,各自采用的技術(shù)有差異?,F(xiàn)代聲碼器的一個(gè)重要的課題是,如何把語(yǔ)音和音樂的編碼融合起來(lái)。

1)語(yǔ)音編碼

語(yǔ)音編碼技術(shù)又分為三類:波形編碼、參數(shù)編碼以及混合編碼(圴屬于無(wú)損壓縮)。波形編碼:波形編碼是在時(shí)域上進(jìn)行處理,力圖使重建的語(yǔ)音波形保持原始語(yǔ)音信號(hào)的形狀,它將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,具有適應(yīng)能力強(qiáng)、話音質(zhì)量好等優(yōu)點(diǎn),缺點(diǎn)是壓縮比偏低。該類編碼的技術(shù)主要有非線性量化技術(shù)、時(shí)域自適應(yīng)差分編碼和量化技術(shù)。非線性量化技術(shù)利用語(yǔ)音信號(hào)小幅度出現(xiàn)的概率大而大幅度出現(xiàn)的概率小的特點(diǎn),通過(guò)為小信號(hào)分配小的量化階,為大信號(hào)分配大的量化階來(lái)減少總量化誤差。我們最常用的G.711標(biāo)準(zhǔn)用的就是這個(gè)技術(shù)。自適應(yīng)差分編碼是利用過(guò)去的語(yǔ)音來(lái)預(yù)測(cè)當(dāng)前的語(yǔ)音,只對(duì)它們的差進(jìn)行編碼,從而大大減少了編碼數(shù)據(jù)的動(dòng)態(tài)范圍,節(jié)省了碼率。自適應(yīng)量化技術(shù)是根據(jù)量化數(shù)據(jù)的動(dòng)態(tài)范圍來(lái)動(dòng)態(tài)調(diào)整量階,使得量階與量化數(shù)據(jù)相匹配。G.726標(biāo)準(zhǔn)中應(yīng)用了這兩項(xiàng)技術(shù),G.722標(biāo)準(zhǔn)把語(yǔ)音分成高、低兩個(gè)子帶,然后在每個(gè)子帶中分別應(yīng)用這兩項(xiàng)技術(shù)。

參數(shù)編碼:利用語(yǔ)音信息產(chǎn)生的數(shù)學(xué)模型,提取語(yǔ)音信號(hào)的特征參量,并按照模型參數(shù)重構(gòu)音頻信號(hào)。它只能收斂到模型約束的最好質(zhì)量上,力圖使重建語(yǔ)音信號(hào)具有盡可能高的可懂性,而重建信號(hào)的波形與原始語(yǔ)音信號(hào)的波形相比可能會(huì)有相當(dāng)大的差別。這種編碼技術(shù)的優(yōu)點(diǎn)是壓縮比高,但重建音頻信號(hào)的質(zhì)量較差、自然度低,適用于窄帶信道的語(yǔ)音通信,如軍事通信、航空通信等。美國(guó)的軍方標(biāo)準(zhǔn)LPC-10就是從語(yǔ)音信號(hào)中提取出來(lái)反射系數(shù)、增益、基音周期、清/濁音標(biāo)志等參數(shù)進(jìn)行編碼的。MPEG-4標(biāo)準(zhǔn)中的HVXC聲碼器用的也是參數(shù)編碼技術(shù),當(dāng)它在無(wú)聲信號(hào)片段時(shí),激勵(lì)信號(hào)與CELP(碼激勵(lì)線性預(yù)測(cè)編碼)相似,都是通過(guò)一個(gè)碼本索引和通過(guò)幅度信息描述;在發(fā)聲信號(hào)片段時(shí)則應(yīng)用了諧波綜合,它是將基音和諧音的正弦振蕩按照傳輸?shù)幕l進(jìn)行綜合。混合編碼:將上述兩種編碼方法結(jié)合起來(lái),采用混合編碼的方法,可以在較低的數(shù)碼率上得到較高的音質(zhì)。它的基本原理是合成分析法,將綜合濾波器引入編碼器,與分析器相結(jié)合,在編碼器中將激勵(lì)輸入綜合濾波器產(chǎn)生與譯碼器端完全一致的合成語(yǔ)音,然后將合成語(yǔ)音與原始語(yǔ)音相比較(波形編碼思想),根據(jù)均方誤差最小原則,求得最佳的激勵(lì)信號(hào),然后把激勵(lì)信號(hào)以及分析出來(lái)的綜合濾波器編碼送給解碼端。這種得到綜合濾波器和最佳激勵(lì)的過(guò)程稱為分析(得到語(yǔ)音參數(shù));用激勵(lì)和綜合濾波器合成語(yǔ)音的過(guò)程稱為綜合。由此我們可以看出,CELP編碼把參數(shù)編碼和波形編碼的優(yōu)點(diǎn)結(jié)合在了一起,使得用較低碼率產(chǎn)生較好的音質(zhì)成為可能。通過(guò)設(shè)計(jì)不同的碼本和碼本搜索技術(shù),產(chǎn)生了很多編碼標(biāo)準(zhǔn),目前我們通信中用到的大多數(shù)語(yǔ)音編碼器都采用了混合編碼技術(shù)。例如,在互聯(lián)網(wǎng)上的G.723.1和G.729標(biāo)準(zhǔn),在GSM上的EFR、HR標(biāo)準(zhǔn),在3GPP2上的EVRC、QCELP標(biāo)準(zhǔn),在3GPP上的AMR-NB/WB標(biāo)準(zhǔn)等等。

2)音樂編碼

音樂編碼主要有自適應(yīng)變換編碼(頻域編碼)、心理聲學(xué)模型和熵編碼等技術(shù)(均屬于有損壓縮)。

自適應(yīng)變換編碼:利用正交變換,把時(shí)域音頻信號(hào)變換到另一個(gè)域,由于去相關(guān)的結(jié)果,變換域系數(shù)的能量集中在一個(gè)較小的范圍,所以對(duì)變換域系數(shù)最佳量化后,可以實(shí)現(xiàn)碼率的壓縮。理論上的最佳量化很難達(dá)到,通常采用自適應(yīng)比特分配和自適應(yīng)量化技術(shù)來(lái)對(duì)頻域數(shù)據(jù)進(jìn)行量化。在MPEGlayer3和AAC標(biāo)準(zhǔn)及DolbyAC-3標(biāo)準(zhǔn)中都使用了改進(jìn)的余弦變換(MDCT);在ITUG.722.1標(biāo)準(zhǔn)中則用的是重疊調(diào)制變換(MLT)。本質(zhì)上它們都是余弦變換的改進(jìn)。心理聲學(xué)模型:其基本思想是對(duì)信息量加以壓縮,同時(shí)使失真盡可能不被覺察出來(lái),利用人耳的掩蔽效應(yīng)就可以達(dá)到此目的,即較弱的聲音會(huì)被同時(shí)存在的較強(qiáng)的聲音所掩蓋,使得人耳無(wú)法聽到。在音頻壓縮編碼中。利用掩蔽效應(yīng),就可以通過(guò)給不同頻率處的信號(hào)分量分配以不同的量化比特?cái)?shù)的方法來(lái)控制量化噪聲,使得噪聲的能量低于掩蔽閾值,從而使得人耳感覺不到量化過(guò)程的存在。在MPEGlayer2、3和AAC標(biāo)準(zhǔn)及DolbyAC-3標(biāo)準(zhǔn)中都采用了心理聲學(xué)模型,在目前的高質(zhì)量音頻標(biāo)準(zhǔn)中,心理聲學(xué)模型是一個(gè)最有效的算法模型。熵編碼:根據(jù)信息論的原理,可以找到最佳數(shù)據(jù)壓縮編碼的方法,數(shù)據(jù)壓縮的理論極限是信息熵。如果要求編碼過(guò)程中不丟失信息量,即要求保存信息熵,這種信息保存編碼叫熵編碼,它是根據(jù)信息出現(xiàn)概率的分布特性而進(jìn)行的,是一種無(wú)損數(shù)據(jù)壓縮編碼。常用的有霍夫曼編碼和算術(shù)編碼。在MPEGlayer1、2、3和AAC標(biāo)準(zhǔn)及ITUG.722.1標(biāo)準(zhǔn)中都使用了霍夫曼編碼;在MPEG4BSAC工具中則使用了效率更高的算術(shù)編碼。

3)數(shù)字音頻編碼的主要應(yīng)用

對(duì)數(shù)字音頻信息的編碼進(jìn)行壓縮的目的,是在不影響人們使用的情況下使數(shù)字音頻信息的數(shù)據(jù)量最少。通常用如下6個(gè)屬性來(lái)衡量:

①比特率;

②主觀/客觀的語(yǔ)音質(zhì)量;

③計(jì)算復(fù)雜度和對(duì)存儲(chǔ)器的要求;

④延遲;

⑤對(duì)于通道誤碼的靈敏度;

⑥信號(hào)的帶寬。由于不同的應(yīng)用,人們對(duì)數(shù)字音頻信息的要求是不同的,并且在選擇數(shù)字音頻信息編碼所采用的技術(shù)時(shí)也需要了解人們對(duì)音頻信息的各種應(yīng)用。目前數(shù)字音頻信息處理技術(shù)主要應(yīng)用于以下幾個(gè)方面:

(1)消費(fèi)電子類數(shù)字音響設(shè)備。CD唱機(jī)、數(shù)字磁帶錄音機(jī)(DAT)、MP3播放機(jī)以及MD(MiniDisc)唱機(jī)已經(jīng)廣泛地應(yīng)用了數(shù)字音頻技術(shù)。

(2)廣播節(jié)目制作系統(tǒng)。在聲音節(jié)目制作系統(tǒng),如錄音、聲音處理加工、記錄存儲(chǔ)、非線性編輯等環(huán)節(jié)使用了數(shù)字調(diào)音臺(tái)、數(shù)字音頻工作站等數(shù)字音頻設(shè)備。

(3)多媒體應(yīng)用。在多媒體上的應(yīng)用體現(xiàn)在VCD、DVD、多媒體計(jì)算機(jī)以及Internet。VCD采用MPEG-1編碼格式記錄聲音和圖像;DVD-Audio格式支持多種不同的編碼方式和記錄參數(shù),可選的編碼方式包括無(wú)損的MLP、DSD、DolbyAC-3、MPEG2-layer2Audio等,而且是可擴(kuò)充的、開放的,并可以應(yīng)用未來(lái)的編碼技術(shù);Internet上采用MP3的音頻格式傳輸聲音,以提高下載能力。

(4)廣播電視數(shù)字化。在廣播電視和數(shù)字音頻廣播系統(tǒng)中,聲音編碼采用MUSICAM編碼方法,符合MPEG-1Layer1高級(jí)音頻編碼。如當(dāng)今的數(shù)字電視采用的音頻標(biāo)準(zhǔn)就是DolbyAC-3和MPEG-layer2。

(5)通信系統(tǒng)。在通信系統(tǒng)中,必須對(duì)音頻進(jìn)行壓縮。傳統(tǒng)的PSTN電話中采用的是G.711和G.726的標(biāo)準(zhǔn);GSM移動(dòng)通信采用的是GSMHR/FR/EFR標(biāo)準(zhǔn);CDMA移動(dòng)通信采用的是3GPP2EVRC、QCELP8k、QCELP16k、4GV標(biāo)準(zhǔn);WCDMA第3代移動(dòng)通信采用的是3GPPAMR-NB、AMR-WB標(biāo)準(zhǔn)。另外在IPTV和移動(dòng)流媒體中,采用的是AMR-WB+和AAC的標(biāo)準(zhǔn)??傊?,根據(jù)應(yīng)用場(chǎng)合的不同,可以將數(shù)字音頻編碼分為如下兩種編碼:

語(yǔ)音編碼:針對(duì)語(yǔ)音信號(hào)進(jìn)行的編碼,主要應(yīng)用于實(shí)時(shí)語(yǔ)音通信中減少語(yǔ)音信號(hào)的數(shù)據(jù)量。典型的編碼標(biāo)準(zhǔn)有ITU-TG.711、G.722、G.723.1、G.729;GSMHR、FR、EFR;3GPPAMR-NB、AMR-WB;3GPP2QCELP8k、QCELP13k、EVRC、4GV-NB等。

音頻編碼:針對(duì)頻率范圍較寬的音頻信號(hào)進(jìn)行的編碼,主要應(yīng)用于數(shù)字廣播和數(shù)字電視廣播、消費(fèi)電子產(chǎn)品、音頻信息的存儲(chǔ)和下載等。典型的編碼有MPEG1/MPEG2的layer1、2、3和MPEG4AAC的音頻編碼。還有最新的ITU-TG.722.1、3GPPAMR-WB+?和3GPP24GV-WB,它們?cè)诘痛a率上的音頻表現(xiàn)也很不錯(cuò)。

4)音頻編碼標(biāo)準(zhǔn)發(fā)展現(xiàn)狀

(1)語(yǔ)音編碼標(biāo)準(zhǔn)發(fā)展現(xiàn)狀。

國(guó)際電信聯(lián)盟(ITU)主要負(fù)責(zé)研究和制定與通信相關(guān)的標(biāo)準(zhǔn),作為主要通信業(yè)務(wù)的電話通信業(yè)務(wù)中使用的語(yǔ)音編碼標(biāo)準(zhǔn)均是由ITU負(fù)責(zé)完成的。其中用于固定網(wǎng)絡(luò)電話業(yè)務(wù)使用的語(yǔ)音編碼標(biāo)準(zhǔn)如ITU-TG.711等主要在ITU-TSG15完成,并廣泛應(yīng)用于全球的電話通信系統(tǒng)之中。隨著Internet網(wǎng)絡(luò)及其應(yīng)用的快速發(fā)展,在2005年到2008年研究期內(nèi),ITU-T將研究和制定變速率語(yǔ)音編碼標(biāo)準(zhǔn)的工作轉(zhuǎn)移到主要負(fù)責(zé)研究和制定多媒體通信系統(tǒng)、終端標(biāo)準(zhǔn)SG16中。在歐洲、北美、中國(guó)和日本的電話網(wǎng)絡(luò)中通用的語(yǔ)音編碼器是8位對(duì)數(shù)量化器(相應(yīng)于64?kb/s的比特率)。該量化器所采用的技術(shù)在1972年由CCITT(ITU-T的前身)標(biāo)準(zhǔn)化為G.711。

在1983年,CCIT規(guī)定了32Kb/s的語(yǔ)音編碼標(biāo)準(zhǔn)G.721,其目標(biāo)是在通用電話網(wǎng)絡(luò)上的應(yīng)用(標(biāo)準(zhǔn)修正后稱為G.726)。這個(gè)編碼器價(jià)格雖低但卻提供了高質(zhì)量的語(yǔ)音。

至于數(shù)字蜂窩電話的語(yǔ)音編碼標(biāo)準(zhǔn),在歐洲,TCH-HS是歐洲電信標(biāo)準(zhǔn)研究所(ETSI)的一部分,由他們負(fù)責(zé)制定數(shù)字蜂窩標(biāo)準(zhǔn)。在北美,這項(xiàng)工作是由電信工業(yè)聯(lián)盟(TIA)負(fù)責(zé)執(zhí)行。在日本,由無(wú)線系統(tǒng)開發(fā)和研究中心(稱為RCR)組織這些標(biāo)準(zhǔn)化的工作。此外,國(guó)際海事衛(wèi)星協(xié)會(huì)(Inmarsat)是管理地球上同步通信衛(wèi)星的組織,也已經(jīng)制定了一系列的衛(wèi)星電話應(yīng)用標(biāo)準(zhǔn)。

(2)音頻編碼標(biāo)準(zhǔn)發(fā)展現(xiàn)狀。

音頻編碼標(biāo)準(zhǔn)主要由ISO的MPEG組來(lái)完成。MPEG1是世界上第一個(gè)高保真音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)。MPEG1是針對(duì)最多兩聲道的音頻而開發(fā)的。但隨著技術(shù)的不斷進(jìn)步和生活水準(zhǔn)的不斷提高,有的立體聲形式已經(jīng)不能滿足聽眾對(duì)聲音節(jié)目的欣賞要求,具有更強(qiáng)定位能力和空間效果的三維聲音技術(shù)得到蓬勃發(fā)展。而在三維聲音技術(shù)中最具代表性的就是多聲道環(huán)繞聲技術(shù)。目前有兩種主要的多聲道編碼方案:MUSICAM環(huán)繞聲和DolbyAC-3。MPEG2音頻編碼標(biāo)準(zhǔn)采用的就是MUSICAM環(huán)繞聲方案,它是MPEG2音頻編碼的核心,是基于人耳聽覺感知特性的子帶編碼算法。而美國(guó)的HDTV伴音則采用的是DolbyAC-3方案。MPEG2規(guī)定了兩種音頻壓縮編碼算法,一種稱為MPEG2后向兼容多聲道音頻編碼標(biāo)準(zhǔn),簡(jiǎn)稱MPEG2BC;另一種稱為高級(jí)音頻編碼標(biāo)準(zhǔn),簡(jiǎn)稱MPEG2AAC,因?yàn)樗cMPEG1不兼容,也稱MPEGNBC。

MPEG4的目標(biāo)是提供未來(lái)的交互多媒體應(yīng)用,它具有高度的靈活性和可擴(kuò)展性。與以前的音頻標(biāo)準(zhǔn)相比,MPEG4增加了許多新的關(guān)于合成內(nèi)容及場(chǎng)景描述等領(lǐng)域的工作。MPEG4將以前發(fā)展良好但相互獨(dú)立的高質(zhì)量音頻編碼、計(jì)算機(jī)音樂及合成語(yǔ)音等第一次合并在一起,并在諸多領(lǐng)域內(nèi)給予高度的靈活性。具有我國(guó)自主知識(shí)產(chǎn)權(quán)的廣晟數(shù)碼數(shù)字音頻編/解碼算法(簡(jiǎn)稱廣晟數(shù)碼音頻技術(shù),DRATM),是可以同時(shí)支持立體聲和多聲道環(huán)繞聲的數(shù)字音頻編/解碼技術(shù)。其算法的特點(diǎn)是采用自適應(yīng)時(shí)頻分塊(ATFT)方法實(shí)現(xiàn)對(duì)音頻信號(hào)的最優(yōu)分解,進(jìn)行自適應(yīng)量化和熵編碼。另外,由多家研究所、大學(xué)組成的中國(guó)音視頻編碼技術(shù)委員會(huì)(AVS)目前正在研究制定AVS第2部分音頻標(biāo)準(zhǔn),并已經(jīng)申請(qǐng)了部分專利。AVS音頻標(biāo)準(zhǔn)的指導(dǎo)原則是:在基本解決知識(shí)產(chǎn)權(quán)問題的前提下,制定具有國(guó)際先進(jìn)水平的中國(guó)音頻編碼/解碼標(biāo)準(zhǔn),使AVS音頻編碼的綜合技術(shù)指標(biāo)基本達(dá)到或超過(guò)MPEGAAC編碼技術(shù)的指標(biāo)。目前正在開展移動(dòng)部分AVS-M的音頻標(biāo)準(zhǔn)制定工作。

(3)常見的音頻文件格式。

RIFF(ResourceInterchangeFileFormat,資源交換文件格式)是在多媒體編程接口的規(guī)范,.wave文件是其中的一種格式。波形文件由許多不同類型的文件構(gòu)造塊組成,其中最主要的兩個(gè)文件構(gòu)造塊是格式塊(FormatChunk)和聲音數(shù)據(jù)塊(SoundDataChunk),格式塊包含有描述波形的重要參數(shù),例如采樣頻率和樣本精度等;聲音數(shù)據(jù)塊則包含有實(shí)際的波形聲音數(shù)據(jù)。

★WAVE(擴(kuò)展名為WAV):該格式記錄聲音的波形,故只要采樣率高、采樣字節(jié)長(zhǎng)、機(jī)器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質(zhì)量非常高,但這樣做的代價(jià)就是文件太大?!颩OD(擴(kuò)展名MOD、ST3、XT、S3M、FAR、669等):該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確、音色種類無(wú)限等優(yōu)點(diǎn)。但它也有一些致命弱點(diǎn),以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。

★MPEG-3(擴(kuò)展名MP3):現(xiàn)在最流行的聲音文件格式,因其壓縮率大,在網(wǎng)絡(luò)可視電話通信方面應(yīng)用廣泛,但和CD唱片相比,音質(zhì)不能令人非常滿意。

★RealAudio(擴(kuò)展名RA):這種格式真可謂是網(wǎng)絡(luò)的靈魂,強(qiáng)大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計(jì)的,因此主要目標(biāo)是壓縮比和容錯(cuò)性,其次才是音質(zhì)?!顲reativeMusicalFormat(擴(kuò)展名CMF):Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用于FM聲卡,但其兼容性也很差。

★CDAudio音樂CD(擴(kuò)展名CDA):唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對(duì)的純正、HIFI。但缺點(diǎn)是無(wú)法編輯,文件長(zhǎng)度太大?!颩IDI(擴(kuò)展名MID):目前最成熟的音樂格式,實(shí)際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn),其科學(xué)性、兼容性、復(fù)雜程度等各方面當(dāng)然遠(yuǎn)遠(yuǎn)超過(guò)本文前面介紹的所有標(biāo)準(zhǔn)(除交響樂CD、UnplugCD外,其他CD往往都是利用MIDI制作出來(lái)的),它的GeneralMIDI就是最常見的通行標(biāo)準(zhǔn)。作為音樂工業(yè)的數(shù)據(jù)通信標(biāo)準(zhǔn),MIDI能指揮各音樂設(shè)備的運(yùn)轉(zhuǎn),而且具有統(tǒng)一的標(biāo)準(zhǔn)格式,能夠模仿原始樂器的各種演奏技巧甚至無(wú)法演奏的效果,而且文件的長(zhǎng)度非常小??傊绻袑I(yè)的音源設(shè)備,那么要聽同一首曲子的HIFI程度依次是:

原聲樂器演奏→MIDI→CD唱片→MOD→所謂聲卡上的MIDI→CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。

另外,在多媒體材料中,存儲(chǔ)聲音信息的文件格式也是需要認(rèn)識(shí)的,共有WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種?!颳AV文件:Microsoft公司的音頻文件格式,它來(lái)源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣,可以得到一系列離散的采樣點(diǎn),以不同的量化位數(shù)(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。MicrosoftSoundSystem軟件SoundFinder可以轉(zhuǎn)換AIFSND和VOD文件到WAV格式。

★VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(soundblaster)使用的音頻文件格式。每個(gè)VOC文件由文件頭塊(headerblock)和音頻數(shù)據(jù)塊(datablock)組成。文件頭包含一個(gè)標(biāo)識(shí)版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊,如聲音數(shù)據(jù)靜音標(biāo)識(shí)、終止標(biāo)志及擴(kuò)展塊等?!颩IDI文件:MusicalInstrumentDigitalInterface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來(lái)的一個(gè)通信標(biāo)準(zhǔn),以規(guī)定計(jì)算機(jī)音樂程序、電子合成器和其他電子設(shè)備之間交換信息與控制信號(hào)的方法。MIDI文件中包含音符定時(shí)和多達(dá)16個(gè)通道的樂器定義,每個(gè)音符包括鍵通道號(hào)、持續(xù)時(shí)間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過(guò)程中的指令。

★RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標(biāo)記和文本?!颬CM文件:模擬音頻信號(hào)經(jīng)模/數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進(jìn)制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲霸卡提供的軟件中,可以利用VOC-HDR程序?yàn)镻CM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。

★AIF文件:Apple計(jì)算機(jī)的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。

5)數(shù)字音頻編碼技術(shù)的發(fā)展趨勢(shì)

(1)語(yǔ)音編碼技術(shù)的發(fā)展趨勢(shì)。

經(jīng)過(guò)多年的努力,業(yè)界在語(yǔ)音編碼領(lǐng)域取得了很多重要的進(jìn)展。目前在語(yǔ)音編碼領(lǐng)域的研究焦點(diǎn)主要有兩個(gè):

①在保證語(yǔ)音質(zhì)量的前提下,降低比特率。在采用的技術(shù)方面,從基于線性預(yù)測(cè),使用分析法,向采用參數(shù)編碼技術(shù)方向轉(zhuǎn)變。語(yǔ)音編碼主要的應(yīng)用目標(biāo)是蜂窩電話和應(yīng)答機(jī)。

②對(duì)傳統(tǒng)的語(yǔ)音編碼器進(jìn)行全頻帶擴(kuò)展,使其適應(yīng)音頻的應(yīng)用。例如,AMR從NB發(fā)展到WB,再到最新的WB+,現(xiàn)正在進(jìn)行全頻帶的擴(kuò)展工作;由G.729發(fā)展到G.729.1。除此之外,為適應(yīng)在Internet上傳送語(yǔ)音的需要,ITU-TSG16組正在研究和制定可變速率的語(yǔ)音編碼標(biāo)準(zhǔn)。變速率的語(yǔ)音編碼將是近期語(yǔ)音編碼發(fā)展的一個(gè)趨勢(shì)。

(2)音頻編碼技術(shù)的發(fā)展趨勢(shì)。

MPEG4的研究已經(jīng)開始了一段時(shí)間,也取得了一些進(jìn)展,但由于MPEG4本身設(shè)定的目標(biāo)比較遠(yuǎn)大,一些能力仍然在研究之中。隨著以IPTV業(yè)務(wù)為代表的信息檢索業(yè)務(wù)的開展,適合于在IP網(wǎng)絡(luò)上傳輸?shù)囊纛l信號(hào)編碼技術(shù),用于制作、檢索和存儲(chǔ)音頻信息的技術(shù)將成為發(fā)展的方向。8.2.2圖形與圖像信息處理

圖形圖像技術(shù)與應(yīng)用是工業(yè)造型、視覺傳達(dá)、平面設(shè)計(jì)、室內(nèi)設(shè)計(jì)、建筑設(shè)計(jì)和多媒體技術(shù)等專業(yè)的一項(xiàng)基本技能。圖形、圖像是一種人類視覺所感受到的具象化的信息,一幅圖片可以形象、生動(dòng)和直觀地表達(dá)大量的信息,具有文字和聲音無(wú)可比擬的優(yōu)點(diǎn)。圖形、圖像包含了比文字描述更為豐富、多樣,因而也更為完備的信息量。人類對(duì)于圖形、圖像信息具有一目了然的快速吸收能力。18世紀(jì),瑞士著名數(shù)學(xué)家歐拉從數(shù)學(xué)的實(shí)踐中總結(jié)出“千言萬(wàn)語(yǔ)不如一張圖”這句至理名言。歐拉這句名言對(duì)于我們學(xué)習(xí)圖像制作的指導(dǎo)意義在于,圖像制作不應(yīng)該僅僅是對(duì)言語(yǔ)的詮釋,而應(yīng)該突破言語(yǔ)的樊籠,創(chuàng)造視覺形象的全新境界??傊淖置襟w引導(dǎo)人們通過(guò)邏輯思維給人以直觀的切身感受。20世紀(jì)下半葉又進(jìn)入了視覺形象的時(shí)代,這是人類歷史螺旋發(fā)展的一個(gè)新臺(tái)階。

圖形圖像技術(shù)是一門集圖形、圖像、動(dòng)畫、視頻等信息處理的技術(shù),它可以通過(guò)外部設(shè)備接收外部的圖形和圖像等信息,經(jīng)過(guò)計(jì)算機(jī)加工處理后,以圖形或圖像等多種形式輸出,實(shí)現(xiàn)輸入和輸出方式的多元化,改變了計(jì)算機(jī)早期只能處理文字、數(shù)據(jù)的局限,使人們的工作和生活更加豐富多彩。對(duì)于計(jì)算機(jī)來(lái)說(shuō),圖形和圖像是兩種很不相同的媒體,圖形學(xué)和圖像處理技術(shù)在計(jì)算機(jī)發(fā)展初期是兩門相對(duì)獨(dú)立的學(xué)科。然而,圖形與圖像在很多場(chǎng)合下又是很難區(qū)分的。隨著多媒體技術(shù)的飛速發(fā)展,圖形與圖像的結(jié)合日益緊密。圖像軟件往往包含圖形繪制功能,而圖形軟件又常常具備圖像處理功能。

1.圖像的分類

在計(jì)算機(jī)中的圖像都是以數(shù)字的方式進(jìn)行記錄、處理和存儲(chǔ)的,所以圖像也可以說(shuō)成是數(shù)字化圖像。計(jì)算機(jī)生成的圖形圖像主要分為兩類:一類為矢量圖形,另一類為位圖圖像,如圖8.8所示。圖8.8矢量圖形與位圖圖像

(1)矢量圖形。矢量圖形(也稱為向量圖形)是由數(shù)學(xué)方程所定義的直線和曲線組成。矢量圖形與分辨率無(wú)關(guān),可以將它們進(jìn)行任意縮放也不會(huì)失真。

(2)位圖圖像。位圖圖像(也稱為點(diǎn)陣圖像)是由許多點(diǎn)組成的,其中的每一個(gè)點(diǎn)稱為像素,每個(gè)像素可以具有不同的顏色和亮度,它是組成位圖圖像的基本單位。位圖圖像精細(xì)程度取決于圖像的分辨率,并且處理也比較簡(jiǎn)單方便,但它的最大缺點(diǎn)是:圖像文件保存的是組成位圖的各像素點(diǎn)的顏色信息,顏色的種類越多,圖像文件越大。在將圖像文件放大、縮小和旋轉(zhuǎn)時(shí),會(huì)產(chǎn)生失真。

2.圖形和圖像之間的關(guān)系

(1)矢量圖形的基本元素是圖元,也就是圖形指令。而位圖圖像的基本元素是像素,其顯示要更加逼真一些。

(2)圖形的顯示過(guò)程是按照?qǐng)D元的順序進(jìn)行的,而圖像的顯示過(guò)程是按照位圖圖像中所安排的像素順序進(jìn)行的,與圖像內(nèi)容無(wú)關(guān)。

(3)圖形縮放變換后不會(huì)發(fā)生變形失真,而圖像的變換則會(huì)發(fā)生失真。

(4)圖形能以圖元為單位單獨(dú)進(jìn)行修改、編輯等操作,且局部處理不影響其他部分,而圖像則不行。因?yàn)樵趫D像中沒有關(guān)于圖像內(nèi)容的獨(dú)立單位,只能對(duì)像素或像素塊進(jìn)行

處理。

(5)圖形實(shí)際上是對(duì)圖像的抽象,而這種抽象可能會(huì)丟失原始圖像的一些信息(可能對(duì)應(yīng)用有用,也可能對(duì)應(yīng)用無(wú)用)。

通過(guò)軟件,矢量圖可以轉(zhuǎn)化為位圖,而位圖轉(zhuǎn)化為矢量圖就需要經(jīng)過(guò)復(fù)雜的數(shù)據(jù)處理,而且生成的矢量圖的質(zhì)量不能和原來(lái)的圖像比擬。對(duì)位圖圖像和矢量圖形綜合起來(lái)看,位圖適合處理顏色變化復(fù)雜、細(xì)致的圖案,可以充分發(fā)揮其顏色表現(xiàn)力,如照片、招貼畫等,適合處理圖案圖像;矢量圖則適合處理顏色變化較少、以幾何圖案為主的簡(jiǎn)潔明快的圖案,可以充分發(fā)揮其線條表現(xiàn)力和文件較小的特點(diǎn),如計(jì)算機(jī)輔助設(shè)計(jì)(ComputerAidedDesign,CAD)、計(jì)算機(jī)輔助制造、計(jì)算機(jī)動(dòng)畫(建模階段)、創(chuàng)意設(shè)計(jì)、可視化科學(xué)計(jì)算、地形地貌和自然資源模擬以及卡通畫等領(lǐng)域。

3.顏色模式

顏色模式是指同一屬性下的不同顏色的集合。不同的顏色模式對(duì)顏色的表現(xiàn)會(huì)有較大差異。常見的顏色模式有位圖模式、灰度模式、RGB模式、CMYK模式、SHB模式和Lab模式等。

(1)位圖模式。該模式用兩種顏色(黑和白)來(lái)表示圖像中的像素。位圖模式的圖像也稱為黑白圖像。要想將其他模式轉(zhuǎn)換為位圖模式,應(yīng)先轉(zhuǎn)換為灰度模式,再轉(zhuǎn)換為位圖模式。

(2)灰度模式。該模式可以使用多達(dá)256級(jí)灰度來(lái)表現(xiàn)圖像,使圖像的過(guò)渡更平滑細(xì)膩。灰度圖像的每個(gè)像素有一個(gè)0(黑色)到255(白色)之間的亮度值。當(dāng)一個(gè)彩色圖像被轉(zhuǎn)換為灰度模式時(shí),所有的顏色信息都將從圖像中除去。

(3)RGB顏色模式。該模式是色光的色彩模式。將紅(Red)、綠(Green)和藍(lán)(Blue)三種基色按照從0(黑)到255(白色)的亮度值在每個(gè)色階中分配,從而指定其色彩。當(dāng)不同亮度的基色混合后,便會(huì)產(chǎn)生出256×256×256種顏色,約為1670萬(wàn)種。由于RGB是由三種色彩疊加形成了其他色彩,所以,這種色彩模式是一種加色模式。

(4)CMYK顏色模式。該模式是一種印刷模式。其中四個(gè)字母分別指青(Cyan)、洋紅(Magenta)、黃(Yellow)、黑(Black),在印刷中代表四種顏色的油墨。CMYK模式在本質(zhì)上與RGB模式?jīng)]有什么區(qū)別,只是產(chǎn)生色彩的原理不同,在RGB模式中由光源發(fā)出的色光混合生成顏色,而在CMYK模式中由光線照到物體上時(shí),這個(gè)物體將吸收一部分光線,并將剩下的光線進(jìn)行反射,反射的光線就是物體的顏色。CMYK模式是一種減色模式。

(5)HSB模式。該模式是基于人眼對(duì)色彩的觀察來(lái)定義的,在此模式中,所有的顏色都用色相、飽和度和亮度三個(gè)特性來(lái)描述。

(6)Lab模式。該模式是由國(guó)際照明委員會(huì)(CIE)于1976年公布的一種色彩模式。Lab顏色模式是以一個(gè)亮度分量L及兩個(gè)顏色分量a和b來(lái)表示顏色的。其中L的取值范圍是0~100,a分量代表由綠色到紅色的光譜變化,而b分量代表由藍(lán)色到黃色的光譜變化,a和b的取值范圍均為?-120~120。

Lab模式所包含的顏色范圍最廣,它解決了由于使用不同的顯示器或打印設(shè)備所造成的顏色復(fù)制的差異,也就是說(shuō),與光線及設(shè)備無(wú)關(guān)。彩色模式的色域如圖8.9所示。圖8.9彩色模式的色域示意圖

4.常用圖像文件格式

圖形的生成算法以及曲線構(gòu)成的理論等對(duì)于非專業(yè)用戶來(lái)說(shuō)過(guò)于復(fù)雜,沒有必要細(xì)加研究。我們需要了解的是常用的圖形文件有哪些格式,這些不同的格式分別對(duì)應(yīng)哪些圖形軟件,相互之間如何轉(zhuǎn)換等。要特別注意的是,圖形文件總是與圖形軟件一一對(duì)應(yīng)的,這是因?yàn)閳D形文件中存儲(chǔ)的是生成圖形的算法序號(hào),而每一種圖形軟件的生成算法是完全不同的。

(1)AdobeIllustrator(.ai)。Adobe公司的Illustrator圖形軟件是多媒體圖形軟件的先驅(qū),該軟件于1987年推出,率先在文件層面上實(shí)現(xiàn)了圖形與圖像的集成,從而開創(chuàng)了多媒體時(shí)代圖形軟件的新紀(jì)元。Adobe公司支持的?.eps格式是一種跨平臺(tái)的文件格式,與應(yīng)用軟件無(wú)關(guān),與系統(tǒng)平臺(tái)無(wú)關(guān),甚至還與硬件無(wú)關(guān)。也就是說(shuō),在計(jì)算機(jī)中的?.eps格式文件,可以直接送到印刷機(jī)輸出,而無(wú)須作任何轉(zhuǎn)換。

Illustrator除了處理.ai格式和.eps格式文件以外,還可以處理其他格式的圖形文件格式,Illustrator的導(dǎo)入功能包含在打開命令中,在打開和導(dǎo)入文件格式列表中,文本、圖形和圖像等不同類型的文件都羅列其間,例如有Text、Word、MSRTF、AcrobatPDF、Photoshop等軟件可處理的文件格式。

(2)MacromediaFreeHand(.fh8)。Macromedia公司的FreeHand圖形軟件則著重于圖形與文本的集成,該軟件在圖形軟件基本功能的基礎(chǔ)上,最大限度地?cái)U(kuò)展了文本處理功能,真正做到了多媒體意義上的圖文并茂。FreeHand的本位格式文件的擴(kuò)展名為.fhn,這里n是版本號(hào),.fh8就是版本8的文件格式。與Illustrator一樣,F(xiàn)reeHand除了處理本位格式?.fhn文件以外,還可以通過(guò)導(dǎo)入的方式來(lái)處理其他格式的文件。

(3)CorelDRAW(.cdr)。加拿大軟件公司Corel公司的圖形軟件DRAW于1989年推出,該軟件在功能集成方面后來(lái)居上,在圖形圖像專業(yè)軟件領(lǐng)域中遙遙領(lǐng)先,業(yè)界稱為“矢量之王”。CorelDRAW集成了圖形、圖像、文本以及排版等功能,為真正實(shí)現(xiàn)計(jì)算機(jī)圖像制作的軟件平臺(tái)一體化邁出了堅(jiān)實(shí)的一步。CorelDRAW的本位格式是?.cdr,跟所有的圖形軟件一樣,也具備向下兼容的特性,目前已經(jīng)升級(jí)到了版本12。CorelDRAW除了處理?.cdr文件之外,還可以通過(guò)導(dǎo)入的方式來(lái)處理其他格式的各類文件。

(4)3DSMax。這是Autodesk公司推出的三維建模、渲染、動(dòng)畫制作軟件,其基本設(shè)計(jì)思想是通過(guò)建模完成對(duì)物品的形狀設(shè)計(jì),通過(guò)材質(zhì)的選擇和編輯實(shí)現(xiàn)物品的質(zhì)感設(shè)計(jì),通過(guò)光源類型的選擇和燈光調(diào)整賦予物品適當(dāng)?shù)囊曈X效果,最后通過(guò)渲染完成物品的基本設(shè)計(jì)。

(5)AutoCAD。這是Autodesk公司推出的一個(gè)基于矢量繪圖的更為專業(yè)化的計(jì)算機(jī)輔助設(shè)計(jì)軟件,廣泛應(yīng)用于建筑、城市公共基礎(chǔ)設(shè)施、機(jī)械等設(shè)計(jì)領(lǐng)域。圖8.10給出了兩張矢量工具繪制圖片。圖8.10矢量工具繪制圖片

5.圖像分辨率及常見圖像文件格式

1)分辨率

(1)圖像分辨率:指圖像文件中保存的圖像網(wǎng)格采樣點(diǎn)數(shù),顯示實(shí)際包含的圖像信息量,一般用像素(Pixel)表示。分辨率越高,圖像就越清晰。

(2)屏幕分辨率:每屏所包含的像素來(lái)表示。通常取決于顯示器以及顯示卡的類型。屏幕分辨率是屏幕橫向包含的像素點(diǎn)數(shù)乘以縱向包含的像素點(diǎn),例如有640×480、800×600、1024×768像素等。

(3)掃描分辨率:用每英寸中所包含的采樣點(diǎn)數(shù)(dotperinch)來(lái)表示。掃描儀的分辨率分為光學(xué)分辨率和輸出分辨率。

(4)光學(xué)分辨率:是硬件技術(shù)指標(biāo),是掃描儀真正能掃描到的分辨率。常見的為800~3200dpi等。

(5)輸出分辨率:是經(jīng)過(guò)軟件強(qiáng)化以及插值補(bǔ)點(diǎn)之后所產(chǎn)生的分辨率,大約為光學(xué)分辨率的3~4倍。

(6)打印分辨率:用每英寸中所打印的點(diǎn)數(shù)(dpi)來(lái)表示。一般24針的針式打印機(jī)可達(dá)180dpi,噴墨打印機(jī)則為300~720dpi,激光打印機(jī)的分辨率可達(dá)600~1200dpi。

2)圖像文件格式

圖像文件格式是千變?nèi)f化的,主要由兩方面的因素互動(dòng)的結(jié)果,首先是壓縮算法的因素,其次就是色彩的表示方法。下面介紹一些常用的圖像文件格式。

(1)PSD:Photoshop軟件的本位格式,兼容所有的圖像類型,支持16種額外通道和基于向量的路徑。用PSD格式存盤,保存的圖像信息最完整,同時(shí)所占據(jù)的硬盤存儲(chǔ)容量也最大。

(2)BMP:Microsoft公司定義的Bitmap格式是一種與設(shè)備無(wú)關(guān)的圖像格式,采用索引色。兼容DOS、Windows、WindowsNT和OS/2,不兼容Macintosh。通常的Windows格式是不壓縮的,相同的分辨率就有相同的文件大小,與圖像所含的視覺內(nèi)容無(wú)關(guān)。與PSD格式相比,BMP格式?jīng)]有通道、路徑等附加信息,所占據(jù)的硬盤存儲(chǔ)容量也就小許多。

(3)?GIF(GraphicsInterchangeFormat,圖像互換格式):是CompuServe公司制定的圖像存儲(chǔ)規(guī)范,文件小,兼容索引色、線畫稿和灰度類型。GIF采用Hash散列壓縮編碼,壓縮率較高,同樣的圖像內(nèi)容,用GIF格式要比用PSD格式小20倍。除了壓縮效率高之外,GIF格式的另一個(gè)特點(diǎn)是動(dòng)畫格式的兼容性。因此,GIF格式是網(wǎng)頁(yè)設(shè)計(jì)的最佳選擇。

(4)JPG:是JPEG圖像格式的擴(kuò)展名。JPEG(JointPhotographicExpertsGroup)直譯為聯(lián)合圖片專家組。從1980年開始,國(guó)際標(biāo)準(zhǔn)化組織ISO和國(guó)際電話電報(bào)咨詢委員會(huì)CCITT聯(lián)合進(jìn)行了視頻壓縮的標(biāo)準(zhǔn)化研究,歷時(shí)10年,于1991年完成了JPEG標(biāo)準(zhǔn)。JPG格式的特點(diǎn)是在保持圖像的高精度的前提下,獲得高壓縮比,這是GIF格式所望塵莫及的。專業(yè)攝影師一般都采用JPG格式,與PSD格式相比,JPG格式只占十幾分之一?;ヂ?lián)網(wǎng)上高精度的圖像也都是JPG格式。用Photoshop制作圖像時(shí),一般情況下,制作的中間過(guò)程用PSD格式保存,最后完成稿則用JPG格式保存,這樣的做法有利于節(jié)省存儲(chǔ)空間??傮w上說(shuō),對(duì)于低壓縮率高質(zhì)量的圖片使用JPG文件是一個(gè)恰當(dāng)?shù)倪x擇。

(5)TIFF(TaggedImageFileFormat):是由Aldus公司和Microsoft聯(lián)合開發(fā)的一種24位圖像格式。它具有可移植性好的優(yōu)點(diǎn),兼容多種平臺(tái),如Macintosh、UNIX等。描述圖像的細(xì)微層次信息量大,包含特殊信息阿爾法通道,允許所有操作,有利于原稿階調(diào)和色彩復(fù)制。TIFF采用哈夫曼行程編碼。與PSD格式相比,TIFF格式的兼容性特別好,比如,3DSMAX/VIZ只認(rèn)得TIFF格式的通道信息。

(6)EPS(EncapsulatedPostScript):該格式在文件層面上實(shí)現(xiàn)了圖形與圖像的集成,是一種跨平臺(tái)的文件格式,與應(yīng)用軟件無(wú)關(guān),與系統(tǒng)平臺(tái)無(wú)關(guān),甚至還與硬件無(wú)關(guān)。也就是說(shuō),在計(jì)算機(jī)中的EPS格式文件可以直接送到印刷機(jī)輸出,而無(wú)須作任何轉(zhuǎn)換。印刷排版行業(yè)多用此格式。

(7)PCX:是Xsoft公司的專用格式,適用于索引色和線畫稿,有多種版本。Photoshop支持PCXV.5。PCX采用掃描線行程壓縮編碼。

(8)TGA(Targa):TrueVision的專用顯示卡定義,是一種24位圖像格式,兼容Macintosh。

6.常見的圖像處理技巧

(1)圖像變換:快速傅里葉變換(FFT)、離散余弦變換(DCT)、霍特林變換(HT)、哈達(dá)馬變換(HadamardTransform)。

(2)圖像編碼:微分脈沖編碼(DPC)、線性預(yù)測(cè)編碼(LDC)、行程編碼(RLE)、哈夫曼編碼(HuffmanCode)。

(3)圖像復(fù)原:線性算子復(fù)原法、反向?yàn)V波器、最小二乘法。

(4)圖像增強(qiáng):對(duì)比度擴(kuò)展法(銳化)、鄰域平均法(平滑)、同態(tài)濾波(模型化)。

(5)彩色表示:標(biāo)準(zhǔn)色度學(xué)模型、孟塞爾表色法、色光加色法、色料減色法、色相分量法。

(6)分割描述:點(diǎn)相關(guān)、區(qū)域相關(guān)、拓?fù)涿枋?區(qū)域)、關(guān)系描繪(串文法)、測(cè)度描述。

這些算法的基本原理、設(shè)計(jì)細(xì)節(jié)和實(shí)現(xiàn)方法等,要具備相當(dāng)?shù)臄?shù)理基礎(chǔ)才能搞懂,對(duì)于圖像制作軟件應(yīng)用者來(lái)說(shuō),沒有必要深入探討。從應(yīng)用的層面歸納起來(lái),這些圖像處理技術(shù)可以概括為以下幾個(gè)方面。

(1)像質(zhì)改善:圖像增強(qiáng)、銳化、平滑、校正、圖像整飾、色彩處理。

(2)圖像分析:邊緣檢測(cè)、區(qū)域分割、特征抽取、紋理分析、圖像匹配、模式識(shí)別。

(3)圖像重建:通過(guò)對(duì)離散圖像進(jìn)行線性空間內(nèi)查獲線性空間濾波來(lái)重新獲得連續(xù)圖像。

(4)數(shù)據(jù)壓縮:圖像數(shù)字化、圖像壓縮編碼、圖像分形技術(shù)、圖像小波理論。多年來(lái),圖像處理與圖形學(xué)兩者獨(dú)立發(fā)展、互不相干。但從20世紀(jì)90年代以后,出現(xiàn)了圖像生成技術(shù)與圖像處理相結(jié)合的趨勢(shì),這種趨勢(shì)不僅反映在基于圖像的實(shí)時(shí)動(dòng)態(tài)繪制技術(shù)中,而且突出地表現(xiàn)在科學(xué)計(jì)算可視化這一新興領(lǐng)域中??茖W(xué)計(jì)算可視化是將科學(xué)計(jì)算過(guò)程中的數(shù)據(jù)及結(jié)果數(shù)據(jù)轉(zhuǎn)換為圖像,實(shí)際上也包括了工程計(jì)算可視化和測(cè)量數(shù)據(jù)可視化,其核心是三維數(shù)據(jù)場(chǎng)的可視化。這一技術(shù)可以應(yīng)用于氣象預(yù)報(bào)、石油地質(zhì)勘探、環(huán)境保護(hù)、核爆炸模擬、計(jì)算流體力學(xué)、天體物理及醫(yī)學(xué)等許多領(lǐng)域。圖像處理是三維數(shù)據(jù)場(chǎng)可視化的重要組成部分。8.2.3動(dòng)畫、視頻信息處理

1.什么是動(dòng)畫

動(dòng)畫的英文Animation源自于拉丁文字根的anima,意思為靈魂,動(dòng)詞animare是賦予生命,引申為使某物活起來(lái)的意思,所以animation可以解釋為經(jīng)由創(chuàng)作者的安排,使原本不具生命的東西像獲得生命一般地活動(dòng)。

動(dòng)畫是通過(guò)連續(xù)播放一系列由人工或計(jì)算機(jī)繪制的連續(xù)圖像或圖形畫面,給視覺造成連續(xù)變化的圖畫。它包括了造型動(dòng)畫和幀動(dòng)畫。造型動(dòng)畫是通過(guò)改變畫面物體的坐標(biāo)來(lái)實(shí)現(xiàn)運(yùn)動(dòng)的;幀動(dòng)畫是一系列畫面,其中對(duì)需要?jiǎng)幼鞯牡胤阶髁宋⑿∽兓?,?dāng)它們連續(xù)以每秒15幀以上速度播放時(shí),人就感到像運(yùn)動(dòng)起來(lái)。

2.什么是視頻

視頻則是使用攝像設(shè)備獲取的自然人物和景物,并拍成連續(xù)的幀圖像,并以一定的速度連續(xù)進(jìn)行播放。

3.動(dòng)畫與視頻的關(guān)系

若干幅位圖快速地連續(xù)播放就構(gòu)成了視頻,而矢量圖形連續(xù)變化就構(gòu)成了一個(gè)動(dòng)畫。在實(shí)際工作中,這兩個(gè)詞語(yǔ)有時(shí)并不是嚴(yán)格區(qū)分的,比如說(shuō)如果用Flash制作的動(dòng)畫通常不會(huì)說(shuō)是視頻,但是如果使用3dsmax等軟件制作出的三維動(dòng)畫,實(shí)際上并不是矢量的,而是已經(jīng)逐幀渲染為位圖了

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論