隱馬爾科夫模型_第1頁
隱馬爾科夫模型_第2頁
隱馬爾科夫模型_第3頁
隱馬爾科夫模型_第4頁
隱馬爾科夫模型_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隱馬爾科夫模型一、引入二、定義三、隱馬爾科夫模型的計(jì)算 (1)估值問題 (2)解碼問題 (3)訓(xùn)練問題四、隱馬爾科夫各種結(jié)構(gòu)HMM的由來 o 1870年,俄國(guó)有機(jī)化學(xué)家Vladimir V. Markovnikov第一次提出馬爾科夫模型o 馬爾可夫模型和馬爾可夫鏈o 隱式馬爾可夫模型(HMM)馬爾可夫性o 如果一個(gè)過程的“將來”僅依賴“現(xiàn)在”而不依賴“過去”,則此過程具有馬爾可夫性,或稱此過程為馬爾可夫過程o X(t+1) = f(X(t)馬爾可夫鏈o 時(shí)間和狀態(tài)都離散的馬爾科夫過程稱為馬爾科夫鏈。設(shè)在時(shí)刻t的隨機(jī)變量用表示,其觀察值用表示,則如果當(dāng),,,的前提下,的概率是如下式所示,則稱為n

2、階Markov過程。 (1)這里表示,表示,表示,。特別的當(dāng)如下式成立時(shí),則稱其為1階Markov過程,又叫單純馬爾可夫過程。 (2)即:系統(tǒng)在任一時(shí)刻所處的狀態(tài)只與此時(shí)刻的前一時(shí)刻所處的狀態(tài)有關(guān)。而且,為了處理問題方便,考慮式(2)右邊的概率與時(shí)間無關(guān)的情況,即: (3)同時(shí)滿足: (4) (5)這里是當(dāng)時(shí)刻t從狀態(tài)i到時(shí)刻t1時(shí)的狀態(tài)j的轉(zhuǎn)移概率,當(dāng)這個(gè)轉(zhuǎn)移概率是與時(shí)間無關(guān)的常數(shù)時(shí),又叫,是具有常數(shù)轉(zhuǎn)移概率的Markov過程。隱式馬爾可夫模型(HMM) HMM類似于一階Markov過程。不同點(diǎn)是HMM是一個(gè)雙內(nèi)嵌式隨機(jī)過程,即HMM是由兩個(gè)隨機(jī)過程組成,一個(gè)是狀態(tài)轉(zhuǎn)移序列,它對(duì)應(yīng)著一個(gè)單純

3、Markov過程;另一個(gè)是每次轉(zhuǎn)移時(shí)輸出的符號(hào)組成的符號(hào)序列。這兩個(gè)隨機(jī)過程,其中狀態(tài)轉(zhuǎn)移隨機(jī)過程是不可觀測(cè)的,只能通過另一個(gè)隨機(jī)過程的輸出觀察序列觀測(cè)。設(shè)狀態(tài)轉(zhuǎn)移序列為S=,輸出的符號(hào)序列為O=,。由于模型本身是看不見的,即模型的狀態(tài)不為外界所見,只能根據(jù)觀察序列推導(dǎo)出來,所以稱為隱馬爾可夫模型。 Markov鏈(p, A)隨機(jī)過程(B)狀態(tài)序列觀察值序列S1, S 2, ., S To1, o2, ., oT圖1 HMM的組成示意圖離散HMM中的元素對(duì)于語音識(shí)別使用的HMM可以用下面六個(gè)模型參數(shù)來定義,即:S:模型中狀態(tài)的有限集合,即模型由哪幾個(gè)狀態(tài)組成。設(shè)有N個(gè)狀態(tài),S|i=1,2,,N

4、。記t時(shí)刻模型所處狀態(tài)為,。 O:輸出的觀察值符號(hào)的集合,即每個(gè)狀態(tài)對(duì)應(yīng)的可能的觀察值數(shù)目。記M個(gè)觀察值為,記t時(shí)刻觀察到的觀察值為其中。A:狀態(tài)轉(zhuǎn)移概率的集合。所有轉(zhuǎn)移概率可以構(gòu)成一個(gè)轉(zhuǎn)移概率矩陣,即: 其中是從狀態(tài)到狀態(tài)的轉(zhuǎn)移概率,且有,。B:輸出觀測(cè)值概率的集合。其中,其中根據(jù)B可將HMM分為連續(xù)型和離散型HMM等。 (離散型HMM) (連續(xù)型HMM) :系統(tǒng)初始狀態(tài)概率的集合,表示初始狀態(tài)是的概率,即: (6) F:系統(tǒng)終了狀態(tài)的集合。 Markov模型沒有終了狀態(tài)的概念,只是在語音識(shí)別里用的Markov模型要設(shè)定終了狀態(tài)。 這樣,可以記一個(gè)HMM為M=S,O,A,B,F,為了便于表示

5、,常用下面的形式表示一個(gè)HMM,即簡(jiǎn)寫為M=A,B,。HMM可以分為兩部分,一個(gè)是Markov鏈,由,A描述,產(chǎn)生的輸出為狀態(tài)序列。另一個(gè)隨機(jī)過程,由B描述,產(chǎn)生的輸出為觀察符號(hào)序列。HMM:示例圖2 兩個(gè)狀態(tài)的HMMHMM的三個(gè)基本問題HMM核心理論是解決三個(gè)基本問題:1.已知觀測(cè)序列O=,和模型,如何有效計(jì)算在給定模型的條件下產(chǎn)生觀測(cè)序列O的條件概率最大。2.已知觀測(cè)序列O=,和模型,如何選擇相應(yīng)的在某種意義上最佳的(能最好解釋觀測(cè)序列的)狀態(tài)序列S。3.如何調(diào)整模型參數(shù)以使條件概率最大。第一個(gè)問題是評(píng)估問題,實(shí)際就是一個(gè)識(shí)別的問題,即已知模型和一個(gè)觀測(cè)序列O,如何計(jì)算由該模型產(chǎn)生出該觀測(cè)

6、序列的概率,問題1的求解能選擇出與給定觀測(cè)序列最匹配的模型。第二個(gè)問題目的是找出模型中隱藏的部分,即找出正確的狀態(tài)序列(,這是一個(gè)典型的估計(jì)問題。第三個(gè)問題是模型的參數(shù)最優(yōu)化,通過訓(xùn)練自適應(yīng)調(diào)整模型參數(shù)使之適應(yīng)于訓(xùn)練序列并最優(yōu)化,從而得到實(shí)際應(yīng)用中最好的模型,這是一個(gè)參數(shù)訓(xùn)練問題。三個(gè)問題對(duì)應(yīng)算法分別為:前后向算法,Viterbi算法和Baum-Welch算法。隱馬爾可夫模型的計(jì)算以孤立詞識(shí)別為例,設(shè)有W個(gè)單詞要識(shí)別,我們可預(yù)先得到這W個(gè)詞的標(biāo)準(zhǔn)樣本,第一步就是為每一個(gè)詞建立一個(gè)N個(gè)狀態(tài)的HMM模型。這就要用到問題3(給定觀察下求模型參數(shù))。為了理解模型狀態(tài)的物理意義,可利用問題二將每一個(gè)單詞

7、的狀態(tài)序列分割為一些狀態(tài),再研究導(dǎo)致與每一狀態(tài)響應(yīng)的觀察結(jié)果的那些特征。最后,識(shí)別單詞就要利用問題1,即對(duì)給定觀察結(jié)果找出一個(gè)最合適的模型,使得最大。第一個(gè)問題的求解給定觀察序列O=,和模型,求解,最直接的方法就是通過窮舉所有的長(zhǎng)度為狀態(tài)序列。共有個(gè)狀態(tài)序列,考慮其中一個(gè):,是初始狀態(tài)。給定S,觀察序列O出現(xiàn)的概率為 (7)因?yàn)楦饔^察量假設(shè)是統(tǒng)計(jì)獨(dú)立的,因此得到: (8)上面的狀態(tài)序列的概率為: (9)O和S的聯(lián)合概率為: (10)將聯(lián)合概率中的所有s序列累加就得到O的概率(給定模型參數(shù))。即: (11)根據(jù)上式,要計(jì)算,需要規(guī)模的計(jì)算量。如果對(duì)于N=5(狀態(tài)數(shù)),T=100(觀察量),需要2

8、*100*5100次計(jì)算。前向后向算法定義前向概率為:=即狀態(tài)模型為,部分觀測(cè)序列為,且對(duì)應(yīng)t時(shí)刻HMM的狀態(tài)為時(shí)的概率,利用計(jì)算輸出條件概率1.初始化 (12) 2.選代計(jì)算 (13)3.終止計(jì)算 (14)圖3 狀態(tài)轉(zhuǎn)移示例其中步驟2的迭代過程為前向算法的核心:時(shí)刻t+1的狀態(tài)j可由時(shí)刻t的i狀態(tài)到達(dá)。其中。終止條件中: 。 (15)前向算法只需要次計(jì)算。對(duì)于N=5,T=100,只需要3000次計(jì)算。后向算法定義后向概率為,計(jì)算過程同前向算法類似。第二個(gè)問題的求解(Viterbi算法)第二個(gè)問題是給定觀察序列O以及模型參數(shù),選擇相應(yīng)的在某種意義上最佳的(能最好解釋觀測(cè)序列的)狀態(tài)序列S。Vi

9、terbi算法在最佳意義上確定一個(gè)狀態(tài)序列S,這個(gè)最佳的定義,是指使最大時(shí)確定的序列。定義為時(shí)刻t沿一條路經(jīng)且,產(chǎn)生出觀測(cè)序列的最大概率,即有: (16) 所以: (17)那么,求最佳狀態(tài)序列S的算法過程:1.初始化 (18) (19)2.選代計(jì)算 (20) (21)3.終止計(jì)算 (22) (23)4狀態(tài)序列求取 (24)其中:為t時(shí)刻處于狀態(tài)時(shí)的累積輸出概率,為t時(shí)刻處于狀態(tài)時(shí)的前序狀態(tài)號(hào),為最優(yōu)狀態(tài)序列中t時(shí)刻所處的狀態(tài),為最終的輸出概率。對(duì)語音信號(hào)處理而言,動(dòng)態(tài)范圍很大,不同的狀態(tài)序列S使的值差別很大,而是權(quán)重最大的部分部分,因此常將它們等價(jià)使用,所以Viterbi算法也用來代替計(jì)算。第

10、三個(gè)問題的求解(Baum-Welch算法)HMM的第三個(gè)問題是最復(fù)雜的一個(gè),它是HMM模型參數(shù)的訓(xùn)練問題,即求取,使得最大,這是一個(gè)泛函極值問題。由于給定的序列有限,因此不存在一種最佳方法來估計(jì),Baum-Welch算法利用遞歸的思想,使局部最大,最后得到模型參數(shù)。定義為給定訓(xùn)練觀測(cè)序列O和參數(shù)模型時(shí),時(shí)刻t馬爾可夫鏈處于狀態(tài)i而時(shí)刻t1處于狀態(tài)j的概率: (25)根據(jù)前面前向和后向變量的定義:= (26)定義為給定觀察序列O和模型參數(shù),t時(shí)刻處于狀態(tài)的概率。 (27)顯然:就是從狀態(tài)i發(fā)出的狀態(tài)轉(zhuǎn)移數(shù)的期望值。是從狀態(tài)i到j(luò)的狀態(tài)轉(zhuǎn)移數(shù)的期望值。推導(dǎo)HMM的模型為: (28) (29) (3

11、0)HMM參數(shù)的求取過程為根據(jù)觀察序列O和初始模型,由重估公式得到新的一組參數(shù): ,和,即新的模型??梢宰C明,即由重估公式得到的要比在觀察值O上要好。HMM模型的構(gòu)建 根據(jù)HMM的狀態(tài)轉(zhuǎn)移矩陣(A參數(shù))的不同,決定了HMM的不同結(jié)構(gòu),下面是三種典型的HMM拓?fù)湫问剑?(a)左右無跳轉(zhuǎn)模型(b)左右有跳轉(zhuǎn)模型(c)各態(tài)歷經(jīng)型圖4 HMM常見的三種拓?fù)浣Y(jié)構(gòu)上圖中各態(tài)歷經(jīng)型拓?fù)浣Y(jié)構(gòu)不符合時(shí)間順序的要求,因?yàn)樗梢詮漠?dāng)前狀態(tài)回到以前到過的狀態(tài),所以只能用于不要求時(shí)間順序的語音信號(hào)處理,如:文本無關(guān)的說話人識(shí)別等。而左右型拓?fù)浣Y(jié)構(gòu),狀態(tài)轉(zhuǎn)移只能是從左到右進(jìn)行或停留在原來的狀態(tài),而不能出現(xiàn)返回到以前狀態(tài)的

12、情況,即從編號(hào)高的狀態(tài)(如第n狀態(tài))到編號(hào)低的狀態(tài)(如第n1或n2等等狀態(tài))跳轉(zhuǎn)的情況(這實(shí)際上是一個(gè)時(shí)序的問題,因?yàn)榘凑諘r(shí)間順序,總是從編號(hào)低的狀態(tài)向編號(hào)高的狀態(tài)轉(zhuǎn)移)。因此其狀態(tài)轉(zhuǎn)移矩陣具有如下形式,它是一個(gè)上三角矩陣形式:對(duì)于考慮隨時(shí)間變化的信號(hào),利用從左到右模型來建模比較適合,因?yàn)槠淠芊从硶r(shí)序結(jié)構(gòu)。所以在語音識(shí)別中一般使用從左到右的HMM模型,因?yàn)檎Z音特征參數(shù)是一時(shí)間序列。識(shí)別單元選取選擇識(shí)別單元是語音識(shí)別研究的第一步。識(shí)別單元通常有單詞(句)、音素和音節(jié)三種,具體選擇哪一種,由具體的研究任務(wù)決定。單詞單元廣泛應(yīng)用于小詞匯語音識(shí)別系統(tǒng),但不適合中大型詞匯系統(tǒng),原因在于模型庫過于龐大,訓(xùn)

13、練模型任務(wù)復(fù)雜,難以滿足實(shí)時(shí)性要求。音素單元目前在中、大詞匯量漢語語音識(shí)別系統(tǒng)中越來越多地被采用。圖5 以音素為建模單元模型的選擇上面提到HMM的三個(gè)問題的解決及其算法是針對(duì)離散隱馬爾可夫模型(Discrete HMM簡(jiǎn)稱DHMM)進(jìn)行的。但是DHMM只適合訓(xùn)練樣本較少、計(jì)算、存儲(chǔ)資源有限的場(chǎng)合,所以一般用于孤立詞識(shí)別中。連續(xù)語音識(shí)別系統(tǒng)中多選用連續(xù)密度HMM(Continuous Density HMM簡(jiǎn)稱CDHMM)。CDHMM和DHMM的區(qū)別就在于輸出概率函數(shù)的形式不同,CDHMM允許狀態(tài)輸出的觀測(cè)矢量是連續(xù)的,這種模型的性能的好壞取決于假定的概率分布是否符合實(shí)際情況。通常選取幾個(gè)中心不同、離散度不同的高斯混合密度函數(shù),即用多個(gè)高斯分布的加權(quán)和來近似觀測(cè)矢量的真實(shí)概率分布,大大擴(kuò)充了HMM的建模能力。連續(xù)觀測(cè)概率密度函數(shù)表示為: (32

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論