【畢業(yè)論文】利用hmm技術(shù)實(shí)現(xiàn)基于文本相關(guān)的語音識(shí)別設(shè)計(jì).doc
約59頁DOC格式手機(jī)打開展開
【畢業(yè)論文】利用hmm技術(shù)實(shí)現(xiàn)基于文本相關(guān)的語音識(shí)別設(shè)計(jì),論文標(biāo)準(zhǔn)word格式排版 59頁摘要語音識(shí)別作為一個(gè)交叉學(xué)科,具有深遠(yuǎn)的研究價(jià)值。語音識(shí)別和語音合成技術(shù)已經(jīng)成為現(xiàn)代技術(shù)發(fā)展的一個(gè)標(biāo)志,也是現(xiàn)代計(jì)算機(jī)技術(shù)研究和發(fā)展的一個(gè)重要領(lǐng)域。雖然語音識(shí)別技術(shù)已經(jīng)取得了一些成就,也有部分產(chǎn)品面世,但是,大多數(shù)語音識(shí)別系統(tǒng)仍局限于實(shí)驗(yàn)室,遠(yuǎn)沒有達(dá)到實(shí)用化要求。制約實(shí)用化的根本原因可以...
內(nèi)容介紹
此文檔由會(huì)員 莎士比亞 發(fā)布
論文標(biāo)準(zhǔn)WORD格式排版 59頁
摘要
語音識(shí)別作為一個(gè)交叉學(xué)科,具有深遠(yuǎn)的研究價(jià)值。語音識(shí)別和語音合成技術(shù)已經(jīng)成為現(xiàn)代技術(shù)發(fā)展的一個(gè)標(biāo)志,也是現(xiàn)代計(jì)算機(jī)技術(shù)研究和發(fā)展的一個(gè)重要領(lǐng)域。雖然語音識(shí)別技術(shù)已經(jīng)取得了一些成就,也有部分產(chǎn)品面世,但是,大多數(shù)語音識(shí)別系統(tǒng)仍局限于實(shí)驗(yàn)室,遠(yuǎn)沒有達(dá)到實(shí)用化要求。制約實(shí)用化的根本原因可以歸為兩類,識(shí)別精度和系統(tǒng)復(fù)雜度。
HMM是一種用參數(shù)表示的用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,它是由馬爾可夫鏈演變來的,所以它是基于參數(shù)模型的統(tǒng)計(jì)識(shí)別方法。它是一個(gè)雙重隨機(jī)過程——具有一定狀態(tài)數(shù)的隱馬爾可夫鏈和顯示隨機(jī)函數(shù)集,每個(gè)函數(shù)都與鏈中一個(gè)狀態(tài)相關(guān)聯(lián)?!半[”的過程通過顯示過程所產(chǎn)生的觀察符號(hào)序列來表示,這就是隱馬爾可夫模型。
本文主要介紹了語音識(shí)別的預(yù)處理,隱馬爾可夫模型(Hidden Markov Models,HMM)和語音識(shí)別的基礎(chǔ)理論和發(fā)展方向。對(duì)數(shù)字0~9的識(shí)別進(jìn)行了詳細(xì)的Matlab語言實(shí)現(xiàn)。
關(guān)鍵詞:HMM;文本相關(guān);語音識(shí)別
摘 要 I
ABSTRACT II
第一章 緒論 1
1.1 背景、目的和意義 1
1.2 發(fā)展歷史和國內(nèi)外現(xiàn)狀 1
1.3 語音識(shí)別系統(tǒng)概述 3
1.3.1語音識(shí)別系統(tǒng)構(gòu)成 3
1.3.2語音識(shí)別的分類 4
1.3.3 識(shí)別方法介紹 5
第二章 語音信號(hào)的預(yù)處理及特征提取 8
2.1 語音信號(hào)的產(chǎn)生模型 9
2.2 語音信號(hào)的數(shù)字化和預(yù)處理 9
2.2.1 語音采樣 10
2.2.2 預(yù)加重…………………………………………………………………..10
2.2.3 語音信號(hào)分幀加窗 11
2.3 端點(diǎn)檢測(cè) 13
2.3.1 短時(shí)能量 13
2.3.2 短時(shí)平均過零率 14
2.3.3 端點(diǎn)檢測(cè)——“雙門限”算法 15
2.4 語音信號(hào)特征參數(shù)的提取 16
2.4.1線性預(yù)測(cè)倒譜系數(shù)LPCC 16
2.4.2 Mel倒譜系數(shù)MFCC 17
2.4.3 LPCC系數(shù)和MFCC系數(shù)的比較………………………………………18
第三章 隱馬爾可夫模型(HMM) 20
3.1 隱馬爾可夫模型 20
3.1.1 隱馬爾可夫(HMM)基本思想 20
3.1.2 語音識(shí)別中的HMM 24
3.1.3 隱馬爾可夫的三個(gè)基本問題[10] 24
3.1.4 HMM的基本算法 25
3.2 HMM模型的一些問題 28
3.2.1 HMM溢出問題的解決方法 28
3.2.2 參數(shù)的初始化問題 29
3.2.3提高HMM描述語音動(dòng)態(tài)特性的能力 31
3.2.4直接利用狀態(tài)持續(xù)時(shí)間分布概率的HMM系統(tǒng) 31
第四章 基于文本相關(guān)的語音識(shí)別 33
4.1 引言 33
4.2 HMM模型的語音實(shí)現(xiàn)方案 33
4.2.1初始模型參數(shù)設(shè)定 34
4.2.2 HMM模型狀態(tài)分布B的估計(jì) 34
4.2.3 多樣本訓(xùn)練 35
4.2.4 識(shí)別過程 36
4.3 仿真過程及系統(tǒng)評(píng)估 37
4.3.1 語音數(shù)據(jù)的采集及數(shù)據(jù)庫的建立 37
4.3.2 仿真實(shí)驗(yàn)——HMM用于語音識(shí)別 38
4.3.3 Matlab編程實(shí)現(xiàn) 40
4.4系統(tǒng)仿真中的若干問題 43
總結(jié)展望 44
參考文獻(xiàn) 45
附 錄 46
致 謝 54
摘要
語音識(shí)別作為一個(gè)交叉學(xué)科,具有深遠(yuǎn)的研究價(jià)值。語音識(shí)別和語音合成技術(shù)已經(jīng)成為現(xiàn)代技術(shù)發(fā)展的一個(gè)標(biāo)志,也是現(xiàn)代計(jì)算機(jī)技術(shù)研究和發(fā)展的一個(gè)重要領(lǐng)域。雖然語音識(shí)別技術(shù)已經(jīng)取得了一些成就,也有部分產(chǎn)品面世,但是,大多數(shù)語音識(shí)別系統(tǒng)仍局限于實(shí)驗(yàn)室,遠(yuǎn)沒有達(dá)到實(shí)用化要求。制約實(shí)用化的根本原因可以歸為兩類,識(shí)別精度和系統(tǒng)復(fù)雜度。
HMM是一種用參數(shù)表示的用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,它是由馬爾可夫鏈演變來的,所以它是基于參數(shù)模型的統(tǒng)計(jì)識(shí)別方法。它是一個(gè)雙重隨機(jī)過程——具有一定狀態(tài)數(shù)的隱馬爾可夫鏈和顯示隨機(jī)函數(shù)集,每個(gè)函數(shù)都與鏈中一個(gè)狀態(tài)相關(guān)聯(lián)?!半[”的過程通過顯示過程所產(chǎn)生的觀察符號(hào)序列來表示,這就是隱馬爾可夫模型。
本文主要介紹了語音識(shí)別的預(yù)處理,隱馬爾可夫模型(Hidden Markov Models,HMM)和語音識(shí)別的基礎(chǔ)理論和發(fā)展方向。對(duì)數(shù)字0~9的識(shí)別進(jìn)行了詳細(xì)的Matlab語言實(shí)現(xiàn)。
關(guān)鍵詞:HMM;文本相關(guān);語音識(shí)別
摘 要 I
ABSTRACT II
第一章 緒論 1
1.1 背景、目的和意義 1
1.2 發(fā)展歷史和國內(nèi)外現(xiàn)狀 1
1.3 語音識(shí)別系統(tǒng)概述 3
1.3.1語音識(shí)別系統(tǒng)構(gòu)成 3
1.3.2語音識(shí)別的分類 4
1.3.3 識(shí)別方法介紹 5
第二章 語音信號(hào)的預(yù)處理及特征提取 8
2.1 語音信號(hào)的產(chǎn)生模型 9
2.2 語音信號(hào)的數(shù)字化和預(yù)處理 9
2.2.1 語音采樣 10
2.2.2 預(yù)加重…………………………………………………………………..10
2.2.3 語音信號(hào)分幀加窗 11
2.3 端點(diǎn)檢測(cè) 13
2.3.1 短時(shí)能量 13
2.3.2 短時(shí)平均過零率 14
2.3.3 端點(diǎn)檢測(cè)——“雙門限”算法 15
2.4 語音信號(hào)特征參數(shù)的提取 16
2.4.1線性預(yù)測(cè)倒譜系數(shù)LPCC 16
2.4.2 Mel倒譜系數(shù)MFCC 17
2.4.3 LPCC系數(shù)和MFCC系數(shù)的比較………………………………………18
第三章 隱馬爾可夫模型(HMM) 20
3.1 隱馬爾可夫模型 20
3.1.1 隱馬爾可夫(HMM)基本思想 20
3.1.2 語音識(shí)別中的HMM 24
3.1.3 隱馬爾可夫的三個(gè)基本問題[10] 24
3.1.4 HMM的基本算法 25
3.2 HMM模型的一些問題 28
3.2.1 HMM溢出問題的解決方法 28
3.2.2 參數(shù)的初始化問題 29
3.2.3提高HMM描述語音動(dòng)態(tài)特性的能力 31
3.2.4直接利用狀態(tài)持續(xù)時(shí)間分布概率的HMM系統(tǒng) 31
第四章 基于文本相關(guān)的語音識(shí)別 33
4.1 引言 33
4.2 HMM模型的語音實(shí)現(xiàn)方案 33
4.2.1初始模型參數(shù)設(shè)定 34
4.2.2 HMM模型狀態(tài)分布B的估計(jì) 34
4.2.3 多樣本訓(xùn)練 35
4.2.4 識(shí)別過程 36
4.3 仿真過程及系統(tǒng)評(píng)估 37
4.3.1 語音數(shù)據(jù)的采集及數(shù)據(jù)庫的建立 37
4.3.2 仿真實(shí)驗(yàn)——HMM用于語音識(shí)別 38
4.3.3 Matlab編程實(shí)現(xiàn) 40
4.4系統(tǒng)仿真中的若干問題 43
總結(jié)展望 44
參考文獻(xiàn) 45
附 錄 46
致 謝 54