說(shuō)話(huà)人識(shí)別技術(shù)研究進(jìn)展.doc
約11頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)
說(shuō)話(huà)人識(shí)別技術(shù)研究進(jìn)展,全文11頁(yè)9365字 敘述詳盡摘要:本文從說(shuō)話(huà)人識(shí)別的幾個(gè)關(guān)鍵問(wèn)題出發(fā),介紹了目前說(shuō)話(huà)人識(shí)別技術(shù)的基本原理、方法以及存在的問(wèn)題和難點(diǎn)。關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法一、引言說(shuō)話(huà)人識(shí)別是語(yǔ)音識(shí)別的一種。它主要分為說(shuō)話(huà)人辨認(rèn)和說(shuō)話(huà)人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語(yǔ)音是多個(gè)參考說(shuō)話(huà)人中哪一個(gè)...
內(nèi)容介紹
此文檔由會(huì)員 周伯通 發(fā)布
說(shuō)話(huà)人識(shí)別技術(shù)研究進(jìn)展
全文11頁(yè)9365字 敘述詳盡
摘要:本文從說(shuō)話(huà)人識(shí)別的幾個(gè)關(guān)鍵問(wèn)題出發(fā),介紹了目前說(shuō)話(huà)人識(shí)別技術(shù)的基本原理、方法以及存在的問(wèn)題和難點(diǎn)。
關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法
一、 引言
說(shuō)話(huà)人識(shí)別是語(yǔ)音識(shí)別的一種。它主要分為說(shuō)話(huà)人辨認(rèn)和說(shuō)話(huà)人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語(yǔ)音是多個(gè)參考說(shuō)話(huà)人中哪一個(gè)人所說(shuō),用于辨認(rèn)說(shuō)話(huà)者的身份,是一個(gè)多元判決問(wèn)題;后者是說(shuō)話(huà)人先聲明身份(如輸入用戶(hù)號(hào)) ,然后由系統(tǒng)判定待識(shí)別語(yǔ)音是否與其參考聲音相符,用于對(duì)特定人進(jìn)行身份驗(yàn)證,是一個(gè)二元判決問(wèn)題。
說(shuō)話(huà)人識(shí)別技術(shù)的發(fā)展始于60 年代,隨著信息社會(huì)化發(fā)展,說(shuō)話(huà)人識(shí)別作為具有語(yǔ)音識(shí)別與理解功能的智能人機(jī)接口,是新一代計(jì)算機(jī)的重要組成部分,其應(yīng)用領(lǐng)域不斷擴(kuò)大:在司法領(lǐng)域中,可以幫助對(duì)嫌疑人的查證;在保安領(lǐng)域中,可以用于機(jī)密場(chǎng)所的進(jìn)入控制、合法使用通信線(xiàn)路、機(jī)要設(shè)備的身份核查及電子銀行轉(zhuǎn)帳業(yè)務(wù)的安全檢查等;在醫(yī)學(xué)領(lǐng)域,如使識(shí)別系統(tǒng)僅響應(yīng)患者的命令,則可實(shí)現(xiàn)對(duì)假肢的控制;在玩具、家用電器等領(lǐng)域也有廣泛的應(yīng)用前景。針對(duì)以上領(lǐng)域中的許多商用系統(tǒng)已經(jīng)投入使用。
參考文獻(xiàn)
[1] 曹業(yè)敏,侯風(fēng)雷,王炳錫,說(shuō)話(huà)人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展,河南科技 1998年09期
[2] 寧飛,陳頻,說(shuō)話(huà)人識(shí)別的幾種方法,電聲技術(shù) 2001年 12期
[3] 李燦偉,楊震,基于HMM的說(shuō)話(huà)人確認(rèn)系統(tǒng)的研究,南京郵電學(xué)院學(xué)報(bào)(自然科學(xué)版) 2001年02期
[4] 王濤,徐乃平,說(shuō)話(huà)人識(shí)別及其應(yīng)用的研究,微處理機(jī) 1997年04期
[5]C. R Jankowski Jr., T. F. Quatierui, D. A. Reynolds. Fine Structure Features for Speaker Identification. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):680-692.
[6] 吳志強(qiáng),HMM用于說(shuō)話(huà)人識(shí)別的研究及系統(tǒng)實(shí)現(xiàn)[D],北京:北京大學(xué),1996
[7]C. W. Che, Q. G. Yuk. An HMM Approach to Text-Prompted Speak Verification. The 1996 IEEE International Conference On Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):673-676.
[8]M Birnbaum, K. L. Brown, S. Bardenhagen. Text-independent Speaker Identification Using Fenonic Speaker Markov Modeling. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, 677-680.
[9]Y. H. Pao. Adaptive Pattern Recognition and Neural Networks, Addison-Wesley Publishing Company, Inc, 1989. 馬頌德等譯,《自適應(yīng)模式識(shí)別與神經(jīng)網(wǎng)絡(luò)》,北京:科學(xué)出版社,1992
全文11頁(yè)9365字 敘述詳盡
摘要:本文從說(shuō)話(huà)人識(shí)別的幾個(gè)關(guān)鍵問(wèn)題出發(fā),介紹了目前說(shuō)話(huà)人識(shí)別技術(shù)的基本原理、方法以及存在的問(wèn)題和難點(diǎn)。
關(guān)鍵詞:模板匹配法、概率模型法、神經(jīng)網(wǎng)絡(luò)法
一、 引言
說(shuō)話(huà)人識(shí)別是語(yǔ)音識(shí)別的一種。它主要分為說(shuō)話(huà)人辨認(rèn)和說(shuō)話(huà)人確認(rèn)兩個(gè)方面:前者是判斷待識(shí)別語(yǔ)音是多個(gè)參考說(shuō)話(huà)人中哪一個(gè)人所說(shuō),用于辨認(rèn)說(shuō)話(huà)者的身份,是一個(gè)多元判決問(wèn)題;后者是說(shuō)話(huà)人先聲明身份(如輸入用戶(hù)號(hào)) ,然后由系統(tǒng)判定待識(shí)別語(yǔ)音是否與其參考聲音相符,用于對(duì)特定人進(jìn)行身份驗(yàn)證,是一個(gè)二元判決問(wèn)題。
說(shuō)話(huà)人識(shí)別技術(shù)的發(fā)展始于60 年代,隨著信息社會(huì)化發(fā)展,說(shuō)話(huà)人識(shí)別作為具有語(yǔ)音識(shí)別與理解功能的智能人機(jī)接口,是新一代計(jì)算機(jī)的重要組成部分,其應(yīng)用領(lǐng)域不斷擴(kuò)大:在司法領(lǐng)域中,可以幫助對(duì)嫌疑人的查證;在保安領(lǐng)域中,可以用于機(jī)密場(chǎng)所的進(jìn)入控制、合法使用通信線(xiàn)路、機(jī)要設(shè)備的身份核查及電子銀行轉(zhuǎn)帳業(yè)務(wù)的安全檢查等;在醫(yī)學(xué)領(lǐng)域,如使識(shí)別系統(tǒng)僅響應(yīng)患者的命令,則可實(shí)現(xiàn)對(duì)假肢的控制;在玩具、家用電器等領(lǐng)域也有廣泛的應(yīng)用前景。針對(duì)以上領(lǐng)域中的許多商用系統(tǒng)已經(jīng)投入使用。
參考文獻(xiàn)
[1] 曹業(yè)敏,侯風(fēng)雷,王炳錫,說(shuō)話(huà)人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展,河南科技 1998年09期
[2] 寧飛,陳頻,說(shuō)話(huà)人識(shí)別的幾種方法,電聲技術(shù) 2001年 12期
[3] 李燦偉,楊震,基于HMM的說(shuō)話(huà)人確認(rèn)系統(tǒng)的研究,南京郵電學(xué)院學(xué)報(bào)(自然科學(xué)版) 2001年02期
[4] 王濤,徐乃平,說(shuō)話(huà)人識(shí)別及其應(yīng)用的研究,微處理機(jī) 1997年04期
[5]C. R Jankowski Jr., T. F. Quatierui, D. A. Reynolds. Fine Structure Features for Speaker Identification. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):680-692.
[6] 吳志強(qiáng),HMM用于說(shuō)話(huà)人識(shí)別的研究及系統(tǒng)實(shí)現(xiàn)[D],北京:北京大學(xué),1996
[7]C. W. Che, Q. G. Yuk. An HMM Approach to Text-Prompted Speak Verification. The 1996 IEEE International Conference On Acoustics, Speech and Signal Processing Conference Proceedings, 1996, (7-10):673-676.
[8]M Birnbaum, K. L. Brown, S. Bardenhagen. Text-independent Speaker Identification Using Fenonic Speaker Markov Modeling. The 1996 IEEE International Conference on Acoustics, Speech and Signal Processing Conference Proceedings, 1996, 677-680.
[9]Y. H. Pao. Adaptive Pattern Recognition and Neural Networks, Addison-Wesley Publishing Company, Inc, 1989. 馬頌德等譯,《自適應(yīng)模式識(shí)別與神經(jīng)網(wǎng)絡(luò)》,北京:科學(xué)出版社,1992
TA們正在看...
- qlh35-003-2009鋼質(zhì)通艙套筒.doc
- qlh35-004-2009半套管.doc
- qlh35-002-2009直通套筒.doc
- qsda2132da4-2011文件和資料的管理規(guī)定.doc
- qsy84-2003測(cè)井工程質(zhì)量技術(shù)監(jiān)督及驗(yàn)收規(guī)范.pdf
- qsyxq20-2003西氣東輸天然氣管道工藝操作規(guī)程.doc
- 某公司顏料工程b712-714水池玻璃鋼施工方案.doc
- db29-134-2005鋼結(jié)構(gòu)防火涂料工程施工驗(yàn)收規(guī)范.doc
- db29-80-2004天津城市道路綠化建設(shè)標(biāo)準(zhǔn).doc
- db29-86-2004天津市建設(shè)工程文件歸檔整理規(guī)程.doc