中文文本自動(dòng)校隊(duì)中的語(yǔ)料庫(kù)技術(shù)研究.doc
約25頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)
中文文本自動(dòng)校隊(duì)中的語(yǔ)料庫(kù)技術(shù)研究,2.4萬(wàn)字 25頁(yè)摘要語(yǔ)料庫(kù)語(yǔ)言學(xué)是當(dāng)代計(jì)算機(jī)學(xué)語(yǔ)言學(xué)中經(jīng)驗(yàn)主義論取得顯著成效從而在計(jì)算機(jī)語(yǔ)言學(xué)領(lǐng)域占有一定的優(yōu)勢(shì)地位的新學(xué)科方向。語(yǔ)料庫(kù)是自然語(yǔ)言處理領(lǐng)域的基礎(chǔ)性資源,因此語(yǔ)料庫(kù)建設(shè)和研究就成為計(jì)算機(jī)語(yǔ)言學(xué)的重要工作之一。本文是研究中文文本中語(yǔ)料庫(kù)的建立與設(shè)計(jì)。我們采用手工或軟件形式...
內(nèi)容介紹
此文檔由會(huì)員 劉麗 發(fā)布
中文文本自動(dòng)校隊(duì)中的語(yǔ)料庫(kù)技術(shù)研究
2.4萬(wàn)字 25頁(yè)
摘要
語(yǔ)料庫(kù)語(yǔ)言學(xué)是當(dāng)代計(jì)算機(jī)學(xué)語(yǔ)言學(xué)中經(jīng)驗(yàn)主義論取得顯著成效從而在計(jì)算機(jī)語(yǔ)言學(xué)領(lǐng)域占有一定的優(yōu)勢(shì)地位的新學(xué)科方向。語(yǔ)料庫(kù)是自然語(yǔ)言處理領(lǐng)域的基礎(chǔ)性資源,因此語(yǔ)料庫(kù)建設(shè)和研究就成為計(jì)算機(jī)語(yǔ)言學(xué)的重要工作之一。本文是研究中文文本中語(yǔ)料庫(kù)的建立與設(shè)計(jì)。我們采用手工或軟件形式獲得語(yǔ)料庫(kù),并用對(duì)語(yǔ)料庫(kù)進(jìn)行加工整理。
關(guān)鍵詞:文本自動(dòng)校對(duì)、語(yǔ)料庫(kù)、索引。
Abstract
Corpus Linguistic, a successful empirical methodology, now is a prevailed newtrend in Computational Linguistic field. Corpus is fundamental resource for Natural Language Processing. So some theory and method in different with rational methodology is required that means the construction and research on corpus issue is the basic of Computational Linguistic. This paper attempts to research into corpus for Chinese text. We adopt the handicraft or software form the winning Corpus, and counteract to Corpus proceeds process the sorting.
Keywords: Chinese Proofreading, corpus, index.
參考文獻(xiàn)
[1] 易蓉湘,何克抗 “計(jì)算機(jī)漢語(yǔ)文稿校對(duì)系統(tǒng)” 計(jì)算機(jī)研究與發(fā)展 1997.5.Vol 34.No5。
[2] 許嘉璐 “中文信息處理技術(shù)現(xiàn)狀及相關(guān)語(yǔ)言文字研究” 軟件世界 1996.4 P13-20.
2.4萬(wàn)字 25頁(yè)
摘要
語(yǔ)料庫(kù)語(yǔ)言學(xué)是當(dāng)代計(jì)算機(jī)學(xué)語(yǔ)言學(xué)中經(jīng)驗(yàn)主義論取得顯著成效從而在計(jì)算機(jī)語(yǔ)言學(xué)領(lǐng)域占有一定的優(yōu)勢(shì)地位的新學(xué)科方向。語(yǔ)料庫(kù)是自然語(yǔ)言處理領(lǐng)域的基礎(chǔ)性資源,因此語(yǔ)料庫(kù)建設(shè)和研究就成為計(jì)算機(jī)語(yǔ)言學(xué)的重要工作之一。本文是研究中文文本中語(yǔ)料庫(kù)的建立與設(shè)計(jì)。我們采用手工或軟件形式獲得語(yǔ)料庫(kù),并用對(duì)語(yǔ)料庫(kù)進(jìn)行加工整理。
關(guān)鍵詞:文本自動(dòng)校對(duì)、語(yǔ)料庫(kù)、索引。
Abstract
Corpus Linguistic, a successful empirical methodology, now is a prevailed newtrend in Computational Linguistic field. Corpus is fundamental resource for Natural Language Processing. So some theory and method in different with rational methodology is required that means the construction and research on corpus issue is the basic of Computational Linguistic. This paper attempts to research into corpus for Chinese text. We adopt the handicraft or software form the winning Corpus, and counteract to Corpus proceeds process the sorting.
Keywords: Chinese Proofreading, corpus, index.
參考文獻(xiàn)
[1] 易蓉湘,何克抗 “計(jì)算機(jī)漢語(yǔ)文稿校對(duì)系統(tǒng)” 計(jì)算機(jī)研究與發(fā)展 1997.5.Vol 34.No5。
[2] 許嘉璐 “中文信息處理技術(shù)現(xiàn)狀及相關(guān)語(yǔ)言文字研究” 軟件世界 1996.4 P13-20.