基于svm的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)_獨(dú)家原創(chuàng).doc
約41頁DOC格式手機(jī)打開展開
基于svm的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)_獨(dú)家原創(chuàng),基于svm的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)1.98萬字自己原創(chuàng)的畢業(yè)論文,已經(jīng)通過校內(nèi)系統(tǒng)檢測,重復(fù)率低,僅在本站獨(dú)家出售,大家放心下載使用摘要 文本分類是指計(jì)算機(jī)將一篇文章歸于預(yù)先給定的某一類或某幾類的過程。支持向量機(jī)是一種機(jī)器學(xué)習(xí)方法,它是以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),較好地解決了非線性、高維數(shù)、局部小樣本等實(shí)際問題。文本分類是基于...
內(nèi)容介紹
此文檔由會(huì)員 小丑88 發(fā)布
基于SVM的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)
1.98萬字
自己原創(chuàng)的畢業(yè)論文,已經(jīng)通過校內(nèi)系統(tǒng)檢測,重復(fù)率低,僅在本站獨(dú)家出售,大家放心下載使用
摘要 文本分類是指計(jì)算機(jī)將一篇文章歸于預(yù)先給定的某一類或某幾類的過程。支持向量機(jī)是一種機(jī)器學(xué)習(xí)方法,它是以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),較好地解決了非線性、高維數(shù)、局部小樣本等實(shí)際問題。文本分類是基于內(nèi)容的自動(dòng)信息管理的核心技術(shù)。文本向量的最大特點(diǎn)是稀疏性大和維數(shù)高,支持向量機(jī)對(duì)于處理高維數(shù)的問題具有較大的優(yōu)勢。因此,支持向量機(jī)非常適用于文本分類問題,在文本分類中具有很大的應(yīng)用潛力。
本文簡單介紹了文本分類的發(fā)展、研究現(xiàn)狀、以及文本分類的過程。并在此基礎(chǔ)上對(duì) SVM 算法的理論進(jìn)行了研究,同時(shí)在該算法的基礎(chǔ)上研究了基于 SVM 算法的文本分類系統(tǒng),系統(tǒng)包含訓(xùn)練過程的文本預(yù)處理、特征處理、文本表示,訓(xùn)練樣本集,得到分類器;并使用分類器對(duì)測試樣本測試,最后對(duì)系統(tǒng)結(jié)構(gòu)和運(yùn)行結(jié)果進(jìn)行了簡單的分析。
關(guān)鍵詞:文本分類 支持向量機(jī) SVM 機(jī)器學(xué)習(xí)
Design and Implementation of the Text Classifier Based on SVM
Abstract Text Classification refers to that The computer will classify an article to a certain category or categories. Support vector machine (SVM) is a learning method, it is based on statistical learning theory, it can well resolve such practical Problems as nonlinearity, high dimension and local minima. Text categorization is a key technique in content-based automatic information management. The biggest features of text vectors are high dimensional and extremely sparse. SVM is particularly suited for text categorization and have great potential in text categorization, as SVM have advantages in dealing with high dimensional problems. A large number of experiments have shown that support vector machine has not only simpler structure, but also better performance, especially its better generalization ability.
This article briefly introduced the development of text classification, research, and the process of text classification ,and researched on the theory of SVM algorithm. This system contains preprocessing, feature selection processing and classification module constructing. At the same time a simple text classification system that is based on SVM algorithm was researched, and at last some analysis of system structure and the results of operation was done.
Keywords: Text Classification SVM Machine learing.
目 錄
第一章 緒論 1
1.1 課題研究的背景與意義 1
1.2 國內(nèi)外研究現(xiàn)狀 2
1.2.1國外研究現(xiàn)狀 2
1.2.2國內(nèi)研究現(xiàn)狀 3
1.2.3存在問題 3
1.3 本文研究內(nèi)容 4
1.4 本文的組織結(jié)構(gòu) 5
第二章 文本分類的主要技術(shù) 6
2.1 文本分類的過程 6
2.2 文本預(yù)處理 6
2.2.1 中文分詞 6
2.2.2 停用詞處理 8
2.3 特征處理 9
2.3.1頻率統(tǒng)計(jì) 9
2.3.2降維技術(shù) 10
2.3.3特征權(quán)重 11
2.4 文本表示 12
第三章 基于支持向量機(jī)文本分類相關(guān)理論介紹 15
3.1支持向量機(jī)定義 15
3.2支持向量機(jī)的優(yōu)勢 17
3.3支持向量機(jī)在文本分類應(yīng)用中存在的主要問題 17
3.4支持向量機(jī)的主要思想 18
3.4.1最優(yōu)超平面 18
3.4.2線性可分的支持向量機(jī)分類 19
3.4.3線性不可分的支持向量機(jī)分類 19
3.4.4非線性情況 20
3.5常用支持向量機(jī)訓(xùn)練算法 22
第四章 基于SVM的文本分類器系統(tǒng)設(shè)計(jì) 23
4.1 系統(tǒng)開發(fā)環(huán)境 23
4.2 系統(tǒng)設(shè)計(jì) 23
4.2.1 語料庫設(shè)計(jì) 23
4.2.2 主要功能模塊設(shè)計(jì) 24
4.2.3 系統(tǒng)評(píng)價(jià)標(biāo)準(zhǔn) 27
第五章 SVM文本分類器系統(tǒng)的實(shí)驗(yàn)分析 28
5.1 系統(tǒng)運(yùn)行過程 28
5.3 結(jié)果及分析 32
結(jié) 論 36
致 謝 37
參考文獻(xiàn) 38
1.98萬字
自己原創(chuàng)的畢業(yè)論文,已經(jīng)通過校內(nèi)系統(tǒng)檢測,重復(fù)率低,僅在本站獨(dú)家出售,大家放心下載使用
摘要 文本分類是指計(jì)算機(jī)將一篇文章歸于預(yù)先給定的某一類或某幾類的過程。支持向量機(jī)是一種機(jī)器學(xué)習(xí)方法,它是以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),較好地解決了非線性、高維數(shù)、局部小樣本等實(shí)際問題。文本分類是基于內(nèi)容的自動(dòng)信息管理的核心技術(shù)。文本向量的最大特點(diǎn)是稀疏性大和維數(shù)高,支持向量機(jī)對(duì)于處理高維數(shù)的問題具有較大的優(yōu)勢。因此,支持向量機(jī)非常適用于文本分類問題,在文本分類中具有很大的應(yīng)用潛力。
本文簡單介紹了文本分類的發(fā)展、研究現(xiàn)狀、以及文本分類的過程。并在此基礎(chǔ)上對(duì) SVM 算法的理論進(jìn)行了研究,同時(shí)在該算法的基礎(chǔ)上研究了基于 SVM 算法的文本分類系統(tǒng),系統(tǒng)包含訓(xùn)練過程的文本預(yù)處理、特征處理、文本表示,訓(xùn)練樣本集,得到分類器;并使用分類器對(duì)測試樣本測試,最后對(duì)系統(tǒng)結(jié)構(gòu)和運(yùn)行結(jié)果進(jìn)行了簡單的分析。
關(guān)鍵詞:文本分類 支持向量機(jī) SVM 機(jī)器學(xué)習(xí)
Design and Implementation of the Text Classifier Based on SVM
Abstract Text Classification refers to that The computer will classify an article to a certain category or categories. Support vector machine (SVM) is a learning method, it is based on statistical learning theory, it can well resolve such practical Problems as nonlinearity, high dimension and local minima. Text categorization is a key technique in content-based automatic information management. The biggest features of text vectors are high dimensional and extremely sparse. SVM is particularly suited for text categorization and have great potential in text categorization, as SVM have advantages in dealing with high dimensional problems. A large number of experiments have shown that support vector machine has not only simpler structure, but also better performance, especially its better generalization ability.
This article briefly introduced the development of text classification, research, and the process of text classification ,and researched on the theory of SVM algorithm. This system contains preprocessing, feature selection processing and classification module constructing. At the same time a simple text classification system that is based on SVM algorithm was researched, and at last some analysis of system structure and the results of operation was done.
Keywords: Text Classification SVM Machine learing.
目 錄
第一章 緒論 1
1.1 課題研究的背景與意義 1
1.2 國內(nèi)外研究現(xiàn)狀 2
1.2.1國外研究現(xiàn)狀 2
1.2.2國內(nèi)研究現(xiàn)狀 3
1.2.3存在問題 3
1.3 本文研究內(nèi)容 4
1.4 本文的組織結(jié)構(gòu) 5
第二章 文本分類的主要技術(shù) 6
2.1 文本分類的過程 6
2.2 文本預(yù)處理 6
2.2.1 中文分詞 6
2.2.2 停用詞處理 8
2.3 特征處理 9
2.3.1頻率統(tǒng)計(jì) 9
2.3.2降維技術(shù) 10
2.3.3特征權(quán)重 11
2.4 文本表示 12
第三章 基于支持向量機(jī)文本分類相關(guān)理論介紹 15
3.1支持向量機(jī)定義 15
3.2支持向量機(jī)的優(yōu)勢 17
3.3支持向量機(jī)在文本分類應(yīng)用中存在的主要問題 17
3.4支持向量機(jī)的主要思想 18
3.4.1最優(yōu)超平面 18
3.4.2線性可分的支持向量機(jī)分類 19
3.4.3線性不可分的支持向量機(jī)分類 19
3.4.4非線性情況 20
3.5常用支持向量機(jī)訓(xùn)練算法 22
第四章 基于SVM的文本分類器系統(tǒng)設(shè)計(jì) 23
4.1 系統(tǒng)開發(fā)環(huán)境 23
4.2 系統(tǒng)設(shè)計(jì) 23
4.2.1 語料庫設(shè)計(jì) 23
4.2.2 主要功能模塊設(shè)計(jì) 24
4.2.3 系統(tǒng)評(píng)價(jià)標(biāo)準(zhǔn) 27
第五章 SVM文本分類器系統(tǒng)的實(shí)驗(yàn)分析 28
5.1 系統(tǒng)運(yùn)行過程 28
5.3 結(jié)果及分析 32
結(jié) 論 36
致 謝 37
參考文獻(xiàn) 38