基于半監(jiān)督學(xué)習(xí)方法的研究.doc
基于半監(jiān)督學(xué)習(xí)方法的研究,12700字 22頁(yè)摘 要 近幾年來(lái)隨著機(jī)器學(xué)習(xí)在數(shù)據(jù)分析和數(shù)據(jù)挖掘中的廣泛應(yīng)用,半監(jiān)督學(xué)習(xí)的理論研究成果已經(jīng)部分應(yīng)用于實(shí)際問(wèn)題的解決。半監(jiān)督學(xué)習(xí)(semi-supervised learning)是模式識(shí)別和機(jī)器學(xué)習(xí)中的重要研究領(lǐng)域,一直為國(guó)際機(jī)器學(xué)習(xí)界所廣泛關(guān)注。本文主要研究了半監(jiān)督學(xué)習(xí)方法...
內(nèi)容介紹
此文檔由會(huì)員 csfujixie 發(fā)布基于半監(jiān)督學(xué)習(xí)方法的研究
12700字 22頁(yè)
摘 要
近幾年來(lái)隨著機(jī)器學(xué)習(xí)在數(shù)據(jù)分析和數(shù)據(jù)挖掘中的廣泛應(yīng)用,半監(jiān)督學(xué)習(xí)的理論研究成果已經(jīng)部分應(yīng)用于實(shí)際問(wèn)題的解決。半監(jiān)督學(xué)習(xí)(Semi-supervised Learning)是模式識(shí)別和機(jī)器學(xué)習(xí)中的重要研究領(lǐng)域,一直為國(guó)際機(jī)器學(xué)習(xí)界所廣泛關(guān)注。
本文主要研究了半監(jiān)督學(xué)習(xí)方法,具體考慮了不同度量對(duì)半監(jiān)督學(xué)習(xí)的影響??紤]關(guān)于標(biāo)記的和未標(biāo)記數(shù)據(jù)的一般問(wèn)題的學(xué)習(xí),其通常被稱(chēng)為半監(jiān)督學(xué)習(xí)或轉(zhuǎn)導(dǎo)推理。半監(jiān)督學(xué)習(xí)的原則性方法是定義一個(gè)有關(guān)標(biāo)記的和未標(biāo)記的點(diǎn)集的固有結(jié)構(gòu)所共同顯現(xiàn)的足夠平穩(wěn)的分類(lèi)函數(shù)。實(shí)驗(yàn)結(jié)果表明,使用指數(shù)度量的GCM算法的性能最優(yōu),而使用歐幾里得度量的GCM算法的性能最差;另外,不同度量中的參數(shù)取值對(duì)算法的性能具有一定的影響。
關(guān)鍵詞:半監(jiān)督 機(jī)器學(xué)習(xí) GCM CM
ABSTRCAT
With Machine learning methods being widely applied for real world data analysis and data mining, semi-supervised learning has been introduce for solving more and more real world problems.Semi-supervised learning, which combines information from both labeled and unlabeled data for learning tasks, has drawn wide attention.
We consider the general problem of learning from labeled and unlabeled data,which is often called semi-supervised learning or transductive inference.A principled approach to semi-supervised learning is to design a classifying function which is suf_ciently smooth with respect to the intrinsic structure collectively revealed by known labeled and unlabeled points. Experimental results show that performance of GCM algorithm for using the exponential measure is superior to other measures and performance of GCM algorithm for using the Euclidean measure is inferior to other measures. Moreover, arguments for different measures impact on the performance of algorithm.
Key words:Semi-supervised Machine learing GCM CM
目 錄
一 引言 1
1.1研究背景和意義 1
1.1.1研究背景 1
1.1.2研究意義 1
1.2國(guó)內(nèi)外研究現(xiàn)狀 1
1.3研究?jī)?nèi)容 2
1.4論文組織與安排 2
二 半監(jiān)督學(xué)習(xí)算法 3
2.1樸素貝葉斯分類(lèi)器 3
2.1.1貝葉斯法則 3
2.2.2 樸素貝葉斯分類(lèi)器學(xué)習(xí) 3
2.2 k-近鄰算法 4
三 常用的度量方法 6
3.1加權(quán)s階Minkowski度量 6
3.2非線(xiàn)性度量 6
3.3 K近鄰度量 6
3.4指數(shù)度量 6
3.5雙曲正切度量 7
四 基于核策略的半監(jiān)督學(xué)習(xí)算法 8
4.1 CM算法 8
4.2 GCM算法 8
五 總體設(shè)計(jì)與詳細(xì)設(shè)計(jì) 10
5.1總體設(shè)計(jì) 10
5.2 詳細(xì)設(shè)計(jì) 10
六 實(shí)驗(yàn)研究與分析 13
6.1實(shí)驗(yàn)數(shù)據(jù) 13
6.1.1 CM算法實(shí)驗(yàn)數(shù)據(jù) 13
6.1.2 GCM算法實(shí)驗(yàn)數(shù)據(jù) 14
6.2實(shí)驗(yàn)方法 14
6.2.1 CM實(shí)驗(yàn)方法 14
6.2.2 GCM實(shí)驗(yàn)方法 14
6.3 實(shí)驗(yàn)結(jié)果與分析 15
七 結(jié)論 17
謝 辭 18
參考文獻(xiàn) 19