k近鄰文本分類器的設(shè)計(jì)與實(shí)現(xiàn).doc
約32頁DOC格式手機(jī)打開展開
k近鄰文本分類器的設(shè)計(jì)與實(shí)現(xiàn),摘要 時(shí)代的進(jìn)步,信息產(chǎn)品的多樣化,世界范圍內(nèi)的因特網(wǎng)的飛速發(fā)展,使得網(wǎng)絡(luò)技術(shù)已經(jīng)滲透到了我們生活的各個(gè)角落?,F(xiàn)在因特網(wǎng)已經(jīng)發(fā)展成為了世界上最大、信息最齊全的多媒體信息庫。我們怎樣才能從因特網(wǎng)上準(zhǔn)確快速地找到我們想要的信息是目前所面臨的難題。在這樣一個(gè)大環(huán)境下,文本分類器應(yīng)運(yùn)而生,它的出現(xiàn),...
內(nèi)容介紹
此文檔由會(huì)員 那年三月 發(fā)布
k近鄰文本分類器的設(shè)計(jì)與實(shí)現(xiàn)
摘要 時(shí)代的進(jìn)步,信息產(chǎn)品的多樣化,世界范圍內(nèi)的因特網(wǎng)的飛速發(fā)展,使得網(wǎng)絡(luò)技術(shù)已經(jīng)滲透到了我們生活的各個(gè)角落?,F(xiàn)在因特網(wǎng)已經(jīng)發(fā)展成為了世界上最大、信息最齊全的多媒體信息庫。我們怎樣才能從因特網(wǎng)上準(zhǔn)確快速地找到我們想要的信息是目前所面臨的難題。在這樣一個(gè)大環(huán)境下,文本分類器應(yīng)運(yùn)而生,它的出現(xiàn),使這一問題得到很好的解決。
K近鄰算法是一種簡單,但是非常有效的文本分類算法,有著廣泛的應(yīng)用。本文針對K近鄰算法進(jìn)行研究,該算法的基本思路是,先將訓(xùn)練文本集中所有文本表示成向量的形式,再將這文本向量組成文本向量集并儲(chǔ)存起來,當(dāng)待分類文本到達(dá)時(shí),計(jì)算這篇文本與訓(xùn)練文本集中每一個(gè)文本的相似度,并將計(jì)算得到的值按降序排列,找出排在最前面的K篇文本,然后根據(jù)這K篇文本所屬的類別來判斷待分類文本所屬的類別。