基于spider技術(shù)的搜索引擎的實(shí)現(xiàn).doc
約6頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)
基于spider技術(shù)的搜索引擎的實(shí)現(xiàn),基于spider技術(shù)的搜索引擎的實(shí)現(xiàn)頁(yè)數(shù):5字?jǐn)?shù):4112【內(nèi)容提要】本文介紹了基于spider技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢(xún)。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行切詞處理,以及以用戶(hù)“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁(yè)進(jìn)行排名,從而解決了查詢(xún)速度慢和準(zhǔn)確度低的實(shí)際問(wèn)題,滿(mǎn)足了...
內(nèi)容介紹
此文檔由會(huì)員 cnlula 發(fā)布
基于SPIDER技術(shù)的搜索引擎的實(shí)現(xiàn)
頁(yè)數(shù):5 字?jǐn)?shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢(xún)。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行切詞處理,以及以用戶(hù)“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁(yè)進(jìn)行排名,從而解決了查詢(xún)速度慢和準(zhǔn)確度低的實(shí)際問(wèn)題,滿(mǎn)足了用戶(hù)對(duì)搜索引擎又快又準(zhǔn)的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點(diǎn)擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more
頁(yè)數(shù):5 字?jǐn)?shù):4112
【內(nèi)容提要】本文介紹了基于SPIDER技術(shù)的搜索引擎的核心實(shí)現(xiàn)--內(nèi)容分析與查詢(xún)。該核心采用了相關(guān)的信息處理和人工智能技術(shù),提出了逐詞掃描最大匹配法對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行切詞處理,以及以用戶(hù)“點(diǎn)擊率”的觀點(diǎn)對(duì)網(wǎng)頁(yè)進(jìn)行排名,從而解決了查詢(xún)速度慢和準(zhǔn)確度低的實(shí)際問(wèn)題,滿(mǎn)足了用戶(hù)對(duì)搜索引擎又快又準(zhǔn)的迫切要求。
【關(guān)鍵詞】SPIDER技術(shù)、搜索引擎、逐詞掃描最大匹配法、點(diǎn)擊率
ABSTRACT: This thesis describes the implementation of the hard core of SPIDER Search Engine, Content Analysis and Query. The System uses a new Mathing method called Word By Word Maximum Mathing method to divide a passage into phrases, and uses the “Hit Rate” which comes from the users to arrange the WebPages.Thus it can make the query more