分布式代理技術(shù)的文件搜索系統(tǒng)設(shè)計(jì).doc
約24頁DOC格式手機(jī)打開展開
分布式代理技術(shù)的文件搜索系統(tǒng)設(shè)計(jì), 本文共計(jì)24頁,7562字;中文提要在信息時(shí)代的今天,數(shù)據(jù)的抓取和挖掘是一種非常重要的手段,而搜索引擎是一種最具特色的網(wǎng)絡(luò)信息工具。搜索引擎一般由三部分組成:搜索代理、數(shù)據(jù)庫、人機(jī)界面。其中搜索代理,即所謂的機(jī)器人程序,用于在互聯(lián)網(wǎng)上漫游、探索并將所發(fā)現(xiàn)的網(wǎng)絡(luò)資源清單存入數(shù)據(jù)庫以供搜索...
內(nèi)容介紹
此文檔由會(huì)員 李嬌嬌 發(fā)布
分布式代理技術(shù)的文件搜索系統(tǒng)設(shè)計(jì)
本文共計(jì)24頁,7562字;
中文提要
在信息時(shí)代的今天,數(shù)據(jù)的抓取和挖掘是一種非常重要的手段,而搜索引擎是一種最具特色的網(wǎng)絡(luò)信息工具。搜索引擎一般由三部分組成:搜索代理、數(shù)據(jù)庫、人機(jī)界面。其中搜索代理,即所謂的機(jī)器人程序,用于在互聯(lián)網(wǎng)上漫游、探索并將所發(fā)現(xiàn)的網(wǎng)絡(luò)資源清單存入數(shù)據(jù)庫以供搜索,是系統(tǒng)中最具有智能成分的一部分,由于互聯(lián)網(wǎng)信息量之大,一般需要采用很多的搜索代理來協(xié)同探索。本文主要就搜索代理展開研討,對(duì)于多個(gè)搜索代理協(xié)通工作的情形進(jìn)行分析與討論,為分布式代理系統(tǒng)提供一種高效、安全、可靠的解決方案。
關(guān)鍵詞
FTP文件,分布式,代理,搜索引擎,數(shù)據(jù)采集
Abstract
At today of information ages, the data gathering is a important side of information processing, and search engine is a kind of useful tools to get information from Internet. Search engine is generally constituted by three parts: The data gathering agent, database and the user interface. Among them the agent, also named robots,
參考文獻(xiàn)
著作
1、 謝希仁,計(jì)算機(jī)網(wǎng)絡(luò)(第4版)[M],電子工業(yè)出版社,2003
2、 Andrew S. Tanenbaum,分布式系統(tǒng)原理與范型[M],清華大學(xué)出版社,2002
論文
1、 黃華,楊德志,張建剛,分布式文件系統(tǒng)[J],中國科學(xué)院計(jì)算技術(shù)研究所論文,2003
其它
1、 IETE, FTP文件傳輸協(xié)議參考,RFC 0959,1985
本文共計(jì)24頁,7562字;
中文提要
在信息時(shí)代的今天,數(shù)據(jù)的抓取和挖掘是一種非常重要的手段,而搜索引擎是一種最具特色的網(wǎng)絡(luò)信息工具。搜索引擎一般由三部分組成:搜索代理、數(shù)據(jù)庫、人機(jī)界面。其中搜索代理,即所謂的機(jī)器人程序,用于在互聯(lián)網(wǎng)上漫游、探索并將所發(fā)現(xiàn)的網(wǎng)絡(luò)資源清單存入數(shù)據(jù)庫以供搜索,是系統(tǒng)中最具有智能成分的一部分,由于互聯(lián)網(wǎng)信息量之大,一般需要采用很多的搜索代理來協(xié)同探索。本文主要就搜索代理展開研討,對(duì)于多個(gè)搜索代理協(xié)通工作的情形進(jìn)行分析與討論,為分布式代理系統(tǒng)提供一種高效、安全、可靠的解決方案。
關(guān)鍵詞
FTP文件,分布式,代理,搜索引擎,數(shù)據(jù)采集
Abstract
At today of information ages, the data gathering is a important side of information processing, and search engine is a kind of useful tools to get information from Internet. Search engine is generally constituted by three parts: The data gathering agent, database and the user interface. Among them the agent, also named robots,
參考文獻(xiàn)
著作
1、 謝希仁,計(jì)算機(jī)網(wǎng)絡(luò)(第4版)[M],電子工業(yè)出版社,2003
2、 Andrew S. Tanenbaum,分布式系統(tǒng)原理與范型[M],清華大學(xué)出版社,2002
論文
1、 黃華,楊德志,張建剛,分布式文件系統(tǒng)[J],中國科學(xué)院計(jì)算技術(shù)研究所論文,2003
其它
1、 IETE, FTP文件傳輸協(xié)議參考,RFC 0959,1985