關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法在基因序列數(shù)據(jù)上的應(yīng)用研究.doc
約30頁DOC格式手機(jī)打開展開
關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法在基因序列數(shù)據(jù)上的應(yīng)用研究,1.3萬字30頁 原創(chuàng)作品,已通過查重系統(tǒng)摘要基因序列數(shù)據(jù)是一類重要的生物數(shù)據(jù),這些數(shù)據(jù)為揭開生命奧秘提供了基礎(chǔ)。后基因組時(shí)代的主要研究任務(wù)是研究基因序列數(shù)據(jù)并解讀其含義。數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。典型的數(shù)據(jù)挖掘...
內(nèi)容介紹
此文檔由會(huì)員 馬甲線女神 發(fā)布
關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法在基因序列數(shù)據(jù)上的應(yīng)用研究
1.3萬字 30頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘要基因序列數(shù)據(jù)是一類重要的生物數(shù)據(jù),這些數(shù)據(jù)為揭開生命奧秘提供了基礎(chǔ)。后基因組時(shí)代的主要研究任務(wù)是研究基因序列數(shù)據(jù)并解讀其含義。數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。典型的數(shù)據(jù)挖掘包括聚類、分類、孤立點(diǎn)分析、關(guān)聯(lián)規(guī)則、預(yù)測(cè)等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于基因序列數(shù)據(jù)分析,已得到廣泛關(guān)注和應(yīng)用,并取得了研究成果。
本文主要介紹利用關(guān)聯(lián)規(guī)則對(duì)基因序列數(shù)據(jù)進(jìn)行挖掘。首先介紹了生物信息學(xué),數(shù)據(jù)挖掘的相關(guān)知識(shí)。然后分析了關(guān)聯(lián)規(guī)則兩種常用的算法——Apriori算法和Fp-Growth算法。Apriori算法是關(guān)聯(lián)規(guī)則常用的算法,然而效率有待改善。Fp-Growth算法改進(jìn)了Apriori算法的缺點(diǎn),是一種不產(chǎn)生頻繁候選集的算法。最后編程實(shí)現(xiàn)兩種算法對(duì)基因序列數(shù)據(jù)進(jìn)行挖掘,并對(duì)同一數(shù)據(jù)庫進(jìn)行測(cè)試,以便直觀的了解兩種算法的效率。實(shí)驗(yàn)結(jié)果表明,F(xiàn)p-Growth算法較Apriori算法有更高的效率。
關(guān)鍵詞:基因序列數(shù)據(jù) 關(guān)聯(lián)規(guī)則 Fp-Growth Apriori
1.3萬字 30頁 原創(chuàng)作品,已通過查重系統(tǒng)
摘要基因序列數(shù)據(jù)是一類重要的生物數(shù)據(jù),這些數(shù)據(jù)為揭開生命奧秘提供了基礎(chǔ)。后基因組時(shí)代的主要研究任務(wù)是研究基因序列數(shù)據(jù)并解讀其含義。數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。典型的數(shù)據(jù)挖掘包括聚類、分類、孤立點(diǎn)分析、關(guān)聯(lián)規(guī)則、預(yù)測(cè)等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于基因序列數(shù)據(jù)分析,已得到廣泛關(guān)注和應(yīng)用,并取得了研究成果。
本文主要介紹利用關(guān)聯(lián)規(guī)則對(duì)基因序列數(shù)據(jù)進(jìn)行挖掘。首先介紹了生物信息學(xué),數(shù)據(jù)挖掘的相關(guān)知識(shí)。然后分析了關(guān)聯(lián)規(guī)則兩種常用的算法——Apriori算法和Fp-Growth算法。Apriori算法是關(guān)聯(lián)規(guī)則常用的算法,然而效率有待改善。Fp-Growth算法改進(jìn)了Apriori算法的缺點(diǎn),是一種不產(chǎn)生頻繁候選集的算法。最后編程實(shí)現(xiàn)兩種算法對(duì)基因序列數(shù)據(jù)進(jìn)行挖掘,并對(duì)同一數(shù)據(jù)庫進(jìn)行測(cè)試,以便直觀的了解兩種算法的效率。實(shí)驗(yàn)結(jié)果表明,F(xiàn)p-Growth算法較Apriori算法有更高的效率。
關(guān)鍵詞:基因序列數(shù)據(jù) 關(guān)聯(lián)規(guī)則 Fp-Growth Apriori