linpack浮點(diǎn)性能測(cè)試標(biāo)準(zhǔn).doc
約44頁(yè)DOC格式手機(jī)打開展開
linpack浮點(diǎn)性能測(cè)試標(biāo)準(zhǔn),linpack浮點(diǎn)性能測(cè)試標(biāo)準(zhǔn)頁(yè)數(shù) 44字?jǐn)?shù) 13164摘要linpack標(biāo)準(zhǔn)是近年來很有名的一種進(jìn)行浮點(diǎn)性能測(cè)試的標(biāo)準(zhǔn)。它由jack dongarra最早提出。linpack的名字也是來自于利用高斯消去法求解稠密矩陣線性方程的線性代數(shù)包。linpack標(biāo)準(zhǔn)用來解決線性方程問題,問題的大小則作為一種可配置的參數(shù)來優(yōu)化相...
內(nèi)容介紹
此文檔由會(huì)員 張陽(yáng)陽(yáng) 發(fā)布
LINPACK浮點(diǎn)性能測(cè)試標(biāo)準(zhǔn)
頁(yè)數(shù) 44 字?jǐn)?shù) 13164
摘要
LINPACK標(biāo)準(zhǔn)是近年來很有名的一種進(jìn)行浮點(diǎn)性能測(cè)試的標(biāo)準(zhǔn)。它由Jack Dongarra最早提出。LINPACK的名字也是來自于利用高斯消去法求解稠密矩陣線性方程的線性代數(shù)包。LINPACK標(biāo)準(zhǔn)用來解決線性方程問題,問題的大小則作為一種可配置的參數(shù)來優(yōu)化相關(guān)軟件可以獲得的最佳性能表現(xiàn)。事實(shí)上,LINPACK標(biāo)準(zhǔn)也是根據(jù)問題大小分為三種測(cè)試的。它們依次為n=100,n=1000及不對(duì)n做限制的測(cè)試。在測(cè)試中均要求矩陣符合一定條件,運(yùn)算結(jié)果符合精度。因?yàn)樵贚INPACK標(biāo)準(zhǔn)中使用的是基于高斯消去法的矩陣分解,所以可以套用公式算出浮點(diǎn)運(yùn)算次數(shù),從而只要測(cè)出運(yùn)行時(shí)間,就可求得運(yùn)算速度。
我所研究的典型LINPACK標(biāo)準(zhǔn)程序是基于高斯消去法的LU矩陣分解,它采用列主元消去的方法將矩陣A分解為一個(gè)單位下三角陣L與一個(gè)上三角陣U的乘積,然后將分解的結(jié)果回代到源方程中,求得線性方程AX=B的解,并記錄運(yùn)算時(shí)間,在檢驗(yàn)結(jié)果符合精度后求出浮點(diǎn)運(yùn)算率。這一標(biāo)準(zhǔn)程序是基于SCALAPACK的,后者為L(zhǎng)APACK的擴(kuò)展,主要是運(yùn)用了SCALAPACK中分塊減少進(jìn)程間通信從而提高運(yùn)算率的思想。
在分析清楚標(biāo)準(zhǔn)程序運(yùn)行原理后我做了數(shù)據(jù)的測(cè)試,并分析結(jié)果,得出一些有用的結(jié)論。論文的最后是對(duì)本學(xué)期工作的總結(jié)。
關(guān)鍵詞:Linpack程序包,Linpack測(cè)試標(biāo)準(zhǔn),高斯消去法,LU分解,線性代數(shù)方程組,MPI
ABSTRACT
Linpack is one of the more famous floating point benchmarks of recent years, created by Jack Dongarra, which gets its name from a linear algebra package that it uses to solve a dense system of linear equations with Gaussian elimination. The LINPACK Benchmark is to solve a dense system of linear equations. The problem size is configurable as a parameter allowing to optimize the software to achieve best performance for a given machine.In fact, LINPACK Benchmark includes 3 levels when problem size is different.they are n=100,n=1000,and n is random.In the test,the matrix which are used is generated by extra subrountine,the result must accord with precision.Because Gaussian elimination is used,so we just count the program’s running time,then figure out the mflop/s with the formula.
The typical routines I studied is LU factorization which bases on Gaussian elimination. It uses partial pivoting with row interchanges to decompose the matrix A to an unit lower triangular L and an upper triangular U.Then with these information,the program computes out X. In this period,time is recorded.When the precision is accorded,mflop/s is computed out.This standard rountine bases on Scalapack which is extended from Lapack.It uses blocks to reduce communication among processes,so the speed can increase.
After above studies,I began to do some tests and got some conclusions from the tests.At the end of the article,I summarized the work I’v done in this term.
Keyword: LINPACK package, LINPACK Benchmark, Gaussian elimination, LU factorization, linear algebra equations, MPI
目錄
摘要 I
ABSTRACT II
圖表目錄 V
第一部分LINPACK標(biāo)準(zhǔn)簡(jiǎn)介 1
一 LINPACK標(biāo)準(zhǔn)的概念 1
1 LINPACK(Linear Equations Package) 1
2 LINPACK標(biāo)準(zhǔn)(LINPACK Benchmark) 1
二 LINPACK標(biāo)準(zhǔn)解決的問題 1
三 LINPACK標(biāo)準(zhǔn)的組成 2
四 LINPACK標(biāo)準(zhǔn)測(cè)試要求 2
五 LINPACK的底層庫(kù)與并行庫(kù) 3
1 BLAS 3
2 LAPACK 3
3 其它庫(kù)支持 4
六 SCALAPACK簡(jiǎn)介 4
七 性能測(cè)試的計(jì)算 5
八 性能測(cè)試示例 5
九 小結(jié) 6
第二部分 LU分解標(biāo)準(zhǔn)程序 7
一 數(shù)學(xué)原理 7
1 高斯消去法與LU分解 7
2 LU分解的遞推公式 8
二 標(biāo)準(zhǔn)程序內(nèi)容與特點(diǎn) 10
1 主程序與調(diào)用子程序 10
2 程序特點(diǎn) 10
三 程序運(yùn)行過程分析 10
四 主程序流程圖 11
五 關(guān)鍵子程序分析 12
六 數(shù)組在處理器陣列上的塊循環(huán)分布 13
第三部分 數(shù)據(jù)測(cè)試與分析 15
一 測(cè)試數(shù)據(jù)圖表說明 15
二 測(cè)試圖表 15
三 測(cè)試結(jié)果分析與結(jié)論 18
第四部分 LINPACK標(biāo)準(zhǔn)測(cè)試的結(jié)論 19
第五部分 畢業(yè)設(shè)計(jì)小結(jié) 19
1 畢業(yè)設(shè)計(jì)期間的主要工作 19
2 畢業(yè)設(shè)計(jì)中存在的問題 20
3 致謝 20
4 論文發(fā)表 20
參考書目及文獻(xiàn) 20
附1,調(diào)用關(guān)系(CALLING RELATIONSHIP) 21
附2,子程序功能 29
附3 英文報(bào)告 33
參考書目及文獻(xiàn)
1,J. J. Dongarra , “ LINPACK : users' guide” Philadelphia : Society for Industrial and Applied Mathematics, 1979
2,金國(guó)華,陳福接, “大規(guī)模并行機(jī)程序并行化理論與技術(shù)” 北京 : 科學(xué)出版社, 1995
3,徐甲同,李學(xué)干, “并行處理技術(shù)” 西安 : 西安電子科技大學(xué)出版社, 1999
4,J.J. Dongarra, “The LINPACK Benchmark: An Explanation,” Berlin: Springer, 1988.
斯消去法,LU分解,線性代數(shù)方程組,MPI
ABSTRACT
Linpack is one of the more famous floating
頁(yè)數(shù) 44 字?jǐn)?shù) 13164
摘要
LINPACK標(biāo)準(zhǔn)是近年來很有名的一種進(jìn)行浮點(diǎn)性能測(cè)試的標(biāo)準(zhǔn)。它由Jack Dongarra最早提出。LINPACK的名字也是來自于利用高斯消去法求解稠密矩陣線性方程的線性代數(shù)包。LINPACK標(biāo)準(zhǔn)用來解決線性方程問題,問題的大小則作為一種可配置的參數(shù)來優(yōu)化相關(guān)軟件可以獲得的最佳性能表現(xiàn)。事實(shí)上,LINPACK標(biāo)準(zhǔn)也是根據(jù)問題大小分為三種測(cè)試的。它們依次為n=100,n=1000及不對(duì)n做限制的測(cè)試。在測(cè)試中均要求矩陣符合一定條件,運(yùn)算結(jié)果符合精度。因?yàn)樵贚INPACK標(biāo)準(zhǔn)中使用的是基于高斯消去法的矩陣分解,所以可以套用公式算出浮點(diǎn)運(yùn)算次數(shù),從而只要測(cè)出運(yùn)行時(shí)間,就可求得運(yùn)算速度。
我所研究的典型LINPACK標(biāo)準(zhǔn)程序是基于高斯消去法的LU矩陣分解,它采用列主元消去的方法將矩陣A分解為一個(gè)單位下三角陣L與一個(gè)上三角陣U的乘積,然后將分解的結(jié)果回代到源方程中,求得線性方程AX=B的解,并記錄運(yùn)算時(shí)間,在檢驗(yàn)結(jié)果符合精度后求出浮點(diǎn)運(yùn)算率。這一標(biāo)準(zhǔn)程序是基于SCALAPACK的,后者為L(zhǎng)APACK的擴(kuò)展,主要是運(yùn)用了SCALAPACK中分塊減少進(jìn)程間通信從而提高運(yùn)算率的思想。
在分析清楚標(biāo)準(zhǔn)程序運(yùn)行原理后我做了數(shù)據(jù)的測(cè)試,并分析結(jié)果,得出一些有用的結(jié)論。論文的最后是對(duì)本學(xué)期工作的總結(jié)。
關(guān)鍵詞:Linpack程序包,Linpack測(cè)試標(biāo)準(zhǔn),高斯消去法,LU分解,線性代數(shù)方程組,MPI
ABSTRACT
Linpack is one of the more famous floating point benchmarks of recent years, created by Jack Dongarra, which gets its name from a linear algebra package that it uses to solve a dense system of linear equations with Gaussian elimination. The LINPACK Benchmark is to solve a dense system of linear equations. The problem size is configurable as a parameter allowing to optimize the software to achieve best performance for a given machine.In fact, LINPACK Benchmark includes 3 levels when problem size is different.they are n=100,n=1000,and n is random.In the test,the matrix which are used is generated by extra subrountine,the result must accord with precision.Because Gaussian elimination is used,so we just count the program’s running time,then figure out the mflop/s with the formula.
The typical routines I studied is LU factorization which bases on Gaussian elimination. It uses partial pivoting with row interchanges to decompose the matrix A to an unit lower triangular L and an upper triangular U.Then with these information,the program computes out X. In this period,time is recorded.When the precision is accorded,mflop/s is computed out.This standard rountine bases on Scalapack which is extended from Lapack.It uses blocks to reduce communication among processes,so the speed can increase.
After above studies,I began to do some tests and got some conclusions from the tests.At the end of the article,I summarized the work I’v done in this term.
Keyword: LINPACK package, LINPACK Benchmark, Gaussian elimination, LU factorization, linear algebra equations, MPI
目錄
摘要 I
ABSTRACT II
圖表目錄 V
第一部分LINPACK標(biāo)準(zhǔn)簡(jiǎn)介 1
一 LINPACK標(biāo)準(zhǔn)的概念 1
1 LINPACK(Linear Equations Package) 1
2 LINPACK標(biāo)準(zhǔn)(LINPACK Benchmark) 1
二 LINPACK標(biāo)準(zhǔn)解決的問題 1
三 LINPACK標(biāo)準(zhǔn)的組成 2
四 LINPACK標(biāo)準(zhǔn)測(cè)試要求 2
五 LINPACK的底層庫(kù)與并行庫(kù) 3
1 BLAS 3
2 LAPACK 3
3 其它庫(kù)支持 4
六 SCALAPACK簡(jiǎn)介 4
七 性能測(cè)試的計(jì)算 5
八 性能測(cè)試示例 5
九 小結(jié) 6
第二部分 LU分解標(biāo)準(zhǔn)程序 7
一 數(shù)學(xué)原理 7
1 高斯消去法與LU分解 7
2 LU分解的遞推公式 8
二 標(biāo)準(zhǔn)程序內(nèi)容與特點(diǎn) 10
1 主程序與調(diào)用子程序 10
2 程序特點(diǎn) 10
三 程序運(yùn)行過程分析 10
四 主程序流程圖 11
五 關(guān)鍵子程序分析 12
六 數(shù)組在處理器陣列上的塊循環(huán)分布 13
第三部分 數(shù)據(jù)測(cè)試與分析 15
一 測(cè)試數(shù)據(jù)圖表說明 15
二 測(cè)試圖表 15
三 測(cè)試結(jié)果分析與結(jié)論 18
第四部分 LINPACK標(biāo)準(zhǔn)測(cè)試的結(jié)論 19
第五部分 畢業(yè)設(shè)計(jì)小結(jié) 19
1 畢業(yè)設(shè)計(jì)期間的主要工作 19
2 畢業(yè)設(shè)計(jì)中存在的問題 20
3 致謝 20
4 論文發(fā)表 20
參考書目及文獻(xiàn) 20
附1,調(diào)用關(guān)系(CALLING RELATIONSHIP) 21
附2,子程序功能 29
附3 英文報(bào)告 33
參考書目及文獻(xiàn)
1,J. J. Dongarra , “ LINPACK : users' guide” Philadelphia : Society for Industrial and Applied Mathematics, 1979
2,金國(guó)華,陳福接, “大規(guī)模并行機(jī)程序并行化理論與技術(shù)” 北京 : 科學(xué)出版社, 1995
3,徐甲同,李學(xué)干, “并行處理技術(shù)” 西安 : 西安電子科技大學(xué)出版社, 1999
4,J.J. Dongarra, “The LINPACK Benchmark: An Explanation,” Berlin: Springer, 1988.
斯消去法,LU分解,線性代數(shù)方程組,MPI
ABSTRACT
Linpack is one of the more famous floating