摘要:“神威·太湖之光”是我國全自主研發(fā)的千萬核超級(jí)計(jì)算機(jī),目前已有很多大型應(yīng)用程序在此先進(jìn)架構(gòu)上進(jìn)行了移植優(yōu)化。然而,高能物理領(lǐng)域的格點(diǎn)量子色動(dòng)力學(xué)(LQCD)數(shù)值模擬軟件在神威平臺(tái)上尚未進(jìn)行過移植優(yōu)化,這引起了科學(xué)工作者們的關(guān)注。針對LQCD在神威平臺(tái)上的移植優(yōu)化問題展開研究。首先,論述了國內(nèi)外對LQCD在不同硬件架構(gòu)上進(jìn)行并行優(yōu)化的發(fā)展歷程。其次,通過對其熱點(diǎn)模塊Dslash的重構(gòu),實(shí)現(xiàn)了在神威平臺(tái)上的成功移植。再次,針對申威26010芯片異構(gòu)眾核的架構(gòu)和并行模式,實(shí)現(xiàn)了從核陣列異構(gòu)并行、從核本地設(shè)備存儲(chǔ)器(LDM)與主存之間的直接存儲(chǔ)訪問(DMA)通訊、主核之間的消息傳遞接口(MPI)通訊及全局歸約等操作。最后,經(jīng)過實(shí)驗(yàn)測試,單核組優(yōu)化程序與16核組優(yōu)化程序相比單主核程序分別獲得了165倍和25倍的加速比,并發(fā)現(xiàn)了一些重要的性能瓶頸問題,為進(jìn)一步優(yōu)化提升整體效率奠定重要基礎(chǔ)。同時(shí),對國產(chǎn)超算平臺(tái)的推廣使用具有積極意義。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社