
背景
近年來,伴隨著越來越多的生命科學(xué)及物理學(xué)家們將數(shù)值計算和數(shù)值模擬作為其重要的科學(xué)研究和手段,高校中的高性能計算需求與日俱
增。上海交大作為傳統(tǒng)理工科強(qiáng)校,校內(nèi)對計算資源的需求尤其迫切,傳統(tǒng)的單純由 CPU 構(gòu)建的超級計算機(jī),無論在可支持的計算規(guī)模
還是在計算效率上都無法滿足這么巨大的需求。相較于 CPU,GPU 具有支持高并發(fā)并行計算的特點(diǎn)。以分子動力學(xué)模擬為例,許多應(yīng)用在
GPU 上能獲得更高的性能,從而縮短模擬周期以及擴(kuò)大模擬規(guī)模,這都將極大推動科研人員的研究進(jìn)展。
挑戰(zhàn)
分子動力學(xué)模擬是一種物質(zhì)微觀領(lǐng)域的模擬方法,它通過計算機(jī)模擬微觀粒子(主要是原子、分子)之間的相互作用及運(yùn)動過程來
得到計算系統(tǒng)的結(jié)構(gòu)和特性。分子動力學(xué)模擬作為獲得液體、固體分子性質(zhì)的常用計算手段,廣泛應(yīng)用于化學(xué)、物理、醫(yī)藥、材料、生物等眾
多領(lǐng)域中。分子動力學(xué)模擬體系的復(fù)雜性和精確性的需求,使得計算量巨大,而基于傳統(tǒng)的CPU計算設(shè)備購置成本高,其有限的計算能力一直是制約
這方面研究發(fā)展的瓶頸 。
解決 方案
上海交通大學(xué) π集群機(jī)分 CPU與 GPU兩類節(jié)點(diǎn),各類節(jié)點(diǎn)上運(yùn)行的應(yīng)用程序分布情況分別如圖 1、圖 2 所示。顯而易見,Gromacs是上海
交通大學(xué) π集群機(jī)兩類節(jié)點(diǎn)中使用比例較多的軟件,尤其是 GPU節(jié)點(diǎn)更為顯著。事實(shí)上,Gromacs也是分子動力學(xué)模擬領(lǐng)域使用非常廣泛
的開源軟件,主要用于蛋白質(zhì)、核酸等的模擬,對 GPU支持也非常好。目前在交大生命學(xué)院、自然科學(xué)研究院使用較多,將來可能會在
生物制藥方面具有應(yīng)用前景。



圖 1 應(yīng)用程序采用 π集群 CPU節(jié)點(diǎn)的分布情況
x

圖 2 應(yīng)用程序采用 π集群 GPU節(jié)點(diǎn)的分布情況
成效
平臺:π 集群,分子動力學(xué)模擬分別在以下兩類計算機(jī)系統(tǒng)中進(jìn)行:
1) 單 CPU節(jié)點(diǎn) 2路 E5-2670 CPU, 節(jié)點(diǎn)間使用 56Gb FDRInfiniband 網(wǎng)絡(luò)互聯(lián)。
2) 單 GPU節(jié)點(diǎn) 2 路 E5-2670 CPU+2 Kepler K20/K40,節(jié)點(diǎn)間使用 56Gb FDR Infiniband網(wǎng)絡(luò)互聯(lián)。
使用算例:分別使用 46000/92000/184000個 atoms模擬。
加速效果: 至少 2倍以上的加速效果(CPU節(jié)點(diǎn)使用 16線程)。
影響
上海交通大學(xué)于 2011 年成為全球第 16 個 CUDA 卓越中心,并于 2014年獲得 CUDA 卓越中心年度成就獎提名。其擁有的超級計算機(jī) π 位列國
內(nèi)高校第一,是唯一配置了超過 100 塊 Kepler K20 的超級計算機(jī),也是國內(nèi)少有的 GPU 利用率高于 CPU 利用率的超級計算機(jī)。2014 年至今已
有多篇在 π GPU 集群上進(jìn)行的分子動力學(xué)應(yīng)用相關(guān)的高水平論文得到發(fā)表,上海交大的案例為 GPU 在國內(nèi)高性能計算領(lǐng)域的實(shí)用起到了推動作用。