gpu超算算法_科学网—GPU“虎山”探未来
GPU“虎山”探未來
以上為鎘化鈧系統(tǒng)(CdSc)、硅的量子點系統(tǒng)(Si-QD)和磷化鎵銦(GaInP)材料計算結(jié)果可視化圖片。通過研究人員研發(fā)的相關(guān)軟件,GPU的強大計算能力正在一步步為材料計算領(lǐng)域的研究提供支持。
不少人認為,GPU(圖形處理器)難以在平面波第一原理計算這樣復(fù)雜的算法中發(fā)揮作用,甚至斷言GPU不適合此類計算。盡管如此,一支來自中科院超算中心的隊伍卻鐵了心,偏偏要去挑戰(zhàn)——
■本報記者 楊琪
“現(xiàn)在,我們的代碼已經(jīng)可以跑模守恒贗勢的分子動力學(xué)、原子弛豫以及電子結(jié)構(gòu)計算;我們正在研發(fā)超軟贗勢的GPU代碼,相應(yīng)的測試工作也已展開。”中國科學(xué)院計算機網(wǎng)絡(luò)信息中心超級計算中心(以下簡稱超算中心)的研究人員賈偉樂通過微信,向《中國科學(xué)報》記者傳來了團隊最新的科研進展。
“我們的研發(fā)更加游刃有余。”他的話語似乎透露著輕松科研的感覺,其實“苦日子”早已猛烈地席卷了參與研發(fā)的每一個人。
因為這一團隊之前的工作,是向被判了“不可能”的領(lǐng)域進發(fā)——他們要讓GPU(圖形處理器)在平面波第一原理計算這樣復(fù)雜的算法中發(fā)揮作用。
挑戰(zhàn):超算不休 GPU將當?shù)?/p>
今年夏天,“天河二號”以每秒33.86千萬億次的浮點運算速度,成為全球最快的超級計算機。
“中國的超級計算正在迎頭趕上。”美國勞倫斯伯克利國家實驗室材料計算專家汪林望這樣評價。
超算發(fā)展無止境。未來十年,超級計算機性能將向百億億次邁進,GPU(圖形處理器)和多核CPU處理器的廣泛應(yīng)用將極大地促進該進程。
作為資深科學(xué)家,汪林望同時也發(fā)現(xiàn)了中國超算發(fā)展的不足,“缺乏在這些大機器上運行的應(yīng)用軟件”。因此,許多大型計算機被分成多個部分,被不同的研究人員使用。
“這有悖于建設(shè)超級計算機的初衷。因此,研發(fā)大規(guī)模并行應(yīng)用軟件極其重要。這樣的工作正是超算中心團隊正在做的工作。”汪林望說。
這支隊伍將目光聚焦在如何讓傳統(tǒng)的材料計算軟件使用GPU進行有效加速。
GPU是一種新型顯卡“心臟”,其體系結(jié)構(gòu)與傳統(tǒng)CPU不同,導(dǎo)致傳統(tǒng)軟件設(shè)計往往不再適用。特別是“材料計算算法和GPU體系結(jié)構(gòu)的雙重復(fù)雜性,這一工作很少有人能夠突破。”超算中心研究員王龍介紹。
再加上硬件設(shè)備水平不斷提升,建好的大型高性能計算沒有軟件“跑”怎么辦?“一定要有所儲備。”超算中心團隊看到的不只是眼前。
啟動:三方合作戰(zhàn)旗揚起
材料計算軟件在半導(dǎo)體、太陽能等材料科學(xué)研究領(lǐng)域中被廣泛應(yīng)用。如果材料計算軟件使用GPU進行有效加速,攻克難題的團隊至少要“懂量子力學(xué)用于哈密頓矩陣求解,并行計算、懂數(shù)學(xué),還需要懂得GPU的特性并設(shè)計算法”。
因此,這是一次物理學(xué)、計算機學(xué)和數(shù)學(xué)多學(xué)科的碰撞。超算團隊的執(zhí)意,更有賴于來自各方學(xué)者的傾力支持,比如汪林望。早些時候,他已研發(fā)出CPU平面波第一原理計算軟件PEtot。
2011年,汪林望得知復(fù)旦大學(xué)教授高衛(wèi)國帶領(lǐng)吳悅進行GPU相關(guān)的研究工作后,他便與高衛(wèi)國商量大家一同試一試平面波第一原理。超算中心主任遲學(xué)斌一直非常重視科學(xué)計算軟件的研發(fā),在他的支持下,王龍帶領(lǐng)賈偉樂、曹宗雁和付繼蕓加入針對GPU的研究工作。
沒有鮮花也沒有盛大的儀式,美國勞倫斯伯克利國家實驗室、復(fù)旦大學(xué)和超算中心的三方合作平靜地啟動了。
可是,攀登科學(xué)高峰的過程,卻很難用平靜來形容。數(shù)不清的險阻隱藏在超算這一虛擬空間中,即便是汪林望或超算團隊對于研究成功與否也不敢打保票。
出招:科研就該對自己狠一點
“搞科研,就得對自己狠一點。”這是團隊的共識,聽起來似乎是調(diào)侃,其實這支團隊將“狠”勁滲透了科研的點點滴滴。
比如,他們將黑夜當白天用。許多夜晚,他們都在想辦法解決難題。GPU代碼的調(diào)試非常困難,因為許多變量不能夠直接打印出來。在CPU代碼中需要花幾個小時調(diào)試出來的錯誤,在GPU代碼中卻需要幾天時間。
因此,王龍與賈偉樂常常在清晨5點下班。回家休整一下,8點回到辦公室繼續(xù)工作。
賈偉樂還記得有一次自己零點離開實驗室,門衛(wèi)保安稀奇地問:怎么這么早就下班?
大多數(shù)時候,王龍累了就在辦公室的皮凳子上休息一會,“直到現(xiàn)在,我都忘不了224室皮凳子的氣息”。
這樣的“黑加白”和“5+2”持續(xù)了近4個月的時間,他們面對的難題異常艱澀。
比如其中的關(guān)鍵性問題,即計算體系規(guī)模太小,只能用GPU卡進行計算,多個GPU之后,關(guān)鍵的傅里葉計算部分又不適合多GPU計算。如果不攻克這一難題,加速度只能達到5倍。
另外,GPU的計算速度非常快,沒有數(shù)據(jù)結(jié)構(gòu)的總體設(shè)計和改變,計算塊太小,因此通信也成為瓶頸之一。
“我們堅信,改變軟件的總體結(jié)構(gòu)可以有效地利用GPU,推進材料計算的發(fā)展。”汪林望說。
對自己“狠”一點,還體現(xiàn)在他們的科研追求:這支團隊采用非常嚴苛的標準來測算加速度。因為,“我們做這件事情是要有實用性、被大家認可的,不是發(fā)幾篇文章就了事”。
“在當時,該軟件將業(yè)內(nèi)最快紀錄提高了7倍,效果非常好。”超算中心主任遲學(xué)斌說。目前,他們已經(jīng)將加速提升至20倍以上,同時擴充了新功能。
未來:幾分運氣更需腳踏實地
經(jīng)歷4個月的磨礪,超算中心團隊在至為關(guān)鍵的核心模塊研發(fā)中發(fā)揮了主要作用。2011年4月,他們超算領(lǐng)域頂級大會——國際超級計算大會(SC11)提交論文。
至此,故事依然沒有畫上句號。
“希望更多的用戶能夠使用他們的軟件,這樣GPU的強大的計算能力能夠真正為材料計算領(lǐng)域的研究人員所用。”汪林望說。
他認為,商業(yè)化對于軟件是必要的,這樣可以保證軟件的正確性和堅固性。同時,這也將對整個材料科學(xué)模擬社區(qū)作出重要貢獻。這也得到了遲學(xué)斌和計算機網(wǎng)絡(luò)信息中心領(lǐng)導(dǎo)的大力支持。
軟件的開發(fā)是一個龐大的工程,已經(jīng)作出的成績和未來持續(xù)的探索都離不開專家與團隊的支持。
汪林望幫助大家理解算法并給出了必不可少的指導(dǎo),高衛(wèi)國等貢獻了數(shù)學(xué)領(lǐng)域的精華;盡管來自超算中心的付繼蕓是團隊中唯一的女生,但是她并不嬌氣,反而是用女性的細膩和耐性撰寫了大量代碼;超算中心副研究員曹宗雁更是“神奇”:他用兩個小時將超算集群上所有的底層的庫與軟件安裝完畢、進行匹配,而專業(yè)公司往往花一天時間安裝一個軟件。
這支團隊繼續(xù)探索GPU領(lǐng)域,不久的將來,他們將會發(fā)布一個可以用于大規(guī)模GPU異構(gòu)集群系統(tǒng)的軟件:Ultra-Mat。這一軟件將會在半導(dǎo)體材料、計算物理、納米材料、計算化學(xué)等領(lǐng)域廣泛使用。
《中國科學(xué)報》 (2013-10-15 第8版 平臺)
總結(jié)
以上是生活随笔為你收集整理的gpu超算算法_科学网—GPU“虎山”探未来的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 波波的个人简历
- 下一篇: python 获取行列号两个数组相等_p