超級電腦的競賽速度一再加快,但在朝百萬兆級(Exascale)發(fā)展的道路上,卻遭遇到功效、成本及資料安全性等重大挑戰(zhàn)。
本月初,包括超微(AMD),Appro,Cray,PenguinComputing和Supermicro等公司,針對高性能運(yùn)算(HPC)進(jìn)行了討論,而GartnerResearch副總裁暨分析師CarlClaunch將超級運(yùn)算領(lǐng)域稱之為一個“不斷移動的目標(biāo)”。
政府、企業(yè)和學(xué)術(shù)單位的資料都顯示系統(tǒng)對速度的需求不斷提高,Claunch說,這些系統(tǒng)必須應(yīng)對日益增加的多種問題,從氣候變遷到防御核武,甚至還包含了朝生物醫(yī)學(xué)方面的發(fā)展挑戰(zhàn)。
Exascale級運(yùn)算,即每秒可進(jìn)行10的18次方(quintillion)運(yùn)算,已不再是科幻小說了,業(yè)界希望能在2018年實(shí)現(xiàn),Claunch說。
事實(shí)上,超級電腦和高性能運(yùn)算受業(yè)界重視程度日增,且其應(yīng)用跨越眾多產(chǎn)業(yè),從核子物理到氣候建模,甚至金融業(yè)都包含在內(nèi),而目前大家對超級電腦的一致問題,都集中在效率、密度和成本上。
“大部份的超級電腦采購者都受限于預(yù)算,”Claunch指出,盡管已經(jīng)在運(yùn)算建模方面居得了很大進(jìn)展,且HPC的設(shè)計彈性也不斷增加,但業(yè)界對更小、售價更低的系統(tǒng)需求依然強(qiáng)勁。
摩爾定律大幅改善了電晶體密度,但還有很多工作要做,與會的專家們指出,特別是在每瓦功率方面,如何將更多的電源轉(zhuǎn)換為FLOPS運(yùn)算速度是關(guān)鍵。
超級電腦的電源預(yù)算不斷上升,而為了求取更高的效率,最終超級電腦的開發(fā)成本也不斷提高。
例如,美國政府已增加了太空計劃的投資金額,據(jù)報導(dǎo)僅2012年便將挹注1.26億美元在Exascale級運(yùn)算的開發(fā)上,以提升其在超級電腦霸主地位方面的競爭力。特別是中國和日本最近在太空領(lǐng)域也展現(xiàn)出積極態(tài)度。
Cray的HPC系統(tǒng)資深副總裁MargaretWilliams指出,“超級電腦是維持美國領(lǐng)先地位的關(guān)鍵之一。”她表示,Cray經(jīng)常與美國政府官員接觸,并游說美國能源部門投注更多資源在超級運(yùn)算領(lǐng)域。“該領(lǐng)域確實(shí)需要大量的投資,”她強(qiáng)調(diào)。
盡管有些人認(rèn)為美國并不需要做這些龐大的投資,但也有一些人表示,在HPC領(lǐng)域的投資最終將有利于整個產(chǎn)業(yè)發(fā)展,Supermicro公司行銷暨業(yè)務(wù)開發(fā)副總裁DonClegg認(rèn)為,爭論終將平息。“今天的尖端技術(shù)就是明天的主流系統(tǒng),”他說。
電力、地板空間限制
然而,盡管許多資金挹注在HPC領(lǐng)域,但仍有許多具潛力的超級電腦客戶,仍然受限于電力甚至是地面放置空間,Claunch說。他補(bǔ)充道,發(fā)展HPC將可提高效率,從而獲得巨大利益。
Supermicro的Clegg說,“”我們非常重視電源效率挑戰(zhàn)。他進(jìn)一步指出,“大家都更加關(guān)注電源,”Supermicro的目標(biāo)是獲得約94%的效率。“電源和冷卻是最大的問題,”Clegg再度指出,冷卻成本幾乎是和性能的提升呈指數(shù)級成長,因此要達(dá)到有利的成本效益比更加困難了。
“目前我們?nèi)狈ψ銐虻牧畠r電力讓我們發(fā)展Eexascale級運(yùn)算,除非我們做出一些重大的架構(gòu)變化,”他說。
Appro公司的AnthonyKenisky同意,“電力是Exascale級運(yùn)算面臨的主要挑戰(zhàn)。”
AMD院士暨技術(shù)長ChuckMoore說,希望實(shí)現(xiàn)Exascale級運(yùn)算的人,可能要考慮到每Megawatt高達(dá)百萬美元的花費(fèi)。他補(bǔ)充說:Bulldozer或Interlagos處理器性能仍然不足,無法讓我們達(dá)到Exascale級的運(yùn)算目標(biāo)。
Moore預(yù)測,或許至少要到2019或2020年,AMD的晶片才能提供足以讓客戶達(dá)到Exascale級運(yùn)算的可編程水準(zhǔn),他并指出,GPU將成為其中的一大關(guān)鍵因素。
事實(shí)上,業(yè)界人士大多同意在超級電腦內(nèi)使用GPU會是推動該領(lǐng)域前進(jìn)的關(guān)鍵之一。
“在抒解瓶頸方面,GPU是異質(zhì)運(yùn)算相當(dāng)重要的一部分,”Clegg指出,繪圖處理器正成為建構(gòu)異質(zhì)運(yùn)算的一項(xiàng)要素。盡管GPU近期一直是熱門討論議題,但Clegg仍抱持謹(jǐn)慎態(tài)度。“未來該領(lǐng)域是否100%都會是異質(zhì)運(yùn)算且基于GPU的?我不這么想,因?yàn)橛幸恍?yīng)用會適合,但也有一些不會,”他說。
“此刻,GPU在HPC領(lǐng)域是相當(dāng)流行的詞匯,”PenguinComputing公司CEOCharlesWuischpard說。該公司以‘依照需求的模型’來執(zhí)行超級運(yùn)算。“對我們的大型系統(tǒng)而言,我們所做的每件工作事實(shí)上都涉及到GPU,但大多數(shù)并不是對大量市場。”
GPU在超級電腦領(lǐng)域站穩(wěn)腳步
“GPU逐漸在超級電腦領(lǐng)域站穩(wěn)腳步,”Cray的Williams同意,并表示她的公司已經(jīng)開發(fā)出一些全球最快的超級電腦系統(tǒng),并看到了GPU在該領(lǐng)域的重要性日益提升。今年五月,Cray發(fā)表XK6混合超級電腦,整合了AMD的多核心純量處理器,及Nvidia的多核心GPGPU處理器器,達(dá)到了50petaflops的峰值性能,Williams并表示,該公司目前正在改良其Jaguar系統(tǒng),預(yù)計將添加GPU。
Williams說,問題在于這個產(chǎn)業(yè)是否能讓應(yīng)用程式更輕易地存取GPU,而且更具功效。
Appro的Kenisky同意,“應(yīng)用程式將是驅(qū)動GPU在此領(lǐng)域應(yīng)用普及的要素,”他并指出,雖然已經(jīng)看到對GPU技術(shù)越來越廣泛的關(guān)注和需求,但該公司仍未看到GPU具有足夠的影響力。
“GPU運(yùn)算仍處于起步階段,”Moore說。他表示AMD目前投注在GPU的發(fā)展工作將使其繪圖處理器更像是向量電腦,這將更容易進(jìn)行編程。“最好的東西還沒到呢,他表示,該公司正試圖讓CPU和GPU之間的無縫切換更加簡便。
另外,這次會議也討論到了ARM架構(gòu)。
“ARM只是缺乏x86的生態(tài)系統(tǒng),”Williams說,而Cray并不指望ARM架構(gòu)能在超級電腦領(lǐng)域快速起飛。
Kenisky則樂觀多了,他表示Appro公司認(rèn)為ARM可作為“補(bǔ)充解決方案”,特別是在超級電腦領(lǐng)域中以外的嵌入式管理部份。
“ARM在高度競爭的產(chǎn)業(yè)維持了良好的競爭力,”Moore表示,AMD認(rèn)為ARM推動了創(chuàng)新,但他懷疑ARM的平臺是否能在HPC領(lǐng)域扮演重要角色。
“在微控制器使用ARM核心是理所當(dāng)然的,”Moore說,他承認(rèn)ARM的平臺表現(xiàn)良,但很快便會面臨安達(dá)爾定律(Amdahl'sLaw)的局限性。
安達(dá)爾的論點(diǎn)經(jīng)常被用來形容當(dāng)希望最大幅度地改善整個系統(tǒng)時,該系統(tǒng)卻僅有部分獲得改善。
“x86將維持其作為超級電腦核心的地位,”Moore肯定道。
Clegg表示,對云端或HPC來說,現(xiàn)在還沒有一個放諸四海皆準(zhǔn)的標(biāo)準(zhǔn)。
討論到在HPC和云端運(yùn)算之間工作量差異時,與會人員同意,二者之間雖然有一些共通性,但在不同應(yīng)用間應(yīng)該采用何種模式仍然未有定論。