日前,在2013亞洲大學生超級計算機競賽(ASC13)總決賽上清華大學代表隊奪得總冠軍,并以7.58Tflops的Linpack成績拿下“最高計算性能”單項獎,成為ASC13大賽的最大贏家。據悉,清華大學創造的7.58Tflops的Linpack成績,也是國際同類大賽中的最好成績。
清華大學的奪冠之路并非輕而易舉,本次入圍ASC13總決賽的其他高校:臺灣清華大學、上海交通大學、國防科學技術大學、中山大學、華中科技大學、韓國蔚山科學技術大學、香港中文大學、圣彼得堡大學、沙特阿卜杜勒阿齊茲國王大學也堪稱翹楚。其中,被清華大學帶隊教師、清華大學地球系統科學研究中心副教授黃小猛稱為“老大哥”的臺灣清華大學,參賽歷史長,在既往的各類國際超算大賽表現搶眼,曾兩度摘得美國SC超算大賽的總冠軍;同時還有ISC、SC雙料“最高計算性能獎”的國防科學技術大學、主場作戰的上海交通大學等等,都是賽前奪冠的熱門。
根據大賽要求,參賽隊需要在3000瓦功耗限制下自行設計搭建超級計算機系統,并進行HPL、GROMACS、OPENCFD、WRF、BSDE等5項優化測試,大賽對各參賽隊的超算理論基礎和實踐操作技能提出非常高的要求。
從組委會公布的數據來看,雖然清華大學第一輪HPL浮點性能基準測試中創造了7.58Tflops的國際同類大賽最好成績,但是贏得并不輕松,上海交通大學以7.43Tflops的成績緊追其后。依托競賽平臺浪潮NF5280M3超算服務器高性能高擴展的優勢,清華大學和上海交大均采用了富有創造力的“一機雙卡”方案,每個計算節點配置了2塊最新的NVIDIA的K20GPU加速卡,在同等功耗限制下的平臺比其他參賽隊性能更高。
在隨后的應用優化測試中,考驗各隊對應用的了解和熟悉程度,臺灣清華大學體現出其多年征戰SC大賽的豐富經驗和優勢。他們熟知每個算例的復雜程度從而更好地規劃了競賽時間,爭取用最短的時間來實現應用的最大優化,而華中科大也奪得了WRF、BSDE兩項測試第一,中山大學在GROMACS測試中表現最優異。
據了解,賽前清華大學代表隊做了非常充分的準備,這可能是其奪冠的關鍵所在。清華大學耗費了3周時間對OpenCFD軟件進行評估、1周時間將其移植到GPU平臺,并優化了該軟件的I/O架構,使得平臺通訊復雜度由16N2降低到12N2,他們還將WRF系統串行I/O優化為并行I/O,將系統通信效率提升10%以上,將BSDE軟件從串行架構改寫為高并行MIC程序,并優化數據訪問方式、算法模型,使程序性能提升上萬倍。
談到奪冠,有關專家評委表示,超級計算機大賽是對競賽平臺和參賽隊應用理解的綜合考驗。而區別于ISC、SC大賽,ASC13為參賽隊提供了統一的競賽平臺即浪潮NF5280M3超算服務器。浪潮NF5280M3曾支持清華大學、國防科學技術大學征戰國際比賽并立下累累戰功,它的高穩定性、高擴展性已蜚聲業界。在這樣毋庸置疑的硬件基礎上,要想贏得比賽,更多憑借的是各高校參賽隊對應用的理解。
清華大學對最新計算技術的深刻理解和嫻熟操作顯然起到了關鍵作用,在單純CPU集群、CPU+GPU異構集群和CPU+MIC集群的平臺策略選擇中,清華大學根據參加超算大賽的經驗,選擇了CPU+GPU異構集群。這種方案其他參賽隊伍也測試過,但加速比情況不理想、設備過熱,且容易超出3000瓦的功率約束,清華大學顯然更好的解決了這些問題,奠定了奪冠基礎。