4月15日-19日,2013亞洲大學生超級計算機競賽(ASC13)在上海交通大學舉行,來自中國大陸、香港、臺灣、韓國、沙特阿拉伯等6個國家和地區的10支隊伍進行了5天的激烈角逐,在開局第一場HPL比賽中,清華大學以7579Gflops的成績拔得頭籌,該成績刷新了同類賽事中HPL測試的全球最高紀錄。
HPL即High Performance Linpack,也叫高度并行計算基準測試,是目前國際上最流行的用于測試高性能計算機系統浮點性能的基準測試,也是各類超算競賽的保留算例。該軟件的原理是用高斯消元法求解一元N次稠密線性代數方程組來測試高性能計算機的浮點性能。
ASC13大賽中,參賽隊伍需要采用給定種類的設備搭建各自的超級計算機系統,在總功耗3000瓦的電力約束下,得到最高計算能力,就像“超級計算機的F1方程式賽車”,首先得造出出色的‘跑車’,然后在統一規則下跑出最快的性能。
從歷屆國際的ISC、SC賽事來看,HPL最高成績均未突破4000Gflops,此次清華大學的成績相比實現了近乎翻番的增長,因為IT技術的快速更新提供了性能功耗比遠大于上一代平臺的設備,這成為各參賽隊成績提高的重要技術基礎。大賽主辦方浪潮集團為大賽提供的都是最新技術產品,包括浪潮主力服務器NF5280M3,采用最新的Intel至強E5-2600平臺,通過轉接卡的方式可以支持2塊GPU加速器,以及NVIDIA最新的GPU Tesla K20和Intel剛發布的MIC眾核加速卡, Tesla K20在功耗不變的情況下,性能可提升3倍有余。
清華大學能夠力壓群雄奪得冠軍,不僅因為其長期參加各類超算賽事,積累了豐富的參賽經驗,也源于其對最新計算技術的深刻理解和嫻熟操作。選擇單純的CPU集群,還是CPU+GPU的混合集群,還是選用CPU+MIC集群,平臺策略選擇這只能由各個參賽隊根據以往的經驗來作出,最終,清華大學選擇了CPU+GPU混合集群,而且采用了每臺服務器搭配兩塊GPU加速卡的激進做法。據了解,此前其他參賽隊伍提前將該方案進行了測試,不僅加速比情況不理想、設備過熱,而且很容易超出3000瓦的功率約束。顯然,在參賽前,清華大學已經很好地解決了上述問題。
HPL算例是對參賽隊伍軟硬件知識技能的全方位考量,充分體現了大賽的終極目的——加快超算人才培養。參賽隊伍要取得更好的測試成績,需要完成對超算系統體系結構、多級存儲一致性、高速網絡、算法優化等方面全方位的綜合研究,在不僅要在混合架構、單一架構等方案之間比較選擇,還要結合性能功耗比加以反復優化和測試。
據了解,ASC是與美國SC、德國ISC大學生超算大賽并駕齊驅的全球三大超算賽事之一,該賽事由中國倡議成立,日本、俄羅斯、韓國、新加坡、泰國、中國臺灣、中國香港等國家及地區的專家和機構聯合發起和組織,由浪潮集團主辦。推動亞洲國家及地區間超算青年人才交流和培養,提升超算應用水平和研發能力。