狂賀俞昊天參加清華團隊勇奪ISC歐洲超級電腦大賽第二名!
🍔 什麼是ISC24?
國際超級計算機大會(International Supercomputing Conference)是受IEEE認可的國際性會議,主要展覽高效能計算與網通、散熱等解決方案。
🍔 他們是誰?
清大超算團隊(NTHUSCC)致力於在各種學生集群競賽中奪冠,並在超級計算與高性能計算(HPC)領域展現卓越實力。該團隊隸屬於國立清華大學的大型系統架構實驗室(LSA Lab)。他們在去年由澳洲、新加坡國家高速網路中心聯合舉辦的HPC-AI學生叢集競賽中取得冠軍,受邀前往德國漢堡參加ISC SCC大賽。
🍔 比賽介紹/心得
ISC的比賽包含8個參賽隊伍(台灣清華、北京清華、加泰隆尼亞理工大學、漢堡大學、蘇黎世聯邦理工學院、愛丁堡大學、南非高效能計算中心、南洋理工大學)。他們需要在3天內,就3個Benchmark以及3個應用題+1個隱藏應用題進行效能優化,以性能指標諸如時間、速度等和現場interview作為評分依據。他們這次因為有技嘉Gigabyte贊助,拿到最新的4節點cluster,甚至包含10張H100! (每張都需要約96萬台幣,他們都開玩笑說這整台cluster可以在台北買小套房了)。因此周志遠老師希望他們以獨立的HPL獎作為目標,礙於比賽對用電量的瓦數限制,這基本上就等於要他們放棄拿名次,甚至他們必須要關掉一顆節點才能使電量勉強撐住不壓線。
然而,第一天遞交完HPL結果後就被北京清華重重打擊,他們靠著AMD較低的耗電量、更快的網通方式、更多的H100(這比賽其實就是國家間的軍備競賽),硬是跑出比他們對他們預期更高的不合理成績。到第二天,基本上他們已經有點半放棄狀態,已經開始把比賽當buffet吃到飽了。甚至,在第二天跑完一部分應用題後,他們發現設備除了一些問題導致性能驟降,到最後一天排查才發現有記憶體壞掉,雖然嚴重的影響到他們的應用題性能,但也已經來不及了。
即便如此,他和學長也還是放棄會使整體變慢的那顆節點,改用更少的2節點去執行他們的應用軟體。雖然跑出來的結果比原本3節點更慢,但只要有跑出來多少還是能拿到一些分數。
頒獎時,學生們被集合到台上等待公布成果,他們沒有任何一個隊員預期他們會拿任何獎,因此,第二名叫到國立清華的時候所有隊員都是愣住的,過了一陣子才想起來要上去領獎拍照。
再次恭喜俞昊天參加清華團隊勇奪ISC歐洲超級電腦大賽第二名!