2025 ASC世界大學生超算競賽(ASC25)預賽階段已接近尾聲,經預賽選拔的隊伍將參加5月10日-14日在青海大學舉行的總決賽。全球300多支高校隊伍在預賽階段需完成指定任務,其中包括一道基于最新諾貝爾化學獎成果的人工智能難題――AlphaFold3推理優化。參賽隊伍需要根據組委會的要求,在不同計算平臺上運行并優化AlphaFold3結構預測代碼,同時保持模型精度,推動AlphaFold3在實際業務場景的應用落地。
AlphaFold3能以極高精度預測多種蛋白質復合結構
諾獎應用AlphaFold推理優化難題亟待突破
2024年諾貝爾化學獎的一半被授予戴米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper),以表彰他們在“蛋白質結構預測”方面的貢獻。他們開發的AlphaFold2模型解決了一個已有50年歷史的重大難題。
精準預測蛋白質結構對生命科學意義重大。AlphaFold2基于大量氨基酸序列及對應蛋白質三維結構數據進行訓練,最終實現了端到端準確預測蛋白質結構,不到一年時間就預測了超過兩億個蛋白質三維結構,而以往完成這些結構的預測需要花費數年甚至十幾年的時間,這極大降低了科研時間和成本。以蛋白質設計應用為例,傳統蛋白質設計受限于生物試驗的長周期和高成本,只能在已發現蛋白的局部進行有限探索。而通過AlphaFold預測蛋白質屬性,則突破了生物試驗的速度和成本瓶頸,可在無限空間中探索全新蛋白設計,為藥物研發和生物制造帶來無限可能。最新的AlphaFold3功能再度升級,能以極高的精度預測多種蛋白質復合結構,包括蛋白質與蛋白質、DNA、RNA、配體分子等多種生物分子,在藥物研發、疾病機理研究、精準醫學等領域應用廣泛。
隨著AlphaFold3的廣泛應用,其推理優化的重要性逐漸凸顯。AlphaFold3的復雜性很高,其推理過程需要消耗大量的計算資源。盡管現有推理速度已提升至分鐘級,但在高通量設計體系下,面對百萬級序列預測,現有速度仍顯不足,限制了業務效果提升和產業發展。因此,突破AlphaFold3推理速度優化問題是當務之急。但AlphaFold3推理優化并非易事,需要在減少模型復雜度和保持預測準確性之間找到平衡,以確保優化后的模型仍能提供可靠的預測結果。若蛋白質結構預測不準確,下游功能必然受影響。
大學生探索AlphaFold3在更廣泛計算平臺的運行優化
為了引導大學生學習理解人工智能與生命科學研究結合的最新成果,探索解決最前沿的生命科學行業難題,ASC25大賽設置了AlphaFold3推理優化賽題。要求各參賽隊伍基于組委會提供的氨基酸序列,在不同平臺上分別運行和優化AlphaFold3結構預測代碼。大賽期望通過這一賽題,考察參賽隊伍對AlphaFold3推理過程的理解能力和優化能力,并探索其在更廣泛平臺上的運行優化。
該賽題的難點在于:其一,參賽學生需要在保持模型精度的前提下提升推理速度,不能使用明顯降低精度的優化手段;其二,基于CPU平臺的模型推理優化難度大且可參考的實例少,CPU平臺的并行處理方式、內存訪問模式和編程范式與GPU平臺不同,對大學生來說是很大的挑戰。要想在這道賽題中取得佳績,各參賽隊伍需要充分了解并掌握AlphaFold3模型結構、推理過程,以及常見的模型優化方法,學習并嘗試運用各種技術手段加速推理過程。
AlphaFold3推理優化賽題專家、百圖生科技術副總裁張曉明表示,探索AlphaFold3在不同計算平臺的運行優化,對于提升業務效果、降低研發成本意義重大。希望這道極具挑戰性的賽題能夠激發大學生對人工智能、蛋白質結構預測領域的興趣,也期待參賽學生提出優秀的創新優化方案,從而降低AlphaFold3的運行門檻和計算成本。
AlphaFold3推理優化賽題專家、百圖生科技術副總裁張曉明
ASC世界大學生超級計算機競賽(ASC Student Supercomputer Challenge)由中國發起組織,并得到亞洲及歐美相關專家和機構支持,旨在通過大賽平臺推動各國及地區間超算青年人才交流和培養,提升超算應用水平和研發能力,發揮超算的科技驅動力,促進科技與產業創新。ASC超算大賽迄今已舉行至第十二屆,吸引來自全球六大洲上萬名大學生報名參賽,是全球最大規模的大學生超算競賽。