華為DCS AI解決方案,將助推AI在不同的醫院加速落地。
2025年2月18日,上海交通大學醫學院附屬瑞金醫院(以下簡稱:瑞金醫院)正式發布瑞智病理大模型RuiPath,一時吸引醫學界目光。RuiPath覆蓋了中國每年全癌種發病人數90%的常見癌種,不僅需要融合多模態數據,還要結合人群的疾病特征,從而為病理醫生提供更精準、更高效的輔助診斷支持。
“對一家醫院來講,真正的堰塞湖、真正的堵點是圖像分析?!?span style="font-weight: 600;">瑞金醫院院長寧光院士說。
在病理診斷領域,AI應用將有效緩解我國病理醫生短缺的現狀,顯著提升病理切片檢查效率和診斷準確率,為臨床治療提供更精準的決策支持。然而,要訓練專業權威的醫學大模型,并非一日之功。
病理大模型為何僅用兩個月訓練上線?
2024年11月底,華為數據存儲產品線AI解決方案首席專家王帥所在團隊接到任務——與瑞金醫院共同打造下一代病理多模態大模型。王帥帶上華為DCS AI解決方案來到現場,與醫院一起研發,僅兩個月就完成大模型訓練并上線。
然而,病理大模型在建立過程中,需要克服四大痛點:
第一,要提高病理數字化程度,數字切片的積累是構建病理大模型的基石。
第二,數據質量與共享難題。傳統病理的物理切片質量本身就存在一定的差異,而在切片數字化過程當中,由于國內外掃描儀種類繁多,加之WSI(Whole Slide Images,全視野數字切片)圖像格式標準目前也不統一,從而形成數據孤島。
第三,病理數據通?!昂艽蟆?。一張WSI病理圖像大小已經接近一部高清電影,醫院每年新增病理數據達到PB級,面臨快速訪問和存儲成本壓力。
第四,病理模型訓練所需算力高。由于GPU的GB級顯存和病理數據PB級訓練數據集之間的矛盾,醫院往往算力不足,難以高效開展海量數據集的訓練。
關于前兩個難點,瑞金醫院通過數年來建設“數字化智慧病理科”,矛盾已經逐步化解。一方面,2021年,瑞金醫院“數字化智慧病理科”建設立項,開啟病理的數字化、智能化之路,累積了數字病理切片數據庫。另一方面,為解決不同格式病理數字切片導致的數據孤島,瑞金醫院從2023年開始,啟動研制針對病理專用的CSP格式,目前已經納入上海市地方標準以及國家級團體標準相關項目立項。
針對后兩個新挑戰,瑞金醫院聯合華為,創新性實施數字化病理存儲方案,實現了全院毫秒級無卡頓病理閱片。通過存算協同模式,借助端到端的AI工具鏈(Model Engine),縮短大模型上線時間。
因此,上述痛點的克服,一方面得益于瑞金醫院4年來持續推進“數字化智慧病理科”建設,另一方面則與支撐大模型訓練的華為DCS AI解決方案密不可分。
華為DCS AI解決方案如何掃清障礙?
“病理,對我來說是一個非常陌生的領域。但是,它所面臨的行業痛點,卻又是十分熟悉的?!?span style="font-weight: 600;">王帥坦言。
第一,數據工程的問題。病理科醫生所見的每一張病理切片都是GB級,當處理上百萬張切片時,也即總共PB級的數據,同時還有數十萬份的病理報告需要進行時空對齊?!叭绻褂脗鹘y的數據工程手段,使用一個個Python腳本、工具和人工標注方式處理,效率非常低下,必須革新數據工程的手段?!?/p>
第二,圖像訓練、推理成本問題。在做圖像訓練時,如果不做任何優化,訓練一輪就要上萬的GPU hours,而到了推理階段,分析一張完整的40倍鏡下的WSI切片,需要計算上千萬的Token?!斑@樣的AI注定只是一個奢侈品,沒有辦法普惠大眾?!?/p>
第三,應用上線問題。訓練出來好的模型,并不代表有了好的應用。病理學診斷應當結合患者病史、基因組組學、分子學等多模態數據,這就要求AI系統能夠開放地對接醫院內部不同科室的不同業務信息系統,同時能夠靈活地承載不同的業務數據,靈活響應用戶需求。
能有效應對上述難題,正是DCS AI解決方案的核心價值所在。華為在數據工程上做了大量的革新,降低了80%的數據準備周期。在模型訓推上,通過長期存儲、調度引擎的創新,將資源利用率達到極致,模型的訓練周期也降低了30%,系統的吞吐提升了一倍,同時還打造了一站式的應用開發平臺,讓用戶可以實現低代碼開發、零代碼運維。
這些革新具體是怎么實現的?王帥如數家珍:
首先,在存儲層面,通過Omni-Dataverse快速建立統一的數據視圖,通過簡單配置實現高效的數據歸集,以及在不同系統之間的數據流轉。同時,瑞金醫院病理圖像采用了統一的CSP格式,壓縮率更高、讀取速度更快,從而避免了圖像多種格式在圖像處理時協議轉換帶來的開銷。
在數據治理階段,華為積累了一批專項行業數據算子,無論是數據的去重、特征提取,還是分級工作,都能夠快速找到對應的算子進行處理,并且基于數據平臺可以靈活編排組裝這些算子,進一步提升數據處理效率。
華為對病理學的圖像處理還做了深度優化??紤]到病理圖像一般在GB級,如果不經過優化就去處理百萬級的圖像,需要耗費數月,甚至超過花費在模型訓練上的時間。為此,華為研制了專用的神經網絡,實現病理學圖像的免切分算法,將整個病理學圖像處理時間從月級壓縮到了天級,極大提升了數據的處理效率。
類似的工作,不一而足。華為DCS AI解決方案,堪比“清道夫”,幫助醫院掃清大模型落地過程中面臨的數據工程處理慢、模型/應用對接難、AI系統可用度低等障礙。
落地醫療AI應用為何要重視“數據工程”?
華為公司副總裁、數據存儲產品線總裁周躍峰認為,在人工智能的三大要素——“數據、算法、算力”中,數據的作用越來越重要。
華為公司副總裁、數據存儲產品線總裁周躍峰
事實上,在AI落地過程中,并不是有了算力、算法模型,就能夠一帆風順,還要克服很多障礙。
一是數據工程。訓練大模型的數據,一般不是原始數據,而是要做很多加工處理。這好比要讓學生能夠獲得知識、獲得成長,教材質量非常重要。而打磨教材和課程需要很長的過程。
二是模型的訓練和應用的落地。模型在訓練過程當中,怎樣能夠讓它更好地理解知識,并且能夠更好地讓這些結果反映到應用中去,需要有提示工程等,這個過程同樣漫長而復雜。
三是算力基礎設施成本高。不可能讓每一家醫院都買一堆算力來實現AI應用。今天大部分AI集群系統的利用率不到50%,意味著一半以上的時間都是徒然在消耗電力。
如何突破這些極限?華為DCS AI解決方案,恰恰為各行各業落地AI應用提供了經濟、高效的部署和訓練環境。在與瑞金醫院合作的過程中,華為DCS AI解決方案的關鍵組件Model Engine——AI全數據流程、應用對接以及模型對接的工具鏈,較好地解決了上述障礙。
作為歐拉社區開源的工具鏈,Model Engine能夠大幅提升訓推及精調過程效率,有效降低AI部署和訓練成本,加速AI落地。
周躍峰表示,華為和瑞金醫院在訓練RuiPath大模型的過程中,DCS AI解決方案變得更加成熟。它不僅是硬件,更是一整套開放性的工具鏈,可供更多醫療行業集成商使用,助推AI在不同的醫院加速落地。
“數智世界 一觸即達” 選擇華為,讓您的企業輕松數智化。