<acronym id="pokdi"><strong id="pokdi"></strong></acronym>
      <acronym id="pokdi"><label id="pokdi"><xmp id="pokdi"></xmp></label></acronym>

      <td id="pokdi"><ruby id="pokdi"></ruby></td>
      <td id="pokdi"><option id="pokdi"></option></td>
      <td id="pokdi"></td>

        1. 教育裝備采購網
          第八屆圖書館論壇 校體購2

          瑞金病理大模型是怎樣練成的

          教育裝備采購網 2025-04-08 16:35 圍觀1306次

            華為DCS AI解決方案,將助推AI在不同的醫院加速落地。

            2025年2月18日,上海交通大學醫學院附屬瑞金醫院(以下簡稱:瑞金醫院)正式發布瑞智病理大模型RuiPath,一時吸引醫學界目光。RuiPath覆蓋了中國每年全癌種發病人數90%的常見癌種,不僅需要融合多模態數據,還要結合人群的疾病特征,從而為病理醫生提供更精準、更高效的輔助診斷支持。

            “對一家醫院來講,真正的堰塞湖、真正的堵點是圖像分析?!?span style="font-weight: 600;">瑞金醫院院長寧光院士說。

            在病理診斷領域,AI應用將有效緩解我國病理醫生短缺的現狀,顯著提升病理切片檢查效率和診斷準確率,為臨床治療提供更精準的決策支持。然而,要訓練專業權威的醫學大模型,并非一日之功。

          瑞金病理大模型是怎樣練成的

          病理大模型為何僅用兩個月訓練上線?

            2024年11月底,華為數據存儲產品線AI解決方案首席專家王帥所在團隊接到任務——與瑞金醫院共同打造下一代病理多模態大模型。王帥帶上華為DCS AI解決方案來到現場,與醫院一起研發,僅兩個月就完成大模型訓練并上線。

            然而,病理大模型在建立過程中,需要克服四大痛點:

            第一,要提高病理數字化程度,數字切片的積累是構建病理大模型的基石。

            第二,數據質量與共享難題。傳統病理的物理切片質量本身就存在一定的差異,而在切片數字化過程當中,由于國內外掃描儀種類繁多,加之WSI(Whole Slide Images,全視野數字切片)圖像格式標準目前也不統一,從而形成數據孤島。

            第三,病理數據通?!昂艽蟆?。一張WSI病理圖像大小已經接近一部高清電影,醫院每年新增病理數據達到PB級,面臨快速訪問和存儲成本壓力。

            第四,病理模型訓練所需算力高。由于GPU的GB級顯存和病理數據PB級訓練數據集之間的矛盾,醫院往往算力不足,難以高效開展海量數據集的訓練。

            關于前兩個難點,瑞金醫院通過數年來建設“數字化智慧病理科”,矛盾已經逐步化解。一方面,2021年,瑞金醫院“數字化智慧病理科”建設立項,開啟病理的數字化、智能化之路,累積了數字病理切片數據庫。另一方面,為解決不同格式病理數字切片導致的數據孤島,瑞金醫院從2023年開始,啟動研制針對病理專用的CSP格式,目前已經納入上海市地方標準以及國家級團體標準相關項目立項。

            針對后兩個新挑戰,瑞金醫院聯合華為,創新性實施數字化病理存儲方案,實現了全院毫秒級無卡頓病理閱片。通過存算協同模式,借助端到端的AI工具鏈(Model Engine),縮短大模型上線時間。

            因此,上述痛點的克服,一方面得益于瑞金醫院4年來持續推進“數字化智慧病理科”建設,另一方面則與支撐大模型訓練的華為DCS AI解決方案密不可分。

          華為DCS AI解決方案如何掃清障礙?

            “病理,對我來說是一個非常陌生的領域。但是,它所面臨的行業痛點,卻又是十分熟悉的?!?span style="font-weight: 600;">王帥坦言。

            第一,數據工程的問題。病理科醫生所見的每一張病理切片都是GB級,當處理上百萬張切片時,也即總共PB級的數據,同時還有數十萬份的病理報告需要進行時空對齊?!叭绻褂脗鹘y的數據工程手段,使用一個個Python腳本、工具和人工標注方式處理,效率非常低下,必須革新數據工程的手段?!?/p>

            第二,圖像訓練、推理成本問題。在做圖像訓練時,如果不做任何優化,訓練一輪就要上萬的GPU hours,而到了推理階段,分析一張完整的40倍鏡下的WSI切片,需要計算上千萬的Token?!斑@樣的AI注定只是一個奢侈品,沒有辦法普惠大眾?!?/p>

            第三,應用上線問題。訓練出來好的模型,并不代表有了好的應用。病理學診斷應當結合患者病史、基因組組學、分子學等多模態數據,這就要求AI系統能夠開放地對接醫院內部不同科室的不同業務信息系統,同時能夠靈活地承載不同的業務數據,靈活響應用戶需求。

            能有效應對上述難題,正是DCS AI解決方案的核心價值所在。華為在數據工程上做了大量的革新,降低了80%的數據準備周期。在模型訓推上,通過長期存儲、調度引擎的創新,將資源利用率達到極致,模型的訓練周期也降低了30%,系統的吞吐提升了一倍,同時還打造了一站式的應用開發平臺,讓用戶可以實現低代碼開發、零代碼運維。

          瑞金病理大模型是怎樣練成的

            這些革新具體是怎么實現的?王帥如數家珍:

            首先,在存儲層面,通過Omni-Dataverse快速建立統一的數據視圖,通過簡單配置實現高效的數據歸集,以及在不同系統之間的數據流轉。同時,瑞金醫院病理圖像采用了統一的CSP格式,壓縮率更高、讀取速度更快,從而避免了圖像多種格式在圖像處理時協議轉換帶來的開銷。

            在數據治理階段,華為積累了一批專項行業數據算子,無論是數據的去重、特征提取,還是分級工作,都能夠快速找到對應的算子進行處理,并且基于數據平臺可以靈活編排組裝這些算子,進一步提升數據處理效率。

            華為對病理學的圖像處理還做了深度優化??紤]到病理圖像一般在GB級,如果不經過優化就去處理百萬級的圖像,需要耗費數月,甚至超過花費在模型訓練上的時間。為此,華為研制了專用的神經網絡,實現病理學圖像的免切分算法,將整個病理學圖像處理時間從月級壓縮到了天級,極大提升了數據的處理效率。

            類似的工作,不一而足。華為DCS AI解決方案,堪比“清道夫”,幫助醫院掃清大模型落地過程中面臨的數據工程處理慢、模型/應用對接難、AI系統可用度低等障礙。

          落地醫療AI應用為何要重視“數據工程”? 

            華為公司副總裁、數據存儲產品線總裁周躍峰認為,在人工智能的三大要素——“數據、算法、算力”中,數據的作用越來越重要。

          瑞金病理大模型是怎樣練成的

          華為公司副總裁、數據存儲產品線總裁周躍峰

            事實上,在AI落地過程中,并不是有了算力、算法模型,就能夠一帆風順,還要克服很多障礙。

            一是數據工程。訓練大模型的數據,一般不是原始數據,而是要做很多加工處理。這好比要讓學生能夠獲得知識、獲得成長,教材質量非常重要。而打磨教材和課程需要很長的過程。

            二是模型的訓練和應用的落地。模型在訓練過程當中,怎樣能夠讓它更好地理解知識,并且能夠更好地讓這些結果反映到應用中去,需要有提示工程等,這個過程同樣漫長而復雜。

            三是算力基礎設施成本高。不可能讓每一家醫院都買一堆算力來實現AI應用。今天大部分AI集群系統的利用率不到50%,意味著一半以上的時間都是徒然在消耗電力。

          瑞金病理大模型是怎樣練成的

            如何突破這些極限?華為DCS AI解決方案,恰恰為各行各業落地AI應用提供了經濟、高效的部署和訓練環境。在與瑞金醫院合作的過程中,華為DCS AI解決方案的關鍵組件Model Engine——AI全數據流程、應用對接以及模型對接的工具鏈,較好地解決了上述障礙。

            作為歐拉社區開源的工具鏈,Model Engine能夠大幅提升訓推及精調過程效率,有效降低AI部署和訓練成本,加速AI落地。

            周躍峰表示,華為和瑞金醫院在訓練RuiPath大模型的過程中,DCS AI解決方案變得更加成熟。它不僅是硬件,更是一整套開放性的工具鏈,可供更多醫療行業集成商使用,助推AI在不同的醫院加速落地。

            “數智世界 一觸即達” 選擇華為,讓您的企業輕松數智化。

          來源:搜狐 責任編輯:陽光 我要投稿
          校體購終極頁

          相關閱讀

          版權與免責聲明:

          ① 凡本網注明"來源:教育裝備采購網"的所有作品,版權均屬于教育裝備采購網,未經本網授權不得轉載、摘編或利用其它方式使用。已獲本網授權的作品,應在授權范圍內使用,并注明"來源:教育裝備采購網"。違者本網將追究相關法律責任。

          ② 本網凡注明"來源:XXX(非本網)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,且不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、網站或個人從本網下載使用,必須保留本網注明的"稿件來源",并自負版權等法律責任。

          ③ 如涉及作品內容、版權等問題,請在作品發表之日起兩周內與本網聯系,否則視為放棄相關權利。

          校體購產品
          99久久国产自偷自偷免费一区|91久久精品无码一区|国语自产精品视频在线区|伊人久久大香线蕉av综合

            <acronym id="pokdi"><strong id="pokdi"></strong></acronym>
              <acronym id="pokdi"><label id="pokdi"><xmp id="pokdi"></xmp></label></acronym>

              <td id="pokdi"><ruby id="pokdi"></ruby></td>
              <td id="pokdi"><option id="pokdi"></option></td>
              <td id="pokdi"></td>