《科創板日報》7 月 1 日訊(記者 黃心怡)華為、螞蟻等大廠正在加碼布局 AI 醫療健康。
6 月 30 日,瑞金醫院宣布與華為開源了病理大模型 "RuiPath", 并與海內外的 12 家醫療機構共同啟動 RuiPath 病理大模型的全球多中心計劃,協同推動病理大模型持續迭代。
螞蟻集團在收購好大夫后,持續布局 AI 醫療。最新推出的 AI 健康應用 "AQ",提供健康科普、就診咨詢、報告解讀、健康檔案等上百項 AI 功能。
此外,科大訊飛、百川、Kimi 等也紛紛看中了 AI 醫療這一賽道。從落地場景來看,名醫智能體、AI 診療、新藥研發等是被重點關注的方向。
弗若斯特沙利文預測,中國 AI 醫療市場規模將從 2023 年的 88 億元增至 2033 年的 3157 億元,年復合增長率達 43.1%。
不過,《科創板日報》記者在采訪中獲悉,高質量的醫療數據缺乏,以及數字化建設成本高昂等,仍在一定程度上影響了 AI 在醫療領域的應用。
▍ AI 智能體落地:為名醫打造數字分身
AI 應用于醫療服務,已經有很長一段時間。但此前小模型由于其泛化能力有限。
螞蟻集團 AI 醫療總經理劉軍偉認為,大模型時代與此前階段的區別在于,AI 將成為生產力。比如,醫生 AI 分身既可以幫助醫生解決問題,也可以快速響應用戶的需求。螞蟻集團的 AI 健康應用 AQ,就整合了全國近 200 位名醫 "AI 分身 "。
" 偏遠地區的老百姓,如果要想掛到大專家號,甚至進行在線專家問診,是很困難的。通過 AI 能力打造專家醫生分身,偏遠山區的老百姓就可以享受 24 小時隨時溝通。在不影響工作的情況下,專家也可以收到很多用戶的反饋或者用戶的需求。"
劉軍偉介紹,為專科名醫打造 AI 分身,不僅需要形象和聲音相似,關鍵環節在于大模型對醫生科室診療經驗的針對性學習,讓智能體真正接近醫生本人的問診邏輯,這是在訓練模型、安全評估等一系列深度合作中完成的。當 AI 涉及到診療診斷等深入問題時,AI 會為用戶匹配醫生來做二次判斷,在有必要時建議掛號就診。
" 我們希望 AI 扮演把所有類型的服務串聯起來的角色。大模型的關鍵進化還在于改變了交互方式,不需要任何門檻,一句話就可以。AI 主要做的是咨詢,可以幫你直接喚起互聯網醫院和線下的陪診。"
▍大模型能否走入臨床應用?
華為于今年 3 月組建了醫療衛生軍團。《科創板日報》記者了解到,華為希望大模型不止于問答咨詢,而是能直接在醫生的診斷環節發揮作用。
此次瑞金醫院與華為打造的 RuiPath 病理大模型,正是 AI 在診斷方面的一大探索。該模型是基于對百萬數字病理切片等數據進行訓練,能識別病理切片中的病灶區域。
中國工程院院士、上海交通大學醫學院附屬瑞金醫院院長寧光認為,AI 真正走向實際臨床應用,是醫療行業有待跨出的、非常重要的一步。" 我們為什么一直在發布,臨床總是不應用?這是所面臨的非常重要的問題。"
這是為何瑞金醫院選擇開源 RuiPath 病理大模型。目前 RuiPath 超越傳統小模型,已覆蓋 19 個常見癌種,覆蓋中國每年全癌種發病人數 90% 的癌種。但在寧光看來,還有 10% 腫瘤未能覆蓋。
" 我們能否通過開源的方式,真正可以覆蓋百分之百的癌種。只有這樣才可能達到臨床應用級的大模型,這就需要大家一起來提高和打磨。"
在寧光的期望里,應該集上海所能、集上海所強,所有醫院一起合作攻關,這樣才可以在上海形成垂直化大模型生態。
" 在衛建委和上海申康醫院發展中心的支持和領導下,可以有更多的醫院、更多的模型。而每家醫院對別家醫院的模型,都給予更多的關心支持和率先的使用。相信這樣就真正可以看到,不是一家一家醫院在發布、在使用,而是整個上海在使用。也只有如此,才可能提高垂直化醫學大模型在上海乃至全國,甚至全球的應用。"
▍數據仍是最大挑戰
瑞金醫院病理科主任助理笪倩表示,在病理人工智能的落地過程當中存在多重挑戰,比如數據切片和掃描的質量不合格,會影響模型的精度,數據格式不統一就會形成數據孤島。
笪倩提到,中國約有 5000 家醫院具有病理科,但不足 5% 的醫院將數字化應用于日常的診斷過程當中,導致數據的規模很小,影響了智慧化的發展。
在算法的層面上,傳統的模式數據標注依賴于病理學的專業知識,導致非常的昂貴而費時,并且具有個人的主觀性。
笪倩稱,在算力層面上,100 萬張的切片對應的是一個 PB 的數據,單張的主流 GPU 顯存僅為 80 個 GB,這導致投資成本很高。在存力方面,三甲醫院病理數據的增量非常大,也使得存儲的成本非常高,數字化建設的門檻高居不下。以瑞金醫院為例,每天的增長切片量為 6000 張,所以每年的數據增量達到 1.5 個 PB。
望石智慧創始人 &CEO 周杰龍認為,醫藥創新的問題分為水面之上和水面之下:水面之上是研發挑戰的問題,創新難度大,怎么突破創新的過程,避免 " 專利撞車 ";水面之下,醫藥行業作為數據密集型產業,很多藥企有非常多數據,但今天這些數據沉積在很多數劇倉里,沒有實現數據價值最大化。"
"相對于其他行業,醫藥領域在數字化層面可能更偏落后,面臨更大的挑戰:一方面,業務每個環節的數據記錄可能未必規范,導致很多的數據之間沒有打通,或由于保密性原因無法辦法共享,導致數據浪費,知識無法沉淀。另一方面,對于工具層面,雖然目前已經有非常多的工具,但這些工具就好像散布在系統里面的一個個點,沒有形成從設計目標出發,構建一條系統化的工具鏈。" 周杰龍表示。
望石智慧也在與亞馬遜云科技等廠商合作,推進數據治理方面的技術探索,包括:數據結構化治理、模型輸入 / 輸出安全控制策略、基礎設施和各種高性能計算平臺的支持等。
周杰龍表示,在醫藥領域里,需要訓練和學習化學、生物、模態醫藥的垂類大模型,基于底層的垂類生成模型,再融合文本模型,最終走向智能體(Agent)之路。通過多個智能體(Multi-agents)的方式提高集體智能和決策的方式。