首頁 > 新聞 > 智能 > 正文

AI 醫生,靠譜嗎?

2023-08-14 18:17:01來源:ZAKER科技  

作者 | 伊澤貝爾


(資料圖片)

不是幫忙寫病歷,不是輔助看報告,不是手術導航定位,更不是智能導診,真正能看病的 "AI 醫生 " 可能要來了。

中國的醫療科技公司正在自主研發基于 Transformer 架構的醫療大語言模型,并應用于真實醫療場景的 AI 醫生產品 "MedGPT"。而這款產品的首次 " 出圈 ",是因為一場上百人規模的真實世界試驗。

這場 6 月 30 日在成都進行的 " 大型公開測評 ",參與者包括 120 多位真實患者和 10 名四川大學華西醫院的主治醫師,還有 7 位全國各地三甲醫院專家作為陪審。畢竟大模型能不能用來看病這件事,最有發言權的,還是專家醫生。

最終,"AI 醫生 " 與三甲主治醫生在比分結果上的一致性達到了 96%。

8 月 10 日,其研發企業醫聯 Medlinker 對外公布了該產品的最近進展。據介紹,醫聯 MedGPT 又完成了 1052 例醫生臨床測試,不斷通過數據刷新 AI 醫生臨床有效性記錄,并持續驗證醫療安全性。

圍繞這款橫空出世的 "AI 醫生 " 產品和其實際效果,本文試圖討論幾個核心問題:

1.MedGPT 看病靠譜嗎?評價是否靠譜的標準是什么?

2.MedGPT 能在哪些環節幫助提升就醫體驗、診療效率和質量?

3.MedGPT 走向成熟和普及之時,地域資源不平衡、看病難的醫療痼疾能否被推動解決?

MedGPT 看病,靠譜嗎?

鑒于患者和醫生之間存在巨大的信息鴻溝,判斷 MedGPT 可靠性的標準和結果,都來自經驗豐富的醫生專家。

其實施過程是,邀請 120 位真實患者使用 "AI 醫生 " 問診,過程中實習醫生輔助將信息同步傳達給 10 位四川大學華西醫院的真人醫生(職級主治及以上),雙方在互不影響的情況下分別給出獨立判斷。

評估結果時,將上述過程切分為問詢、診斷、給出治療建議、開具輔助檢查方案、分析檢查結果、提供可信解釋等 6 個環節,由來自北京阜外醫院、中日友好醫院、北大人民醫院等三甲醫院的 7 位主任專家,針對每個環節分別給 AI 和真人按照準確性、專業性等統一標準進行打分。

最終,真人醫生的綜合得分為 7.5,而 AI 醫生得分為 7.2,二者一致性為 96%。評測疾病涵蓋消化科、心內科、老年呼吸科、骨科、泌尿外科、腎內科等多個領域。

一位專家在打分時,甚至對 AI 給出了高于真人醫生的分數,理由是在專業水平接近的情況下,MedGPT 更加細致,不易誤診漏診,甚至對患者表現出更大的人文關懷。

據醫聯對外公布的數據,MedGPT 目前的參數規模為 100B 規模,預訓練階段使用了超過 20 億的醫學文本數據,微調訓練階段使用了 800 萬條的高質量結構化臨床診療數據,并投入超過 1000 名醫生參與人工反饋監督微調訓練。

在短短 40 天左右的時間里,MedGPT 的患者測試案例實現從百到千的十倍量級增長,不難看出醫聯對這一產品的投入程度。據了解,在過去的幾個月內,其醫療專家和技術專家團隊 " 以小時為單位 " 進行著迭代和調優。在這個過程中,已有超過 1000 名三甲醫院醫生參與到產品的研發、測試、優化過程中。

值得一提的是,在全球范圍內,這種 "AI 醫生 " 與人類醫生同時面對真實患者的 " 雙盲實驗 " 還是首次完成,這也為檢驗醫療 GPT 的有效性和準確性等開拓了標準范式。任何產品或業務,涉及到醫療領域都是一件嚴肅的事情,但在當前,各國相關監管部門還尚未提出對醫療大模型產品的注冊審查標準,則更需要最早的產品研發者對自身提出要求,需要市場的行業自律。如今臨床測試的數量已經達到了 1052 例,而在以往創新藥物或醫療器械的臨床試驗項目中,千人量級均屬于超大型規模水平。

數字醫療的全新引擎

在此之前,醫療領域已經誕生了不少應用 AI 技術開發的產品,比如電子病歷、智能導診分診系統、醫學影像輔助診斷產品以及手術機器人(或稱手術導航定位系統)等,這些產品都是 " 碎片化 " 地聚焦分布在診療流程的某一個具體環節,幫助優化就醫體驗、提升就醫效率和質量。

但大語言模型的技術突破,讓 AI 技術在醫療場景下的應用,有了更進一步參與或跟蹤整個診療流程的可能。

理論上,除了需要動手術、拍片子和取藥等必須在線下實體進行的環節,其他步驟如咨詢、診斷、開具檢查、報告解讀、給出治療方案和康復建議等,均可以在對話中完成,并且通過上傳檢查結果等交互行為,MedGPT 可以 " 補上 " 線下未參與部分,進而做出可靠回答。

此時,于患者而言,MedGPT 的實際角色變成了一個可以識別和診斷大部分常見疾病,并給出進一步線下檢查或用藥、診療建議的 "AI 家庭醫生 "。

特別是當用戶養成隨手問診的行為依賴,持續反饋不同醫院的線下就診信息,而 MedGPT 又能儲存并自動調取歷史記錄時,就儼然成為了一個身邊最清楚你過去病史和身體狀況變化的、普通人也能擁有的全天候隨時守護的 " 家庭醫生 ";

對醫生而言,MedGPT 可以成為一個幫助高年資醫生完成基礎工作,進行信息核對、查漏補缺、跟蹤隨訪及進行患者管理的 "AI 助理醫師 ",也可以是一個幫助低年資醫生快速學習和成長、隨時探討病例并分析思路的 "AI 醫生導師 ",還可以是一個幫助一線醫生及時獲取前沿治療指南和專家共識、更新自身專業儲備的 " 學術推廣 AI 醫生 "。

而對于整個醫療醫藥行業而言,大模型 AI 技術則可能成為一個為行業帶來新一輪發展動力的全新 " 引擎 ",將這一垂類模型應用于不同的場景、不同載體上,能夠不斷碰撞產生新的火花。

MedGPT 的研發企業醫聯,其自身已在醫療領域深耕近十年。2014 年公司成立,2017 年獲得互聯網醫院牌照,2018 年開設首個互聯網醫院科室感染科,同期啟動自主研發的丙肝患者管理體系。目前平臺擁有數十萬名注冊醫生,覆蓋腫瘤、心腦血管、糖尿病、呼吸、慢性腎病、感染、精神心理、消化、神經、中醫等多個病種學科領域。

MedGPT 同樣也是醫聯的全新引擎,作為第一個大模型應用在醫療場景應用的探索者,有望引領行業真正進入數字醫療 2.0 時代。

醫聯 MedGPT 項目負責人早就 " 喊話 ",希望業內 AI 科技、醫學、院校機構、醫療多模態應用等各種類型的合作伙伴,共同開發建設通用型人工智能技術的醫療應場景為醫療行業的技術發展貢獻力量。

當前其主要征集的合作伙伴包括三大類:一是數據合作,包括三甲醫院、相關醫療數據企業等;二是科室建設合作,包括三甲醫院、醫學專家、數字醫療企業、數字療法等;三是多模態模型合作,包括但不限于輔助診斷模型、治療推薦模型、預后評估模型、藥物發現模型和流行病學模型等。

世界性難題,往往由顛覆性科技推動解決

盡管 MedGPT 的出現令眾多醫生驚艷,也讓我們進一步打開了未來就醫便捷化的可能性,但不難猜想,當前一定還存在些許優化空間。

比如,為了保證結果 " 不出錯 ",醫療 GPT 給出的建議是否存在過度診療的傾向?

又比如,醫療 GPT 對患者疾病做出診斷和治療方案,都是基于目前現有的專家共識或者診療指南,但一些新開發的藥物的臨床應用,仍然需要一線專家去探索嘗試,現階段 AI 技術的應用大概率還不會突破人類醫生自身的認識邊界。

不過,這并不會影響這項技術所帶來的興奮和未來的想象空間。

醫療改革一向是個世界性難題,對于中國這個人口龐大、地域廣袤的發展中國家而言則更甚。早自 2009 年起我國便開始探索和鼓勵公立醫院醫生多點執業,2015 年起我國正式提出并開始在多個城市試點分級診療制度,近年來各地醫聯體、醫共體持續推行遠程醫療等,均是為了改善醫療衛生資源在不同地區分配不平衡、百姓看病難的問題。

科技的發展或許難以對抗自然規律的生老病死,但我們可以展望的是,有了 MedGPT,無論身處何時何地,我們將能夠以自然對話的最低門檻形式,即時獲取自己關心或者迫切需要的權威醫療健康信息。

所謂 " 低門檻對話 ",一方面要求技術在于打破時間和空間的限制,另一方面還在于用戶體驗上,語言溝通的 " 無障礙 "。

因此 "AI 醫生 " 的自然語言交互能力也格外重要,除了準確、靠譜、專業,能聽到患者非專業用語表達的 " 大白話 ",是保證用戶體驗的基本。

例如在真實評測體驗中,對于一句通俗的 " 肚子疼 ",AI 醫生會進一步引導患者說出具體的疼痛部位、疼痛持續的頻率、疼痛方式等,并通過詢問飲食情況、有無外力撞擊、有無相關病史等細節、不斷縮小范圍、排除錯誤判斷,最終給出確切答案。

AI 醫生沒有問診的時間限制,也不懂何為壓力和情緒,可以不厭其煩地 7*24 小時接診。

目前,醫聯 MedGPT 已經可以覆蓋我國最新疾病分類標準(ICD10)中 60% 的疾病病種,并在近期將研發重心傾斜在多發疾病,以提升數字醫院的普惠率。據悉預計在 2023 年底,可以覆蓋 80% 病種的就診需求。

有一天,當 MedGPT 真正走向成熟和普及,不僅有助于打破醫療資源的地域不平衡,對于消除醫學專業信息鴻溝、減少誤診漏診,提升國民整體的健康素養和健康水平,都有巨大幫助。

與此同時,MedGPT 會不斷沉淀用戶關于疾病和患者診療行為的真實世界數據,其中不僅包括原本靜靜躺在各個公立醫院電腦信息系統內的診療數據,也包括醫院所無法持續追蹤的院外數據,隨著相關法律法規的健全,這些海量數據也有望被釋放出來,對于罕見疾病的新藥研發、常見病的健康管理甚至是針對精準人群的健康保險產品開發等,都具有重要意義。

屆時,我們能夠真正期待全新的 " 健康新世界 "。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀