清華校友立功!谷歌發布首個全科醫療大模型,14 項任務 SOTA
全球首個全科醫療大模型正式發布:
由谷歌 Research 和 DeepMind 共同打造的多模態生成模型Med-PaLM M,懂臨床語言、懂影像,也懂基因組學。
【資料圖】
而在 246 份真實胸部 X 光片中,臨床醫生表示,在高達 40.50% 的病例中,Med-PaLM M 生成的報告都要比專業放射科醫生的更受采納,這表明 Med-PaLM M 并非 " 紙上談兵 ",用于臨床指日可待。
對此,谷歌也自己給出了評價:這是通用醫學人工智能史上的一個里程碑。
所以,Med-PaLM M 具體什么來頭?
全球首個全科醫療大模型來了在正式了解 Med-PaLM M 之前,我們先簡單介紹谷歌自建的多模態醫學測試基準MultiMedBench。
谷歌表示,在 MultiMedBench 之前,市面上缺乏這樣一個全面的多模態醫學基準。
該基準由 12 個開源數據集和 14 個單獨的任務組成,用于測量通用生物醫學 AI 執行各種臨床任務的能力。
其中 12 個數據集共包含了六種生物醫學數據模式(文本、放射學(CT、MRI 和 X 光)、病理學、皮膚病學、乳房 X 光檢查和基因組學),14 個任務則涵蓋五種類型(問題回答、報告生成和摘要、視覺問題回答、醫學圖像分類和基因組變體調用)。
Med-PaLM M 就在上面進行了微調。正如其名 "M" 代表多模態,Med-PaLM M 相比之前谷歌發布的 Med-PaLM、Med-PaLM-2 等醫療大模型,是一個主打全科、通才的醫療 AI,不僅能回答各種醫學問題,還能直接看片、懂基因組學。
它的基本架構是 PaLM-E(多模態語言模型),并采用 ViT 預訓練模型作為視覺編碼器,具體實現了三種組合:
-PaLM 8B+ViT 4B ( PaLM-E 12B )
-PaLM 62B+ViT 22B ( PaLM-E 84B )
-PaLM 540B+ViT 22B ( PaLM-E 562B )
通過 MultiMedBench 對 PaLM-E 模型進行微調,并將其與生物醫學領域對齊,Med-PaLM M 得以誕生。以下是一些實現細節:
(1)數據集和預處理方面,將 MultiMedBench 中所有圖像大小調整為 224 × 224 × 3,同時按需使用填充來保留原始縱橫比。
(2)由于谷歌的目標是訓練一個通用的生物醫學 AI 模型,使用統一的模型架構和模型參數,用多模式輸入執行多個任務。為此,他們為 Med-PaLM M 提供了特定于各種任務的指令以及一個純文本的 " 一次性示例 "。
如下圖所示的胸部 x 光解讀和皮膚病變分類任務所示,這些指令有一種寫提示語的味道,以 " 你是一個很給力的放射科助理 " 開頭。
(3)訓練過程中,作者對 PaLM-E 進行了端到端的微調。在多模態任務中,圖像標記與文本標記交錯,以形成對 PALM-E 模型的多模式上下文輸入。對于所有微調任務,多模式上下文輸入最多包含 1 個圖像,然而 Med-PaLM M 能夠在推理過程中處理具有多個圖像的輸入。14 項任務接近 or 超 SOTA,臨床戰勝 40% 放射科醫生
性能評估階段,作者主要測試 Med-PaLM M 的 " 多面手 "(即全科)能力、突發涌現能力以及放射學報告生成質量(與真實放射科醫生進行對比)。
結果顯示:
(1)與專業 SOTA 模型和無生物醫學領域微調的廣義模型(PaLM-E 84B)相比,Med-PaLM M 在 MultiMedBench 上的所有任務、數據集和指標組合(共計 14 項)中,性能均基本接近 SOTA 或超過 SOTA。
需要注意的是,該結果是在沒有任何特定任務定制的情況下使用相同的模型權重集實現的。
(2)在 scale 實驗中,三個不同規模的 Med-PaLM M 對各類任務的影響各不相同:粗略來看,對于純語言任務和需要調整的多模式任務來說,模型越大越好;但對圖像分類和胸部 X 光報告生成任務來說,84B 的效果比 562B 表現反而更好一些。
(3)零樣本思維鏈推理能力涌現。Med-PaLM M 可以通過胸部 X 射線圖像檢測沒有訓練過的結核病,與針對該類數據集進行專門優化過的 SOTA 結果相比,它的準確率已相差不大。不過,它給出的具體報告還是存在具體錯誤,說明還有不足。(4)放射性報告生成測試中,80B 參數的 Med-PaLM M 平均有 40.50% 的報告比放射科醫生做的更好(被臨床醫生采納),而 12B 和 562B,分別為 34.05% 和 32.00%。另外,遺漏和錯誤率測試顯示,Med-PaLM M 12B 和 84B 模型平均每份報告的遺漏率最低,為 0.12,其次是 562B 模型為 0.13。這一結果與 MIMIC-CXR 上人類放射科醫生基線報告的相當。多久能實用?
作為人類首個全科醫學大模型,Med-PaLM M 多久能投入實用,想必也是大家關心的問題。
雖然它被 " 自詡 " 為里程碑(主要是因為靠一組模型權重在各種生物醫學任務上接近或超過 SOTA),但谷歌也指出目前還有不少局限性待解決。
比如缺乏高質量的測試基準。谷歌表示,這是迄今為止通用生物醫學人工智能發展的關鍵瓶頸,因為只有高質量的基準才能在很大程度上促進相關領域的發展。
而目前的 MultiMedBench 還存在單個數據集大小有限以及模式和任務多樣性有限(比如缺乏轉錄組學和蛋白質組學)等問題。
再比如,擴展(scale)多模態 AI 模型也具有挑戰性。
在語言領域,這一操作可以顯著提高性能和應急能力。然而,谷歌在 Med-PaLM M 上的初步實驗表明,由于醫學數據的稀缺性,這對于生物醫學任務領域的多模態廣義模型來說并沒有這么簡單。
作者介紹
目前,谷歌僅發布了 Med-PaLM M 的論文。
它一共有兩位共同一作,其中一位叫 Tao Tu。他本科畢業于北理工(2010 年),碩士畢業于清華大學,博士為美國哥倫比亞大學,專業都是醫學工程。目前已在谷歌擔任軟件工程師快兩年。
論文地址:https://arxiv.org/abs/2307.14334
責任編輯:hnmd003
相關閱讀
相關閱讀
-
清華校友立功!谷歌發布首個全科醫療大模型,14 項任務 SOTA
全球首個全科醫療大模型正式發布:由谷歌Research和DeepMind共同打造的
-
百度智能云“千帆大模型平臺”升級:接入 LLaMA2 等 33 個模型
品玩8月2日訊,據科創板日報報道,百度智能云千帆大模型平臺已完成新一
-
阿里云通義聽悟新增自動提取 PPT 等三大功能
品玩8月2日訊,阿里云通義聽悟上線了三大新功能,包括國內音視頻AI領域
-
Microsoft 成為 2023 年第二季度網絡釣魚詐騙中最常被冒充的品牌
CheckPointResearch的最新《品牌網絡釣魚報告》顯示,隨著Google排名上
-
警惕“黑客”來敲門!360 數字安全專家呼吁須提升安全防范意識
隨著互聯網的迅速發展,網絡已經成為我們日常生活不可或缺的一部分,與
-
安徽省宿州市市場監管局高新區分局:履行觀察員職責 確保資質認定評審公正性
中國質量新聞網訊近日,根據安徽省市場監管局工作部署,檢驗檢測機構資
-
C視頻·大運村的“young”氣生活丨“三”人行必有我師,他們在這里練太極
三人行必有我師,他們在這里練太極
-
痛心!北京房山藍天救援女隊員王宏春在救災中犧牲
記者8月2日從北京藍天救援隊獲悉,在此次強降雨搶險救災中失聯的房山藍
-
未名醫藥上半年預虧4764.90萬元 凈利同比降298.90 %
近期,未名醫藥(002581 SZ)公布2023年半年度業績預告,報告期歸屬于上
-
三星 F34 5G 新機官宣!8 月 7 日正式發布 不到 1500 元?
【手機中國新聞】手機中國獲悉,三星F345G新機正式官宣,將于8月7日在
-
華為 Mate60 系列高清圖曝光!這次靈動島有一點變化
【手機中國新聞】8月2日,有數碼博主放出了最新制作的華為Mate60系列假
-
10 元起步的奶茶店早餐,怎么就成了打工人的福音?
圖片來源@視覺中國文|觀潮新消費,作者|行藏,編輯|杜仲當代打工人,一
-
俄羅斯正式禁用 iPhone?蘋果回應來了
鴨鴨跟大家伙兒上回聊到俄羅斯政府部門將會全面禁用iPhone的事兒。詳情
-
李杰:一加 Ace2 Pro 用的是地球上能選到的最好芯片
【手機中國新聞】8月2日,手機中國注意到,一加手機官方正式宣布一加Ac
-
2023年最后5個月,值得期待的10款車
不知不覺時間已經來到2023年8月,掐指一算今年滿打滿算也就剩下5個月時
-
關聯公司成被執行人還借錢收購田中精機?肖永富入主后,加碼布局新能源
關聯公司成被執行人還借錢收購田中精機?肖永富入主后,加碼布局新能源
-
姚振華遭多人圍堵討薪,沖突中被打掉眼鏡,隨即開會再裁員
日前,網傳視頻顯示,寶能集團董事長姚振華被討薪員工圍堵在深圳市羅湖
-
意外保險出車禍可以報銷嗎?報銷多少錢?
可以報銷。 意外事故是在意外險的保障范圍之內的,其一般可以對被保險
-
20萬的重疾險值得買嗎?怎么買?
這個問題的答案并不是簡單的肯定或否定。 首先,我們需要根據個人的經
-
單位購買的意外險如何理賠?理賠比例是多少?
首先,被保險人需要及時向單位報告事故,并提供相關的證明文件,如醫療
-
工地意外傷害保險怎么賠付?賠償標準是什么?
一般來說,保險公司會要求被保險人在發生意外傷害后及時向保險公司報案
-
太平洋壽險分紅如何領取?領取多久到賬?
太平洋壽險的分紅領取方式主要有兩種:現金領取和再投保。客戶可以根據
-
浙江榮泰聚焦耐高溫絕緣云母制品,A股將迎“電池安全衛士”
文 孫沐霖8月1日,浙江榮泰電工器材股份有限公司(以下簡稱“浙江榮泰”
-
關聯公司成被執行人還借錢收購田中精機?肖永富入主后,加碼布局新能源
肖永富入主后,田中精機(300461 SZ)業績出現好轉。今年一季度,田中
-
一起看!這9部紀錄片,讓課本知識活起來了
9部中央電視臺出品的紀錄片,把課堂里涉及到的人文、歷史和地理信息生
-
捍衛祖國統一堅定不移!東部戰區發布熱血MV《底氣》
硬核實力,是戰場制勝的底氣!瞄準制勝先機,苦練本領殺敵……打勝仗有
-
阿里分家,優酷“斷流”
撰文|何芙蓉編輯|吳先之在長視頻平臺虧損的漫漫長路中,愛奇藝一度因為
-
2023《財富》世界500強:10家深企上榜,一家排名“狂飆”
2023年8月2日,最新的《財富》世界500強排行榜正式發布。深圳衛視記者
-
韓國KOSPI指數跌幅擴大至2%,日經225指數現跌2.17%,澳大利亞S&P/ASX200指數現跌1.08%
韓國KOSPI指數跌幅擴大至2%,日經225指數現跌2 17%,澳大利亞S&P ASX20
-
平安壽險退保去哪里退?要注意什么?
平安壽險退保可以通過多種途徑進行,包括線上和線下兩種方式。 首先,
精彩推薦
閱讀排行
精彩推送
- 小學生平安險怎么報銷?可以報銷...
- 意外保險報銷需要什么材料?報銷...
- 平安車險個人意外險有必要買嗎?...
- 百萬醫療保險過期一天能續費嗎?...
- 網約車司機馳援京冀 滴滴救援隊...
- 傳豐田將在美國為斯巴魯生產電動...
- 齊暉醫藥終止上交所主板IPO 保...
- 榮盛發展:收深交所第二輪定增事...
- 阿里巴巴、小米、理想汽車等多家...
- 我在網上做手機租賃,遇到了一批...
- 海爾懼怕的對手是小米?
- 探訪北京雁柏山莊:“豪華”酒店...
- 京東辟謠收購永輝超市,永輝成色...
- 杭州65億元成交4宗涉宅地塊,綠...
- 嘉靖差點把明成祖朱棣的牌位扔出...
- 山西鋼廠產量穩居高位 資源悄然累庫
- 今日歐元/美元匯率交易策略(202...
- 玫莉蔻玻尿酸面膜,開啟“膜法”...
- 酒駕身故意外保險理賠嗎?理賠多...
- 北京醫療保險要交多少年?要交多...
- 重疾險交20年還是30年劃算?每年...
- 人意外死亡保險公司賠多少?理賠...
- 意外險買了多長時間生效?可以保...
- 寶馬集團上調2023年全年利潤率預期
- 阿維塔7月交付1786輛
- 通用因高田氣囊故障召回超900輛汽車
- 美國因轉向失靈對28萬輛特斯拉汽...
- 福特F-150 Lightning產能將提升兩倍
- 九強生物8720.93萬股限售股將于8...
- 7月滬深兩市IPO申報降溫 上會...