根據世界衛生組織,肺癌每年造成 1700 萬人死亡,是致死率最高的癌症(死亡率超過乳腺癌、前列腺癌和結直腸癌的總和),是全球第六大死因。儘管肺癌在所有癌症中存活率最低,但如果發現得早並及早干預是可以有更多治療機會的。然而,統計數據顯示,大部分肺癌到了晚期才被診斷出來。
過去三十年,醫生探索了很多方式來診斷肺癌高危人羣。儘管低劑量 CT 篩查被證明能夠降低肺癌死亡率,但是仍然存在一些問題導致不明確的診斷結果、後續不必要治療、醫療成本等等。
谷歌的最新研究
根據谷歌博客介紹,谷歌於 2017 年末開始探索如何使用 AI 解決一些挑戰。研究者利用 3D 體建模的進展,結合來自谷歌合作伙伴(包括美國西北大學)的數據集,在建模肺癌預測方面取得了很大進步,爲未來臨牀測試奠定了基礎。谷歌的相關研究已發佈在 Nature Medicine 上。
該研究所用數據集:
該研究中來自美國西北大學的數據集暫未公開。
放射科醫生在一次 CT 掃描中通常需要查看數百張 2D 圖像,而癌症是很微小也很難看到的。谷歌研究者創建了一個模型,該模型不僅能夠生成肺癌惡性腫瘤整體預測,還可以識別出肺部不易被察覺的惡性組織(肺結節)。該模型還可以將之前的掃描結果考慮在內,幫助預測肺癌風險,因爲肺結節的增長速度有可能預示着有惡性腫瘤的存在。
整體建模框架圖示。
在谷歌的這項研究中,研究者利用 45856 個去識別化的胸部 CT 掃描案例(其中一部分是癌症病例),這些案例來自美國國家肺癌篩查試驗(National Lung Screening Trial, NLST)和美國西北大學的 NIH 研究數據集。研究者使用另一個數據集進行驗證,並將實驗結果與六名美國認證放射科醫生的診斷結果進行對比。
在使用單次 CT 掃描進行診斷時,谷歌的模型性能堪比甚至優於六名放射科醫生。與沒有輔助的放射科醫生相比,該模型檢測出的癌症病例多出 5%,且假陽性檢查結果減少了 11% 以上。谷歌的方法獲得了 94.4% 的 AUC(曲線下面積)。
該模型在完整 NLST 數據集上和在單獨測試集上的結果。
下圖展示了在僅使用當前 CT 掃描時,該模型與人類放射科醫生的肺癌檢測性能對比:
下圖展示了,在使用當前和之前 CT 掃描時,該模型與人類放射科醫生的肺癌檢測性能對比:
對於無癌症史的無症狀病患,該 AI 系統審查和檢測出了潛在肺癌,而該病患先前被診斷爲正常。
下一步計劃
儘管肺癌篩查具有很大價值,但現在美國僅有 2-4% 的相關病患接受篩查。谷歌的這項研究展示了人工智能在提升肺癌篩查準確率和一致性方面的潛力,這將有助於加速在全球範圍內推廣肺癌篩查。
這些初步結果令人鼓舞,但後續研究將對臨牀實踐中的影響和效果進行評估。研究者正與 Google Cloud Healthcare 和 Life Sciencecs 團隊合作,並通過 Cloud Healthcare API 提供該模型,同時與全球合作伙伴進行早期接洽以繼續其他的臨牀驗證研究和部署。
論文:End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography
論文地址:https://www.nature.com/articles/s41591-019-0447-x
2018 年,美國肺癌死亡人數約爲 160000,是美國排名第一位的腫瘤死因。使用低劑量 CT 篩查進行肺癌掃描已被證實能夠將死亡率降低 20–43%,低劑量 CT 篩查現已包含在美國篩查指南中。但仍然存在一些挑戰,包括評估者差異可變性(inter-grader variability)以及較高的假陽性和假陰性率。
谷歌研究者提出了一種深度學習算法,利用病患當前和以前的 CT 來預測肺癌風險。他們提出的模型在 6716 個美國國家肺癌篩查試驗病例上取得了當前最佳的效果(曲線下面積爲 94.4%),並在包含 1139 個病例的獨立臨牀驗證集上獲得了類似的性能。
研究者還進行了兩項評估者研究。當以前的 CT 影像不可用時,模型效果優於所有六位放射科醫生的診斷,將假陽性率降低 11%,假陰性率降低 5%。當以前的 CT 影像可用時,模型效果與放射科醫生的診斷相當。這爲利用計算機輔助和自動化來優化篩查過程提供了機會。目前絕大多數病患處於未接受篩查的狀態,研究者認爲深度學習模型有助於提升全球範圍內肺癌的篩查準確率、一致性和推廣。
原文鏈接:https://blog.google/technology/health/lung-cancer-prediction/
報導截取自幫趣:http://bangqu.com/lFAM69.html