國立台灣大學資工研究所教授徐宏民認為,醫學與資訊結合,才能了解問題,進而快速解決問題。蔡騰輝攝
藉由機器學習和深度學習,與跨界人士不斷合作包括智慧醫療在內各式應用的國立台灣大學資工研究所教授徐宏民表示,深度學習技術已能在許多面向推進醫療並且有所突破,尤其在視覺感知、辨識、生成、時序預測上都有很多進展,然而在運算效率、訓練資料、自動網路設計上則是各團隊偶會碰到的瓶頸。
「CT和MRI的前後序列很重要」徐宏民一語點出醫師領域知識的價值以及跨領域合作(Cross-disciplined cooperation)的關鍵。如果沒有醫師告訴工程師醫學的思考邏輯,工程師不會知道、也不知道應該要這樣才能確實切入問題。目前已和台大醫院蘇東弘醫師合作癌症相關研究,將過去兩三種影像顏色,擴充至48種,僅而提升診斷時的依據。
如何解決醫療影像不足的問題
機器學習或深度學習的訓練,一般多從公開影像資料著手,但如果資料量不夠,只能以少量資料來訓練時,或許影像翻轉、顏色調整等資料轉譯方式,以及CT與MRI影像互轉等合成影像,都能夠替資料產出多樣性。不過,同時也提醒,資料量越大、雜訊也會越多,所以在訓練模型時,並不是越多越好,有時候過多的資料,很可能會讓產出的正確率大幅下降。
影像機器學習應用方面,可概分為4種方法,包括影像層數應用、簡化法、蒸餾法、運算單位修剪法。舉例來說,若是想要加快機器學習的效率,影像較大的演算層數就要少一些,而影像較小的經過層數就可以多一點;另外,如果有矩陣較多的情況,也可以用低秩逼近法 (low-rank approximation)來簡化。
擴增智慧 VS 人工智慧
針對很多人喜歡標榜「人工智慧(Artificial Intelligence)」,徐宏民認為「機器學習」(Machine Learning)會更適切一些。因為分類、排序、交易與行為建議、包括聲音和影像的互轉、跨國語言之間轉譯、影像判別等地「翻譯」都算是在機器學習能夠幫忙的範圍之內。此外,也將傾向將一般人所謂的人工智慧定義為「擴增智慧(Augmented Intelligence)」。
機器學習的價值在於看見人類所看不到、沒看到、看不清楚的部分。比方說,在數千張DICOM醫學檢驗影像當中,醫師工作一整天,在疲勞的狀況下,難免會有些內容沒看到或是不完全,因此,這時候就是電腦影像輔助判別系統的價值所在。此外,臺北市立聯合醫院忠孝院區醫務長郭麗琳也說,電腦輔助系統的價值,不僅在於節省時間,更是能偵測出人類所看不到的資訊,那才更是具有劃時代意義的技術推進。
邊緣運算與情緒識別
選擇哪一種,沒有特定的答案,但有些醫療院所的網路基礎建設不像都會區那麼強,連線速度較慢,然而醫學救治分秒必爭,也因此徐宏民認為未來部分的雲端運算效能將會逐漸下放置當地,和端點儀器整合,以邊緣運算的方式提供即時服務。
「人工同理心」也是臺北醫學大學科技學院院長李友專相當關注的技術,針對電腦如何了解人類的情緒,徐宏民與團隊透過分析影片中人類使用的語言、說話的內容、抑揚頓挫、聲音變化、影像光線等不同元素,成功以電腦全自動方式剪輯出電影預告片。其中成功的關鍵,更至在於影片的解析度與光影是否適宜。也就是說,如果未來不論是在本地診所或是透過遠距醫療的方式,要讓電腦系統得以判斷人類的情緒,進而提供適當的回應,鏡頭解析度與輸入時的光影設置都會相當關鍵。
報導截取自Digitimes:https://www.digitimes.com.tw/iot/article.asp?cat=158&cat1=20&cat2=70&cat3=15&id=0000565742_4KY62INZ54ZIQ41LCOFOC