醫學(xué)成像中的AI技術(shù)可能會(huì )導致錯誤的診斷

2020-05-13 12:43:05    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻

一項最新的研究表明,機器學(xué)習和AI在醫學(xué)圖像重建中非常不穩定,并且可能導致誤報和誤報。

醫學(xué)成像中的AI技術(shù)可能會(huì )導致錯誤的診斷

由劍橋大學(xué)和西蒙弗雷澤大學(xué)領(lǐng)導的一組研究人員針對基于A(yíng)I和深度學(xué)習的醫學(xué)圖像重建算法設計了一系列測試,發(fā)現這些技術(shù)會(huì )導致大量偽像或數據中的不必要更改,以及最終圖像中的其他主要錯誤。在基于非AI的成像技術(shù)中通常不存在這種效果。

這種現象廣泛分布在不同類(lèi)型的人工神經(jīng)網(wǎng)絡(luò )中,這表明該問(wèn)題將不容易解決。研究人員告誡說(shuō),依靠基于A(yíng)I的圖像重建技術(shù)進(jìn)行診斷并確定治療方法可能最終會(huì )對患者造成傷害。他們的結果發(fā)表在《美國國家科學(xué)院院刊》上。

劍橋大學(xué)應用數學(xué)系主任安德斯·漢森(Anders Hansen)表示:“ 人們對醫學(xué)成像中的 AI充滿(mǎn)熱情,它可能具有革新現代醫學(xué)的潛力:但是,存在潛在的陷阱,不容忽視。”理論物理學(xué),由西蒙·弗雷澤大學(xué)的本·阿德考克博士領(lǐng)導研究。“我們發(fā)現AI技術(shù)在醫學(xué)成像中非常不穩定,因此輸入的微小變化可能會(huì )導致輸出的巨大變化。”

典型的MRI掃描可能需要15分鐘到兩個(gè)小時(shí)之間的任何時(shí)間,具體取決于掃描區域的大小和所拍攝圖像的數量?;颊咴跈C器內花費的時(shí)間越長(cháng),最終圖像的分辨率就越高。但是,需要限制患者在機器內花費的時(shí)間,以減少單個(gè)患者的風(fēng)險并增加可以執行的掃描總數。

使用AI技術(shù)提高M(jìn)RI掃描或其他類(lèi)型醫學(xué)成像的圖像質(zhì)量是解決在最短時(shí)間內獲得最高質(zhì)量圖像的問(wèn)題的有吸引力的可能性:理論上,AI可以拍攝低分辨率圖像并使其成為高分辨率版本。AI算法基于先前數據的訓練來(lái)“學(xué)習”重建圖像,并通過(guò)此訓練過(guò)程來(lái)優(yōu)化重建質(zhì)量。與僅基于數學(xué)理論而不依賴(lài)先前數據的經(jīng)典重建技術(shù)相比,這代表了根本性的變化。特別是,古典技術(shù)不會(huì )學(xué)習。

任何AI算法都需要兩件事來(lái)保證可靠性:準確性和穩定性。AI通常會(huì )將貓的圖像分類(lèi)為貓,但是圖像中幾乎看不見(jiàn)的微小變化可能會(huì )導致算法將貓分類(lèi)為卡車(chē)或桌子。在此圖像分類(lèi)示例中,可能出錯的一件事是圖像分類(lèi)不正確。但是,在圖像重建(例如醫學(xué)成像中使用的圖像重建)方面,可能會(huì )出錯。例如,諸如腫瘤之類(lèi)的細節可能會(huì )丟失或被錯誤地添加。細節可能被遮蓋,并且圖像中可能會(huì )出現不需要的偽影。

漢森說(shuō):“當涉及到有關(guān)人類(lèi)健康的關(guān)鍵決策時(shí),我們不能讓算法犯錯誤。” “我們發(fā)現,如果您使用AI和深度學(xué)習來(lái)重建醫學(xué)圖像,那么最細微的損壞(例如可能是由患者移動(dòng)引起的)可能會(huì )產(chǎn)生截然不同的結果,這意味著(zhù)這些算法缺乏所需的穩定性。”

Hansen及其來(lái)自挪威,葡萄牙,加拿大和英國的同事設計了一系列測試,以發(fā)現基于A(yíng)I的醫學(xué)成像系統(包括MRI,CT和NMR)的缺陷。他們考慮了三個(gè)關(guān)鍵問(wèn)題:與微小擾動(dòng)或運動(dòng)相關(guān)的不穩定性;關(guān)于微小結構變化的不穩定性,例如帶有或不帶有小腫瘤的大腦圖像;以及樣本數量變化的不穩定性。

他們發(fā)現某些微小的運動(dòng)會(huì )導致最終圖像中出現大量偽像,細節被模糊或完全去除,并且圖像重建的質(zhì)量會(huì )因重復進(jìn)行二次采樣而變差。這些錯誤廣泛分布在不同類(lèi)型的神經(jīng)網(wǎng)絡(luò )中。

研究人員認為,最令人擔憂(yōu)的錯誤是放射科醫生可能將其解釋為醫學(xué)問(wèn)題,而不是那些由于技術(shù)錯誤而可以輕易消除的錯誤。

漢森說(shuō):“我們開(kāi)發(fā)了這項測試,以驗證我們的論點(diǎn),即深度學(xué)習技術(shù)在醫學(xué)成像中普遍不穩定。” “我們進(jìn)行預測的理由是,在有限的掃描時(shí)間下如何進(jìn)行良好的重建是有局限的。從某種意義上說(shuō),現代AI技術(shù)打破了這一障礙,結果變得不穩定。我們通過(guò)數學(xué)方法證明了為這些不穩定因素付出代價(jià),或者簡(jiǎn)單地說(shuō):仍然沒(méi)有免費的午餐之類(lèi)的東西。”

研究人員現在專(zhuān)注于提供AI技術(shù)可以完成的基本限制。只有知道了這些限制,我們才能了解可以解決的問(wèn)題。漢森說(shuō):“基于試驗和錯誤的研究永遠不會(huì )發(fā)現煉金術(shù)士無(wú)法制造黃金:我們在現代AI方面處于類(lèi)似情況。” “這些技術(shù)永遠不會(huì )發(fā)現自己的局限性。這些局限性只能以數學(xué)方式顯示出來(lái)。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。