研究人員將計算機與疾病聯(lián)系起來(lái)

2020-01-22 13:11:47    來(lái)源:    作者:

麻省理工學(xué)院的一項新研究發(fā)現了“健康知識圖”,該圖顯示了癥狀與疾病之間的關(guān)系并旨在幫助臨床診斷,但在某些情況和患者人群中可能不足。結果還提出了提高性能的方法。

研究人員將計算機與疾病聯(lián)系起來(lái)

健康知識圖通常由專(zhuān)家臨床醫生手動(dòng)編輯,但這可能是一個(gè)費力的過(guò)程。最近,研究人員嘗試通過(guò)患者數據自動(dòng)生成這些知識圖。麻省理工學(xué)院的團隊一直在研究這些圖表在不同疾病和患者人群中的表現情況。

在2020年太平洋生物計算研討會(huì )上發(fā)表的一篇論文中,研究人員基于真實(shí)數據集對自動(dòng)生成的健康知識圖進(jìn)行了評估,該數據集包含270,000多名患有近200種疾病和770多種癥狀的患者。

研究人員將計算機與疾病聯(lián)系起來(lái)

該團隊分析了各種模型如何使用電子病歷(EHR)數據(包含患者的醫療和治療歷史)來(lái)自動(dòng)“學(xué)習”疾病-癥狀相關(guān)性的模式。他們發(fā)現,對于年齡較大或非常年輕的患者或男性或女性患者的比例較高的疾病,該模型的效果特別差-但為正確的模型選擇正確的數據并進(jìn)行其他修改可以改善性能。

該想法旨在為研究人員在使用電子健康記錄構建健康知識圖時(shí)有關(guān)數據集大小,模型規格和性能之間的關(guān)系提供指導。這可能會(huì )產(chǎn)生更好的工具,以幫助醫生和患者進(jìn)行醫療決策,或者尋找疾病和癥狀之間的新關(guān)系。

“在過(guò)去的10年中,醫院使用EHR的人數猛增,因此我們希望挖掘大量數據來(lái)學(xué)習這些疾病-癥狀關(guān)系圖,”第一作者Irene Y. Chen說(shuō)。電氣工程與計算機科學(xué)系(EECS)。“至關(guān)重要的是,我們必須仔細檢查這些圖,以便將它們用作診斷工具的第一步。”

麻省理工學(xué)院計算機科學(xué)與人工智能實(shí)驗室(CSAIL)的研究生Monica Agrawal與Chen一起發(fā)表論文。貝絲以色列女執事醫療中心(BIDMC)的史蒂芬·霍恩(Steven Horng);EECS教授David Sontag是CSAIL和醫學(xué)工程與科學(xué)研究所的成員,也是臨床機器學(xué)習小組的負責人。

患者與疾病

在健康知識圖中,有數百個(gè)節點(diǎn),每個(gè)節點(diǎn)代表不同的疾病和癥狀。邊緣(線(xiàn)條)將諸如“糖尿病”之類(lèi)的疾病節點(diǎn)與諸如“口渴”之類(lèi)的相關(guān)癥狀節點(diǎn)相連接。谷歌在2015年推出了自己的版本,該版本由幾位臨床醫生在數百小時(shí)內人工策劃,被認為是黃金標準?,F在,當您搜索一種疾病時(shí),系統會(huì )顯示相關(guān)癥狀。

在2017年《 自然科學(xué)報告》的 一篇論文中,Sontag,Horng和其他研究人員利用了他們當前研究中相同的270,00名患者的數據(這些數據來(lái)自BIDMC的急診科,在2008年至2013年之間)來(lái)建立健康知識圖。他們使用了三種模型結構來(lái)生成圖,分別稱(chēng)為邏輯回歸,樸素貝葉斯和噪聲OR。研究人員使用Google提供的數據,將自動(dòng)生成的健康知識圖與Google健康知識圖(GHKG)進(jìn)行了比較。研究人員的圖表效果非常好。

在他們的新工作中,研究人員進(jìn)行了嚴格的錯誤分析,以確定模型對哪些特定患者和疾病的治療效果不佳。此外,他們還嘗試了從急診室以外向更多的數據擴展模型。

在一項測試中,他們將數據分解為疾病和癥狀的亞群。對于每種模型,他們研究了疾病與所有可能癥狀之間的聯(lián)系,并將其與GHKG進(jìn)行了比較。在論文中,他們將調查結果分為50種表現最差的疾病和50種表現最差的疾病。表現不佳的例子是多囊卵巢綜合征(影響女性),過(guò)敏性哮喘(非常罕見(jiàn))和前列腺癌(主要影響老年男性)。高績(jì)效者是較常見(jiàn)的疾病和病癥,例如心律不齊和足底筋膜炎,這是組織沿腳腫脹的原因。

他們發(fā)現,對于幾乎所有疾病和患者,總的來(lái)說(shuō),有噪聲的OR模型對錯誤的抵御能力最強。但是,對于具有多種同時(shí)發(fā)生的疾病和同時(shí)出現的癥狀的所有模型,以及年齡很小或在85歲以上的患者,所有模型的準確性都會(huì )下降。對于百分比很高或很低的患者群體,其性能也會(huì )受到影響性別。

基本上,研究人員假設,性能不佳是由具有異常預測性能的患者和疾病以及潛在的無(wú)法衡量的混雜因素引起的。例如,老年患者往往比年輕患者進(jìn)入疾病和相關(guān)癥狀更多的醫院。Chen說(shuō),這意味著(zhù)模型很難將特定疾病與特定癥狀相關(guān)聯(lián)。她補充說(shuō):“類(lèi)似地,年輕患者沒(méi)有很多疾病或許多癥狀,如果他們患有罕見(jiàn)疾病或癥狀,就不會(huì )以模型理解的正常方式出現。”

分割數據

研究人員還收集了更多的患者數據,并創(chuàng )建了三個(gè)不同粒度的不同數據集,以查看這是否可以改善性能。在原始分析中使用的270,000次就診中,研究人員提取了140,804名獨特患者的完整EHR歷史,追溯了十年,并從各種來(lái)源(例如醫生筆記)中總共獲得了740萬(wàn)個(gè)注釋。

數據集創(chuàng )建過(guò)程中的選擇也影響了模型性能。其中一個(gè)數據集將140,400個(gè)患者歷史記錄的每一個(gè)匯總為一個(gè)數據點(diǎn)。另一個(gè)數據集將740萬(wàn)個(gè)注釋中的每個(gè)注釋視為一個(gè)單獨的數據點(diǎn)。最后一個(gè)為每個(gè)患者創(chuàng )建“情節”,定義為連續的就診系列,間隔不超過(guò)30天,總共產(chǎn)生約140萬(wàn)次發(fā)作。

從直覺(jué)上講,將完整的患者歷史記錄匯總到一個(gè)數據點(diǎn)的數據集將導致更高的準確性,因為考慮了整個(gè)患者歷史記錄。然而,與直覺(jué)相反,這也使樸素的貝葉斯模型在某些疾病上的表現更差。“通過(guò)機器學(xué)習模型,您可以假設患者信息越多越好。但是這些模型取決于您提供給它們的數據的粒度。” Chen說(shuō)。“您使用的模型類(lèi)型可能會(huì )不知所措。”

如預期的那樣,提供模型人口統計信息也可能是有效的。例如,模型可以使用該信息排除所有男性患者,例如,預測宮頸癌。而且某些疾病對于老年患者而言更為常見(jiàn),可以在年輕患者中消除。

研究人員將計算機與疾病聯(lián)系起來(lái)

但是,令人驚訝的是,人口統計信息并不能提高最成功模型的性能,因此可能不需要收集數據。Chen說(shuō),這一點(diǎn)很重要,因為根據數據編譯數據和訓練模型可能既昂貴又耗時(shí)。但是,根據模型,使用數據分數實(shí)際上可能不會(huì )提高性能。

接下來(lái),研究人員希望利用他們的發(fā)現建立一個(gè)強大的模型,以在臨床環(huán)境中進(jìn)行部署。當前,健康知識圖了解疾病和癥狀之間的關(guān)系,但是不能從癥狀中直接給出疾病的預測。“我們希望將任何預測模型和任何醫學(xué)知識圖表置于壓力測試之下,以便臨床醫生和機器學(xué)習研究人員可以自信地說(shuō):'我們相信這是一種有用的診斷工具,” Chen說(shuō)。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。