根據PLOS One上發(fā)表的一項研究,在對50萬(wàn)英國生物銀行參與者的研究中,包括深度學(xué)習和隨機森林在內的機器學(xué)習方法極大地提高了諾丁漢大學(xué)團隊預測過(guò)早死亡的能力。

該研究由助理教授兼研究科學(xué)家Stephen F. Weng博士率先進(jìn)行,旨在通過(guò)開(kāi)發(fā)和報告新穎的預后模型以補充現有技術(shù),將機器學(xué)習整合到傳統的流行病學(xué)工作中。兩年前,同一團隊報告發(fā)現機器學(xué)習模型可以將心血管疾病預測的準確性提高約3.6%。
Weng和合著(zhù)者寫(xiě)道:“在大數據時(shí)代,機器學(xué)習可以潛在地改變醫療保健,提供診斷評估方法并個(gè)性化與臨床醫生同等或優(yōu)于臨床醫生的個(gè)性化治療決策,這令人非常樂(lè )觀(guān)。” “使用機器學(xué)習開(kāi)發(fā)的應用程序和算法所面臨的挑戰不僅是增強傳統方法可以實(shí)現的目標,而且還要以類(lèi)似透明和可復制的方式開(kāi)發(fā)和報告它們。”

對于他們目前的工作,研究人員考慮了502,628名40至69歲的成年人,他們的健康信息已于2006年至2010年期間記錄在UK Biobank中。他們使用人口統計學(xué)數據并考慮到生物特征識別,臨床和生活方式因素,開(kāi)發(fā)了預測死亡率模型,學(xué)習,隨機森林和Cox回歸。
根據研究小組的結果,將近3%的研究人群在累計隨訪(fǎng)3,508,454人年期間死亡,并且死亡率數據與國家記錄相符?;谀挲g和性別的Cox模型(一種傳統的風(fēng)險預測方法)具有最小的預測性,曲線(xiàn)下面積(AUC)為0.689,其次是多變量Cox回歸模型,該模型可將6.2%的辨別力提高AUC為0.751。
應用隨機森林進(jìn)一步將判別力提高了3.2%,AUC達到0.783,深度學(xué)習模型最成功,從多元Cox回歸方法獲得的辨別力為0.790,再提高了3.9%的判別力。

兩種機器學(xué)習算法(分別是隨機森林和深度學(xué)習)與準年齡和性別Cox回歸模型相比,分別提高了9.4%和10.1%的辨別力。雖然兩種機器學(xué)習方法都達到了相似的判別水平并進(jìn)行了很好的校準,但Cox回歸模型始終高估了風(fēng)險。
“研究表明,使用機器學(xué)習來(lái)探索各種個(gè)體臨床,人口統計學(xué),生活方式和環(huán)境風(fēng)險因素的價(jià)值,以產(chǎn)生使用標準方法無(wú)法實(shí)現的新穎而整體的模型,” Weng等人。說(shuō)過(guò)。“這項工作表明,在開(kāi)發(fā)用于預后或診斷的模型時(shí),應更常規地考慮使用機器學(xué)習。”
這組作者說(shuō),下一步包括在更廣泛的人群中驗證這些方法,并將其集成到醫療保健系統中,以及探索其他機器學(xué)習模型(例如支持向量機或梯度提升)如何參與風(fēng)險預測。
他們寫(xiě)道:“機器學(xué)習模型組成的有趣變化可以為潛在的重大風(fēng)險因素提供新的假設生成,否則這些風(fēng)險因素將無(wú)法被發(fā)現。” “然后,可以專(zhuān)門(mén)設計流行病學(xué)研究,并相應地進(jìn)行驗證,以驗證這些信號。”
