在這個(gè)“大數據”時(shí)代,人工智能(AI)已成為科學(xué)家的寶貴盟友。例如,機器學(xué)習算法正在幫助生物學(xué)家理解控制基因功能的令人眼花number亂的分子信號。但是,隨著(zhù)開(kāi)發(fā)出新算法來(lái)分析更多數據,它們也變得更加復雜且難以解釋。定量生物學(xué)家 Justin B. Kinney 和Ammar Tareen制定了設計高級機器學(xué)習算法的策略,使生物學(xué)家更容易理解。

該算法是一種人工神經(jīng)網(wǎng)絡(luò )(ANN)。受神經(jīng)元在大腦中連接和分支的方式的啟發(fā),人工神經(jīng)網(wǎng)絡(luò )是高級機器學(xué)習的計算基礎。盡管具有人工神經(jīng)網(wǎng)絡(luò )的名稱(chēng),但它并不是專(zhuān)門(mén)用于研究大腦的。
像塔里恩(Tareen)和金尼(Kinney)這樣的生物學(xué)家,都使用人工神經(jīng)網(wǎng)絡(luò )來(lái)分析來(lái)自稱(chēng)為DNA的“大規模平行報告基因分析”(MPRA)實(shí)驗方法的數據。利用這些數據,定量生物學(xué)家可以制作出人工神經(jīng)網(wǎng)絡(luò ),以預測哪些分子在稱(chēng)為基因調控的過(guò)程中控制特定基因。
細胞并不總是需要所有蛋白質(zhì)。相反,他們依靠復雜的分子機制根據需要打開(kāi)或關(guān)閉產(chǎn)生蛋白質(zhì)的基因。當這些規定失效時(shí),通常會(huì )出現疾病。
Kinney說(shuō):“了解機制,例如基因調控的原理,這種機械知識通常是能夠開(kāi)發(fā)針對疾病的分子療法與無(wú)法做到的區別。”
不幸的是,根據MPRA數據塑造標準ANN的方式與科學(xué)家在生命科學(xué)中提出問(wèn)題的方式大不相同。這種錯位意味著(zhù)生物學(xué)家發(fā)現很難解釋基因調控是如何發(fā)生的。
現在,Kinney和Tareen開(kāi)發(fā)了一種新方法,可以彌合計算工具與生物學(xué)家的想法之間的鴻溝。他們創(chuàng )建了自定義的人工神經(jīng)網(wǎng)絡(luò ),以數學(xué)方式反映了生物學(xué)中有關(guān)基因和控制它們的分子的常見(jiàn)概念。通過(guò)這種方式,這對夫婦實(shí)際上迫使他們的機器學(xué)習算法以生物學(xué)家可以理解的方式處理數據。
Kinney解釋說(shuō),這些努力強調了如何優(yōu)化現代工業(yè)AI技術(shù)以用于生命科學(xué)。Kinney的實(shí)驗室已經(jīng)驗證了這種用于制作自定義ANN的新策略,并將其用于研究各種各樣的生物系統,包括涉及人類(lèi)疾病的關(guān)鍵基因電路。
