如此眾多的化石,如此之短的時(shí)間—訓練人們對其進(jìn)行識別。
隨著(zhù)科學(xué)家們努力應對大量待定的海洋化石積壓,由耶魯大學(xué)領(lǐng)導的國際組織已開(kāi)始使用機器學(xué)習技術(shù)來(lái)解決研究海洋最豐富的生命形式的研究人員面臨的艱巨任務(wù)。

由耶魯大學(xué)地質(zhì)學(xué)家Pincelli Hull實(shí)驗室領(lǐng)導的研究小組 建立了一個(gè)自動(dòng)化系統,可以瀏覽大量浮游生物化石圖像并正確識別單個(gè)物種。這項新技術(shù)代表著(zhù)科學(xué)家評估過(guò)去和現在全球生態(tài)變化對浮游生物的影響的能力的重大提升。
一項宣布這項技術(shù)的研究發(fā)表在《古海洋學(xué)和古氣候學(xué)》雜志上。
“數以百萬(wàn)計地球上的物種,以及數百萬(wàn)更在化石記錄中,有太多幾個(gè)分類(lèi)學(xué)專(zhuān)家,以確定他們,這樣我們就可以理解這樣的關(guān)鍵事情,物種和生態(tài)系統如何應對氣候變化,說(shuō):”赫爾,該研究的資深作者。
赫爾補充說(shuō):“在這里,我們通過(guò)匯集全球分類(lèi)學(xué)家的專(zhuān)業(yè)知識來(lái)解決此問(wèn)題,從而創(chuàng )建了一個(gè)重要的浮游生物群體的最大圖像數據庫(按物種級別識別)。” “然后,我們使用機器學(xué)習技術(shù)來(lái)訓練計算機做同樣的事情。”
從進(jìn)行地球化學(xué)研究到了解海洋中物理過(guò)程的復雜,相互聯(lián)系的動(dòng)力學(xué),識別浮游生物是海洋古生物學(xué)許多領(lǐng)域的核心。例如,可以對它們進(jìn)行分析以重建海面溫度,鹽度和某些大氣值。然而,鑒于缺乏可用于培訓學(xué)生浮游生物分類(lèi)學(xué)的資源,事實(shí)證明難以識別單個(gè)浮游生物種類(lèi)進(jìn)行研究。
赫爾和她的同事們開(kāi)始了一個(gè)雄心勃勃的計劃,以對這種情況做些事情。他們通過(guò)一個(gè)名為Endless Forams的在線(xiàn)門(mén)戶(hù)網(wǎng)站 (“ forams ”是有孔蟲(chóng)的簡(jiǎn)稱(chēng),這是一種有著(zhù)悠久化石記錄且可追溯到億萬(wàn)年的悠久歷史的單細胞生物)匯集了34,000多種典型浮游生物物種圖像的數據庫。 通過(guò)在公民科學(xué)平臺Zooniverse上托管的培訓門(mén)戶(hù)網(wǎng)站。這些圖像來(lái)自耶魯大學(xué)皮博迪自然歷史博物館和倫敦自然歷史博物館的藏品。
接下來(lái),研究人員使用機器學(xué)習技術(shù),訓練了計算機模型來(lái)識別浮游生物。表現最佳的模型能夠正確識別87.4%的物種。
赫爾說(shuō):“這真的很令人興奮,因為它既可以自動(dòng)化也可以標準化一項重要任務(wù)。” “它在保留分類(lèi)學(xué)專(zhuān)家的關(guān)鍵知識的同時(shí),提高了科學(xué)的可重復性。”
該研究的主要作者是前耶魯大學(xué)博士后的艾莉森·香(Allison Hsiang),他現在在瑞典自然歷史博物館。該研究的合著(zhù)者來(lái)自英國,德國,法國,荷蘭和美國的機構。
研究人員指出,使用監督式機器學(xué)習技術(shù)回答生物學(xué)問(wèn)題提出了獨特的挑戰。監督圖像分類(lèi)的大多數應用用于許多不同的目的,例如實(shí)時(shí)識別自動(dòng)駕駛系統的對象或識別手寫(xiě)字母和數字。研究人員說(shuō),同樣,某些機器學(xué)習識別技術(shù),包括翻轉和旋轉圖像,對于識別分類(lèi)法可能是成問(wèn)題的,需要仔細實(shí)施。例如,對某些化石的識別取決于其殼被纏繞的方式,并且如果圖像被翻轉或旋轉將發(fā)生變化。
耶魯大學(xué)皮博迪自然歷史博物館生物多樣性信息學(xué)和數據科學(xué)負責人納爾遜·里奧斯(Nelson Rios)說(shuō):“我們的最終目標是讓專(zhuān)家掌握更多數據。” “能夠評估氣候隨時(shí)間的變化并了解物種的反應非常重要。”
赫爾補充說(shuō):“這個(gè)項目一直是我研究小組的長(cháng)期目標之一,我們很高興看到這些結果。”
