大約70年前,著(zhù)名的數學(xué)家,代碼破壞者和計算機科學(xué)家艾倫·圖靈(Alan Turing)問(wèn):“機器能思考嗎?” 如今,一些專(zhuān)家毫不懷疑,人工智能(AI)很快將能夠開(kāi)發(fā)人類(lèi)擁有的那種通用智能。但是其他人則認為機器永遠無(wú)法達到預期的效果。盡管在某些任務(wù)上,人工智能已經(jīng)可以超越人類(lèi),就像計算器一樣,但它們卻無(wú)法教給人類(lèi)創(chuàng )造力。

畢竟,我們的創(chuàng )造力有時(shí)是出于熱情和直覺(jué)而不是邏輯和證據的驅使,使我們能夠做出驚人的發(fā)現-從疫苗到基本粒子。人工智能肯定不會(huì )競爭嗎?好吧,事實(shí)證明他們可能會(huì )這么做。最近在《自然》雜志上發(fā)表的一篇論文指出,人工智能現在已經(jīng)能夠通過(guò)簡(jiǎn)單地從研究出版物中提取有意義的數據來(lái)預測未來(lái)的科學(xué)發(fā)現。
語(yǔ)言與思維有著(zhù)深厚的聯(lián)系,它已經(jīng)塑造了人類(lèi)社會(huì ),人際關(guān)系,并最終影響了智力。因此,毫不奇怪,人工智能研究的圣杯就是對人類(lèi)語(yǔ)言的所有細微差別的充分理解。自然語(yǔ)言處理(NLP)是更大的一部分(稱(chēng)為機器學(xué)習)的一部分,旨在評估,提取和評估文本數據中的信息。
兒童通過(guò)反復試驗與周?chē)氖澜缁?dòng)學(xué)習。學(xué)習如何騎自行車(chē)經(jīng)常會(huì )遇到一些顛簸和跌落。換句話(huà)說(shuō),我們犯了錯誤并從中學(xué)習。這恰恰是機器學(xué)習的運行方式,有時(shí)需要一些額外的“教育”輸入(監督的機器學(xué)習)。

例如,AI可以通過(guò)從許多單獨的示例中構建對象的圖片來(lái)學(xué)習識別圖像中的對象。在這里,人類(lèi)必須向其顯示是否包含該物體的圖像。然后,計算機會(huì )對是否進(jìn)行猜測,并根據猜測的準確性來(lái)調整其統計模型,如人類(lèi)所判斷的那樣。但是,我們也可以讓計算機程序自己完成所有相關(guān)的學(xué)習(無(wú)監督機器學(xué)習)。在這里,AI自動(dòng)開(kāi)始能夠檢測數據中的模式。無(wú)論哪種情況,計算機程序都需要通過(guò)評估錯誤程度來(lái)找到解決方案,然后嘗試對其進(jìn)行調整以最大程度地減少此類(lèi)錯誤。
假設我們想了解與特定材料相關(guān)的一些屬性。顯而易見(jiàn)的步驟是從書(shū)籍,網(wǎng)頁(yè)和任何其他適當的資源中搜索信息。但是,這很耗時(shí),因為它可能涉及數小時(shí)的網(wǎng)絡(luò )搜索,閱讀文章和專(zhuān)業(yè)文獻。NLP可以幫助我們。通過(guò)復雜的方法和技術(shù),計算機程序可以從大型文本數據集中識別概念,相互關(guān)系,一般主題和特定屬性。
在這項新研究中,人工智能學(xué)會(huì )了通過(guò)無(wú)監督學(xué)習從科學(xué)文獻中檢索信息。這具有顯著(zhù)的含義。到目前為止,大多數基于NLP的自動(dòng)化自動(dòng)方法都受到監督,需要人工輸入。盡管與純手工方法相比有所改進(jìn),但這仍然是一項勞動(dòng)密集型工作。
但是,在這項新研究中,研究人員創(chuàng )建了一個(gè)可以獨立準確地識別和提取信息的系統。它使用了基于數據統計和幾何特性的復雜技術(shù)來(lái)識別化學(xué)名稱(chēng),概念和結構。這是基于約150萬(wàn)篇有關(guān)材料科學(xué)的科學(xué)論文摘要。
然后,機器學(xué)習程序會(huì )根據特定的特征(例如“元素”,“能量學(xué)”和“粘合劑”)對數據中的單詞進(jìn)行分類(lèi)。例如,“熱”被歸類(lèi)為“能量學(xué)”的一部分,“氣體”被歸類(lèi)為“元素”。這有助于將某些具有磁性類(lèi)型和與其他材料相似的化合物連接起來(lái),從而提供了在不需要人工干預的情況下單詞如何關(guān)聯(lián)的見(jiàn)解。

科學(xué)發(fā)現
這種方法可以捕獲復雜的關(guān)系并識別不同的信息層,這實(shí)際上是人類(lèi)無(wú)法實(shí)現的。與科學(xué)家目前可以預測的相比,它提前提供了深刻的見(jiàn)解。實(shí)際上,人工智能可以在實(shí)際發(fā)現前幾年為功能性應用推薦材料。有五種這樣的預測,所有這些預測都是基于2009年之前發(fā)表的論文。例如,人工智能設法識別出一種稱(chēng)為CsAgGa2Se4as的物質(zhì)作為熱電材料,科學(xué)家僅在2012年才發(fā)現。因此,如果人工智能在2009年左右出現, ,這可能會(huì )加快發(fā)現速度。
它通過(guò)將化合物與諸如“硫族化物”(包含“ 硫族元素 ”的材料,例如硫或硒),“ 光電 ”(提供,檢測和控制光的電子設備)和“ 光伏應用 ” 等詞聯(lián)系起來(lái)進(jìn)行預測。許多熱電材料都具有這種特性,而AI很快證明了這一點(diǎn)。
這表明有關(guān)未來(lái)發(fā)現的潛在知識在很大程度上已嵌入過(guò)去的出版物中。人工智能系統變得越來(lái)越獨立。沒(méi)有什么可擔心的。它們可以極大地幫助我們?yōu)g覽由人類(lèi)活動(dòng)不斷產(chǎn)生的大量數據和信息。盡管與隱私和安全有關(guān),但AI正在改變我們的社會(huì )。我相信它將引導我們做出更好的決策,改善我們的日常生活,并最終使我們變得更聰明。
