富士通實(shí)驗室有限公司(Fujitsu Laboratories Ltd.)今天宣布開(kāi)發(fā)“廣泛學(xué)習”,這是一種機器學(xué)習技術(shù),即使操作員無(wú)法獲得培訓所必需的數據量,也可以進(jìn)行準確的判斷?,F在,通常使用AI來(lái)利用各個(gè)領(lǐng)域的數據,但是在要分析的數據量較小或不平衡的情況下,AI的準確性可能會(huì )受到影響。富士通的廣泛學(xué)習技術(shù)使判斷變得比以前更準確,并且即使檢查了哪種假設,即使數據不平衡,也可以統一實(shí)現學(xué)習。它是通過(guò)首先提取具有高度重要性的假設來(lái)實(shí)現這一目標的,該假設是由所有數據項組合構成的大量假設組成的,然后通過(guò)基于假設的重疊關(guān)系來(lái)控制各個(gè)假設的影響程度。此外,由于假設被記錄為邏輯表達式,因此人類(lèi)也可以理解判斷背后的原因。富士通的新型廣泛學(xué)習技術(shù)甚至允許在醫療保健和市場(chǎng)營(yíng)銷(xiāo)等領(lǐng)域使用AI,因為在這些領(lǐng)域中,做出判斷所需的數據非常稀缺,可支持操作并使用AI促進(jìn)工作流程的自動(dòng)化。

近年來(lái),人工智能技術(shù)已開(kāi)始用于醫療,營(yíng)銷(xiāo)和金融等各個(gè)領(lǐng)域。人們越來(lái)越期待使用AI決策來(lái)支持這些領(lǐng)域的運營(yíng)和自動(dòng)化任務(wù)。然而,要實(shí)現這些技術(shù)的潛力仍然面臨的挑戰之一是數據可能不平衡。具體而言,根據行業(yè)的不同,可能難以獲得足夠的數據來(lái)對AI進(jìn)行判斷的目標進(jìn)行培訓。實(shí)際上,這使得這些技術(shù)中的許多技術(shù)無(wú)法產(chǎn)生足夠準確的結果以供實(shí)際使用。此外,AI部署缺乏進(jìn)展的主要原因是,即使AI提供了足夠準確的識別或分類(lèi)性能,
基于深度學(xué)習的 AI技術(shù)通常,通過(guò)對大量數據(包括要判斷的大量目標數據)進(jìn)行訓練來(lái)做出高度準確的判斷。但是,在現實(shí)世界中,很多情況下數據不足,目標數據極少。在這些情況下,當面對未知數據時(shí),人工智能技術(shù)很難做出高度準確的判斷。此外,基于深度學(xué)習的現有AI的機器學(xué)習模型是一個(gè)黑匣子模型,無(wú)法解釋AI做出判斷背后的原因,從而造成了透明性問(wèn)題。因此,展望未來(lái),有必要開(kāi)發(fā)新的AI技術(shù),以根據不平衡的數據實(shí)現高度準確的判斷,并且它也是透明的,以解決社會(huì )中的各種問(wèn)題。

考慮到這些挑戰,Fujitsu Laboratories現在開(kāi)發(fā)了Wide Learning,這是一種機器學(xué)習技術(shù),即使在數據不平衡的情況下也能夠做出高度準確的判斷。廣泛學(xué)習技術(shù)的功能包括以下兩點(diǎn)。
1.創(chuàng )建數據項組合以提取大量假設
該技術(shù)將數據項的所有組合模式視為假設,然后根據標簽類(lèi)別的命中率來(lái)確定每個(gè)假設的重要程度。例如,當分析誰(shuí)購買(mǎi)某些產(chǎn)品的趨勢時(shí),系統會(huì )針對未購買(mǎi)商品的人(類(lèi)別標簽)組合來(lái)自數據項的各種模式,例如擁有駕照的20-34歲之間的單身女性,然后將這些組合模式作為假設時(shí),分析實(shí)際購買(mǎi)商品的數據中有多少次匹配。達到一定水平以上命中率的假設被定義為重要的假設,稱(chēng)為“知識塊”。這意味著(zhù)即使目標數據不足,系統也可以提取所有值得研究的假設,
2.調整知識塊的影響程度以建立準確的分類(lèi)模型
該系統基于多個(gè)提取的知識塊和目標標簽建立分類(lèi)模型。在該過(guò)程中,如果組成知識塊的項目與其他知識塊的項目頻繁重疊,則系統控制它們的影響程度,以減少其對分類(lèi)模型的影響的權重。這樣,即使目標標簽或標記為正確的數據不平衡,系統也可以訓練能夠進(jìn)行準確分類(lèi)的模型。例如,在沒(méi)有購買(mǎi)商品的人占商品購買(mǎi)數據集的絕大多數的情況下,如果在不控制影響程度的情況下對AI進(jìn)行了訓練,則知識塊將包括一個(gè)人是否具有獨立于性別的許可證不會(huì )對分類(lèi)產(chǎn)生太大影響。
富士通實(shí)驗室對此技術(shù)進(jìn)行了試驗,并將其應用于數字營(yíng)銷(xiāo)和醫療保健等領(lǐng)域的數據。在UC Irvine機器學(xué)習存儲庫中使用營(yíng)銷(xiāo)和醫療保健領(lǐng)域的基準數據進(jìn)行的測試中,與深度學(xué)習相比,該技術(shù)將準確性提高了約10-20%。它成功地降低了系統忽略可能訂閱服務(wù)的客戶(hù)或病情患者的可能性約20%至50%。在營(yíng)銷(xiāo)數據中,測試使用的大約5,000個(gè)客戶(hù)數據條目中,只有約230個(gè)用于購買(mǎi)客戶(hù),這造成了一組不平衡的情況。這項技術(shù)將深度學(xué)習分析的結果,從促銷(xiāo)中排除的潛在客戶(hù)數量從120個(gè)減少到74個(gè)。此外,判斷對于在社會(huì )中實(shí)施該技術(shù)也很有用。即使基于新數據的結果確定需要對模型進(jìn)行校正,也可以進(jìn)行更適當的修改,因為用戶(hù)可以理解結果的原因。

富士通實(shí)驗室將繼續將該技術(shù)應用于需要AI判斷背后的推理的任務(wù)(例如金融交易和醫療診斷)以及處理低頻現象(例如欺詐和設備故障)的任務(wù),以將其商業(yè)化。一種新的機器學(xué)習技術(shù) 在2019財年為富士通有限公司的富士通以人類(lèi)為中心的AI Zinrai提供支持。富士通實(shí)驗室還將有效利用這項技術(shù)的獨特功能進(jìn)行解釋?zhuān)^續研究和開(kāi)發(fā)主題,例如在為應用該任務(wù)的任務(wù)中做出判斷和決策提供更好的支持,以及整個(gè)系統的設計,包括與人的協(xié)作。
