越來(lái)越強大的硬件功能和大量數據使現有的機器學(xué)習方法(例如模式識別,自然語(yǔ)言處理和強化學(xué)習)成為可能。人工智能正在影響開(kāi)發(fā)過(guò)程;它增加了版本控制,CI / CD和測試之類(lèi)的復雜性。

ThoughtWorks人工智能全球負責人Christoph Windheuser在Goto Berlin 2018上談到了該行業(yè)的AI應用。InfoQ將通過(guò)問(wèn)答,摘要和文章涵蓋本次會(huì )議。
Windheuser認為,機器學(xué)習方法的最大優(yōu)點(diǎn)是可以通過(guò)從數據中學(xué)習而不是編程來(lái)優(yōu)化算法的行為。這意味著(zhù)算法可以實(shí)現無(wú)法編程的行為,例如光學(xué)和聲學(xué)模式識別或自然語(yǔ)言處理。他說(shuō),因此,全新的應用成為可能,而可能性是無(wú)限的。
Windheuser表示,在數據科學(xué)和機器學(xué)習項目中,開(kāi)發(fā)人員不僅必須照顧自己的編程代碼,而且還必須照顧大量數據,例如訓練模式,從這些模式中提取的功能以及參數和超參數。學(xué)習算法。他認為,這給開(kāi)發(fā)過(guò)程帶來(lái)了新的復雜性。

隨著(zhù)當今硬件功能的不斷增強和可用數據的大量增加,古老而著(zhù)名的機器學(xué)習方法可以突然以可擴展和可操作的方式應用。各種模式識別,例如語(yǔ)音識別和圖像識別。在自然語(yǔ)言處理領(lǐng)域,諸如語(yǔ)言翻譯,情感分析,意圖識別,文本語(yǔ)音轉換和聊天機器人等都是眾所周知的。通過(guò)強化學(xué)習,甚至可以學(xué)習玩電子游戲,下棋或圍棋或平穩安全地駕駛汽車(chē)的策略。沒(méi)有機器學(xué)習方法,所有這些都是不可能的。
數據是任何機器學(xué)習算法的基礎。對于像反向傳播這樣的有監督學(xué)習,您需要的訓練模式數量要遠遠多于要優(yōu)化的參數(權重)以實(shí)現網(wǎng)絡(luò )的良好泛化。對于深度學(xué)習模型,其中的層數很高,每層單元數很多,參數的數量很容易變成數百萬(wàn)個(gè),這需要更大數量的訓練模式才能成功進(jìn)行訓練。
對于有監督的學(xué)習,訓練模式需要標簽(例如,該模式的正確分類(lèi)),通常必須手動(dòng)策劃。除此之外,還必須將數據模式轉換為正確的格式,以便通過(guò)學(xué)習算法進(jìn)行消化。這意味著(zhù)必須從訓練數據中提取正確的特征。這對于獲得良好的訓練算法非常重要。

例如,如果您想了解未來(lái)客戶(hù)對雜貨店中商品的需求,則可以使用歷史銷(xiāo)售數據來(lái)預測未來(lái)的銷(xiāo)售。您可以直接使用POS(銷(xiāo)售點(diǎn))數據來(lái)訓練您的網(wǎng)絡(luò )。但是,例如從POS數據中的時(shí)間戳中提取工作日并將其作為附加功能饋入網(wǎng)絡(luò )非常有幫助。由于客戶(hù)需求高度依賴(lài)工作日,因此這將有助于網(wǎng)絡(luò )更輕松,更快速地學(xué)習和融合。
