深度學(xué)習是機器學(xué)習的一個(gè)子領(lǐng)域,(一般來(lái)說(shuō))是受人類(lèi)大腦及其功能啟發(fā)的技術(shù)。在20世紀50年代首次引入,機器學(xué)習通過(guò)所謂的人工神經(jīng)網(wǎng)絡(luò )累積起來(lái),人工神經(jīng)網(wǎng)絡(luò )是大量相互連接的數據節點(diǎn),它們共同構成了人工智能的基礎。

機器學(xué)習本質(zhì)上允許計算機程序在外部數據或編程提示時(shí)自行改變。從本質(zhì)上講,它能夠在沒(méi)有人為干預的情況下實(shí)現這一點(diǎn)。它與數據挖掘具有相似的功能,但挖掘的結果由機器而不是人類(lèi)處理。它分為兩大類(lèi):有監督和無(wú)監督的學(xué)習。
監督機器學(xué)習涉及通過(guò)標記的訓練數據推斷預定操作。換句話(huà)說(shuō),監督結果事先由(人類(lèi))程序員知道,但推斷結果的系統被訓練為“學(xué)習”它們。相比之下,無(wú)監督機器學(xué)習從未標記的輸入數據中得出推論,通常作為檢測未知模式的手段。
與機器學(xué)習的線(xiàn)性算法相反,深度學(xué)習在通過(guò)分層算法訓練自身的能力方面是獨一無(wú)二的。深度學(xué)習層次結構越來(lái)越復雜和抽象,因為它們發(fā)展(或“學(xué)習”)并且不依賴(lài)于監督邏輯。簡(jiǎn)而言之,深度學(xué)習是一種非常先進(jìn),準確和自動(dòng)化的機器學(xué)習形式,并且處于人工智能技術(shù)的最前沿。
深度學(xué)習的商業(yè)應用
機器學(xué)習已經(jīng)在幾個(gè)不同的行業(yè)中普遍使用。例如,社交媒體使用它來(lái)策劃用戶(hù)時(shí)間線(xiàn)中的內容供稿。Google Brain成立于幾年前,旨在隨著(zhù)技術(shù)的發(fā)展,在Google的各種服務(wù)中實(shí)現產(chǎn)品化深度學(xué)習。
由于其專(zhuān)注于預測分析,營(yíng)銷(xiāo)領(lǐng)域特別投資于深度學(xué)習創(chuàng )新。由于數據積累是推動(dòng)技術(shù)發(fā)展的動(dòng)力,因此銷(xiāo)售和客戶(hù)支持等行業(yè)(已經(jīng)擁有豐富多樣的客戶(hù)數據)具有獨特的優(yōu)勢,可以在地面采用。
早期適應深度學(xué)習很可能是特定部門(mén)從技術(shù)中獲益的關(guān)鍵決定因素,特別是在其最早階段。然而,一些具體的痛點(diǎn)使許多企業(yè)無(wú)法投入深度學(xué)習技術(shù)投資。
大數據和深度學(xué)習的V
2001年,META集團(現為Gartner)的分析師Doug Laney概述了研究人員認為大數據的三大挑戰:數量,種類(lèi)和速度。十多年后,互聯(lián)網(wǎng)接入點(diǎn)的快速增長(cháng)(主要是由于移動(dòng)設備的激增和物聯(lián)網(wǎng)技術(shù)的興起)使這些問(wèn)題成為主要科技公司和小型企業(yè)的首要問(wèn)題。和初創(chuàng )公司一樣。
最近有關(guān)全球數據使用情況的統計數字令人震驚。研究表明,世界上大約90%的數據僅在過(guò)去幾年內創(chuàng )建。根據一項估計,2016年全球移動(dòng)流量約為每月7 艾字節,預計這一數字將在未來(lái)五年內增加約7倍。
超越數量,多樣化(隨著(zhù)新媒體的發(fā)展和擴展,數據類(lèi)型的快速增長(cháng))和速度(電子媒體發(fā)送到數據中心和集線(xiàn)器的速度)也是企業(yè)如何適應新興領(lǐng)域的主要因素深度學(xué)習。為了擴展助記設備,近年來(lái)在大數據痛點(diǎn)列表中添加了其他幾個(gè)v-words,包括:
有效性:大數據系統中輸入數據準確度的測量。未檢測到的無(wú)效數據可能會(huì )導致嚴重的問(wèn)題以及機器學(xué)習環(huán)境中的連鎖反應。
漏洞:大數據自然會(huì )引起安全問(wèn)題,僅僅是因為它的規模。雖然通過(guò)機器學(xué)習在安全系統中看到了很大的潛力,但是他們當前化身的那些系統因其缺乏效率而受到關(guān)注,特別是由于它們傾向于產(chǎn)生錯誤警報。
價(jià)值:由于各種原因,證明大數據(在商業(yè)或其他地方)的潛在價(jià)值可能是一項重大挑戰。如果此列表中的任何其他痛點(diǎn)無(wú)法有效解決,那么它們實(shí)際上可能會(huì )給任何系統或組織帶來(lái)負面價(jià)值,甚至可能帶來(lái)災難性后果。
列表中添加的其他痛點(diǎn)包括可變性,準確性,波動(dòng)性和可視化 - 所有這些都為大數據系統帶來(lái)了獨特的挑戰。隨著(zhù)現有列表(可能)逐漸減少,可能仍會(huì )添加更多內容。雖然對某些人來(lái)說(shuō)似乎有點(diǎn)做作,但助記符“v”列表包含了大數據所面臨的嚴重問(wèn)題,這些問(wèn)題在深度學(xué)習的未來(lái)中發(fā)揮著(zhù)重要作用。
黑匣子困境
深度學(xué)習和人工智能最具吸引力的特征之一是兩者都旨在解決人類(lèi)無(wú)法解決的問(wèn)題。然而,應該允許的相同現象也呈現出一種有趣的困境,其形式為所謂的“黑匣子”。
通過(guò)深度學(xué)習過(guò)程創(chuàng )建的神經(jīng)網(wǎng)絡(luò )是如此龐大和復雜,其復雜的功能基本上是人類(lèi)觀(guān)察的不可理解的。數據科學(xué)家和工程師可能對深入學(xué)習系統的內容有了透徹的了解,但是他們如何更頻繁地得出他們的輸出決策是完全無(wú)法解釋的。
雖然這可能不是營(yíng)銷(xiāo)人員或銷(xiāo)售人員的重要問(wèn)題(取決于他們的營(yíng)銷(xiāo)或銷(xiāo)售),但其他行業(yè)需要一定數量的流程驗證和推理才能從結果中獲得任何用途。例如,金融服務(wù)公司可能會(huì )使用深度學(xué)習來(lái)建立高效的信用評分機制。但是,信用評分通常必須帶有某種口頭或書(shū)面解釋?zhuān)绻麑?shí)際的信用評分方程完全不透明且無(wú)法解釋?zhuān)瑒t難以形成。
這個(gè)問(wèn)題也擴展到許多其他領(lǐng)域,特別是在健康和安全領(lǐng)域。醫學(xué)和交通運輸本身可以從深度學(xué)習中獲益,但也面臨著(zhù)黑匣子形式的重大障礙。任何輸出導致這些字段,無(wú)論多么有益,都可以完全丟棄,因為它們的底層算法是完全默默無(wú)聞的。這給我們帶來(lái)了他們所有人中最具爭議的痛點(diǎn)......
規
2016年春季,歐盟通過(guò)了“ 通用數據保護條例”(GDPR),該條例(除其他事項外)授予公民對機器學(xué)習系統產(chǎn)生的“顯著(zhù)影響”自動(dòng)決策的“解釋權”。該法規計劃于2018年生效,引起了對由于其難以穿透的黑匣子而投資于深度學(xué)習的科技公司的擔憂(yōu),這在很多情況下會(huì )妨礙GDPR規定的解釋。
GDPR打算限制的“自動(dòng)化個(gè)人決策”是深度學(xué)習的基本特征。但是,當歧視的可能性如此之高且透明度如此之低時(shí),對這種技術(shù)的擔憂(yōu)是不可避免的(并且在很大程度上是有效的)在美國,食品和藥物管理局同樣通過(guò)要求這些過(guò)程保持可審計來(lái)規范藥物的測試和營(yíng)銷(xiāo)。這給制藥行業(yè)帶來(lái)了障礙,據報道,總部位于馬薩諸塞州的生物技術(shù)公司Biogen就是這種情況,由于FDA的規定,該公司已被禁止使用無(wú)法解釋的深度學(xué)習方法。
深度學(xué)習(道德,實(shí)踐和超越)的含義是前所未有的,坦率地說(shuō),是非常深刻的。對技術(shù)的大量擔憂(yōu)在很大程度上歸功于其破壞性潛力與其不透明的邏輯和功能的結合。如果企業(yè)可以證明在深度學(xué)習中存在超過(guò)任何可能的威脅或危害的有形價(jià)值,那么它們可以幫助我們完成人工智能的下一個(gè)關(guān)鍵階段。
