評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

2020-01-13 13:59:32    來(lái)源:    作者:

AI換AI越來(lái)越受到關(guān)注-但是是否會(huì )忽略嵌入AI以提高數據生產(chǎn)力的能力?讓我們直截了當地查看行業(yè)專(zhuān)家的觀(guān)點(diǎn)。

在BCG亨德森研究所(BCG Henderson Institute)最近的一篇文章中,“ 如何用人工智能取勝”中,作者提出了一個(gè)問(wèn)題:

評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

在眾多投資人工智能的公司中,有一個(gè)令人驚訝的獨家集團:從AI創(chuàng )造價(jià)值的公司。而且,至少到現在,反對被錄取的可能性是發(fā)人深省的。據2500名多名高管的調查-為進(jìn)行新的報告由麻省理工學(xué)院斯隆管理評論,BCG伽瑪和BCG亨德森學(xué)院-十家企業(yè)的七人報告很少或沒(méi)有收益從他們的AI行動(dòng)為止。為什么有些努力成功了,而更多的失敗了?

在新的報告由麻省理工學(xué)院斯隆管理評論,BCG伽瑪和BCG亨德森學(xué)院提供六點(diǎn)建議,以改善該組織可以與AI成功率:

將AI策略與業(yè)務(wù)策略整合

將收入增長(cháng)優(yōu)先于降低成本

承擔具有重大影響的大型項目-即使它們具有風(fēng)險

使AI的生產(chǎn)與AI的消??費保持一致

將AI視為主要的業(yè)務(wù)轉型工作

投資于A(yíng)I人才,數據治理和流程變更

這很明顯。唯一讓我震驚的是#3。并不是說(shuō)它是如此新穎,而是作者對仍然是一個(gè)備受爭議的問(wèn)題表示了立場(chǎng):目標高,但起點(diǎn)低,而起點(diǎn)低。我不會(huì )認為#3是給定的。這取決于太多因素。

人工智能悄然取得了可驗證和有益進(jìn)展的領(lǐng)域之一不是應用程序。在應用程序管道的另一端,我們看到了嵌入在流程中的AI的迅速擴展:管理,解釋和配置信息。

評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

關(guān)鍵是,用于數字轉換和創(chuàng )建面向客戶(hù)的應用程序的AI比將嵌入式AI集成到工具中要困難得多。這是雙贏(yíng)的,因為未能提供干凈且可用于A(yíng)I的數據是缺少進(jìn)度的最常見(jiàn)的原因。這樣做,以推動(dòng)AI通過(guò)所需的規模和節奏準備數據已經(jīng)成為一項不人道的任務(wù)。利用AI為AI做準備; 它聽(tīng)起來(lái)很優(yōu)美。

在福布斯(Forbes.com)上瀏覽Gil Press的一篇文章,《2020年AI預測120種》,我對此想法有所支持。(注意:文章中只有60條評論,我想這是第1部分)。我將這些作為示例。這不是完整的行業(yè)調查。以下是受訪(fǎng)者的一些亮點(diǎn)以及我的反應。

Trifacta的聯(lián)合創(chuàng )始人兼首席運營(yíng)官Joe Hellerstein。Joe是加州大學(xué)伯克利分校的計算機科學(xué)教授,他的工作重點(diǎn)是以數據為中心的系統及其驅動(dòng)計算的方式。他是ACM研究員,Alfred P. Sloan研究研究員,并且由于他的研究獲得了兩個(gè)ACM-SIGMOD“時(shí)間測試”獎。Hellerstein認為AI在數據背后的作用:

還期望看到數據準備方面的投資有所增加,而數據準備是任何數據項目中不可或缺的組成部分,仍然經(jīng)常被視為許多項目的最大瓶頸,這將推動(dòng)數據質(zhì)量的提高,并使IT擺脫準備數據的壓力。

李浩遠,Alluxio創(chuàng )始人兼首席技術(shù)官:

過(guò)去的統計模型現在已經(jīng)與計算機科學(xué)融合,并已成為AI和機器學(xué)習。因此,數據,分析和AI團隊不再相互孤立。他們需要合作并共同努力,以從他們都使用的相同數據中獲取價(jià)值。2020年,我們將看到更多的組織圍繞數據堆棧建立專(zhuān)門(mén)的團隊。

MyPOV:他們將使用帶有AI輔助開(kāi)發(fā)的工具。這些專(zhuān)門(mén)的團隊將需要大大減少他們?yōu)閿祿芾?,版本控制,一鍵式訪(fǎng)問(wèn)算法(或張量)而編寫(xiě)的代碼量。AI / ML對于A(yíng)I工程師的工作效率沒(méi)有得到足夠的重視。

Virtana首席執行官Philippe Vincent :

……企業(yè)……將需要基于A(yíng)IOps的解決方案,該解決方案將基礎架構監視,工作負載自動(dòng)化和容量規劃集成到一個(gè)平臺中。因此,無(wú)法采用AIOps服務(wù)模型的供應商和未能在端到端基礎架構可見(jiàn)性方面進(jìn)行投資的企業(yè)將無(wú)法實(shí)現客戶(hù)要求和性能SLA。

MyPOV:好主意,但并沒(méi)有真正談?wù)揂I。

Qlik全球市場(chǎng)情報主管高級總監Dan Sommer :

現在比以往任何時(shí)候都更容易進(jìn)行數據庫內索引和分析,并且我們擁有確保數據可以移到正確位置的工具。數據的神秘性消失了:2019年Hadoop分銷(xiāo)商的整合和快速消亡標志著(zhù)這一轉變的信號。下一個(gè)重點(diǎn)領(lǐng)域將是非常分散的或“廣泛的數據”。數據格式變得越來(lái)越多樣化和碎片化,結果,適用于各種數據風(fēng)格的不同類(lèi)型的數據庫增加了一倍以上。

MyPOV:如果沒(méi)有具有嵌入式機器學(xué)習,深度學(xué)習和NLP的工具,任何人都無(wú)法組織這個(gè)smorgasbord。

Genpact首席數字官Sanjay Srivastava :

我們將看到數字道德官員的崛起,他們將負責實(shí)施道德框架以做出決策。這包括安全性,偏見(jiàn),預期用途和內置治理

MyPOV:這是唯一提及道德的評論;否則,與主題無(wú)關(guān)。我只是想指出六十位預測者中有五十九位被忽略了,而一件事將在2020年變得炙手可熱。

智庫首席營(yíng)銷(xiāo)官兼企業(yè)傳播負責人Yaffa Cohen-Ifrah :

人工智能使保險公司能夠更好地利用他們掌握的大量數據,以從至關(guān)重要的客戶(hù)洞察中受益,從而最大程度地提高其服務(wù)和產(chǎn)品。這樣可以使客戶(hù)滿(mǎn)意并提高業(yè)務(wù)效率。

MyPOV:實(shí)際上,這取決于哪種類(lèi)型的保險公司。長(cháng)尾風(fēng)險(例如人壽保險)具有老化應用程序中的數據,記錄了40年,五十年或更久的歷史。利用這些“數據寶庫”非常困難,并且對于使用AI的解決方案(使語(yǔ)義上的困難混合合理化)已經(jīng)成熟。

Qentelli總裁Sanjay Jupudi:

2020年將更多地關(guān)注可解釋的AI,以減少預測中的任何偏差。數據科學(xué)家將成為產(chǎn)品團隊不可或缺的一部分,并與他們緊密合作,以數據為先的方法開(kāi)發(fā)應用程序,而不是專(zhuān)注于理解由應用程序生成的數據

MyPOV:我不完全理解他所說(shuō)的“數據優(yōu)先”的含義,但是我認為它暗示了AI通知的數據管道,這很好。

Talend首席技術(shù)官兼首席運營(yíng)官Laurent Bride :

無(wú)論是用于自動(dòng)執行重復性任務(wù)(數據準備等),還是通過(guò)來(lái)自您和您的同行的上下文信息來(lái)連接管道,人工智能都將開(kāi)始滲透到業(yè)務(wù)功能的所有領(lǐng)域。

MyPOV:我不相信其他人提到管道。制藥公司GSK在公開(kāi)演示中證明,所有臨床試驗數據的合并均使用StreamSets精心策劃的10,000多個(gè)管道進(jìn)行,但我沒(méi)有明確聽(tīng)說(shuō)StreamSets在其產(chǎn)品中使用AI,但我懷疑它們確實(shí)這樣做了。

軟機器人首席執行官Carl Vause :

關(guān)于人工智能,僅僅因為組織內存在數據并不意味著(zhù)數據是可用的,可傳輸的格式。2020年將是企業(yè)開(kāi)始了解其數據尚未支持AI的一年,這將使其業(yè)務(wù)流程效率低下,效率低下或不準確。

值得注意的是,一些將AI注入其DataOps和/或信息集成產(chǎn)品的技術(shù)提供商的示例是:

Informatica:Informatica于3年前推出,它宣布了一種名為CLAIRE的產(chǎn)品,該產(chǎn)品據稱(chēng)是其大量產(chǎn)品平臺中注入的一組AI功能。我花了差不多幾年的時(shí)間才或多或少地了解他們在做什么。CLAIRE現在是具有工程師,市場(chǎng)營(yíng)銷(xiāo)和管理專(zhuān)職的獨立產(chǎn)品,它提供AI(ML,各種類(lèi)型的神經(jīng)網(wǎng)絡(luò ),NLP)來(lái)支持整個(gè)產(chǎn)品平臺。

UnifiSofware(現在是Boomi的一部分):Unifi OneMind AI技術(shù)是功能的基礎,從數據準備和數據目錄建議到發(fā)現類(lèi)似數據集,再到自然語(yǔ)言查詢(xún)支持。它基于知識圖,采用遞歸卷積神經(jīng)網(wǎng)絡(luò ),隱馬爾可夫模型和基因測序算法。

Trifacta將自己描述為“數據爭吵者”(到目前為止,這不是一個(gè)官方的技術(shù)術(shù)語(yǔ),但也許要關(guān)注這個(gè)領(lǐng)域)。它結合了機器學(xué)習和人工操作來(lái)查詢(xún)和組織數據以產(chǎn)生各種見(jiàn)解。

Paxata(現在是DataRobot的一部分)Paxata具有類(lèi)似AI的功能,盡管未明確描述為AI引擎。它具有自動(dòng)發(fā)現相關(guān)數據準備項目和數據集并自動(dòng)創(chuàng )建多項目數據流的能力。不用說(shuō),被認為是AI公司的公司DataRobot將為Paxata的數據集成和目錄功能添加AI。

Tamr:Tamr使用機器學(xué)習的主要地方有兩個(gè):實(shí)體合并(重復數據刪除)和實(shí)體分類(lèi)。一個(gè)有趣的方面是,當最初沒(méi)有足夠的訓練數據來(lái)建立模型時(shí),Tarr會(huì )使用強化學(xué)習。實(shí)體分類(lèi)(記錄分類(lèi))是一個(gè)包含ML部分的多步驟過(guò)程。

評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

我拿

有關(guān)AI的大量對話(huà)涉及人員,應用程序和自動(dòng)化,這是應用程序培訓的結尾。人工智能為列車(chē)的無(wú)形部分提供動(dòng)力的機會(huì )正在逐漸成熟,并將為人工智能的成功(失敗)體驗提供推動(dòng)力。

也許與我的建議有點(diǎn)相切,哈克農恩認為:

當將AI應用于我們開(kāi)發(fā)應用程序的方式時(shí),它將改變我們用來(lái)管理基礎結構的方式。AIOps將取代DevOps,并使您的IT部門(mén)員工能夠進(jìn)行精確的根本原因分析。此外,這將使您立即輕松地從海量數據集中找到有用的見(jiàn)解和模式。大型企業(yè)和云供應商將受益于DevOps與AI的融合。

我不得不問(wèn)Irfan Ahmed Khan,DataOps發(fā)生了什么事情,這似乎很快就來(lái)了,但是我想AIOps只是更智能的DataOps。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。