評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

2020-01-13 13:59:32 來(lái)源：作者：

AI換AI越來(lái)越受到關(guān)注-但是是否會(huì )忽略嵌入AI以提高數據生產(chǎn)力的能力?讓我們直截了當地查看行業(yè)專(zhuān)家的觀(guān)點(diǎn)。

在BCG亨德森研究所(BCG Henderson Institute)最近的一篇文章中，“ 如何用人工智能取勝”中，作者提出了一個(gè)問(wèn)題：

在眾多投資人工智能的公司中，有一個(gè)令人驚訝的獨家集團：從AI創(chuàng )造價(jià)值的公司。而且，至少到現在，反對被錄取的可能性是發(fā)人深省的。據2500名多名高管的調查-為進(jìn)行新的報告由麻省理工學(xué)院斯隆管理評論，BCG伽瑪和BCG亨德森學(xué)院-十家企業(yè)的七人報告很少或沒(méi)有收益從他們的AI行動(dòng)為止。為什么有些努力成功了，而更多的失敗了?

在新的報告由麻省理工學(xué)院斯隆管理評論，BCG伽瑪和BCG亨德森學(xué)院提供六點(diǎn)建議，以改善該組織可以與AI成功率：

將AI策略與業(yè)務(wù)策略整合

將收入增長(cháng)優(yōu)先于降低成本

承擔具有重大影響的大型項目-即使它們具有風(fēng)險

使AI的生產(chǎn)與AI的消??費保持一致

將AI視為主要的業(yè)務(wù)轉型工作

投資于A(yíng)I人才，數據治理和流程變更

這很明顯。唯一讓我震驚的是#3。并不是說(shuō)它是如此新穎，而是作者對仍然是一個(gè)備受爭議的問(wèn)題表示了立場(chǎng)：目標高，但起點(diǎn)低，而起點(diǎn)低。我不會(huì )認為#3是給定的。這取決于太多因素。

人工智能悄然取得了可驗證和有益進(jìn)展的領(lǐng)域之一不是應用程序。在應用程序管道的另一端，我們看到了嵌入在流程中的AI的迅速擴展：管理，解釋和配置信息。

評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

關(guān)鍵是，用于數字轉換和創(chuàng )建面向客戶(hù)的應用程序的AI比將嵌入式AI集成到工具中要困難得多。這是雙贏(yíng)的，因為未能提供干凈且可用于A(yíng)I的數據是缺少進(jìn)度的最常見(jiàn)的原因。這樣做，以推動(dòng)AI通過(guò)所需的規模和節奏準備數據已經(jīng)成為一項不人道的任務(wù)。利用AI為AI做準備; 它聽(tīng)起來(lái)很優(yōu)美。

在福布斯(Forbes.com)上瀏覽Gil Press的一篇文章，《2020年AI預測120種》，我對此想法有所支持。(注意：文章中只有60條評論，我想這是第1部分)。我將這些作為示例。這不是完整的行業(yè)調查。以下是受訪(fǎng)者的一些亮點(diǎn)以及我的反應。

Trifacta的聯(lián)合創(chuàng )始人兼首席運營(yíng)官Joe Hellerstein。Joe是加州大學(xué)伯克利分校的計算機科學(xué)教授，他的工作重點(diǎn)是以數據為中心的系統及其驅動(dòng)計算的方式。他是ACM研究員，Alfred P. Sloan研究研究員，并且由于他的研究獲得了兩個(gè)ACM-SIGMOD“時(shí)間測試”獎。Hellerstein認為AI在數據背后的作用：

還期望看到數據準備方面的投資有所增加，而數據準備是任何數據項目中不可或缺的組成部分，仍然經(jīng)常被視為許多項目的最大瓶頸，這將推動(dòng)數據質(zhì)量的提高，并使IT擺脫準備數據的壓力。

李浩遠，Alluxio創(chuàng )始人兼首席技術(shù)官：

過(guò)去的統計模型現在已經(jīng)與計算機科學(xué)融合，并已成為AI和機器學(xué)習。因此，數據，分析和AI團隊不再相互孤立。他們需要合作并共同努力，以從他們都使用的相同數據中獲取價(jià)值。2020年，我們將看到更多的組織圍繞數據堆棧建立專(zhuān)門(mén)的團隊。

MyPOV：他們將使用帶有AI輔助開(kāi)發(fā)的工具。這些專(zhuān)門(mén)的團隊將需要大大減少他們?yōu)閿祿芾?，版本控制，一鍵式訪(fǎng)問(wèn)算法(或張量)而編寫(xiě)的代碼量。AI / ML對于A(yíng)I工程師的工作效率沒(méi)有得到足夠的重視。

Virtana首席執行官Philippe Vincent ：

……企業(yè)……將需要基于A(yíng)IOps的解決方案，該解決方案將基礎架構監視，工作負載自動(dòng)化和容量規劃集成到一個(gè)平臺中。因此，無(wú)法采用AIOps服務(wù)模型的供應商和未能在端到端基礎架構可見(jiàn)性方面進(jìn)行投資的企業(yè)將無(wú)法實(shí)現客戶(hù)要求和性能SLA。

MyPOV：好主意，但并沒(méi)有真正談?wù)揂I。

Qlik全球市場(chǎng)情報主管高級總監Dan Sommer ：

現在比以往任何時(shí)候都更容易進(jìn)行數據庫內索引和分析，并且我們擁有確保數據可以移到正確位置的工具。數據的神秘性消失了：2019年Hadoop分銷(xiāo)商的整合和快速消亡標志著(zhù)這一轉變的信號。下一個(gè)重點(diǎn)領(lǐng)域將是非常分散的或“廣泛的數據”。數據格式變得越來(lái)越多樣化和碎片化，結果，適用于各種數據風(fēng)格的不同類(lèi)型的數據庫增加了一倍以上。

MyPOV：如果沒(méi)有具有嵌入式機器學(xué)習，深度學(xué)習和NLP的工具，任何人都無(wú)法組織這個(gè)smorgasbord。

Genpact首席數字官Sanjay Srivastava ：

我們將看到數字道德官員的崛起，他們將負責實(shí)施道德框架以做出決策。這包括安全性，偏見(jiàn)，預期用途和內置治理

MyPOV：這是唯一提及道德的評論;否則，與主題無(wú)關(guān)。我只是想指出六十位預測者中有五十九位被忽略了，而一件事將在2020年變得炙手可熱。

智庫首席營(yíng)銷(xiāo)官兼企業(yè)傳播負責人Yaffa Cohen-Ifrah ：

人工智能使保險公司能夠更好地利用他們掌握的大量數據，以從至關(guān)重要的客戶(hù)洞察中受益，從而最大程度地提高其服務(wù)和產(chǎn)品。這樣可以使客戶(hù)滿(mǎn)意并提高業(yè)務(wù)效率。

MyPOV：實(shí)際上，這取決于哪種類(lèi)型的保險公司。長(cháng)尾風(fēng)險(例如人壽保險)具有老化應用程序中的數據，記錄了40年，五十年或更久的歷史。利用這些“數據寶庫”非常困難，并且對于使用AI的解決方案(使語(yǔ)義上的困難混合合理化)已經(jīng)成熟。

Qentelli總裁Sanjay Jupudi：

2020年將更多地關(guān)注可解釋的AI，以減少預測中的任何偏差。數據科學(xué)家將成為產(chǎn)品團隊不可或缺的一部分，并與他們緊密合作，以數據為先的方法開(kāi)發(fā)應用程序，而不是專(zhuān)注于理解由應用程序生成的數據

MyPOV：我不完全理解他所說(shuō)的“數據優(yōu)先”的含義，但是我認為它暗示了AI通知的數據管道，這很好。

Talend首席技術(shù)官兼首席運營(yíng)官Laurent Bride ：

無(wú)論是用于自動(dòng)執行重復性任務(wù)(數據準備等)，還是通過(guò)來(lái)自您和您的同行的上下文信息來(lái)連接管道，人工智能都將開(kāi)始滲透到業(yè)務(wù)功能的所有領(lǐng)域。

MyPOV：我不相信其他人提到管道。制藥公司GSK在公開(kāi)演示中證明，所有臨床試驗數據的合并均使用StreamSets精心策劃的10,000多個(gè)管道進(jìn)行，但我沒(méi)有明確聽(tīng)說(shuō)StreamSets在其產(chǎn)品中使用AI，但我懷疑它們確實(shí)這樣做了。

軟機器人首席執行官Carl Vause ：

關(guān)于人工智能，僅僅因為組織內存在數據并不意味著(zhù)數據是可用的，可傳輸的格式。2020年將是企業(yè)開(kāi)始了解其數據尚未支持AI的一年，這將使其業(yè)務(wù)流程效率低下，效率低下或不準確。

值得注意的是，一些將AI注入其DataOps和/或信息集成產(chǎn)品的技術(shù)提供商的示例是：

Informatica：Informatica于3年前推出，它宣布了一種名為CLAIRE的產(chǎn)品，該產(chǎn)品據稱(chēng)是其大量產(chǎn)品平臺中注入的一組AI功能。我花了差不多幾年的時(shí)間才或多或少地了解他們在做什么。CLAIRE現在是具有工程師，市場(chǎng)營(yíng)銷(xiāo)和管理專(zhuān)職的獨立產(chǎn)品，它提供AI(ML，各種類(lèi)型的神經(jīng)網(wǎng)絡(luò )，NLP)來(lái)支持整個(gè)產(chǎn)品平臺。

UnifiSofware(現在是Boomi的一部分)：Unifi OneMind AI技術(shù)是功能的基礎，從數據準備和數據目錄建議到發(fā)現類(lèi)似數據集，再到自然語(yǔ)言查詢(xún)支持。它基于知識圖，采用遞歸卷積神經(jīng)網(wǎng)絡(luò )，隱馬爾可夫模型和基因測序算法。

Trifacta將自己描述為“數據爭吵者”(到目前為止，這不是一個(gè)官方的技術(shù)術(shù)語(yǔ)，但也許要關(guān)注這個(gè)領(lǐng)域)。它結合了機器學(xué)習和人工操作來(lái)查詢(xún)和組織數據以產(chǎn)生各種見(jiàn)解。

Paxata(現在是DataRobot的一部分)Paxata具有類(lèi)似AI的功能，盡管未明確描述為AI引擎。它具有自動(dòng)發(fā)現相關(guān)數據準備項目和數據集并自動(dòng)創(chuàng )建多項目數據流的能力。不用說(shuō)，被認為是AI公司的公司DataRobot將為Paxata的數據集成和目錄功能添加AI。

Tamr：Tamr使用機器學(xué)習的主要地方有兩個(gè)：實(shí)體合并(重復數據刪除)和實(shí)體分類(lèi)。一個(gè)有趣的方面是，當最初沒(méi)有足夠的訓練數據來(lái)建立模型時(shí)，Tarr會(huì )使用強化學(xué)習。實(shí)體分類(lèi)(記錄分類(lèi))是一個(gè)包含ML部分的多步驟過(guò)程。

評估數據生產(chǎn)率工具中嵌入式AI的機會(huì )

我拿

有關(guān)AI的大量對話(huà)涉及人員，應用程序和自動(dòng)化，這是應用程序培訓的結尾。人工智能為列車(chē)的無(wú)形部分提供動(dòng)力的機會(huì )正在逐漸成熟，并將為人工智能的成功(失敗)體驗提供推動(dòng)力。

也許與我的建議有點(diǎn)相切，哈克農恩認為：

當將AI應用于我們開(kāi)發(fā)應用程序的方式時(shí)，它將改變我們用來(lái)管理基礎結構的方式。AIOps將取代DevOps，并使您的IT部門(mén)員工能夠進(jìn)行精確的根本原因分析。此外，這將使您立即輕松地從海量數據集中找到有用的見(jiàn)解和模式。大型企業(yè)和云供應商將受益于DevOps與AI的融合。

我不得不問(wèn)Irfan Ahmed Khan，DataOps發(fā)生了什么事情，這似乎很快就來(lái)了，但是我想AIOps只是更智能的DataOps。

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時(shí)間聯(lián)系我們修改或刪除，多謝。

RM新时代投资官网

相關(guān)推薦