新服務(wù)使數據科學(xué)團隊能夠快速,輕松地協(xié)作構建和部署強大的機器學(xué)習模型
Oracle宣布推出Oracle Cloud Data Science Platform。Oracle Cloud Infrastructure Data Science的核心是,它可以幫助企業(yè)協(xié)作構建,訓練,管理和部署機器學(xué)習模型,以提高數據科學(xué)項目的成功率。與其他專(zhuān)注于單個(gè)數據科學(xué)家的數據科學(xué)產(chǎn)品不同,Oracle云基礎架構數據科學(xué)通過(guò)共享項目,模型目錄,團隊安全策略,可再現性和可審計性等功能來(lái)幫助提高數據科學(xué)團隊的效率。Oracle Cloud Infrastructure Data Science通過(guò)AutoML算法的選擇和調整,模型評估和模型解釋?zhuān)詣?dòng)選擇最佳的訓練數據集。

如今,組織僅意識到數據巨大變革潛力中的一小部分,因為數據科學(xué)團隊無(wú)法輕松訪(fǎng)問(wèn)正確的數據和工具來(lái)構建和部署有效的機器學(xué)習模型。最終結果是,模型花費的時(shí)間太長(cháng),無(wú)法始終滿(mǎn)足企業(yè)對準確性和魯棒性的要求,并且過(guò)于頻繁地永遠無(wú)法將其投入生產(chǎn)。
“有效的機器學(xué)習模型是成功的數據科學(xué)項目的基礎,但是企業(yè)面臨的數據量和種類(lèi)繁多,可能會(huì )使這些計劃在付諸實(shí)踐之前就停滯不前,” Oracle Data and AI產(chǎn)品開(kāi)發(fā)高級副總裁Greg Pavlik說(shuō)。服務(wù)。“借助Oracle Cloud Infrastructure Data Science,我們可以通過(guò)自動(dòng)化其整個(gè)工作流程并增加強大的團隊支持協(xié)作來(lái)提高單個(gè)數據科學(xué)家的生產(chǎn)力,以幫助確保數據科學(xué)項目為企業(yè)帶來(lái)真正的價(jià)值。”
專(zhuān)為數據科學(xué)團隊和科學(xué)家而設計
Oracle Cloud Infrastructure Data Science包含自動(dòng)化的數據科學(xué)工作流程,可通過(guò)以下功能節省時(shí)間并減少錯誤:
AutoML自動(dòng)算法選擇和調整 使針對多種算法和超參數配置的運行測試過(guò)程自動(dòng)化。它檢查結果的準確性,并確認選擇了最佳模型和配置以供使用。這為數據科學(xué)家節省了大量時(shí)間,更重要的是,它旨在使每位數據科學(xué)家都能獲得與最有經(jīng)驗的從業(yè)人員相同的結果。
自動(dòng)預測特征選擇 通過(guò)從大型數據集中自動(dòng)識別關(guān)鍵預測特征來(lái)簡(jiǎn)化特征工程。
模型評估會(huì ) 生成一套全面的評估指標和合適的可視化文件,以針對新數據衡量模型的性能,并可以隨時(shí)間對模型進(jìn)行排名,以實(shí)現生產(chǎn)中的最佳行為。模型評估超出了原始性能,要考慮到預期的基線(xiàn)行為,并使用成本模型,以便可以完全合并誤報和誤報的不同影響。

模型說(shuō)明: Oracle Cloud Infrastructure Data Science提供有關(guān)生成預測的因素的相對權重和重要性的自動(dòng)說(shuō)明。Oracle Cloud Infrastructure Data Science提供了不可知模型的第一個(gè)商業(yè)實(shí)現。例如,借助欺詐檢測模型,數據科學(xué)家可以解釋哪些因素是欺詐的最大驅動(dòng)因素,因此企業(yè)可以修改流程或實(shí)施保護措施。
成功地將有效的機器學(xué)習模型成功投入生產(chǎn),不僅需要專(zhuān)門(mén)的人員。這需要數據科學(xué)家團隊共同合作。Oracle云基礎架構數據科學(xué)提供強大的團隊功能,包括:
共享項目可 幫助用戶(hù)組織,啟用版本控制并可靠地共享團隊的工作,包括數據和筆記本會(huì )話(huà)。
使用模型目錄, 團隊成員可以可靠地共享已經(jīng)構建的模型以及修改和部署它們所需的工件。
基于團隊的安全策略 允許用戶(hù)控制對模型,代碼和數據的訪(fǎng)問(wèn),這些模型,代碼和數據已與Oracle Cloud Infrastructure Identity and Access Management完全集成。
可再現性和可審計性 功能使企業(yè)能夠跟蹤所有相關(guān)資產(chǎn),從而即使團隊成員離開(kāi),也可以復制和審計所有模型。
借助Oracle Cloud Infrastructure Data Science,組織可以加速成功的模型部署,并產(chǎn)生企業(yè)級結果和性能以進(jìn)行預測分析,以推動(dòng)積極的業(yè)務(wù)成果。
全面的數據和機器學(xué)習服務(wù)
Oracle云數據科學(xué)平臺包括七項新服務(wù),這些服務(wù)可提供旨在加速和改善數據科學(xué)成果的全面的端到端體驗:
Oracle云基礎架構數據科學(xué): 使用戶(hù)能夠使用Python和其他開(kāi)源工具和庫(包括TensorFlow,Keras和Jupyter)在Oracle Clou上構建,訓練和管理新的機器學(xué)習模型。
Oracle自治數據庫中強大的新機器學(xué)習功能:機器學(xué)習算法緊密集成在 Oracle自治數據庫中, 并新增了對Python和自動(dòng)機器學(xué)習的支持。即將與Oracle Cloud Infrastructure Data Science集成,將使數據科學(xué)家能夠使用開(kāi)源和可伸縮的數據庫內算法開(kāi)發(fā)模型。獨特地,將算法應用于Oracle數據庫中的數據可減少數據準備和移動(dòng),從而加快了實(shí)現結果的速度。
Oracle Cloud Infrastructure數據目錄: 允許用戶(hù)發(fā)現,查找,組織,豐富和跟蹤Oracle Cloud上的數據資產(chǎn)。Oracle Cloud Infrastructure數據目錄具有內置的業(yè)務(wù)術(shù)語(yǔ)表,可輕松組織和發(fā)現正確的可信數據。

Oracle大數據服務(wù): 提供完整的Cloudera Hadoop實(shí)施,與其他Hadoop產(chǎn)品相比,其管理要簡(jiǎn)單得多,只需單擊一下即可使集群具有高可用性并實(shí)現安全性。Oracle大數據服務(wù)還包括用于Spark的機器學(xué)習,從而使組織可以使用一種產(chǎn)品和最少的數據移動(dòng)在內存中運行Spark機器學(xué)習。
Oracle Cloud SQL : 對HDFS,Hive,Kafka,NoSQL和對象存儲中的數據啟用SQL查詢(xún)。只有CloudSQL才能使能夠與Oracle數據庫對話(huà)的任何用戶(hù),應用程序或分析工具透明地使用其他數據存儲中的數據,并具有下推,橫向擴展處理的優(yōu)勢,可最大程度地減少數據移動(dòng)。
Oracle云基礎架構數據流: 一項完全托管的大數據服務(wù),允許用戶(hù)在無(wú)需部署或管理基礎架構的情況下運行Apache Spark應用程序。它使企業(yè)能夠更快地交付大數據和AI應用程序。與競爭的Hadoop和Spark服務(wù)不同,Oracle Cloud Infrastructure數據流包括一個(gè)窗口來(lái)跟蹤所有Spark作業(yè),從而使您可以輕松地識別昂貴的任務(wù)或解決問(wèn)題。
面向數據科學(xué)的Oracle云基礎架構虛擬機: 基于預配置的基于GPU的環(huán)境,具有常見(jiàn)的IDE,筆記本和框架,可以在15分鐘內啟動(dòng)并運行,每天收費30美元。
客戶(hù)在說(shuō)什么
AgroScout致力于檢測早期農作物病害,以提高農作物產(chǎn)量,減少農藥使用并增加利潤。“我們的愿景是使全球范圍內有5億個(gè)農場(chǎng)的10億農民在經(jīng)濟上可以使用現代農業(yè),占全球勞動(dòng)力的30%。我們計劃通過(guò)提供基于云的,由AI驅動(dòng)的可持續農業(yè)技術(shù)來(lái)實(shí)現這一目標,它完全依賴(lài)于低成本無(wú)人機,手機和種植者的手動(dòng)輸入的輸入,” Simcha Shore說(shuō),AgroScout創(chuàng )始人兼首席執行官。“這一愿景的成功取決于管理連續不斷增長(cháng)的輸入數據流的能力以及我們自己的基于A(yíng)I的解決方案,以將數據大規模轉換為精確的決策農業(yè)。Oracle Cloud的速度,規模和敏捷性幫助我們實(shí)現了夢(mèng)想?,F在,最近增加的Oracle Cloud Infrastructure Data Science開(kāi)辟了新的視野,它提高了我們的數據科學(xué)家協(xié)作構建,訓練和部署機器學(xué)習模型的能力。這種增加降低了成本,提高了效率,并幫助我們更快地擴大了全球足跡。”
IDenTV基于計算機視覺(jué),自動(dòng)語(yǔ)音識別和文本語(yǔ)義分類(lèi)器支持的AI功能提供高級視頻分析。“借助Oracle云基礎架構數據科學(xué),我們可以擴展我們的數據科學(xué)工作,以前所未有的速度提供業(yè)務(wù)價(jià)值。我們的數據科學(xué)團隊現在可以無(wú)縫訪(fǎng)問(wèn)數據,而不必擔心數據位置或訪(fǎng)問(wèn)機制的復雜性。在使用嵌入到環(huán)境中的TensorFlow,Keras和Jupyter筆記本等開(kāi)源功能時(shí),我們可以簡(jiǎn)化模型訓練和部署任務(wù),從而節省大量成本并獲得更快的結果,” Amro Shihadah說(shuō)道。,IDenTV創(chuàng )始人兼首席運營(yíng)官。“我們認為Oracle云基礎架構數據科學(xué)與自治數據庫的優(yōu)勢將為我們提供在市場(chǎng)上具有競爭力和獨特性所需的優(yōu)勢。”
