Kubeflow的第一個(gè)穩定版本(由Google LLC支持的工具包,用于在Kubernetes上運行人工智能工作負載)今天正式可用。

Kubeflow在2017年由一組Google工程師和其他科技公司的一些同行開(kāi)源。它是一個(gè)工具套件,使組織能夠在由流行的容器編排框架Kubernetes支持的基礎架構上部署AI工作負載。
Kubeflow 1.0版本引入了該軟件幾個(gè)核心組件的整數版本。這些組件現在符合企業(yè)用戶(hù)需求的“定義的穩定性,可支持性和可升級性級別”,這意味著(zhù)該工具包作為一個(gè)整體現在更適合生產(chǎn)使用。
Kubeflow 1.0帶來(lái)了穩定的內置管理控制臺版本,其中包含關(guān)鍵功能的快捷方式。這些功能之一是Jupyter Notebook控制器,該控制器也已升級到穩定狀態(tài),并允許AI團隊使用無(wú)處不在的Jupyter Notebook開(kāi)發(fā)工具創(chuàng )建新的機器學(xué)習模型。

模型準備好后,用戶(hù)可以使用TensorFlow或PyTorch對其進(jìn)行訓練。Kubeflow 1.0通過(guò)TFJob和PyTorch Operator兩者都支持,這兩個(gè)代碼抽象使開(kāi)發(fā)人員可以使用他們選擇的框架和相對簡(jiǎn)單的腳本來(lái)設置AI培訓工作流。
今天的版本還為管理員提供了一些功能,這些管理員可以管理開(kāi)發(fā)人員在其上構建AI工作負載的基礎架構。有一個(gè)kfctl,它可以在云環(huán)境中自動(dòng)部署Kubeflow,并具有可以在各個(gè)開(kāi)發(fā)人員之間分配環(huán)境資源的控件。
Google開(kāi)源戰略家Thea Lamkin在博客文章中詳細介紹:“有了Kubeflow,每個(gè)數據科學(xué)家或團隊都可以得到一個(gè)自己的命名空間,可以在其中運行他們的工作負載。” 命名空間提供了安全性和資源隔離。使用Kubernetes資源配額,平臺管理員可以輕松限制個(gè)人或團隊可以消耗多少資源,以確保公平的調度。”

在另一篇文章中,Google云工程師Jeremy Lewi和Abhishek Gupta寫(xiě)道,公司可以在其Anthos應用程序平臺上部署Kubeflow 1.0,以利用這些新功能。展望未來(lái),這家搜索巨頭計劃加強對AI工具包的支持。Google將允許企業(yè)在本地Anthos部署上設置Kubeflow,并將與Google Cloud的網(wǎng)絡(luò )安全功能添加更緊密的集成。
