IT運營(yíng)的人工智能(AIOps)現在正式成為IT的一部分。這種采用新一代技術(shù)的平臺方法有望改變現代IT運營(yíng)團隊的效率和有效性,這些團隊經(jīng)常被洪水般的警報,數據,期限和壓力所掩蓋。

AIOps是Gartner Research定義的平臺,結合了大數據和人工智能功能,可替代廣泛的IT運營(yíng)流程和任務(wù),包括可用性和性能監控,事件關(guān)聯(lián)和分析以及IT服務(wù)管理。應用程序包括文本分析,高級分析,面部和圖像識別,機器學(xué)習和自然語(yǔ)言生成。
在本eWEEK數據點(diǎn)文章中,OpsRamp產(chǎn)品管理和云運營(yíng)高級副總裁Bhanu Singh 提供了行業(yè)信息,建議在采用AIOps之前,任何組織應采取的五個(gè)步驟。
數據點(diǎn)1:定義用例。
首先確定AIOps在組織內可以和需要完成的任務(wù)。您是否需要通過(guò)事件補救提供服務(wù)可用性?AIOps是否應該通過(guò)警報升級,抑制和重復數據刪除來(lái)支持您的ITSM實(shí)踐?或者,它是您的DevOps計劃的一部分,通過(guò)數據和指標提取和推理建模提供連續,可操作的見(jiàn)解?
數據點(diǎn)2:設置成功基準。
通常,AIOps的成功指標將包括平均解決時(shí)間(MTTR),預測和預防中斷,提高員工工作效率以及通過(guò)重復性手動(dòng)任務(wù)的自動(dòng)化減少工時(shí)或通過(guò)消除多點(diǎn)工具而節省的成本。這些成功基準可以始終如一地驗證用例的有效性和完成性。
數據點(diǎn)3:重要的細分數據。
擁有廣泛客戶(hù)群的企業(yè),如電子商務(wù),醫療保健組織或流媒體內容服務(wù),將希望通過(guò)分析預測或避免服務(wù)中斷的數據來(lái)確保平臺可用性,低延遲數據傳輸和服務(wù)質(zhì)量。
或者,一些運營(yíng)團隊對數據更感興趣,這些數據突出了應用程序性能,正常運行時(shí)間,依賴(lài)性以及對其他系統的下游影響。
數據點(diǎn)4:制定適應性強的數據收集和分析計劃。
AIOps工具依賴(lài)于來(lái)自可能數千個(gè)設備,組件或客戶(hù)接觸點(diǎn)的最高優(yōu)先級端點(diǎn)的數據,這些設備,組件或客戶(hù)接觸點(diǎn)通常是龐大的IT環(huán)境。
IT運營(yíng)團隊必須根據算法和攝取引擎主動(dòng)規劃如何處理數據的各種格式和狀態(tài) - 結構化,非結構化或半結構化。隨著(zhù)某些數據湖泊或資源可能比其他數據更有用,這些數據可能會(huì )隨著(zhù)時(shí)間的推移而發(fā)展。在某些情況下,與數據無(wú)關(guān)的工具相比,本機檢測將是提供更清晰數據集的更好選擇。
這些數據源也將影響分析計劃。在這里,您可以?xún)?yōu)化您的AIOps攝取引擎,以產(chǎn)生可操作的見(jiàn)解。
數據點(diǎn)5:設置自動(dòng)化。
為應用程序性能監控,安全漏洞警報和資源配置等基本活動(dòng)建立自動(dòng)化工作流程,Runbook和流程對于A(yíng)IOps準備工作至關(guān)重要。一旦確定了數據,就應該盡可能自動(dòng)化,以充分利用AIOps的有效性,并將通常與警報管理相關(guān)的例行任務(wù)替換為更復雜的自動(dòng)化腳本
