智能運維在中國移動IT云中的應(yīng)用與實踐
2021年電子技術(shù)應(yīng)用第11期
劉 虹,滕 濱,張 琳,郭志斌
中國移動通信集團有限公司 信息技術(shù)中心,北京100032
摘要: 介紹了中國移動IT云針對IaaS層的智能運維場景體系規(guī)劃,選擇了數(shù)據(jù)基礎(chǔ)較好的兩個典型應(yīng)用場景“智能化指標(biāo)異常檢測”和“智能化告警關(guān)聯(lián)與溯源”進行了研究和論證,分別分析了兩個場景適用的算法和實現(xiàn)過程,論述了兩個場景實施后的效果評估方法,并經(jīng)實際生產(chǎn)驗證了場景實施的效果。
中圖分類號: TN929.5;TP399
文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.211543
中文引用格式: 劉虹,滕濱,張琳,等. 智能運維在中國移動IT云中的應(yīng)用與實踐[J].電子技術(shù)應(yīng)用,2021,47(11):20-24.
英文引用格式: Liu Hong,Teng Bin,Zhang Lin,et al. Best practice of AIops in China Mobile private cloud[J]. Application of Electronic Technique,2021,47(11):20-24.
文獻標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.211543
中文引用格式: 劉虹,滕濱,張琳,等. 智能運維在中國移動IT云中的應(yīng)用與實踐[J].電子技術(shù)應(yīng)用,2021,47(11):20-24.
英文引用格式: Liu Hong,Teng Bin,Zhang Lin,et al. Best practice of AIops in China Mobile private cloud[J]. Application of Electronic Technique,2021,47(11):20-24.
Best practice of AIops in China Mobile private cloud
Liu Hong,Teng Bin,Zhang Lin,Guo Zhibin
Information Technology Center,China Mobile Communications Group Co.,Ltd.,Beijing 100032,China
Abstract: The planning of infrastructure AIops scenario for China Mobile private cloud is described, and the two typical scenarios named "Intelligent Index Anomaly Detection" and "Intelligent Alarm Traceability" are researched. The algorithm and business processes of the two scenarios are introduced respectively.The effect evaluation method of the two scenarios is discussed,and the actual production verifies the implementation effect.
Key words : AIops;index anomaly detection;alarm traceability;machine learning
0 引言
隨著國內(nèi)企業(yè)數(shù)智化轉(zhuǎn)型的深入推進,企業(yè)私有云的設(shè)備規(guī)模呈現(xiàn)持續(xù)增加的趨勢,作為中國移動內(nèi)部支撐系統(tǒng)的云化基礎(chǔ)設(shè)施,一級云資源池的規(guī)模持續(xù)增加,運營和運維工作面臨著越來越大的壓力。從業(yè)界經(jīng)驗來看,運維人員數(shù)量無法隨著設(shè)備數(shù)量線性增加,每萬臺服務(wù)器運維人員的數(shù)量持續(xù)下降,因此亟需引入智能化運維手段,解決人力不足的矛盾。同時,也需要借助智能化工具提高資源的可用性,提升租戶的使用體驗。為此,中國移動結(jié)合IT云自身特點,梳理了一級IT云的智能運維場景體系,并選取典型場景進行了應(yīng)用與實踐。本文基于中國移動一級IT云運維團隊的切實需求,綜合評估業(yè)界關(guān)鍵技術(shù)成熟度和一級IT云的基礎(chǔ)運維數(shù)據(jù)質(zhì)量,選擇以下兩個場景進行分析和研究:
本文詳細內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003819。
作者信息:
劉 虹,滕 濱,張 琳,郭志斌
(中國移動通信集團有限公司 信息技術(shù)中心,北京100032)
此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。