集中化戰(zhàn)略是中國移動在網絡運維方面的核心戰(zhàn)略,為網絡質量提升和生產力的發(fā)展提供堅實的管理基礎。隨著網絡規(guī)模的不斷擴大和運維集中化的不斷深入,省市兩級機構在組織協(xié)調、專家經驗和知識傳遞、全局指揮調度手段、集中化和專業(yè)細化結合等方面出現許多新的問題。
相比而言,傳統(tǒng)運維模式特點是:設備、人員分散管理;各地維護模式各異;效率低,規(guī)范性、標準性不高。而集中化運維模式的特點是:實現了設備的集中監(jiān)控、集中維護、集中管理;專家集中操作,現場主要為硬件配合人員,現場工作和遠程工作經?;?;要求標準化、信息化、自動化程度高。
不過,集中化運維也面臨一些新的問題。首先,專家異地處理與現場人員技能不足矛盾凸顯;其次,新設備增加后,設備遠程故障處理難度加大;再次,本地和遠程處理過程復雜,遠程調度溝通不暢,處理效率不高;最后,專業(yè)化的不斷演進,集中受理的規(guī)模和難度不斷增加,運維壓力越來越大。
網絡協(xié)同運維管理模式" height="274" src="http://files.chinaaet.com/images/20101213/49aba296-3e43-401b-a823-e90e89da6d56.jpg" width="500" />
圖1 知識管理協(xié)作過
網絡維護新趨勢需求
伴隨差異化運營、TD發(fā)展、全業(yè)務運營等新的工作內容不斷增多,網絡規(guī)模不斷擴大,業(yè)務種類日益增加,網絡維護工作面臨新的挑戰(zhàn)和考驗,進一步提升維護效率成為維護工作的重中之重。
比如設備種類的不斷增加,與維護人員數量基本不變的矛盾越來越突出;一線維護人員技能不足,專家經驗積累不足,知識隱性化,知識共享和傳播能力不足;各種新業(yè)務的需求不斷增加,新技術不斷演進,對運維工作提出更高要求;新的IT系統(tǒng)越來越多,各種應用工具在應急中難以發(fā)揮出整體效應。
這些現象和問題的解決需要省市公司、各專業(yè)高度協(xié)作,需要故障處理信息、運維經驗等有效支撐,需要減少不規(guī)范的行為和操作,為此亟需實現高效的網絡協(xié)同工作管理。實現了網絡故障智能發(fā)現、科學決策和高效處理,發(fā)揮網絡協(xié)同工作優(yōu)勢,使網絡運維工作顯性化、簡單化、及時化,提升網絡運維效率和客戶感受。
協(xié)同管理模式思路形成
山東引入TOC的分析思想,組織省、市公司的專家隊伍,去梳理網絡運維中的問題,在實施的過程中,借鑒TOC持續(xù)改善的思想,對分析出的關鍵約束迭代解決,建立相應的長效完善機制。
通過對現狀的分析,找出了和人員、組織相關的分工協(xié)作協(xié)率不高、專家經驗傳遞不暢等關鍵約束,通過不斷的迭代分析,找出了標準化程度不高、處理自動化程度低等關鍵約束。
通過專家團隊的點對點支持,省、市公司上下各部門的討論反饋,確定從知識管理、虛擬團隊、協(xié)同管理、場景管理四個方面加強管理力度。
構建信息共享的專家知識系統(tǒng)
在網絡協(xié)同工作的過程中,通過梳理各種故障的表象和原因,經過專家的分析提煉固化維護經驗,構建信息共享的專家知識系統(tǒng),形成技術支援知識庫,在故障過程中主動推送相關知識,固化相關的操作步驟,提高了工作效率。通過固化維護經驗、建立網絡安全模型,構建一個信息共享的專家知識系統(tǒng)(如圖1)。
安全模型
將隱形知識顯性化,將專家經驗與故障處理規(guī)范相結合,建立表征重大故障的科學模型。最大程度地將山東公司各專業(yè)網絡、多種業(yè)務資源、復雜的運維流程等運營中涉及到的數據、信息、流程等以固化的安全模型形式來表述。其包括網絡知識安全模型化、業(yè)務知識安全模型化、流程安全模型化。知識模型可細分,如網絡知識模型又劃分為交換知識模型、傳輸知識模型、智能網知識模型、信令網知識模型等。而智能網知識模型又可以包括:網絡評估模型、資源管理模型、業(yè)務分析模型、預警預測模型。通過安全模型的建立,提供有效過濾和關聯(lián)分析,實現故障準確定位,提高故障發(fā)現反應能力。隱形知識顯性化,將專家經驗與故障處理規(guī)范相結合,建立表征重大故障的科學模型;告警、性能、信令、撥測信息的綜合應用;創(chuàng)造性地實現基于回溯法的模型簡化算法。
故障處理規(guī)則提煉固化
通過對已有知識的整理、增添、結合和分類等方式,對既存信息進行重新構造,形成新的知識系統(tǒng)。知識規(guī)范化是對顯性知識的管理,可以看作是知識轉換模式中的聯(lián)結化。知識規(guī)范化結果形成知識庫,以經驗知識為基礎來構建各類規(guī)則庫。包括網絡維護經驗規(guī)則、知識積累規(guī)則、生產操作規(guī)則(如圖2)。
故障回放總結,提煉新知識
基于各種信息自動生成故障報告,支持故障過程回放;通過知識管理流程,將新的故障經驗提煉為新的知識,納入故障經驗處理庫。
技術支援的主動推送
指知識轉化和應用知識進行自動化處理。對網絡運維工作中需要大量人工、重復性的工作進行知識積累,并與IT系統(tǒng)相結合,利用各類技術手段和方法,實現相關運維過程的無人參與或少許人為參與,將維護人員從大量重復性工作中解脫出來??梢愿鶕I(yè)來劃分知識自動化處理,例如智能網知識自動化包括告警自動處理、告警自動派單、自動巡檢、自動核查、自動預警等內容。通過協(xié)同平臺實現的專家技術支援信息的主動推送,實現知識的分享。
成果創(chuàng)新點集中凸顯
建立集中化、高效率智能應用協(xié)同工作平臺
通過閉合的工作流程,實現一線維護人員、各地技術專家、遠方廠家技術支持、管理人員的協(xié)同工作;通過整合即時通訊、操作助手、視訊會議、集中操作等手段實現工具的協(xié)同;通過故障拓撲呈現、運維知識呈現、協(xié)同信息交互,支持圖形化的故障交互分析、定位處理,實現故障定位協(xié)同;通過固化處理經驗、規(guī)范工作流程和操作、強化現場管理,按照角色職責分工,協(xié)同配合,固化運維經驗,實現故障處理的協(xié)同;通過故障影響分析、故障處理過程信息、處理決策影響分析,整合調度手段,突出集中管理,實現協(xié)同決策;通過建立人員、角色、任務的耦合機制,實現省市兩級維護專家的聯(lián)動,形成了完善的虛擬團隊管理模式,并且從組織、流程、支撐手段三個方面結合使得虛擬組織能夠高效、穩(wěn)定的協(xié)同工作,保障了網絡集中化運維工作的順利開展。
構建模型化、規(guī)則化、自動化知識管理體系
在網絡協(xié)同工作的過程中,通過梳理各種故障的表象和原因,經過專家的分析提煉固化維護經驗,構建信息共享的專家知識系統(tǒng),形成技術支援知識庫,在故障過程中主動推送相關知識,固化相關的操作步驟,提高了工作效率。
同時,圍繞協(xié)同管理的目標,山東公司通過梳理各種故障的表象和原因,經過專家的分析提煉固化維護經驗,形成技術支援知識庫,構建信息共享的專家知識系統(tǒng),使得知識管理效益更加突出。建立表征系統(tǒng)重大故障的分析定位模型,通過綜合告警、性能、信令等全面的故障信息,屏蔽冗余信息,獲取典型故障的典型特征,建立安全模型,通過回溯法求核形成定位信息,提高重大故障的自動發(fā)現和定位能力。
圖2 故障規(guī)則提煉過程圖
形成虛擬團隊組織和協(xié)同工作機制
虛擬組織以其靈活的組成方式提升對市場的快速反應能力,可使企業(yè)在市場中占據有利地位,提高自身的核心競爭力。山東公司建立的統(tǒng)一指揮導向的機制是集團“三集中”核心的體現,是保障虛擬組織協(xié)同一致、發(fā)揮最大效應并為企業(yè)帶來價值的集中體現。統(tǒng)一指揮導向是指遵循集團“三集中”戰(zhàn)略,圍繞山東公司網絡精益運營要求,使用統(tǒng)一的智能化平臺,組織虛擬團隊高效地完成網絡運營協(xié)同工作。
山東公司通過高效的選拔機制,將各個地市的技術骨干經省公司選拔后組成虛擬團隊,虛擬團隊的工作內容是制定全省的網絡維護管理辦法、執(zhí)行方案,進行深層次專項網絡維護課題研究、網絡技術經驗推廣等工作。
虛擬團隊的協(xié)同,在組織流程方面,虛擬組織成員在本地或進行人員集中等方式開展多種形式的專項課題研究和對兄弟公司的技術支援工作,實現虛擬組織的全省共享。省公司專家隊伍作為一個面向全省的技術團隊,每一名成員均有責任和義務對全省網絡中的各個網元出現的問題進行分析、解決和優(yōu)化;在手段方面,可以通過智能化平臺的指揮調度系統(tǒng)使用網絡會議、協(xié)同工作平臺、可視聊天室、在線交流等工具完成虛擬團隊的協(xié)同工作。
確立靈活、可視化場景式網絡監(jiān)控模式
通過梳理不同故障處理場景,根據故障分類的進行信息化建模,固化每一個場景所需要的信息,規(guī)范現場處理各個環(huán)節(jié),規(guī)范故障處理信息和過程,標準化處理過程,自動化提示,使故障信息、角色管理和處理過程規(guī)范化、標準化。同時應用信息化手段,實現了故障處理過程的可視化管理。
可視化故障場景管理是對故障現場的信息化建模,對資源信息、故障信息,角色信息、處理過程等進行規(guī)范和標準,使協(xié)同人員都能夠系統(tǒng)獲取相關信息、快速把握現場故障信息。場景可以由安全模型自動生成,也可以由手工發(fā)起。所有維護人員均可以發(fā)起一個新場景,管理員可以對已有場景進行刪除和鎖定。一個場景完成后自動保存所有相關信息,對以前保存的場景可以進行瀏覽。維護人員和廠家人員均可以登陸未關閉的場景,場景中可以看到目前登陸的所有人員信息,便于管理者統(tǒng)一調配,協(xié)同指揮。
新運維管理模式產生更高社會效益
通過基于集中化運維的網絡協(xié)同管理,建立了網絡安全模型,提高故障發(fā)現反應能力,規(guī)范故障處理流程,提供準確及時數據和溝通手段,提高故障處理的操作效率,通過網絡資源、應急方案和網絡管理流程的有效集成,實現業(yè)務的安全、快速恢復,縮短業(yè)務中斷時間,提高用戶感知。
基于智能化維護手段的集成、整合平臺,實現了故障發(fā)現、分析、處理等功能,并在此基礎上實現故障的全過程管理和控制,以科學決策、高效處理故障,使故障處理顯性化、簡單化、及時化。通過知識管理、虛擬團隊的建設,有效的實現了知識的顯性化和分享的難題,完善了專家支援隊伍。
該平臺自2009年建成以來,在現網進行了MGW、CE等各種故障類型的演練,并在突發(fā)大話務沖擊事件進行了實際應用,事前、事中、事后各處理環(huán)節(jié)中都明顯提升處理效率,縮短了處理時間,總用時節(jié)省了近90%,經測算帶來直接經濟效益約720萬元人民幣;同時在推動社會信息化進程,促進節(jié)約型社會的形成等方面起到重要作用,有較高的社會效益。