網絡統一監控運維管理解決方案(21頁).pptx
下載文檔
上傳人:Le****97
編號:1306896
2025-01-14
21頁
3.75MB
1、網絡統一監控運維管理解決方案網絡統一監控運維管理解決方案2目錄目錄/ContentsContents需求理解需求理解0101解決方案解決方案02實施方案實施方案03需求理解n建設目標n運維管理能力體系14 4網絡統一運維管理建設目標實現網絡運維工作目標與組織業務目標的統一,助力運維工作降本增效構建完善的網絡運維體系通過組織、流程、制度的完善、支撐手段的建設,構建低成本高效率的IT運營體系,推動IT運營工作自動化、智能化、一體化化發展。具備自動化運維能力通過自動化運維工具集的建設,減輕運維人員重復性、繁瑣的工作,提升運營效率。同時,使得運營人員主要精力用于更有價值的事項。構建網絡一體化監控能力構2、建從設備、數據、系統、業務的立體一體化監控,實現網絡系統的全面精益運營構建問題發現、診斷、處理的一體化服務能力,提升了運維服務水平網絡統一監控運維管理體系自動化一體化體系化5 5構建面向“設備-數據-系統-業務”的端到端運營管理能力體系構建網絡統一運維管理能力體系,對基礎設備、數據、系統、業務進行統一運維管理,提供網絡運維監控、可視化監控、端到端管理、數據質量保障等多個領域的綜合運維管理能力,促進網絡運營降本增效。網絡統一監控運維管理能力體系決策者基層管理者面向業務的數據驅動的主動式運維資源采集監控告警流程數據日志配置操作工具運營分析系統級可視化運維業務級運維管理管理視圖客戶感知流程管理端到端3、全流程業務管理能力全鏈路質量管控,業務服務實時監控與分析,保障業務服務穩定運行。綜合保障能力+精細化運維能力實現對設備、數據、系統等統一監控運營保障統一監控管理能力構建閉環運維管理,明確職責分工,保障系統穩定運行。統一運營管理視圖以數據驅動運營管理,輔助運營運維決策。統一資源管理能力物理、邏輯、應用、業務資源的全面管理利用數據可視化技術展示綜合運營情況,提供統一運營管理視圖,掌握運營態勢。統一運營分析管理能力統一運營流程管理能力固話化運維流程、實現運維流程電子化、移動化統一運營操作管理能力對日常運維操作通過編排,任務定制形成操作場景,實現自動化處理故障恢復。解決方案n總體定位n總體方案藍圖n總4、體業務流程n總體架構27 7總體定位:建設統一運維平臺,構建面向業務的數據驅動的主動、智能的運維體系網絡統一運維平臺負責對某企業所涉及到的網絡設備及服務的運行情況進行全面的監控,及時發現網絡的各類異常并通知維護人員,以保證網絡的正常運行,提升網絡用戶的感知。構建面向業務的,主動式、智能化的統一平臺運維體系建立快速故障和風險識別與預警并主動修復的運維能力保障網絡運行的穩定性和可用性確保網絡運維工作與業務目標的融合網絡各類網絡設備路由器IDS交換機防火墻網絡統一監控運維管理平臺采集各個網絡設備的各項指標采集各個網絡設備的各項指標監控數據采集規則引擎流程管理消息管理大數據能力AI能力非結構化數據處理5、數據建模/標注機器/深度學習規則模型中繼器負載均衡器管理人員管理人員運營人員運營人員運維人員運維人員8 8總體方案藍圖基于大數據技術,參照ITSS、ITIL等技術與行業標準,建設網絡統一運維管控平臺,為網絡運行注入業務化、規范化、智能化的運維管理能力,助力構建完善、科學的平臺運維體系,以確保整個x區網絡的高效運營。網絡統一監控運維管理平臺IT物聯網大數據云計算智能故障分析大屏統一監控快速故障修復信息推送與告警故障報告數據匯集深度分析發現故障/風險數據分析可視化展示信息推送報表管理資源管理智能監控事件管理運維管理運營分析調整算法查收報告整體監控信息配置處理告警處理故障設置任務數據采集主動探測告警6、修復識別、預測實時任務定時全面多維智能基礎能力統一門戶網絡設備9 9總體業務流程數據采集匹配規則智能監控中心監控告警運維流程中心操作管理中心自動運維創建工單分派工單受理工單異常處理工單完成人工報障如果符合自動化運如果符合自動化運維規則,則系統自維規則,則系統自動處理告警動處理告警工單關閉告警消除告警分析如果不符合自動化運維如果不符合自動化運維規則,則人工派單規則,則人工派單1.支持被動式設備數據采集2.支持主動式探索1010總體架構:基于“統一技術+業務中臺”架構設計,支撐“統一規劃+分步實施“的建設模式監管對象路由器交換機防火墻負載均衡器IDS中繼器統一運維管理平臺采用中臺技術架構,整個架7、構核心由基礎能力平臺(資源平臺、采集平臺、監控平臺、流程平臺、運管平臺、消息平臺),業務中心(資源管理、監控預警、作業管理、運維流程、分析)和統一門戶(支持PC、手機端、大屏多端展示)組成。后臺計算資源存儲資源網絡資源標準接口中臺基礎能力核心能力平臺平臺管理組織管理用戶管理角色管理權限管理績效管理數據管理配置管理日志管理業務流程平臺智能監控平臺資源管理平臺消息推送平臺運維管控平臺采集處理平臺AI算法引擎流程管理引擎分布式框架分布式存儲搜索引擎分布式緩存服務調度流處理引擎消息引擎數據共享服務前臺運維門戶應用服務資源管理中心智能監控中心運維流程中心操作管理中心運營分析中心統一門戶個人門戶大屏展示A8、PP實施方案3n平臺運維門戶n資源管理中心n智能監控中心n運維流程中心n操作管理中心n運營分析中心1212統一運維門戶面向不同角色與場景,提供可視化的集中監控應用,全面感知網絡運行健康度統一門戶以使用角色和場景展現統為主線,面向不同使用者特定場景,實現對業務、網絡資源或能力的“可視”、“可控”、“可追溯”,分角色分權限向決策層、管理、基層維護人員提供統一的運維視圖。而數據可視化支持PC、大屏、手機等多端展示,讓不同人員可以實現隨時、隨地的可視化的網絡運維管理。02數據可視化,全面感知03移動端,隨時隨地高效辦公01統一門戶提升效率1313全面資源管理對網絡資源進行全面、全過程規范管控,實現網絡9、資源的可控、可視、可靠資源管理中心通過構建CMDB,將x區網絡所涉及的資源數據集中、統一標準化管理,實現資源數據全生命周期的唯一性、準確性、完整性和可維護性,為網絡運維提供準確的基礎資源數據,為網絡的高效運行與維護奠定基礎。中繼器交換機負載均衡器防火墻路由器IDS堡壘機各類網絡資源對象資源配置維護資源配置維護資源自動發現資源自動發現資源關系自動發現資源關系自動發現資源關系維護調整資源關系維護調整CMDB標準化唯一性準確性完整性資源配置管理資源基線管理資源下線、報廢資源上線管控流程資源狀態變更管控資源自動稽核資源準確性稽核資源合規性稽核資源層次關系拓撲可視1414智能監控-基礎監控對網絡資源進行10、全覆蓋實時監控,保障網絡相關設備穩定運行網絡各種網絡設備網絡統一運維管理平臺資源管理監控預警操作控制數據采集流程管理統一監控門戶路由器交換機防火墻堡壘機操作接口基礎數據事件數據性能數據告警信息日志數據 資源方面:可實現網絡資源的全面管控及信息聯動;監控方面:匯聚各種網絡設備的告警和性能數據。將mx區網絡資源進行統一、規范的管控,實現對網絡資源的全面監控,確保mx區網絡的運行穩定。1515智能監控-自主監控主動巡檢、探測網絡狀態,及時發現風險、保障網絡的可用性可以利用自動化測試腳本,命令執行,模擬操作等方式,主動對網絡各項資源的運行狀況進檢測,主動發現存在的故障與潛在風險,改變被動等待故障發生的11、監控運維工作模式,保證網絡的可用性。設備故障的主動探測、網絡健康自動巡檢、網絡可用性保障業務可用測試發現問題主動巡檢快速修復告警通知問題分析任務分派解決告警設備可用探測系統狀態巡檢設備狀態巡檢執行測試腳本執行檢測命令模擬操作1616智能監控-自主運維智能化監控模型設計,統一告警策略配置,自動故障與風險告警活動會話計數背板利用率大緩沖區命中大緩沖區未命中接口重啟計數DNS請求CPU利用率丟包鏈路響應內存利用率入站出站流量利用率數據包錯誤沖突數監控指標監控設備人工配置人工配置機器學習機器學習監控模型監控模型庫監控告警告警事件告警規則庫告警方式告警內容模版告警聯系人可以根據各個網絡設備的各項監控指標12、建立監控模型,同時,系統能夠通過機器學習的方式完善監控模型庫,并能夠根據告警規則,生成告警。1717智能監控-多維監控從多個維度進行網絡運行監控,保障網絡的可用和穩定性T T從技術角度發現問題從技術的角度來對網絡運行狀態進行分析,識別、預測并排除故障,保障網絡可用。B B從業務視角排除故障從業務的視角來分析故障帶來的影響,排除故障,確保網絡的可用性。M M從管理視角分析風險從管理的視角來檢查使用狀態與分析問題和風險,確保網絡使用符合管理要求與規范。部門主管業務骨干 技術專家技術業務管理丟包延遲抖動可用性流量背板帶寬鏈鏈路路響響應應負載均衡器中繼器防火墻交換機 路由器場景A場景B場景C1818運13、維流程管理基于ITIL標準,建立規范、標準化的運維管理流程,為網絡運維保駕護航基于ITIL行業標準,結合信息安全、IT運維管理標準及制度,建立標準服務支撐流程,故障定級定界、配套應急響應流程,保障問題、故障的有序標準化處理。同時,利用各類支撐工具和手段輔助故障與應急處理,實現故障的快速處理,并逐步形成運維知識庫,不斷管理和技術優化提升運營服務能力,為網絡的運維管理保駕護航。應急響應流程服務支撐流程工具&知識庫監控工具操作工具集成工具經驗沉淀標準方案應急預案1919高效操作管理建立統一運維操作中心,形成運維操作規范與預案,提升運維工作效率統一操作管理中心將日常運營管理工作的常態操作與腳本通過技術14、編排固化形成自動化執行的操作任務,讓系統自動執行、人工觸發、或供第三方系統直接調用等方式實現自動化操作處理,提升日常運營工作效率,讓運營工作更輕松。p縮短操作執行時間,提高執行效率;p減少人工失誤導致的系統故障;p提高運維自動化水平,減少人工投入,降低運營成本。p降低了關鍵崗位的技能要求;p消除故障隱患、保證作業效率;p降低日常運維工作中人員的時間投入、精力投入。自動化操作運營場景命令操作服務啟停集中配置系統巡檢安全檢測應急切換故障預案收到告警匹配預案執行任務告警恢復故障處理驗證通知預案管理預案定義預案編排預案定時調度預案手工調度預案執行日志預案管理(審批、權限、增刪改查)預案庫周期作業調度&15、批量操作處理2020集中運營分析挖掘運維數據潛在價值,輔助維護與運營管理決策統一門戶以使用角色和場景展現統為主線,面向不同使用者特定場景,實現對業務、網絡資源或能力的“可視”、“可控”、“可追溯”,分角色分權限向決策層、管理、基層維護人員提供統一的運維視圖。而數據可視化支持PC、大屏、手機等多端展示,讓不同人員可以實現隨時、隨地的可視化的運維管理。網絡統一運維管理平臺資源數據監控數據告警數據故障數據操作數據日志網絡故障分析健康狀況分析傳輸流量分析設備質量分析服務質量分析管理流程分析u分析網絡的故障率與穩定性,發現問題,提升網絡運行的穩定性和可用性u發現隱患,輔助問題診斷u對資源利用情況進行深入分析,優化資源利用率,為運營降本增效u分析網絡服務質量,助力優化提升網絡性能u對流程流轉進行全面分析,為優化運維管理流程制度提供支撐THANKSTHANKS