2018電力公司數據標準化推動自動化運維持續穩健發展研究報告(22頁).pdf
下載文檔
上傳人:偷****
編號:501471
2022-07-29
22頁
3.09MB
1、時間:2018/12/21 數據標準化推動自動化運維持續穩健發展 目錄 對自動化運維的理解 自動化實踐問題分析 交流總結與工作展望 02 01 03 04 數據標準化解決思路 對自動化運維的理解 資源 技術 流程 人員 通常對自動化的理解 我們通過一些實踐,現在的理解是:IT運維工作,不斷呈現場景化、碎片化、工具化的特征,自動化運維應該是覆蓋資源、技術、流程、人員的運維全自動化。這涵括了早期的對腳本控制的理解。指對遠程腳本的編輯、編排、自動執行、審計等。1-管理角度 更好的滿足公司在技術、業務等方面 更安全、實用、高效的要求。2-成本角度 降低了一些流程維護執行、運維人員成本這兩塊的投入成本。2、自動化實施后帶來的優勢:自動化實施后帶來的風險:目前控制類工具有一定風險,缺乏人員監護或者回滾機制,需要謹慎使用。建議優先使用自動巡檢這樣的監視類的工具。自動化運維的四個發展階段 監視類工具遠程掌控管理對象的運行狀態 控制類工具對管理對象進行一定的遠程操控 階段1-純工具階段 人員驅動-人依然是占主導作用 管理人員審批流程,指定操作人員并進行工具授權 操作人員操作/監督自動化運維工具處置相關事件 處置完畢后,文案歸檔,用于生成月度季度報告 階段2-半自動化階段 數據驅動-數據是核心驅動力 工具在既定邏輯下,按部就班完成任務操作 數據自動流轉,推動流程執行 人僅負責流程設計、監督、審核、回滾等環3、節 階段3-全自動化階段 通過機器學習與訓練,使AI可以掌握一定的運維知識與技能,從而能夠處理特定場景下的特定問題。海量的運維數據是智能化運維的前提 階段4-智能化階段 觸發 流程 事件/需求 人員 授權 主管 審批 操作 預案 分配 工具 資料 歸檔 處置 事件 運行方式報告 全程數據采集 場景 流程 人員 工具 文檔 數據 半/全自動化下的通用業務模式 半自動化模式下,以下節點均需要人工設計、參與,人為核心,部分環節自動化;全自動化模式下,各節點環節是以數據為核心,數據的底層流動直接驅動了業務的流轉。調度場景下的數據驅動全自動化示例 2 3 4 5 6 1 預估本故障可 能的影響范圍 協助4、故障檢修 故障定位工具 搶修 事故分析報告 調度掛牌工具 監控氣泡圖顏色變紅 氣泡圖變綠,業務拓撲恢復 班長電話確 認風險消除 調度撤牌工具 超級日志工具 7 調控班長分析故 障出現原因 應急預案工具 電話通知,屏 蔽故障源告警 影響分析工具 調度班-班長的愿望 主要工作:調度管理、系統監控、應急處置 工作場景:某信息系統故障后,會產生大量的告警信息,某班長需要進行快速判斷及處置。通過一系列定制工具,他將迅速有效的完成工作。實際操作 新增工具 圖例:業務拓撲圖工具顯示異常 5s 1m 1m 1m 30m 1m 2m 總時間40min 調度場景 時間價值、效率價值、服務價值 目錄 對自動化運維的5、理解 自動化實踐問題分析 交流總結與工作展望 02 01 03 04 數據標準化解決思路 建設與執行角度的風險 自動化 產品A 自動化 產品B 自動化 產品C 廠商A 廠商B 廠商C 產品A 產品B 產品C 重復建設風險:相關自動化工具的建設邊界較難把控,各廠商工具部分功能重疊,可能會導致重復建設。潛在管理風險:工具執行人員的選擇與工具授權,在實操層面會增加一定的流程管理成本。執行層面風險:同時在可選擇工具較多的情況下,執行專責可能會存在一定的重復操作與應用情況。調控與運檢角度的問題 自動化運維工具的上線,使部分調控專責的工作效率有了一定的提升,如故障定位工具,但是調控類自動化工具存在一定的重6、復采集、重復存儲問題;在運檢,遠程操控領域,見效相對較慢,一是相關工具需要人員掌握一定的專業技能;二是電網企業的性質決定了在效率與穩定之間,更講求穩定。在風險回退機制尚未建立的背景下,運檢類自動化工具的執行,還需要人員的全程監督與協助。65%35%調控領域 包括信息通信系統的集中監視、調度指揮等工作 運檢領域 包括所轄業務系統、機房基礎設施等運行檢修維護工作 工具聯動角度的問題 在不同的場景下,各自動化工具存在明顯的孤島效應。場景開始 工具A 工具B 工具N 場景結束 調度搶修 故障定位工具、影響范圍工具、應急預案工具、掛牌工具、運維事件全過程管理工具、超級日志中心 運維檢修 影響范圍工具、掛7、牌工具、配置管理工具、RFID輔助資產管理、運維遠程監護工具、一鍵啟停工具 運維巡視 自動化巡視工具、智能指標分析與分享工具、智能檢修工具 資源規劃 資源規劃全過程管理工具、采集輔助工具 全壽命管理 業務系統全生命周期管理工具 風險評估 風險評估工具 業務培訓 故障仿真工具、應急預案工具 應用場景 可選用工具 調度監控 業務拓撲圖工具(目前調度適用網絡拓撲、業務系統應用狀態)、鏈路監控工具、掛牌工具 問題小結 自動化運維工具建設與應用,已經逐步開始見到成效,但是仍然面臨著重復采集與存儲,重復建設與應用,工具數據與應用孤立的問題。這是自動化運維發展到純工具階段與半自動化階段,必然面臨的困擾。自動8、化運維工具的應用場景是瑣碎而繁多的,目前沒有一家企業能夠設計開發出所有的與特定行業業務緊密結合的自動化運維工具全集。因此我們認為,既能夠解決上述問題,能夠支撐百家爭鳴、百花齊放,并且可以推動自動化運維邁向第三階、第四階的重要措施之一,就是數據及其標準化。目錄 對自動化運維的理解 自動化實踐問題分析 交流總結與工作展望 02 01 03 04 數據標準化解決思路 自動化運維數據標準化意義 迭代的是版本 操作的是人員 使用的是技術 面向的是場景 規范的是流程 數據是貫穿于標準化、自動化、智能化這樣IT運維不同發展階段的不變的要素之一。標準化的數據,可以減少自動化運維工具數據生產流通的匯總、清洗、治9、理成本,驅動業務流轉。可以為大數據挖掘與智能化運維的機器學習、深度學習打下良好基礎。未來世界,數據是生產要素,對數據的掌控力,就是生產能力。管控的是資源 實時流通、永久沉淀的 是數據 運維類的軟件系統,包括自動化運維工具:自動化運維元數據內容 場景數據場景數據 人員數據人員數據 流程數據流程數據 技術數據技術數據 資源數據資源數據 自動化運維元數據要素 中文名稱 英文名稱 數據定義 數據類型 數據注解 數據值域 數據權限 場景ID SceneID 場景管理的唯一編碼 字符 AA01 必選項M,最大出現1次“公開級”與“限制級”自動化運維元數據編碼分類規則 自動化運維元數據內容 1-場景元數據/10、2-人員元數據/3-技術元數據 大類編碼 大類名稱 子類名稱 細分類名稱 A 場景元數據 場景基礎子類 場景基礎細分類 場景操作子類 場景操作細分類 B 人員元數據 人員管理子類 基礎信息細分類 績效考核細分類 培訓細分類 運維及管控細分類 人員行為子類 運維行為細分類 人員能力子類 技能水平細分類 知識儲備細分類 C 技術元數據 告警處理子類 處理信息細分類 運維工具子類 工具基礎信息細分類 工具技術信息細分類 大類編碼 大類名稱 子類名稱 細分類名稱 D 流程元數據 檢修管理流程子類 基礎信息細分類 申報人信息細分類 處理信息細分類 搶修管理流程子類 基礎信息細分類 申報人信息細分類 處理11、信息細分類 巡視管理流程子類 基礎信息細分類 申報人信息細分類 處理信息細分類 資源申請流程子類 基礎信息細分類 申報人信息細分類 處理信息細分類 配置變更管理流程子類 基礎信息細分類 維護信息細分類 廠商硬件信息細分類 廠商軟件信息細分類 服務商信息細分類 調度值班流程子類 基礎信息細分類 申報人信息細分類 處理信息細分類 缺陷管理流程子類 基礎信息細分類 申報人信息細分類 處理信息細分類 4-流程元數據 自動化運維元數據內容 大類編碼 大類名稱 子類名稱 細分類名稱 E 資源元數據 基礎環境資源子類 機房基礎設施配置細分類 機房基礎設施性能細分類 硬件資源子類 主機配置細分類 主機性能細分12、類 網絡配置細分類 網絡性能細分類 存儲配置細分類 存儲性能細分類 通用軟件資源子類 數據庫配置細分類 數據庫性能細分類 中間件配置細分類 中間件性能細分類 應用資源子類 應用資源基礎信息細分類 應用Web事務細分類 數據庫調用細分類 外部調用細分類 基礎資源使用細分類 慢事務細分類 錯誤信息細分類 云資源子類 虛擬化配置元數據 虛擬化性能細分類 云平臺配置細分類 云平臺性能細分類 5-資源元數據 自動化運維元數據內容 自動化運維元數據角色 1、梳理清楚可以對外提供的元數據;2、給出獲取相關元數據的接口方式。注冊 管理者提供注冊服務與目錄服務。管理者 生產者 申請 消費者向管理者,查詢了解本次13、使用的元數據是否已有工具提供。目錄服務 消費者 申請 元數據生產者向管理者發起注冊申請,申請內容包括數據生產者廠商信息、數據接口的技術選型。1、獲取基礎的元數據;2、根據業務場景及理解,對基礎元數據進行二次加工,生成復合元數據。提供服務 如有,則直接可以獲取到數據傳遞接口。自動化運維標準化工程實踐 發布 上線 測試調試 研發生產 工具架構設計(數據架構)需求調研及可行性研究 1、自動化運維元數據內容、角色的標準化,應覆蓋自動化運維工具工程實踐的每一個環節。2、新建自動化運維工具應滿足上述要求,歷史自動化運維工具,按上述要求逐步改造。目錄 對自動化運維的理解 自動化實踐問題分析 交流總結與工作展望 02 01 03 04 數據標準化解決思路 總結 溝通 小結 國網蒙東信通公司,基于自己的實踐探索經驗,提出自動化運維四階段概念,并指出現階段的自動化運維發展中的問題,從數據標準化角度給出解決方案。工作 展望 我們后續將積極配合全國信標委大數據標準化工作組開展相關工作。當前我們參與/主導起草的標準草案包括信息技術-服務大數據-運維服務元數據、信息技術-服務大數據-自動化運維參考技術架構等,期待更多同行加入服務大數據專題組,為推動行業發展貢獻自己的力量。THANKS!THANKS!