2019年軟件研究院新員工AI技術在項目中的應用培訓課件.pdf
下載文檔
上傳人:地**
編號:1268111
2024-12-16
46頁
3.47MB
該文檔所屬資源包:
大數據互聯網軟件研究院新員工規章制度信息安全5G基礎知識培訓課件資料
1、2019年7月人工智能基礎課程AI技術在項目中的應用2內容概要本次課程講解人工智能典型場景,包括以下內容:基于AI產品成果的典型案例 AIOps平臺 天宮云平臺運維 人臉識別 計費運維安全管理平臺 機器人聊天 計費釘釘移動運維 預測模型 收入數據管理 基于神經網絡的典型案例 神經網絡在信控熔斷場景中的使用3目錄第二部分第五部分第一部分預測模型與收入數據管理AIOps在天宮平臺運維中的應用第三部分神經網絡在計費信控熔斷中的應用人臉識別與計費運維安全管理平臺第四部分自然語言與計費運維4AIOps技術基礎 架構AIOps有兩個主要組件:大數據、機器學習AIOps架構了三個不同的IT學科:服務管理、性2、能管理和自動化,以實現持續洞察和改進的目標。AIOps是一個認可和一個游戲計劃,在新的加速IT環境中,必須有一個新的方法,由大數據和機器學習的發展所承載。圖示:Gartner對AIOPS平臺的可視化圖示:構成AIOps平臺的技術 AIOps平臺包含性能管理、服務管理、自動化和流程改進等IT技術,以及諸如監控、服務臺、容量管理、云計算、SaaS、移動性、物聯網等技術5AIOps技術基礎AI模型應用計算任務調度管理系統模型構建工具算法庫數據準備數據輸入離線應用實時應用API調用應用離線訓練實時任務離線任務交互式任務Spark connect/Local connect/交互引擎效果評估數據檢索統計3、分析數據調優模型選擇 特征工程深度學習機器學習時間序列文本處理 Sql/表達式分揀代碼編制關聯分類儲備 用戶數據樣本庫HDFS/MYSQL等存儲體API調用任務AIOps建模服務能力視圖數據分析AI建模數據管理數據接入數據計算數據存儲日志檢索日志分析其他分析實時監控智能監控其他智能模型數據開發服務數據分析服務AI建模服務元數據管理數據集市數據安全數據質量交互式分析 數據可視化交互式建模場景模型異構數據庫數據訂閱統一查閱實時計算離線計算復雜事件處理數據采集數據清洗數據分發AIOps平臺能力體系 AIOps開源平臺能力體系、建模服務能力結構圖:AIOps工具集成虛擬存儲應用&數據服務CPU/GPU4、投資回報率服務保證AI成熟度模型存儲支持AI的操作數據庫服務WEB服務機器學習開發環境網絡數據庫業務流程運營服務運營管理黨派 監控 故障預測 容量規劃 KPI分析和報告AI OSS 功能 事件管理 故障管理 問題管理 服務請求管理.容量管理 服務水平管理 客戶體驗管理 自動維護kubernetesDRDSRDSMQOSCustom Library 客戶投訴預測 網絡優化 預測性維護cBSS2.0 IT運維轉型之痛互聯網業務的蓬勃發展,分布式云化架構的廣泛應用,傳統的運維模式面臨越來越多的挑戰,難以適應業務的高速發展需求,智能運維(AIOps)已成為必不可少的運維利器日均9億次調用服務毫秒級響應5、99.999%可靠性云化應用數36個規模大發現難定位難用戶體驗差異常檢測:自動發現時間序列數據中的異常波動故障智能分析:機器學習、數據挖掘、大數據相結合,故障智能分析業務視圖總覽:業務調用鏈+業務指標監控一點看全AIOps基于AIOps的天宮運維解決方案AIOps以機器學習框架為基礎,結合數據挖掘、大數據等技術對監控數據、業務日志、告警信息進行分析構建集異常檢測、故障智能分析、業務視圖為一體的智能運維平臺決策樹算法孤立森林算法Apriori算法監控數據業務日志告警信息異常檢測故障智能分析業務調用鏈數據處理日志處理基于AIOps的天宮運維產品功能架構核心框架:AI智能運維研發的框架,借助機器學習6、建立核心框架。數據中心:運維數據集中化收集和處理,提供流處理能力,實現海量監控數據的集中存儲與處理日志中心:業務日志集中化收集和處理,實時計算、統一報表,實現業務視圖全景監控知識庫:存儲歷史故障表征信息、人工知識經驗、解決方案等,控制運維平臺的行為基礎設施中間件應用數據中心知識庫數據清洗數據采集質量控制數據打標數據存儲執行策略歷史經驗空間向量模型語料庫語義擴充模型業務指標全景圖異常檢測數據存儲故障智能分析業務調用鏈業務日志核心框架模型加載模型訓練統計報表數據挖掘多維度匯聚大數據分析開發工具算法日志中心規則配置日志采集日志清洗持久化存儲聚合計算日志策略解決方案天宮運維產品核心框架-機器學習機器學7、習:需要大量的數據來訓練,對故障的歷史數據進行場景分類和標注,不斷用模式識別和數據來訓練機器識別和分析,讓機器自動準確判斷。執行策略:來自產品功能架構的知識庫模塊。數據中心數據接入特征處理模型訓練模型評估模型發布模型存儲模型調研測試環境模型方案生產環境模型自學習數據接入特征處理模型增量訓練模型更新模型存儲智能告警異常分析執行策略方案后項目對需求的滿足狀況 AIOps方案實施后實現了對故障的預測、智能化分析及解決方案推送的需求,提升了運維效率的同時,縮小了故障發生的頻率與影響范圍。AI故障預測、故障分析 故障預測:解決了目前監控告警只是對已發生的事件進行預警,無法有效的預測故障發生的問題 解決方8、案推送:結合知識庫系統,自動推送故障解決方案故障分析:智能化故障分析解決方案推送:自動推送解決方案故障預測:故障提前預警 故障分析:智能化故障分析,解決了主要依靠人力排障,排障時間長,缺少智能分析定位系統的問題,縮短了排障時間,縮小了影響范圍典型場景:異常檢測 常規的異常檢測多是由業務人員先發現,報告,基于AI的異常檢測能夠在故障發生的第一時間通過機器學習,自動發現問題 基于孤立森林算法構建異常檢測模型,自動發現時間序列數據中的異常波動,具有低時延、高準確率的特點,解決了海量數據中的異常數據識別難的問題歷史數據聚類算法閾值數據拆分異常數據比例數據處理孤立森林算法模型12345676實時監控數據9、數據處理異常檢測123通過對基于高斯分布的異常檢測算法、絕對中位差、孤立森林等算法的測試分析,選擇孤立森林算法作為異常檢測的算法,實際使用中根據業務場景、數據特點等可選擇不通算法,配置靈活典型場景:故障智能分析 機器學習、數據挖掘、大數據相結合,機器學習與專家經驗相結合,構建故障智能分析系統及知識庫系統 實現了故障實時分析,自動生成故障報告,自動推送解決方案,解決了分布式架構下故障發現難、定位難,耗時長的問題,實現了“基于歷史經驗”到“基于機器學習”的轉變離線數據聚類算法特征閾值故障異常指標Apriori算法關聯分析模型12比對3知識庫系統456異常指標結果實時監控數據比對123大數據分析故障10、報告解決方案4567人工知識歷史經驗效果展示異常檢測異常分析&導航式排障項目價值減少資源投入,增加收入減少運維和時間成本,增加企業收入推動創新推動數字化轉型,提升創新動力,促進企業競爭力持續提升提高效率智能化運維,運維效率顯著提升提高服務質量服務更穩定,服務質量顯著提高提升客戶體驗業務中斷時間顯著減少,客戶體驗明顯提升AIOps通過機器的自我學習和分析決策,結合數據挖掘、大數據等相關技術,實現了“基于歷史經驗”到“基于機器學習”的轉變,AIOps的研發與落地有助于激發人員的創新能力,推動數字化轉型,持續提升企業競爭力使用效果提高效率提高效率提升用戶體驗降低運維成本降低運維成本降低負面影響范圍告11、警消息數量30min故障解決率運維人員占比系統穩定性提升業務中斷時間2,5005025%75%75%95%2 Hours10 Mins使用前使用后AIOps30%18%35%20%運維成本占比10%故障投訴率30%17目錄第二部分第五部分第一部分預測模型與收入數據管理AIOps在天宮平臺運維中的應用第三部分神經網絡在計費信控熔斷中的應用人臉識別與計費運維安全管理平臺第四部分自然語言與計費運維計費信控熔斷業務場景說明防止大批量誤停;異常情況直接熔斷;識別小批量異常用戶;效果深挖痛點問題,安全保障優先;高頻監控生產,提高應急效率;挖掘特征規律,建立識別模型;思路異常用戶識別批量停機加固未知風險預防12、目標目前痛點:參數變更頻繁上游模塊參數每天都存在總部和省分變更,量大且對下游影響難以評估充分資料遷轉量大資料變更頻繁,一旦出現問題數據往往是批量問題,存在較大隱患日常停機量大隨著用戶體量增大,正常停機量隨之上升,魚龍混雜容易掩蓋異常停機,識別日益困難信控規則復雜省分個性需求日益復雜,敏感業務通常使用參數、JS規則、配置文件綜合變更才能實現,驗證成本高結合神經網絡技術解決方案生產資料OGG消息智慧信控平臺DMDB實時賬單停機分類統計量級對比計算構成占比計算用戶特征統計多級熔斷規則判斷停機特征計算 用戶行為采集行為向量化行為時序化異常聚類風險行為挖掘批量異常停機熔斷用戶級智能信控監控告警異常數據歸13、檔信控熔斷保護開機基礎數據核心處理異常處置基礎數據以OGG停機分發工單為觸發源,獲取用戶后從DMDB生產資料實時賬單中獲取用戶相關屬性。核心處理1.批量異常停機熔斷從停機單量級、屬性、構成等維度與歷史分析數據相結合判定重大停機風險。2.用戶級智能信控根據業務分析用戶停機前相關性行為數據,通過行為的向量化和時序化通過AI模型識別異常用戶。異常處置根據不同類告警信息進行分級應急處置,異常用戶歸檔供后續分析Hbase神經網絡解決方案(1/2)1.定期分析沉淀的歷史監控數據,結合不同時段、假期、等維度進行時間序列訓練(ARMA/LSTM),預測未來時刻停機量;2.對比5分鐘時間片實時停機量與預測停機量14、的差值波動,匹配熔阻斷規則,對于波動超過閾值的進行告警累計,超過連續3次(個別量小省分可能設定超過3次)進行自動熔阻斷和告警;歷史停機數據預測停機量預測算法實時停機量差異對比匹配熔阻斷規則調用熔斷接口調用告警接口Hbase寬表神經網絡解決方案(2/2)Hbas畫像寬表停機行為向量化服務1.對停機用戶行為排序,形成時間維度的有序序列,采用頻繁集的挖掘算法,提取正常頻繁集,在識別過程中匹配其中是否含有正常頻繁集或異常序列,發現疑似異常停機。2.實時統計構建的停機行為序列組成占比,監控占比波動異常。根據目前采樣,95%停機單由費用觸發,一旦低占比序列發生占比大幅提升狀況則可能存在批量異常停機。數據源15、采集清洗向量化訓練、預測落地、數據分析展示序列模型訓練和預測OGG實時停機序列結果輸出落地序列校驗及占比分析識別到小批量異常停機列規則及閾值行為序列比重展示調用告警保護性開機神經網絡 AI建模實施獲取數據集數據與處理交叉驗證數據劃分模型訓練模型評估模型優化使用LSTM遞歸申請網絡進行學習訓練、參數調優、后的訓練結果,其中藍色為原始數據,黃色為預測數據。23目錄第二部分第五部分第一部分預測模型與收入數據管理AIOps在天宮平臺運維中的應用第三部分神經網絡在計費信控熔斷中的應用人臉識別與計費運維安全管理平臺第四部分自然語言與計費運維人臉識別流程在人臉匹配構建模塊中,兩個模板會進行比較,從而得到一個16、相似度分數,該分數給出了兩者屬于同一個主體的可能性。在人臉表征階段,人臉圖像的像素值會被轉換成緊湊且可判別的特征向量,這也被稱為模板(template)。理想情況下,同一個主體的所有人臉都應該映射到相似的特征向量。人臉檢測器用于尋找圖像中人臉的位置,如果有人臉,就返回包含每張人臉的邊界框的坐標人臉對齊的目標是使用一組位于圖像中固定位置的參考點來縮放和裁剪人臉圖像人臉識別人臉識別 技術清單PythonDlibScipyface_recognition傳統機器學習算法(SVM,KNN)CNN、ResNetface landmark estimation Histogram of Oriented 17、Gradients 實現語言和框架scikit-imagePillowHyperLandmark 算法理論獲取數據集數據與處理交叉驗證數據劃分模型訓練模型評估模型優化處理流程企業、住宅安全和管理電子護照及身份證公安、司法和刑偵自助服務信息安全娛樂應用業界應用場景金融業醫療應用人臉識別在計費運維安全管理的應用目前人臉識別app,是以智云視圖開源的活體檢測方案檢查人像是否合規,以face_recognition作為人臉對比的解決方案,在安全管理平臺的金庫認證中,幫助檢查金庫授權是否合法有效。27目錄第二部分第五部分第一部分預測模型與收入數據管理AIOps在天宮平臺運維中的應用第三部分神經網絡在計費18、信控熔斷中的應用人臉識別與計費運維安全管理平臺第四部分自然語言與計費運維自然語言處理技術清單 HMM Word2vetor CRF Python MITIE Rasa Stack用戶輸入分詞處理特征提取意圖分析對話管理語言生成 NER LSTM 算法理論 Tensorflow duckling chatterbot 實現語言和框架 建模過程自然語言處理的應用 聊天機器人 聊天機器人對理解數字化客服和頻繁咨詢的常規問答領域中的變化至關重要在一些領域中的特定場景中非常有幫助,特別是會被頻繁問到高度可預測的的問題時。自然語言處理在cBSS1.0運維的應用簡介釘釘移動運維微應用中的機器人,使用Chat19、terbot作為自然語言處理工具,Elasticsearch作為知識庫檢索存儲,Rasa Stack作為任務型流程的處理工具,支持文本和語音模式對話。對外提供知識檢索、功能定位、數據查詢、任務執行等功能。基于自然語言處理的釘釘機器人聊天產品總體框架31交互層接口服務層數據采集訓練數據存儲Elasticsearch閑聊語料訓練任務型語料訓練檢索數據采集Mongobd機器人服務內部接口服務RASA StackChatterbotRedisMysql語音識別數據檢索語音轉文本功能定位SpringCloud32目錄第二部分第五部分第一部分預測模型與收入數據管理AIOps在天宮平臺運維中的應用第三部分神20、經網絡在計費信控熔斷中的應用人臉識別與計費運維安全管理平臺第四部分自然語言與計費運維33預測模型理解 人工智能為企業帶來的潛在價值 構建預測分析模型通過一個例子說明預測模型:電子商務業務需要從總倉運送到目的地分倉,并且您已經承諾2天交貨。在他們的分揀設施中都有不同的截止時間。這將需要你的倉庫在15到45分鐘之間來挑選和打包訂單,今晚有超過62的雷暴天氣情況。您是通過空運(快遞)還是通過地面運輸?如果您選擇空運,則會損失所有利潤。如果您選擇地面,您的保證金很好,但可能會很晚,您可能會失去客戶。實現這一決策的唯一方法是每天數千次為您的業務增長預測未來??紤]太多的變量和因素,借助人工智能設計預測分析21、模型。大數據預測分析模型準確分析提升產能34預測模型產能指數級上升35SAP預測分析 全程參與 企業數字化轉型收入構成業務一覽 收入管理系統是銜接B域和M域的生產系統,每月1號-3號,獲取所有涉及B域系統的收入數據,經過業業、業會等處理,并于3日24點前,將轉換后數據送ERP系統,集團公司及各運營公司對外披露均已收入管理系統報送收入數據為準。各收入來源系統主要包含的業務實際在收管落地時間cBSS系統1、賬單、流量結轉、降欠、贈款、降欠回收2、4G公允價值BSS系統集中結算系統ESS系統ECS系統1、cBSS分攤,2日18點2、cBSS報表,2日15點1、賬單、調賬、沉淀收入、積分、會業差異2、22、BSS營業日(月)報、cBSS營業日(月)報1、3日12點前2、12省日報,月報2日-3日1、網間實結;2、網間暫估、全網增值實結、省分增值;3、全網增值暫估;4、攤分14個1、1日前;2、1日-3日;3、3日晚;4、3日12點前1、3G公允價值,存費送機購機送費等1、3日12點前1、積分商城、一卡充銷售折扣等4個1、3日12點前某省分全收入構成VOP系統1、移動轉售業務1、3日12點前手工導入1、合同類收入2、非合同類收入1、當月26日12點前2、3日12點前其他系統1、集中渠道、新零售、權益中心等1、3日12點前業務特點和問題 業務特點:1、cBSS和BSS收入占大頭2、對接系統接口多,業23、務種類復雜,數據源約2500多個3、各類業務提供時間分散,不確定性因素較多 存在問題:1、木桶效應,等最晚的2、系統關賬前總存在變數3、不夠快、時效性不夠,無法盡早掌握收入情況37系統+業務以系統來源和業務組成兩個方面,重點預測各系統收入組成及月度收入情況,結合重點業務的預測實際+預測具備實際數據前以模型預測為準,正式實際數據+預測數據相結合省分試點業務參與建議選取試點省分,出賬綠色通道,同時積極協調業務部門參與確認預測+快報參照廣東模式,分5次預測,出賬前1次,出賬1號開始后,直到收管關賬集中+省分以預測集中系統(如cBSS、結算)的收入為主,省分系統以省分為主收入預測設計原則收入預測方案(24、1/3)基礎數據獲取編編號號字段字段字段名字段名類型類型備注備注1ACCT_CYCLE賬期int2SYSTEM_ID系統編號intCbss/Bss/3SOURCE_TYPE數據類型varcharSF01/JQ4DATASOURCE_CODE數據源bigint512121001/-1/5PROVINCE_ID省分編碼Int6AREA_CODE地市編碼Int7ACCOUNT_ITEM_CODE會計科目Varchar8Professional專業int9DB_TYPE數據庫標識int1正式 2測試10AMOUNT總額decimalFee_type對應金額11NET_AMOUNT凈額decimal凈額25、12TAX_AMOUNT稅額decimal稅額13Fee_type金額標識位tinyint詳情見附錄4.1基于收入管理系統中的詳細收入數據或綜合報表,統計出歷史每個月賬期的各業務的收入基礎數據;主要字段包括賬期、省公司編碼、地市編碼、數據源、專業、數據庫類型(生產、測試)、總額、凈額、稅額等,建立各業務收入時間序列。39收入預測方案(2/3)總部:系統提供+模型預測省分:省分提供+模型預測cBSS系統固寬及4G賬單調賬,降欠及贈款流量不清零、沃云多云財稅差異4G公允價值數據結算系統網間結算、專業間結算、增值結算集中結算系統其他攤分JQ業務14/25項JQ38/JQ39/JQ78/JQ87(EC26、S)、JQ47(VOP)、JQ25(手工)、JQ21(北分)ESS/渠道/新零售3G公允價值數據(ESS)集中渠道包銷折扣(11省)新零售(1?。〣SS出賬固寬23G賬單調賬(扣降欠)、贈款銷賬流量不清零大數據、物聯網、ICT、廣告等BSS營業一次性費用、終端銷售、退費等12省營業日報、19省營業月報cBSS營業、BSS營業手工業務合同類收入、非合同類收入沉淀收入、會業差異、電子券贈送、積分代辦、出租、建安服務、系統外調整賬前:多角度全收入預測賬中:實時快報監控波動賬后:展示全景收入視圖40賬中實時快報賬前多角度收入預測 基于時間序列的快速預測(每月26日):基于近三年的歷史出賬收入情況,建立27、ARIMA趨勢預測模型。(適用系統:cBSS系統、BSS系統、結算系統以及ESS系統的收入數據等)基于實時出賬的準確預測(每月30日/31日):基于近一年各業務預出賬收入情況,和預出賬天數,預估當月日均收入和預測天數,實現出賬收入的準確預測方法=預出賬收入+日均收入*預測天數。(適用業務:cBSS賬單、調賬、流量結轉、省際結算收入等)基于降欠資料的收入預測(次月2日):基于本月分攤側的降欠資料和CB降欠業務相關的用戶和金額(賬單、調賬、銷賬、抵扣),分析三者之間的相關性,建立基于降欠用戶數的回歸預測模型。收入預測方案(3/3)賬后全景視圖 快報展示各系統、各業務維度的計收收入情況。展示預測值、28、快報值與實際計收收入的偏移情況,分析收入波動原因等。從1號-3號,根據省分出賬監控實時同步實際收入數據,實現快報的實時更新。手工填報:省分可以自主選擇填報業務收入,優先級低于實際收入,高于預測收入。次月3日以后41依托歷史數據與預出賬數據,整合協調各收入來源系統,建立準確的收入預測模型;為出賬提速、出賬快報提供有效支持,提前預知各省分全收入情況,為省分公司決策提供支持;提前預知各系統尤其是各集中系統收入情況,與實際值比較,及時分析差異原因,確保各系統收入數據正常波動;實現賬前賬中賬后的全流程預測建模,將時間序列模型、預出賬模型、降欠資料模型的預測結果落地,供收入管理運維平臺的全收入視圖、收入快報等應用的展示。建立健全收入與相關成本預測與應用機制收入預測目標和成效界面展示:全收入視圖全收入視圖用于全國31省的賬中出賬進度監控、賬后業務收入波動分析、收入統計與預測對比分析等功能。界面展示:全收入視圖省分詳情頁:展示出賬進度、出賬時長、預計收入和已歸集收入情況等界面展示:全收入視圖更多詳情頁:主要展示各對接系統及所含業務的收入和波動情況。界面展示:收入快報 快報展示各系統、各業務維度的計收收入情況。采用優先級規則:實際數據填報數據預測數據。賬中實時快報:從1號-3號,根據省分出賬監控實時同步實際收入數據,實現快報的實時更新。CHINAUNICOM歡迎各位加入軟研院!