通信公司互聯網維護CMNET網擁塞處理管理規定23頁.doc
下載文檔
上傳人:職z****i
編號:1131636
2024-09-08
23頁
1.27MB
1、通信公司互聯網維護CMNET網擁塞處理管理規定編 制: 審 核: 批 準: 版 本 號: ESZAQDGF001 編 制: 審 核: 批 準: 版 本 號: 目 錄第一章概述3第二章維護組織4第一節 維護組織機構與職責4第二節 CMNET境內網絡與境外網絡的界面劃分6第三節 與其他系統的界面劃分7第三章系統的日常維護和管理8第四章故障處理10第五章 用戶投訴處理12第六章 CMNET網絡擁塞處理13第七章 質量管理15附錄一 CMNET骨干網故障處理流程16附錄二 CMNET省網和城域網故障處理流程17附錄三 互聯網業務投訴處理流程18附錄四 各省CMNET用戶國際業務的投訴處理流程19附錄六2、 CMNET網絡擁塞監控及擁塞緩解分級處理流程21編 制 歷 史22第一章概述第一條 互聯網(即CMNET)是一個全國性的、以寬帶互聯網技術為核心的,可同時提供話音、傳真、數據、多媒體等高品質電信服務的電信數據基礎網絡,由境外網絡、全國骨干網、省網、城域網組成。第二條 互聯網的骨干網(以下簡稱CMNET骨干網),側重提供跨省業務調度、全網性業務接入和國內外運營商的互聯互通,設備包括骨干核心層路由器、骨干接入層路由器、骨干交換機、國內國際出口路由器、骨干DNS、RADIUS系統等。境外網絡主要指設置在海外的POP點,提供互聯網與國外運營商的互聯業務,設備包括設置在海外的路由器和交換機。互聯網省網3、(以下簡稱CMNET省網)是CMNET骨干網的延伸,側重提供省內業務調度、CMNET骨干網流量疏通和省內運營商直連,設備包括省內骨干路由器、省內運營商直連路由器、省內骨干DNS、省內骨干網交換機、省內接入層路由器、省內接入層交換機等。互聯網城域網(以下簡稱CMNET城域網)是CMNET省網的延伸,側重提供業務的接入和收斂,設備包括城域內核心路由器、城域內業務接入路由器、城域網內寬帶接入服務器、城域內匯聚交換機等。對于直轄市,CMNET省網與CMNET城域網采取融合方式。第三條 為了規范互聯網的維護管理,合理、可靠、安全、高效地組織、管理互聯網,提高互聯網的通信服務質量,提高維護隊伍整體素質和水4、平,特制定本管理規定,作為組織、管理互聯網的依據。第四條 本管理規定適用于境外網絡、全國范圍內構成CMNET骨干網、CMNET省網、CMNET城域網的路由器、交換機、DNS服務器、RADIUS系統等。構成CMNET的傳輸鏈路按照光傳輸網維護管理規定組織維護。第五條 本管理規定按照網絡運行維護規程框架編制,未詳盡描述部分參照網絡運行維護規程執行。第六條 各級維護管理部門應認真執行本規定。國際公司和各省公司在本規定的基礎上,結合本地實際情況,編制實施細則,以確保互聯網安全、可靠、高效地運行。第七條 本辦法的解釋和修改權屬于通信有限公司網絡部。第二章維護組織第一節 維護組織機構與職責第八條 互聯網的5、維護管理采用統一領導、分級管理、分級負責的原則,在總部的統一領導下,總部及各省公司負責管轄范圍內互聯網的維護管理工作。第九條 總部網絡部主要職責為:1. 負責組織制定互聯網的維護管理規定,監督各省落實維護規定的情況,對各省的維護工作給予指導。2. 負責制定互聯網質量考核指標和考核辦法,定期檢查和分析互聯網的運行質量,組織考核評比。3. 負責互聯網重大故障和重大安全事件的管理,為省公司故障和安全事件提供技術支持。4. 負責為互聯網的設備維護、優化和故障處理提供技術支援。5. 負責國內外運營商的互聯網網間互聯工作。6. 負責制定互聯網網絡組織、路由原則、局數據原則和全網性大客戶BGP接入、跨省VP6、N等業務的網絡實施方案,并組織實施。7. 負責互聯網設備、軟件版本、局數據、資源管理等工作。8. 組織制定互聯網的應急通信保障方案,具體負責CMNET骨干網的應急演練,指導各省公司制定CMNET省網的應急方案。9. 分析互聯網的運行情況,指導互聯網的優化調整工作。10. 實施CMNET骨干網(包括設置在南方基地的骨干網設備)的維護和優化工作,負責724小時實時監控CMNET骨干網設備的運行狀況,負責故障處理、資源調度、網絡預警、質量控制、軟件裝載、局數據制作等工作,并落實相關安全要求。11. 組織實施CMNET骨干網(包括設置在南方基地的骨干網設備)工程建設期間的工程隨工及驗收測試工作。12.7、 牽頭組織各級維護人員的技術、業務交流與培訓。13. 負責非法網站的核查、封堵、解封及將封堵/解封數據下發給省公司。14. 負責根據業務需要接收省公司BGP接入客戶的路由并通過CMNET骨干網發往整個互聯網。15. 負責定期向省公司通告CMNET骨干網網絡運行情況,負責CMNET骨干網新技術或新系統應用的推介。16. 指導國際公司做好境外網絡維護工作,配合國際公司完成網絡調整。17. 協助省公司處理通過CMNET骨干網互聯到其他運營商間及其他運營商內部的互聯互通投訴處理。18. 負責CMNET骨干網的日常運行和投訴分析。19. 負責CMNET骨干網的擁塞問題分析與解決。第十條 國際公司的主要職8、責為:1. 貫徹總部網絡部互聯網維護管理規定,根據境外網絡情況制定切實可行的維護管理實施細則。2. 實施境外網絡的維護和優化工作,負責724小時實時監控境外網絡設備的運行狀況,負責故障處理、資源調度、網絡預警、質量控制、軟件裝載、局數據制作、資產管理、設備維護等工作,并落實相關安全要求。3. 負責CMNET境外網絡進行運行分析,并定期向總部網絡部通告。4. 負責國外運營商的互聯網網間互聯工作。5. 組織實施CMNET境外網絡的工程隨工及驗收測試工作。第十一條 南方基地的職責1. 負責做好設置在南方基地的CMNET骨干網設備的現場維護工作,并配合完成骨干網設備的故障處理。2. 配合總部網絡部做好9、設置在南方基地的CMNET骨干網設備的工程隨工及驗收測試工作。第十二條 各省公司網絡維護部門主要職責為:1. 貫徹總部網絡部互聯網維護管理規定,根據本省情況制定切實可行的維護管理實施細則。2. 負責落實總部網絡部互聯網運行質量考核指標和考核辦法,建立質量分析制度和質量監督體系。3. 負責CMNET省網的安全工作。組織制定CMNET省網應急通信保障方案并定期演練,指導各地市制定CMNET城域網的應急方案。4. 在總部的指導下,負責省內運營商直連的互聯網網間互聯工作。5. 負責制定CMNET省網網絡結構、路由原則,負責審核省內業務系統接入CMNET省網的網絡結構、路由原則,指導各地市制定省內大客戶10、BGP接入、集團客戶、家庭客戶及個人用戶互聯網接入等業務的網絡實施方案。6. 在總部的指導下,負責做好CMNET省網和城域網的設備、軟件版本、局數據、資源管理等工作。7. 定期分析CMNET省網和城域網的運行狀況,做好網絡預警工作,制定并實施相應的改造、優化措施。8. 負責724小時實時監控CMNET省網和城域網網絡運行狀況,負責CMNET省網設備的日常維護、故障處理、資源調度、軟件裝載、局數據制作等工作,對于城域網設備問題派單給地市公司。重大故障需向總部網絡部報告,并組織解決CMNET省網和城域網運行維護中的問題。9. CMNET骨干網設備所在省公司配合總部網絡部做好CMNET骨干網設備的現11、場維護工作。10. 組織實施CMNET省網和城域網工程建設期間的工程隨工和驗收測試工作。11. 定期組織本省維護技術人員的交流和培訓工作。12. 負責按照總部下發的數據對非法網站進行封堵、解封及數據上報。13. 負責根據省公司BGP接入業務需要向CMNET骨干網發布BGP接入客戶的路由。14. 負責定期通報CMNET省網網絡運行情況。15. 負責處理地市公司提交的CMNET跨域投訴。16. 負責CMNET省網和城域網的日常運行和投訴分析。17. 負責CMNET省網和城域網的擁塞問題分析與解決。第十三條 地市公司網絡維護部門主要職責:1. 貫徹省公司互聯網維護管理實施細則,根據本地情況制定可行的12、維護作業計劃。2. 落實省公司互聯網運行質量考核指標和考核辦法,建立質量分析制度和質量監督體系。3. 負責所有屬地CMNET骨干網和省網設備現場維護,并配合完成骨干網和省網設備的故障處理。4. 配合省公司進行CMNET省網應急通信保障預案的演練與實施。按照省公司要求制定CMNET城域網應急通信保障方案并定期演練。5. 在省公司的指導下,負責CMNET城域網設備的日常維護、故障處理、投訴處理、資源調度、軟件裝載、局數據制作等工作。6. 負責定期分析本地CMNET城域網設備和網絡運行狀況,做好網絡預警工作,制定并實施相應的改造、優化措施,并按照要求及時提交省公司審核。7. 負責本地用戶端、應用端設13、備的配合、調測、開通工作,負責本地電路的調測、開通工作。8. 做好省公司交辦的其他任務。第二節 CMNET境內網絡與境外網絡的界面劃分第十四條 以CMNET國際出口路由器與POP點路由器之間的鏈路為分工界面,AS9808設備及網絡(境內網絡)由總部網絡部負責維護,AS58453設備及網絡(境外網絡)由國際公司負責維護。AS域之間的自建鏈路及國內租用鏈路由總部網絡部維護,國際鏈路由國際公司維護。后續擴容、新增設備沿用以上原則。第三節 與其他系統的界面劃分第十五條 CMNET是各項數據業務的承載網絡,CMNET與其上承載的各業務系統維護分工界面是:各業務系統設備(防火墻)至CMNET設備的接口,接14、口內側設備歸屬CMNET,接口外側設備歸屬各業務系統。第十六條 CMNET要積極配合完成與GPRS、彩信、WAP、DSMP、郵箱、短信網關、IMS等有關的網絡調整工作,并配合進行相關測試。第三章系統的日常維護和管理第十七條 互聯網維護工作主要指設備網元和網絡層面的維護,包括系統本身及相關連接設備的定期檢測、數據備份、故障處理等。第十八條 系統維護作業計劃的編制和實施1. 對于CMNET骨干網,總部參照本規定中所規定的維護監測項目、周期和要求, 制定詳細的作業計劃,并將部分作業計劃任務指派給設備所在省公司。總部和設備所在省公司按照分工職責分別執行作業計劃,設備所在省公司根據總部要求定期上報作業計15、劃執行情況和設備檢測結果,在設備檢測中一旦發現異常情況,應立即上報總部。2. 對于境外網絡,國際公司參照本規定中所規定的維護監測項目、周期和要求, 制定詳細的作業計劃并組織實施。3. 對于CMNET省網,省公司參照本規定中所規定的維護監測項目、周期和要求,編制日常維護作業計劃并組織實施和定期檢查。4. 對于CMNET城域網,各地市公司參照本規定及省公司維護管理實施細則編制并實施日常維護作業計劃,并定期將維護作業計劃的實施情況上報省公司。第十九條 互聯網日常維護測試項目應包括以下內容。國際公司和各省公司可根據各自設備的實際情況自行補充,測試周期可根據實際情況制定,但頻度不得低于下表中的規定。對于16、例行維護項目,若網管支撐系統支持自動檢測,則優先采用網管支撐系統的自動檢測功能。類別項目周期備注設備檢查硬件系統檢查日設備資源利用率(CPU、內存、磁盤空間)檢查實時監控DNS、RADIUS系統軟件進程檢查日DNS服務器配置文件完整性檢查周監測實時告警消息實時監控主備倒換測試半年系統各相關設備鏈路檢查鏈路通斷狀態實時監控鏈路利用率實時監控網絡檢查網絡連通性日網絡時延、丟包率檢查日DNS服務器解析成功率檢查日DNS服務器并發請求數(QPS)檢查日DNS服務器解析時延檢查日DNS服務器域名解析可用性檢查日重點域名解析準確性檢查日數據備份應用系統數據及用戶數據備份月DNS系統配置文件備份季DNS系統17、域名解析日志備份季系統數據核查季日志文件備份周文件系統備份半年其他配合集團公司進行設備倒換、安全演練半年IP地址資料的檢查核對季端口資料的檢查核對月軟件版本核對月系統日志和操作日志安全審計月系統和軟件安全補丁安裝半年安全掃描半年現場看護機房電源、空調、溫濕度檢查日備品備件的清理核對季第二十條 DNS設備要接入數據網管系統,并至少提供以下監控指標:1. 設備運行指標:服務器的CPU、內存、主要進程、磁盤空間等,并提供5分鐘粒度的實時指標曲線呈現和告警呈現。2. 業務相關指標:DNS業務解析成功率、并發請求數QPS 和解析時延,并提供5分鐘粒度的實時指標曲線呈現和告警呈現。3. 至少保存三個月的上18、述監控記錄數據。4. DNS重點域名解析統計報表(5分鐘粒度): DNS系統指標上報最大時延為30分鐘。第二十一條 針對DNS系統可能發生的DDoS攻擊、權威解析篡改、緩存投毒等安全事件,編寫落實到具體設備、具體指令、具體人員的應急預案,并明確預案觸發條件、聯系方式、知曉范圍等內容。組織應急演練,完善安全事件的聯動處理流程。第二十二條 DNS系統設備要支持完備的日志管理功能。支持SYSLOG功能,支持日志的本地保存和遠程保存。本地日志要保存在非易失性的介質上,系統重啟或宕機時日志數據不會消失。設備輸出的日志要包括系統日志、解析日志和操作日志三部分。系統日志要包括系統硬件、軟件運行狀態。解析日志19、信息中要至少包括用戶源地址、請求域名、請求接受時間和處理時延、域名解析結果IP、解析結果代碼等。操作日志要記錄對DNS的所有操作情況(至少記錄到文件級別)。要求三類日志應存儲至少三個月,每月對系統日志和操作日志進行安全審計。第二十三條 DNS軟件要具備支持標準DNSSEC協議的功能,具備根據未來總部要求快速啟用的能力。第二十四條 設備的維護登錄賬號應納入AAA系統,AAA系統日志至少保留6個月。第四章故障處理第二十五條 故障處理中的職責劃分1. 對于CMNET骨干網,總部負責故障處理及指揮調度,對于需要設備所在省和南方基地進行處理的故障,通過工單方式通知設備所在省和南方基地。設備所在省和南方基20、地負責配合總部進行故障處理或根據總部的工單要求進行相關故障處理。各省公司和南方基地若發現全國CMNET骨干網設備故障,應立即上報總部協調處理。2. 對于境外網絡,國際公司負責故障處理,必要時可商總部網絡部進行配合。3. 對于CMNET省網,由各省公司負責組織故障處理,必要時可商總部網絡部和其他省公司進行配合。4. 對于CMNET城域網,各地市公司接收省公司的故障工單,負責故障的處理工作。第二十六條 故障分類:1. 業務故障:由于CMNET設備不能正常運行、局數據設置錯誤、互聯互通故障、人為差錯等各種原因,造成CMNET相關業務質量下降甚至中斷。2. 設備故障:CMNET的主備用設備由于各種原因21、不能正常運行,對業務正常的運行造成隱患,但尚未影響業務。3. 在業務故障和設備故障同時出現的情況下,定義為業務故障。第二十七條 故障級別分為重大故障、嚴重故障和一般故障三類。第二十八條 互聯網重大故障1. 以下情況發生任意一種即為重大故障:1) 骨干DNS系統單套節點所有主機或四層交換機發生故障造成本節點不能承載業務,設備故障歷時超過60分鐘。2) 由于各種原因,造成CMNET骨干核心層節點雙節點發生故障退出服務,且設備故障歷時超過30分鐘。3) 由于各種原因,造成CMNET RR雙節點發生故障退出服務,且設備故障歷時超過30分鐘。4) 由于各種原因,造成CMNET骨干接入層節點雙節點發生故障22、退出服務,且設備故障歷時超過60分鐘。5) 由于各種原因,造成國內/國際出口路由器三節點發生故障同時退出服務,且設備故障歷時超過30分鐘。6) 由于各種原因,造成CMNET省網核心雙節點(多核心的省份為CMNET省網所有核心節點)發生故障退出服務,且設備故障歷時超過30分鐘。7) 由于各種原因,造成CMNET省網地市雙節點發生故障退出服務,且設備故障歷時超過60分鐘。8) 由于各種原因,造成全國CMNET去往電信/聯通/國際方向業務中斷,且中斷時間超過30分鐘。2. 上報要求:重大故障一經確認,應立即上報,上報到總部不得超過60分鐘。3. 故障通報:若重大故障涉及省際、國際業務,總部網絡部應通23、報業務受影響的省。第二十九條 互聯網嚴重故障2. 以下情況發生任意一種即為嚴重故障1) 由于各種原因,造成CMNET骨干核心層節點雙節點、CMNET RR雙節點、國內/國際出口路由器三節點、CMNET省網核心雙節點(多核心的省份為CMNET省網所有核心節點)發生故障退出服務,且設備故障歷時不超過30分鐘;2) 由于各種原因,造成全國CMNET去往電信/聯通/國際方向業務中斷,且中斷時間不超過30分鐘;3) 骨干DNS系統單套節點所有主機或四層交換機發生故障造成本節點不能承載業務,設備故障歷時不超過60分鐘;4) 由于各種原因,造成CMNET骨干接入層節點雙節點發生故障退出服務,且設備故障歷時不24、超過60分鐘;5) 由于各種原因,造成CMNET省網地市雙節點發生故障退出服務,且設備故障歷時不超過60分鐘。6) DNS系統發生授權域名篡改、緩存中毒、DDoS攻擊等安全事件影響DNS系統提供正常的域名服務,歷時超過60分鐘。7) 系統的冗余設備發生故障不能正常運行,尚未影響業務,但對業務正常的運行造成嚴重隱患,且設備故障歷時超過120分鐘。3. 除上述情況外,省公司可以根據實際情況對嚴重故障進行補充。第三十條 互聯網一般故障:除重大故障和嚴重故障外的其他故障為一般故障。第三十一條 故障處理流程見附錄一和附錄二。涉及網間問題,請參照互聯網網間投訴和障礙處理辦法處理。第五章 用戶投訴處理第三十25、二條 客服部門接到用戶申告,經過預處理后無法解決且判斷為網絡問題的通過工單方式派單給各省網絡維護部門。第三十三條 各省公司網絡維護部門接到用戶投訴后,牽頭處理、協調落實解決。如涉及省際投訴通過工單方式派單給相關省公司網絡維護部門,如需總部協調的通過工單方式派單給總部網絡部,如涉及國際業務通過工單方式派單給國際公司。各省網絡維護部門在處理完畢后,將處理結果反饋給派單部門,以形成閉環。第三十四條 國際公司受理國際運營商或中轉商的投訴,進行預處理,如需總部網絡部或省公司配合,可通過工單形式派單給總部網絡部或相關省公司。總部網絡部或相關省公司處理完畢后,將處理結果反饋國際公司。第三十五條 互聯網業務投26、訴流程參見附錄三、附錄四、附錄五。第六章 CMNET網絡擁塞處理第三十六條 為保障CMNET骨干網鏈路擁塞早發現,早處理,各省公司應當具備擁塞提前發現、提前預警機制。集團公司負責骨干核心層節點(BB)、骨干接入層節點(BC)等CMNET骨干設備間鏈路的擁塞分析、預測和處理,各省公司負責本省CMNET鏈路的擁塞分析、預測和處理,并按集團公司要求做好配合工作。第三十七條 各省公司對忙時利用率超過50%鏈路重點關注并手工核實利用率,可通過數據網管查詢利用率報表,也可通過集團管控平臺登錄骨干設備手工產看端口流量。第三十八條 各省公司對結合出省局向對業務增長進行預測,如判斷3個月內骨干疏導能力不足,應當27、及時上報總部,提高處理問題的時效性。第三十九條 根據紅橙黃藍綠分級處理原則,當鏈路發生擁塞時要根據鏈路利用率進行分級處理,具體處理原則如下:1. 當鏈路利用率60%時,各省需定期分析鏈路流量,根據未來業務發展預估鏈路擁塞情況,做好提前預警;2. 當60%鏈路利用率70%時,各省重點關注并分析歷史流量發展趨勢,并安排每日手工核實鏈路流量。3. 當70%鏈路利用率80%時, 各省配合總部向計劃建設部提鏈路緊急擴容需求,要求工程優先實施;分析流量組成及流向,推動內容與網絡協同,對熱點內容進行下沉。4. 當80%鏈路利用率90%時,已影響業務的鏈路:具備流量繞遠優化條件,各省配合總部實施TE優化方案,28、使部分流量繞遠通過空閑局向進行疏導;若無,省公司采取限流措施限制低價值流量上骨干網。第四十條 CMNET骨干網節點間流量遵循如下疏通原則:1. 核心節點間流量:任何情況下都從核心節點間鏈路疏通;2. 次核心節點到接入節點間流量:優選通過接入節點到次核心節點間鏈路疏通;再選通過核心節點間鏈路疏通;3. 接入節點間流量:優選通過接入節點間鏈路疏通;再選通過核心節點間鏈路疏通。第四十一條 流量調整可以通過BGP、部署流量工程兩種方法調整。1. BGP調整:省內通過BGP調整路由屬性,以控制每臺骨干設備所有鏈路的出/入方向流量,例如在某省1平面流量總體大于2平面流量,則可以通過BGP調整的方式降低1平29、面流量;2. 部署流量工程:將原本較近的省間流量通過人工靜態指定路徑,繞路到其他節點以降低原有鏈路的利用率。此方法對比IGP Metric調整,可以預知繞路流量大小、穿越路徑以及影響到的節點,在原有利用率降低后可隨時撤除。第四十二條 CMNET網絡擁塞監控及擁塞緩解分級處理流程參見附錄六。第七章 質量管理 第四十三條 為完善對互聯網各個環節的質量控制,應建立各級檢查體系。做到統一領導,分級管理,分工負責,層層到位,把好質量關。第四十四條 總部網絡部負責組織建立互聯網的質量分析制度。1. 對于CMNET骨干網及國內運營商間的互聯鏈路,總部網絡部負責定期匯總運行質量、網絡性能等指標,進行數據網運行30、質量分析,排除質量隱患,不斷提高網絡運行質量和服務質量。2. 對于境外網絡,國際公司負責境外網絡與國際其他運營商間的互聯鏈路質量進行管理。3. 對于CMNET省網和城域網,省公司負責組織匯總整理運行質量、網絡性能等指標,進行質量分析,并將運行質量情況定期上報總部網絡部。第四十五條 互聯網網絡運行質量主要指標1. CPU平均和峰值利用率;2. 內存平均和峰值利用率;3. 網內主要節點間時延和丟包率;4. 網內主要節點至國際出口路由器時延和丟包率;5. 網絡互聯鏈路平均和峰值帶寬利用率;6. DNS業務解析成功率;7. DNS業務并發請求數(QPS);8. DNS業務解析時延;第四十六條 對各項運行維護指標的考核評定以運行維護考評體系的規定為準。附錄一 CMNET骨干網故障處理流程 附錄二 CMNET省網和城域網故障處理流程附錄三 互聯網業務投訴處理流程附錄四 各省CMNET用戶國際業務的投訴處理流程附錄五 國際運營商及客戶的投訴處理流程附錄六 CMNET網絡擁塞監控及擁塞緩解分級處理流程