網絡項目割接方案V1.8(24頁).doc
下載文檔
上傳人:正***
編號:876768
2024-01-08
22頁
908.50KB
1、中煙集團數據中心網絡項目割接方案華為技術服務有限公司Huawei Technologies Co., Ltd.2017年6月文檔名稱中煙集團數據中心網絡項目設備割接方案文檔類別技術文檔 工程文檔 培訓文檔 運維文檔 項目文檔 服務文檔 其他 當前版本1.1創建日期2017.6.7文檔主送部門中煙集團數據中心文檔作者聯系方式修訂記錄修改記錄日期修改人審閱人摘要V1.02017.6.1 建立文檔V1.12017.6.8 建立文檔 目 錄第一章割接說明41.1 總體說明41.2 人員安排41.3 物料備件準備51.4 組網結構61.4.1 割接前組網結構61.4.2 割接后組網結構6第二章 割接規劃2、92.1 設備端口規劃92.2 設備標簽以及描述9第三章 割接步驟113.1 離線測試113.2 運行情況信息收集113.3 備份數據113.4 割接動作11第四章 測試驗證134.1 測試驗證內容134.1.1 設備狀態檢查13第五章 回退機制145.1 故障判斷145.2 緊急回退14第六章 風險評估156.1 風險評估15第七章 守局方案151、守局目的:152、職守方式153、管理制度154、守局值班安排16第八章 配置模板17第一章割接說明1.1 總體說明建設單位集團施工單位華為技術有限公司、北京銀信長遠科技股份有限公司割接局點中煙集團數據中心網絡和營銷中心涉及設備及版本號CE1283、04 V200R001USG6600 V500R001CE6851 V200R001割接及測試時間段2017-6-17 08:00至2017-6-18 13:00回退時間段13:00-21:00升級/割接簡述:本次設備替換為,我司的CE12804替換現網的Cisco Catalyst 6509設備,USG6600替換現網的juniper設備。對原有硬件設備進行替換,涉及業務改變,原來的OTV將采用VXALN技術替代,其它配置原則上采用原有配置,接口地址有部分改變,由于設備軟件版本不同命令會有變化,不對網絡結構以及流量走向做改變。升級/割接影響: 此次操作將會影中斷網絡約2天。1.2 人員安排客4、戶配合人員:小組編號割接人員單位聯系電話123華為公司人員:小組編號割接人員施工單位聯系電話1234北京銀信人員:小組編號割接人員施工單位聯系電話1234其它人員:小組編號割接人員施工單位聯系電話12245678后端保障人員小組編號保障人員施工單位聯系電話1231.3 物料備件準備物料名稱數量提供方備注(物料Bom編碼)光纖跳線若干條客戶需要根據現場機房情況確定(單模/多模/長度/接口類型)光功率計1客戶/集成商備用光模塊 10客戶使用本期采購未使用模塊備用網線若干客戶/集成商原有網線長度不夠或失效情況下使用線纜標簽 若干集成商1.4 組網結構1.4.1 割接前組網結構 原中煙數據中心和營銷中5、心現有核心交換機Cisco Catalyst 6509和廣域網路由器Cisco 7606已運行多年,系統容量不足、故障率升高。組網如下圖:1.4.2 割接后組網結構核心區兩臺CE12804(數據中心級交換機)橫向堆疊成一臺設備,然后虛擬成兩臺VS,數據中心VS與園區網VS與數據中心中間通過兩臺USG6650互聯,中間USG6650防火墻進行安全控制,USG6650防火墻雙機熱備;數據中心VS設備通過波分鏈路與CE6851對接,實現VXLAN的分步式網關。園區網部署一個VS作為匯聚交換機,與互聯網USG6650互聯,提供安全控制。割接后組網圖如下:1、數據中心組網圖:VXLAN設計圖:第二章 割6、接規劃VLAN,策略等沿用原有數據不做新規劃,IP設備端口互聯用原有互聯地址,根據網絡拓撲做部分規劃,具體見附件:中煙集團數據中心網絡和營銷中心網絡項目LLD1.3。2.1 設備端口規劃具體接口連接根據中煙集團數據中心網絡和營銷中心網絡項目LLD1.3,現場配置再做具體調整;2.2 設備標簽以及描述設備標簽根據現有條件制定例如:安裝位置:設備編碼:管理地址:xxxx xxxxxxxxx 設備用途:XXX機房線纜標簽模板:集團集團Fr:設備名稱 接口To:設備名稱 接口例如:集團集團Fr: HW_CE12804 X1/,具708況設計連線609999999999999999999999999997、999999999999999999999999999999999999999999999999999999999999999999999999999999999999999990/1/0To: 6F_HW_USG6650 2/0/0第三章 割接步驟3.1 離線測試在割接前對可預料的風險進行了離線測試,在割接前做好了充足準備規避相關風險,在未通過以下測試情況下不進行割接:1, 驗證Cisco 4506千兆光口與CE12800千兆光口對接是否成功。2, CE12800設備多模萬兆單板千兆模塊與USG6650 多模千兆光口對接是否成功。3, 驗證萬兆模塊在千兆多模/多模鏈路運行情況。4, 接口地址8、對應是否正確。5, 板卡熱插拔,電源模塊熱插拔。6, VXLAN分步式網關測試,倒換測試,檢查測試是否正常。7, Cisco 4506生成樹協議與華為生成樹協議對接。3.2 運行情況信息收集1,收集現網C6509 C4506 juniper C7606 ASA5580配置2,接口狀態3,ARP表,MAC表,路由表3.3 備份數據保存現網設備配置至計算機。3.4 割接人員分組及安排由于割接工作跨越了兩個機房,需要安排兩組人員在兩個機房實施,3.5 割接動作序號時間實施內容操作步驟預期結果、檢查方法人員安排1割接前一周割接前準備工作1、設備安裝、調試。2、線路鋪設,完成本部與卷煙廠機房的線路布放,9、并且在割接前一周確認需要布放的線纜無誤。1.1割接前一周光纖跳線鋪設,線纜做好標簽,設備腳本導入加電待命。1、檢查設備配置,確認配置無誤。2、將需要替換的光纖跳線鋪設至相應機柜,割接線纜做好標簽。細化網線和尾纖的標記方法:網線在配線架側均做好標簽,光纖在主機側做好標簽且要與需要割接的光纖的綁在一起,方便萬一回滾。1.2割接前一周CE12804、CE6851、防火墻、各接入交換機聯通,設備狀態正常1、設備安裝,線路連接。需要在割接確認完全無任何問題,例如OSPF,BGP等。2、波分設備安裝配置完成,且完成與卷煙廠機房對接完成。3、光纖交換機需放線至新的OSN1800(待完成)EMC人員負責成功/10、PING通對端設備,OSPF、BGP鄰居關系正常。(華為)208:00-09:30Vxlan割接完成,集成商、華為、數據庫/主機人員2.108:00-08:10C6509,N7000互聯端口shutdown,不下電。將C6509,N7000互聯端口shutdown。2.208:10-08:30CE6851、N5548對接,N5000二層、生成樹數據配置更改。完成CE6851、N5548線路對接,將新布線接至N5000,生成樹狀態檢測2.308:30-09:00Vxlan調通后,安排一組ORACLE RAC/DB2群集,首先聯機進行測試,測試內容包括系統狀態和切換措施,確認RAC及群集可正常工作11、(在此之后需把網口速率升成10GE)Oracle RAC、 HA環境接入1、 Vxlan聯通后,將網口連至新裝交換機,oracle工程師確認RAC集群狀態及業務是否正常 。2、 確認業務正常后,需要把IBM P750網口速率升成10GE2.409:00-09:30ORACLE RAC/DB2群集業務觀察,測試結果確認Oracle RAC、 HA環境測試。2.5視情況處理問題,時間不超過2小時如第2.4步測試業務不正常,進行問題排查。對數據進行對比,路由、MAC、ARP表項查看。2.6如不能排除,將進行回退,后面步驟不再執行建議在配置更改時不做保存,等業務正常后保存,便于回退2.7回退測試2.812、割接終止39:30-11:30服務器遷移 部分服務器把網卡升至10GE1、部分服務器把網卡升至10GE,需廠家和集成商完成配置,更換光模塊,修改服務器配置。3.19:30-10:30線纜遷移,服務器接入。1、 數據中心,服務器接至接入交換機上。PC-SERVER在配線架側依次跳線。2、 小型機需要主機側完成換線操作,有些小型機運行雙機業務,需維保廠家在完成換線操作后確認主機狀態。3.29:30-11:00業務觀察,測試結果確認檢查各項業務的運行情況。3.3視情況處理問題,時間為1小時如第3.2步中ERP、SEM或有超過30臺服務器測試業務不正常,進行問題排查。對數據進行對比,路由、MAC、AR13、P表項查看。3.4如不能排除,將進行回退,后面步驟不再執行建議在配置更改時不做保存,等業務正常后保存,便于回退3.5回退測試3.6割接終止410:00-12:00互聯網割接完成(深信服, 集成商、華為)10:00-10:30互聯網設備線路連接完成USG6650、AD4000、 Cisco 3560連線與配置成功/PING通對端設備,OSPF、鄰居關系正常。(深信服, 集成商、華為)10:30-11:00AD4000配置將原有ISG1000的PAT/NAT配置轉移到AD4000(周末做好配置,不啟用)深信服11:00-12:00互聯網業務測試(各業務測試人員)3.4如互聯網業務測試不通過,預計在14、1個小時內不能排除,將進行互聯網割接項目的單獨回退建議在配置更改時不做保存,等業務正常后保存,便于回退成功/PING通對端設備,OSPF、BGP鄰居關系正常。(華為、集成商)3.5回退測試回退后,業務檢查(各業務測試人員)512:30-14:00廣域網割接5.112:30-13:00進行廣域網USG6650,廣域網設備的割接。將新布線接至CE12804,Cisco 7606成功/PING通對端設備,OSPF、鄰居關系正常。(C7606)人員安排、華為)5.213:00-13:30網絡測試測試廣域網鏈路,檢查鄰居關系和鏈路。華為、集成商、各卷煙廠網絡管理人員5.313:00-14:00業務測試檢15、查各項業務的運行情況。(各業務測試人員)5.4視情況處理問題,時間為1小時如第12步測試業務不正常,進行問題排查。對數據進行對比,路由、MAC、ARP表項查看。是否能解決5.5如不能排除,將進行回退,后面步驟不在執行建議在配置更改時不做做存,等業務正常后保存,便于回退回退后,業務檢查(各業務測試人員)614:00-園區網割接6.114:00-14:30園區網設備聯線與配置樓層接入交換機、CE12804、無線控制器聯線華為、集成商6.214:30-15:00園區網網絡測試測試WLAN業務正常上網,出口業務訪問與園區網與數據中心的互訪聯網訪問園區網與數據中心華為、集成商、客戶安排人員測試6.31516、:00-16:00園區網業務測試檢查各項業務的運行情況。成功(各測試人員)6.4視情況處理問題,時間為1小時對數據進行對比,路由、MAC、ARP表項查看。是否能解決6.5建議在配置更改時不做做存,等業務正常后保存,便于回退回退后,業務檢查(各業務測試人員)716:00-17:00對各業務觀察,再次確認業務是否正常所有測試結果用表格形勢反饋割接完成割接時間窗為2017-6-17 08:00到2017-06-18 17:00,保留序號1-7進行,具體時間根據現場情況作調整。其中分別為VxLan、服務器、互聯網、廣域網、園區網各保留2小時、1小時、1小時、1小時、1小時排故時間,總計保留6個小時的排17、故時間,因此,本次實施原則上斷網時間為D日上午8點至D+1日1點,D+1日1點至17:00為意外應急時間。第四章 測試驗證4.1 測試驗證內容目前了解的有數據業務,廣域網接入業務等。序號測試項目操作及預期備注1互聯網業務互聯網正常訪問各大網站,收發郵件,登陸各業務系統辦公,測試WLAN業務正常上網,出口業務訪問與園區網與數據中心的互訪 2數據業務數據中心VXLAN正常訪問,斷開主鏈路后,VXLAN業務是否正常切換開會時選擇3-4個應用3廣域網接入業務PING通對端網關IP。4視頻會議業務實際使用視頻會議系統,圖形無卡頓亂碼,語音清晰。5Vxlan業務ORACLE RAC/DB2群集,聯機進行測18、試,測試內容包括系統狀態和切換措施,確認RAC及群集可正常工作4.1.1 設備狀態檢查1,設備CPU占用率/內存占用率2,接口錯包統計,接口UP,MAC表,ARP、對比路由表與割接前收集數據對比。接口錯包統計:display this interface brief在鏈路端口下查看端口狀態是否UP:display this interface查看接口下MAC地址學習情況:display mac-address查看接口下ARP表項:display arp對比路由表:dis ip route-table第五章 回退機制為防止割接過程中出現不可預料的異常,我們制定了相應的回退機制。針對割接時間窗內操19、作預期可能存在的風險項定義應對方案。如果出現以下情況在預定時間窗內不能恢復,則進行回退操作。變更失敗定義:1,波分鏈路、以太網鏈路無法UP。2,各路由協議狀態不正常。3,驗證測試不通過。4,所帶業務出現中斷或者時延較大,在60分鐘之內如不能恢復正常。5、割接計劃中說明的其他事項5.1 故障判斷故障情況操作步驟預期結果、檢查方法波分鏈路、以太網鏈路無法UP檢查鏈路光功率,端口協商狀態,更換模塊。檢查網線連通性,更換網線。時間窗內排除直接回退。業務恢復/回退路由協議不正常檢查配置,根據狀態信息排查。時間窗內排除直接回退。業務恢復/回退出現單個電源模塊失效、主控板、業務板失效。單模塊運行,在24小時20、內更換。時間窗內排除直接回退。業務恢復/回退業務出現中斷或者時延較大時間窗內排除直接回退。業務恢復/回退VXLAN對接不成功檢查配置,根據狀態信息排查。時間窗內排除直接回退。業務恢復/回退VXLAN對接成功ORACLE RAC/DB2群集,首先聯機進行測試,測試內容包括系統狀態和切換措施,確認RAC及群集可正常工作業務恢復/回退互聯網USG6650割接測試WLAN業務正常上網,出口業務訪問與園區網與數據中心的互訪聯網訪問園區網與數據中心,時間窗內排除直接回退。業務恢復/回退廣域網設備的割接。測試廣域網業務,測試不成功,時間窗內排除直接回退。業務恢復/回退5.2 緊急回退具體回退步驟:1, 線纜21、拆除,恢復原有設備線纜連接。2, 原設備互聯端口打開。5.3 應急計劃:廣域網、園區網割接時出現以下情況且無法在1個小時內解決,將考慮進行應急:1、 多個廣域網節點無法接入2、 園區網接入交換機出現故障,導致多個樓層無法連接網絡3、 WLAN系統失效,wifi用戶無法連入4、 出現設備不穩定或用戶訪問系統速度慢的問題5、 其他尚未預見的問題主要措施:1、 系統暫時放棄主備架構,修改為單設備或單線路運行2、 安排在周日進行單項故障排查第六章 風險評估在第三章-離線測試部分在割接前對可預料的風險進行了離線測試,在割接前做好了充足準備規避相關風險,在未通過測試情況下不進行割接。6.1 風險評估風險項22、發生可能性應對措施CISCO設備與華為設備千兆-千兆接口對接失敗高割接前測試驗證,更換匹配模塊波分設備與CE12804與CE6851接口對接失敗中割接前測試驗證,更換匹配模塊萬兆模塊在千兆光纖上光功率衰減過大掉包。中割接前測試驗證,更換匹配模塊CE12800設備多模萬兆單板插千兆模塊與USG6650 多模千兆光口對接是否成功中割接前測試驗證,更換匹配模塊CE1280、CE6851與思科交換機對接,生成樹需一致中割接前測試驗證板卡,電源模塊失效很小單模塊運行,申請備件第七章 守局方案1、守局目的:為保障割接后設備的穩定運行,提前發現設備隱患或客戶網絡方案問題,減少對業務的影響,充分調配現有的人力資源,特制定此管理制度。2、職守方式本次割接的設備在市局點,此項目采用現場守局,確保能夠在發現問題的第一時間進行處理。3、管理制度1、 一旦出現影響業務的狀況和其他緊急情況,第一時間通知項目組負責人以及遠程保障人員。2、 一般問題請與設備接口人聯系,如果有現場職守人員,同時通知現場職守人員。3、 守局人員(不管是否在守局狀態)、后方支持人員手機一定要保持24小時暢通。4、 守局人員根據值班表安排,在現場值守我司設備運行狀況,并同時緊急處理設備突發情況;如有特殊情況提前電話通知工程負責人,不得擅自脫崗。4、守局值班安排割接/守局人員名單姓名電話地點第八章 配置模板