北京數據中心總體IT系統應急響應及應急預案(37頁).doc
下載文檔
上傳人:奈何
編號:561578
2022-08-30
35頁
156.54KB
1、 IT系統應急響應及恢復預案編寫指南目錄修訂說明:3修訂記錄41.總則61.1.目的和依據61.2.適用范圍62.系統及資源82.1.系統信息82.2.系統描述92.3.運行指標92.4.關聯系統102.5.物理架構112.6.網絡拓樸112.7.IP及端口112.8.系統軟硬件112.9.后備資源132.10.用戶分配142.11.其他信息143.標準處置預案153.1.標準處置164.故障快速定位204.1.快速定位流程204.2.定位流程描述204.3.故障快速定位排查內容205.系統應急場景分類及描述225.1.故障場景分類225.2.硬件故障場景225.3.通用軟件故障場景265.42、.應用軟件故障場景285.5.網路故障場景295.6.其它故障場景305.7.恢復回切場景306.附錄31附錄一:人員聯系表31附錄二:應急演練方案32附錄三:應急演練報告32附錄四:故障應急報告32附錄五:故障現場收集腳本32修訂說明:北京數據中心于2011年3月推出北京數據中心總體應急預案V1.0(簡稱總體預案)和中國建設銀行XX系統應急響應及恢復預案(模版V3.0)(簡稱新預案模板)。總體預案主要適用于北京數據中心信息系統突發事件的處理,并指導各信息系統編制系統應急預案。在總體預案中,對事件分級及處置原則、中心應急組織架構及職責、應急響應及恢復流程、應急預案管理等內容進行了描述。新預案模3、板主要用于指導數據中心各系統應急新版預案的修訂工作。新預案模板在V2.0版本基礎上,對架構和內容進行了全面的修訂,重點加強了系統應急管理、故障快速定位和故障場景等內容的描述。可確保特定系統發生突發事件時,應急人員能依據預案預設內容,規范處置和快速恢復應用。系統預案中相關的事件分級、處置和應急流程等在總體預案中都有詳細描述。在修訂過程中,編制人員可參照總體預案進行新版預案的修訂。新預案模板由六章組成,分別是總則、系統及資源、標準處置預案、故障快速定位、系統應急場景分類及描述和附錄。新預案模板與V2.0版預案在文檔結構對照關系可參見下表:新版預案模板V3.0舊版預案模板V2.0備 注1 總則新增內4、容2 系統及資源1.應用系統簡介2.系統資源配置對應舊預案第一、二章部分內容3標準處置預案新增內容4故障快速定位新增內容5系統應急場景分類及描述7. 技術應急維護操作手冊對應舊預案第七章部分內容6 附錄9附錄對應舊預案第九章部分內容3.管理部門及職責劃分4.應急組織設置5系統應急管理6應急處理流程8. 預案演練和更新相關內容將統一出現在中心總體預案中新預案模板保持了應急預案版本建設的連貫性,減少了預案版本升級所可能產生的困難和產生的工作量,便于預案修訂人員參考使用。本編寫指南在主體結構與預案模板也基本保持一致,希望能幫助預案修訂人員順利完成新版應急預案修訂工作。修訂記錄說明:每次系統升級及變更5、配置后,都必須對應急預案做相應的修訂,確保這些變化造成的影響能夠在應急預案模版中反映出來并使之符合系統現有狀況。預案維護人員嚴格執行版本控制,在預案內容更新后時應該確保相關人員都能及時得到最新版本。示例:修訂日期版本號修訂說明修訂人審核2007.1V1.0建立數據中心應急預案模板吳磊楊曉勤2008.1V2.0修訂應急預案第五、六、七章節吳磊張翔2009.6V2.5修訂第四、第七、第八章節吳磊張翔2010.3V3.0全面修訂應急預案結構和內容,新增第三、第四章內容吳磊付林1. 總則1.1. 目的和依據說明:請在此簡要描述本預案編制的主要目的,本預案在建設銀行業務持續性突發事件應急響應及恢復工作(6、以下簡稱“應急響應及恢復工作”)過程中所發揮的作用和執行的功能,以及編制本預案的主要依據。示例:防垃圾郵件網關系統(MGAT)應急預案(以下簡稱MGAT預案)是郵件網關系統遇到緊急情況或運行中斷后為恢復郵件網關服務所采取的快速有效的應對手段。通過建立包含應急啟動、執行、恢復等流程、步驟和技術操作方案,為系統相關組織、人員處理應急情況提供指導;并作為與總行其他應急相關人員進行協調的依據。1.2. 適用范圍說明:請在此明確本應急預案的具體適用范圍。如指明該預案適用于因XXX突發事件所導致的建設銀行XXX業務發生中斷,需要采取應急處置和恢復措施予以應對的操作風險事件。示例:本系統應急預案適用范圍是北7、京數據中心與本系統有關的所有組織體系和人員,適用于北京數據中心郵件網關系統的運行所需的功能,操作和資源。該預案適用于因郵件網關系統突發事件所導致的建設銀行郵件收發發生中斷,需要采取應急處置和恢復措施予以應對的操作風險事件。郵件網關系統簡稱為MGAT,產品英文名稱為Websense 郵件網關。2. 系統及資源2.1. 系統信息應用系統中文全稱:說明:請在此描述應用系統在北京數據中心(或ITSM系統中)的中文全稱。應用系統英文縮寫:說明:請在此描述應用系統在北京數據中心(或ITSM系統中)的英文簡稱。應用系統負責部室:說明:請在此描述應用系統在數據中心(或ITSM系統中)的負責部室。應用系統管理員8、:說明:請在此描述應用系統在數據中心(或ITSM系統中)的應用預案修訂人員A/B角或者管理團隊。平臺系統管理員:說明:請在此描述應用系統在數據中心(或ITSM系統中)的平臺預案修訂人員A/B角或者管理團隊。網絡管理員:說明:請在此描述應用系統在數據中心(或ITSM系統中)的網絡管理員A/B角或者管理團隊。2.2. 系統描述系統功能:說明:請在此描述應用系統的主要功能。支撐業務:說明:請在此描述應用系統所支撐的所有業務應用。業務影響范圍:說明:請在此描述應用系統故障后可能影響的范圍。2.3. 運行指標說明:請在此補充應用系統的常用的一些運行指標,如恢復時間目標(RTO,Recovery Time9、 Objective) 恢復點目標(RPO,Recovery Point Objective)、運行維護級別、可用性要求,性能要求,業務連續性要求,安全性要求,可管理性要求,可維護性要求等。運行指標解釋:1)恢復時間目標(RTO):是指突發事件發生并導致業務或系統中斷后,從中斷到必須恢復的時間要求。2)恢復點目標(RPO):是指突發事件發生并導致業務或系統中斷后,數據必須恢復到的時間點要求,即數據可容忍丟失的最大時間長度。注意:恢復時間目標(RTO)和恢復點目標(RPO)是必填項。在營業不同時間段(業務高峰、業務空閑和非業務時間)如對RTO/RPO有不同要求,請單獨列舉。示例:郵件網關系統運行10、指標恢復時間目標(RTO):0分鐘。恢復點目標(RPO):10分鐘。運行維護級別:5*8(8:30 - 17:30)。可用性要求:全年系統可用性達到99.9%。性能要求:系統最大并發連接數 8000 個 TCP連接,郵件處理速度 150 封/秒,郵件延遲時間平均值1 分鐘,郵件錯誤率 170,000 次/小時 包括字典攻擊、目錄攻擊、病毒攻擊、壓縮文件攻擊等。2.4. 關聯系統說明:請在此描述與該系統運行相關的其它關聯系統情況,如:何種關聯系統?所涉及何種業務等。2.5. 物理架構說明:請在此描述系統物理拓樸結構及簡要描述(包括放置在哪個機房,物理如何連接、以及何其他系統的關聯拓撲等)2.6.11、 網絡拓樸說明:請在此描述系統網絡拓樸結構及簡要描述2.7. IP及端口說明:請在此描述簡要描述系統使用的IP地址及端口(請填寫包括帶外管理在內的所有網絡地址和端口)2.8. 系統軟硬件2.8.1. 主機設備說明:請在此描述主機設備的具體配置及參數。示例:主機設備一:郵件網關系統主服務器,設備用途:設備編號:操作系統及版本:WindowsServer2003R2企業版設備位置: 北京洋橋2層數據庫及版本:SQL2005設備型號:IBM xSeries3850中間件及版本:websense V6.3.2設備序列號:99C4653本地硬盤RAID級別:raid5設備微碼:(主要設備)本地硬盤大小及12、數量:146*6CPU及數量:Xeon 3.0G 4網卡一MAC及IP:00-14-5E-BC-7A-2E (無IP地址)內存大小:8G網卡二MAC及IP:00-14-5E-BC-7A-2F(無IP地址)網卡:3塊網卡網卡三MAC及IP:00-10-18-30-69-4D (IP:11.133.190.59)其他2.8.2. 軟件配置說明:請在此描述系統安裝的各種軟件的具體信息及用途,請將系統所用軟件按系統軟件、中間件、數據庫、應用等進行劃分。示例:軟件類型產品名稱版本號用途說明操作系統WEBSENSE OS2. 2.4.22-14生產數據庫Mysql4.0生產應用軟件RiskFilter6.13、3.3生產2.8.3. 磁盤/磁盤陣列說明:請在此描述系統所用的磁盤及磁盤陣列。2.8.4. 磁帶存儲說明:請在此描述系統所用的磁帶存儲。2.8.5. 網絡設備(如路由器、交換機、負載均衡等)說明:請在此描述系統專用的各種網絡設備2.8.6. 其它硬件設備(如加密機等)說明:請在此描述系統專用的各種硬件設備。2.9. 后備資源說明:請在此描述系統各種后備資源,如系統的數據備份、硬件配件、軟件備份等資源信息。2.9.1. 數據備份說明:請在此描述系統可能有的操作系統、應用系統和應用數據備份,要說明備份等級、備份時間、備份介質、存放位置和保管人等信息。2.9.2. 硬件配件說明:請在此描述系統可能14、有的各種硬件配件,如大機、小機、服務器、網絡設備、計算機備件和其它相關配件。對這些配件要注明具體型號、序列號、服務期限、保存位置和保管人等信息。2.9.3. 軟件備份說明:請在此描述系統可能有的各種軟件備份,如操作系統、數據庫系統、應用軟件備份等。對這些備份要注明具體產品名稱、版本號、保存位置和保管人等信息。2.10. 用戶分配說明:請在此描述系統可能有的各種用戶,包括系統原有和自建的用戶。要明確用戶角色、用戶組及其它相關信息。2.11. 其他信息說明:請在此描述其它與系統相關的需要描述的信息。3. 標準處置預案說明:請在此描述系統預設的一些標準處置預案,如主備機切換、應急庫切換、災備環境標準15、切換、硬件設備標準關閉、硬件設備標準重啟等標準處置預案。下面列舉了常見的一些標準處置預案但不完善,請預案編制人員根據系統實際情況酌情修訂。在預案模板中,系統標準處置預案列舉如下:1) 主備機標準切換:該處置預案應包含系統各種設備在運行中出現意外時,所涉及的各種應急切換處置步驟。設備包含大機、小機、服務器、網絡設備、專用設備、存儲等。2) 應急庫標準切換: 該處置預案應包含系統切換應急庫的相關處置步驟。3) 災備環境標準切換:該處置預案應包含系統切換災備環境的相關處置步驟。4) 硬件設備標準關閉:該處置預案包含系統硬件設備關閉時的相關處置步驟。5) 硬件設備標準重啟:該處置預案包含系統硬件設備重16、啟時的相關處置步驟。6) 數據庫標準關閉:該處置預案包含系統數據庫關閉時的相關處置步驟7) 數據庫標準重啟:該處置預案包含系統數據庫重啟時的相關處置步驟。8) 應用服務標準關閉:該處置預案包含系統應用服務關閉時的相關處置步驟。9) 應用服務標準重啟:該處置預案包含系統應用服務重啟時的相關處置步驟。10) 中間件標準關閉:該處置預案包含系統中間件關閉時的相關處置步驟。11) 中間件標準重啟:該處置預案包含系統中間件重啟時的相關處置步驟。12) 其它通用軟件標準關閉:該處置預案包含系統其它通用軟件關閉時的相關處置步驟。13) 其它通用軟件標準重啟:該處置預案包含系統其它通用軟件重啟時的相關處置步驟17、。14) 硬件模塊故障標準處置:該處置預案應包含系統設備出現硬件模塊故障,需要進行在線更換的相關處置步驟。涉及模塊如電源、CPU、內存、RAID卡、光纖卡等。15) 恢復回切標準處置:該處置預案應包含系統通過故障救治,排除故障后恢復到原生產環境所涉及的各種回切處置。3.1. 標準處置說明:請在此對標準處置的主要用途做簡要描述。 修訂日期:說明:請在此描述該標準處置最近一次驗證和修訂的日期。 處置時間:說明:請在此描述完成操作需要的時間。 操作步驟:說明:請在此描述具體操作步驟,要求詳細到具體的操作命令。 驗證步驟:說明:請在此描述操作完后的驗證步驟,也要求詳細到具體的操作命令。示例:標準處置118、:主備機切換該標準處置主要起如下作用:生產環境郵件網關設備出現故障無法工作情況下,郵件網關備機通過該標準處置可緊急接管服務。 修訂日期:2011年3月10日。 處置時間:處置時間20分鐘。 操作步驟:1) 進入運維終端E:日常備份月報郵件網關郵件服務器策略明細表,找到當日備份及證書備份;2) 將備機的IP地址修改為生產主機地址(11.xxx.xxx.31),重新啟動網絡;具體操作命令為:vi /etc/sysconfig/network-scripts/ifcfg-eth0),將IP ADDRESS項中的地址修改為生產地址,存盤退出編輯。3) 將郵件網關31主機的網線拔除并插到備機對應網卡中;19、4) 在超級用戶權限下執行應用啟動命令:#/etc/init.d/smgd restart。5) 用administrator用戶登錄 https:/ 11.xxx.xxx.31/admin管理界面,進入系統設置-幫助設置向導-,輸入(驗證)備份的證書序號和激活碼。6) 繼續在系統設置-更新管理中,立即更新反病毒庫和反垃圾郵件庫。7) 登錄 https:/ 11.xxx.xxx.31:10000端口管理界面,在系統 備份管理導入終端中的備份文件,恢復系統配置及策略設置為31主機狀態; 驗證步驟:1) 登錄 https:/ 11.xxx.xxx.31/admin 查看系統設置、系統面板,分別檢查20、設置是否已經恢復成功,對外連接的服務器狀態是否正常;2) 繼續在https:/ 11.xxx.xxx.31/admin,統計與日志中,分別查看郵件日志、投遞郵件、系統狀態、過濾統計等,測試收發郵件是否正常工作,過濾是否正常;3) 登錄https:/ 11.xxx.xxx.31:10000管理界面,在系統歷史統計數據中,分別查看CPU、磁盤、內存、eth0網絡接口卡等硬件運行情況;如以上三部分檢查都正常,則說明系統主備機切換成功。4. 故障快速定位4.1. 快速定位流程說明:請在此描述當系統出現未知故障情況下,應急人員因按照何種預設流程進行故障排查,以便能快速定位系統故障。為規范和方便大家填寫故21、障快速定位流程,在預案模版中預設一個空白的應急預案的維護流程,預案修訂人員需要根據系統特點修改完善。4.2. 定位流程描述說明:請根據上節的定位流程圖,翔實描述各具體定位流程步驟。)1、2、4.3. 故障快速定位排查內容說明:請在此詳細描述在系統故障排查時,可能涉及的檢查的內容、執行的命令、指標閥值等。在預案模板中預設了快速定位排查表,主要涉及應用應用軟件、網絡狀態、硬件狀態、通用軟件等檢查內容。預案修訂人員要求認真考慮排查的優先順序,按照最快故障排查定位的原則對優先順序進行排序。每步排查步驟都要求有檢查內容、操作步驟、操作/復核人、檢查結果等具體信息。并要求根據排查結果指定下一步檢查內容。如22、故障定位檢查需要相關系統配合,也請按照排查順序,將相關檢查內容添加到排查表中。如檢查內容較多,可在排查表中簡要描述檢查項,詳細內容放在預案附錄中。5. 系統應急場景分類及描述5.1. 故障場景分類說明:請預案修訂人員根據系統特點,在此對故障場景進行分類并簡要描述,要求故障場景分類應能覆蓋系統所有可能出現的故障場景。示例:系統故障場景按照故障特點分為五類:硬件故障場景、通用軟件故障場景、應用軟件故障場景、網絡故障場景和其它故障場景。1.硬件故障場景:主要包含系統硬件方面的故障場景。例如。2.通用軟件故障場景:主要操作系統、數據庫軟件、中間件等方面的故障場景。例如。3.應用軟件故障場景:主要包含業23、務應用系統方面的故障。例如。4.網絡故障場景:主要包含與網絡相關的故障場景。例如。5.其它故障場景:主要包含系統相關的外聯系統、外部環境等方面的故障。例如。5.2. 硬件故障場景說明:請在此詳細列舉并描述系統可能出現的各種硬件場景,在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。(預案編制人員在修訂應急步驟時,建議參考平臺部編制的通用故障處理方案,該方案內包含LINUX、AIX、HP-UX、INFORMIX、ORACLE通過故障處理流程和應急處理步驟。)在預案模板中,系統硬件常見故障事件列舉如下:24、1) 大型機異常報錯2) 小型機異常報錯3) 加密機設備異常4) 服務器異常宕機5) 設備網卡異常6) 設備CPU異常7) 設備硬盤異常8) 設備內存異常9) 設備光纖卡異常10) 設備RAID卡異常11) 設備HA卡異常12) 設備串口卡異常13) 設備其它部件異常5.2.1. XX故障事件說明:請在XX處補全具體故障事件名稱。 修訂日期:說明:請在此描述該故障事件處置最近一次驗證和修訂的日期。 事件級別:說明:請在此設定該故障事件等級(一級/二級/三級/四級/五級/六級)。劃分原則請按照中國建設銀行信息系統生產事件等級認定規定(試行)(建總發2010138號)對事件級別的劃分。 授權級別:25、說明:請在此設定執行該故障救治步驟所需要的授權級別中心領導授權/部室負責人授權/部室日常授權)。授權級別的設定可參照中心總體預案中的授權級別設定原則。 處置時間:說明:請在此在設定執行救治措施,完成故障處置該所需要的時間。 場景描述:說明:請在此簡要描述該故障場景可能出現的狀況和現象。 驗證方法:說明:請在此簡要描述可確認該故障事件驗證方法和手段。 現場保護:說明:請在此描述進行現場保護所使用的現場收集腳本。部分腳本可見附錄。 救治步驟:說明:請在此此翔實描述故障救治步驟,要求細化到具體的操作指令。如救治步驟調用前面標準處置章節的內容,則必須在此注明調用的具體章節號及名稱。示例:郵件網關集群中26、一臺設備硬件宕機 修訂日期:最近一次驗證和修訂的日期為2011年3月11日 事件級別:五級事件 授權級別:部室負責人授權 處理時間:26分鐘 場景描述:1. 應用監控人員通過郵件、短信、實時監控等渠道得知主機不可用。2. 應用用戶可以ping通主機IP地址,但不能從控制臺登入操作系統,且未發現硬件故障燈亮。 驗證方法:(3分鐘)1. 進入主機房檢查主機上是否有硬件報錯或是否有黃燈閃,如果沒有則說明不是因為硬件的損壞導致的主機不可用。 現場保護:(3分鐘)1) 如果系統無法響應且屏幕有信息,用手機將提示信息拍下,或者用筆將文字記錄下來;2) 系統重啟后,執行errspot.sh腳本將系統相關的信27、息和日志收集起來,以備分析故障時使用。 救治步驟:(20分鐘)1) 將備機的IP地址修改為生產主機地址(11.xxx.xxx.31),重新啟動網絡;具體操作命令為:vi /etc/sysconfig/network-scripts/ifcfg-eth0),將IP ADDRESS項中的地址修改為生產地址,存盤退出編輯。2) 將郵件網關31主機的網線拔除并插到備機對應網卡中;3) 在超級用戶權限下執行應用啟動命令:#/etc/init.d/smgd restart。4) 用administrator用戶登錄 https:/ 11.xxx.xxx.31/admin管理界面,進入系統設置-幫助設置向導28、-,輸入(驗證)備份的證書序號和激活碼。5) 繼續在系統設置-更新管理中,立即更新反病毒庫和反垃圾郵件庫。6) 登錄 https:/ 11.xxx.xxx.31:10000端口管理界面,在系統 備份管理導入終端中的備份文件,恢復系統配置及策略設置為31主機狀態;5.3. 通用軟件故障場景說明:請在此詳細列舉并描述系統所有可能出現的操作系統、數據庫、中間件等通用軟件故障場景。在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。(預案編制人員在修訂應急步驟時,建議參考平臺部編制的通用故障處理方案,該方案內29、包含LINUX、AIX、HP-UX、INFORMIX、ORACLE通過故障處理流程和應急處理步驟。)在預案模板中,系統通用軟件常見故障事件列舉如下:1) 系統數據庫崩潰2) 數據庫存儲損壞3) 數據庫無法正常處理請求4) 數據庫表死鎖5) 數據庫表數據無法插入6) 邏輯日志滿導致數據庫掛起7) 數據庫啟動失敗8) 數據庫交易處理緩慢9) 數據庫表空間OffLine10) 數據庫無法連接或無響應11) 數據庫性能極劇下降12) 數據庫短時間內不可用13) 數據庫實例監聽宕掉14) 數據庫實例出現大量等待事件15) 數據庫實例無法切換邏輯日志16) Tuxedo服務異常或僵死17) weblogi30、c實例異常或僵死18) AIX操作系統異常或報錯19) LINUX操作系統異常或報錯20) HP-UX操作系統異常或報錯21) WINDOW操作系統異常或報錯22) 中間件異常或報錯5.4. 應用軟件故障場景說明:請在此詳細列舉并描述系統所有可能出現的應用故障場景。在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。在預案模板中,系統應用軟件常見故障事件列舉如下:1) 系統應用不能正常運行2) 應用進程異常3) 系統應用無法啟動4) 系統應用響應緩慢或無響應5) XX交易異常報錯6) XX交易流量異常31、下降7) XX交易成功率異常下降8) 用戶無法登陸應用界面9) 用戶連接應用異常報錯10) 應用服務隊列堵塞11) 應用出現大量繁忙,交易時間延長12) 應用共享空間異常13) 應用處理性能下降14) 部分分行應用堵塞,無法連接總行15) 某類特定交易成功率異常16) 某類特定交易流量異常下降5.5. 網路故障場景說明:請在此詳細列舉并描述系統所有可能出現的網絡故障場景。在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。在預案模板中,系統網絡常見故障事件列舉如下:1) 外聯節點網絡異常中斷2) 網絡32、外聯服務不可用3) AP與DB間網絡異常或不可用4) WEB與AP間網絡異常或不可用5) 網絡端口流量異常升高/下降6) 防火墻連接數異常7) IP地址異常或出現沖突8) 數據傳輸中出現異常丟包9) 病毒爆發,堵塞網絡10) 網絡被攻擊,不可用11) F5服務異常或報錯5.6. 其它故障場景說明:請在此詳細列舉并描述系統所有可能出現的外部環境、外聯、外部系統等故障場景。在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。在預案模板中,系統其它常見故障事件列舉如下:1) 機柜異常掉電2) 外聯系統交易異33、常3) 外聯系統不可用4) 設備被人為破壞5.7. 恢復回切場景說明:請在此詳細列舉并描述系統所有可能出現的恢復回切場景。在預案模板中列舉了一些常見的故障事件,預案編制人員要根據系統實際情況酌情修訂。修訂后預案表中的列舉的故障事件都要求在預案隨后的章節里進行詳細描述。在預案模板中,系統恢復回切場景列舉如下:1) 應用回切2) 數據庫回切3) 災備庫回切6. 附錄附錄一:人員聯系表說明:請在此詳細描述與本系統應急相關的所有人員。在人員聯系表中應至少含有中心領導層、業務部門、系統處室、網絡、機房、平臺、合作公司、外部機構和外部服務商等應急處置所需的人員。要求在預案模板設置的表中能明確應急處置人員的34、技術水平和能力,以及B角人員的技術水平是否勝任。在預案模板的人員聯系表中,每個人員信息預設如下字段:1) 姓名2) 所屬單位3) 職務4) 聯系郵箱5) 固定電話6) 移動電話7) 專業技能8) 應急職責說明:請在此注明人員在應急中的職責。如指揮A角、指揮B角、操作員A角、操作員B角、審核員A角、審核員B角、外聯人員A角、外聯人員B角、公司技術人員A角、公司技術人員B角等。9) 聯系表修訂日期附錄二:應急演練方案說明:附錄二的應急演練方案是數據中心通用演練方案模板,在組織系統應急演練時,演練人員可以參考使用。附錄三:應急演練報告說明:附錄三的應急演練報告是數據中心通用演練報告模板,在組織系統應35、急演練時,演練人員可以參考使用。附錄四:故障應急報告說明:附錄四的故障應急報告是數據中心通用報告模板,在進行系統應急時,應急人員可以參考使用。附錄五:故障現場收集腳本說明:腳本編號編制規則如下:1. GXXX-通用腳本(general),為數據中心系統平臺部整理的通用故障收集腳本,在故障情況下可有系統應急人員直接使用;2. SXXX-特殊腳本(special),為數據中心系統平臺部整理的特殊故障收集腳本,針對不同的場景和具體問題進行執行的腳本(腳本執行可能會對系統有一定風險,建議由專業技術人員執行)3. CXXX自定義腳本(custom),數據中心預案修訂人員可針對不同的場景和具體問題,自行開36、發的用于特定系統和應用信息收集的腳本。序號腳本名稱系統腳本用途(簡要說明)G001aixgeneral general.aix.shAIX系統通用故障收集腳本,主要用于收集系統、硬件、IO、網絡、內存、snap、Dump、系統安全方面等信息。G002beatuxedogeneralBEAMonitor_MP.shTuxedo通用故障收集腳本,主要用于MP模式下收集應用信息G003beatuxedogeneralBEAMonitor_SHM.shTuxedo通用故障收集腳本,主要用于SHM模式下收集應用信息G004hpgeneralcola.shHP系統通用故障收集腳本,主要用于收集系統、硬件、37、IO、網絡、內存、HACMP、Dump、系統安全方面等信息G005hpgeneralcolb.shHP系統通用故障收集腳本,主要用于收集網絡、ipcs等信息G006informixgeneralcollect.informix.shInformix系統通用故障收集腳本,主要用于收集Onstat、env 、ulimit 、csdk version、oninit、typetab、bar_act.log、online.log、sqlhosts、onconfig等信息G007oraclegeneralgeneral_script.shOracle系統通用故障收集腳本,主要用于收集數據庫常用信息。G0038、8S001aixspecial collect_part_ports.shAIX系統特殊故障收集腳本,主要用于收集網絡TCPDUMP等信息。S002aixspecial collect_spec_port.shAIX系統特殊故障收集腳本,主要用于收集網絡端口等信息。S003aixspecial coredummp.shAIX系統特殊故障收集腳本,主要用于收集系統coredummp相關信息。S004aixspecial HACMPException.shAIX系統特殊故障收集腳本,主要用于收集系統HACMP相關信息。S005aixspecial Memoryhigh.shAIX系統特殊故障收集腳39、本,主要用于收集系統內存相關信息。S006aixspecialnet.shAIX系統特殊故障收集腳本,主要用于收集系統網絡方面信息。S007beaweblogicspecialthread_dump.shWeblogic特殊故障收集腳本,主要用于收集DUMP信息。S008informixspecial collect.sp.informixInformix特殊故障收集腳本,主要用于收集informix共享內存信息。S009oracleSpecial dbv.shOracle特殊故障收集腳本,主要用于收集dbv信息。S010oracleSpecialos.shOracle特殊故障收集腳本,主要用40、于收集vmstat等信息。S011oracleSpecialtopsql.shOracle特殊故障收集腳本,主要用于收集top等信息。S012C001errspot.sh(示例)系統特色腳本,用于收集系統相關的應用信息,。C002壓縮包腳本描述:序號腳本名稱腳本說明G001aixgeneral general.aix.sh參見預案模板壓縮包G002beatuxedogeneralBEAMonitor_MP.sh參見預案模板壓縮包G003beatuxedogeneralBEAMonitor_SHM.sh參見預案模板壓縮包G004hpgeneralcola.sh參見預案模板壓縮包G005hpgen41、eralcolb.sh參見預案模板壓縮包G006informixgeneralcollect.informix.sh參見預案模板壓縮包G007oraclegeneralgeneral_script.sh參見預案模板壓縮包S001aixspecial collect_part_ports.sh參見預案模板壓縮包S002aixspecial collect_spec_port.sh參見預案模板壓縮包S003aixspecial coredummp.sh參見預案模板壓縮包S004aixspecial HACMPException.sh參見預案模板壓縮包S005aixspecial Memoryhigh.sh參見預案模板壓縮包S006aixspecialnet.sh參見預案模板壓縮包S007beaweblogicspecialthread_dump.sh參見預案模板壓縮包S008informixspecial collect.sp.informix參見預案模板壓縮包S009oracleSpecial dbv.sh參見預案模板壓縮包S010oracleSpecialos.sh參見預案模板壓縮包S011oracleSpecialtopsql.sh參見預案模板壓縮包C001C002 第 35 頁 共 35 頁