網上銀行托管平臺業務持續性計劃及應急預案22頁.doc
下載文檔
上傳人:職z****i
編號:1082342
2024-09-06
22頁
155.11KB
1、網上銀行托管平臺業務持續性計劃及應急預案編 制: 審 核: 批 準: 版 本 號: ESZAQDGF001 編 制: 審 核: 批 準: 版 本 號: 目錄一、目標及適用范圍3二、組織架構3(一)信息安全管理委員會3(二)應急處理小組41、應急事件處理42、業務持續性計劃及應急預案優化4(三)技術支持小組4(四)事件宣告小組5三、應急事件定義及響應流程5(一)網上銀行事件分類5(二)網上銀行事件級別6(三)應急預案響應流程7(四)事故防范措施8四、應急預案9(一)意外災害應急預案91、工作目標92、工作程序10(二)電力中斷應急預案111、工作目標112、工作程序11(三)網絡故障應急預案112、1、工作目標112、工作程序111、問題現象122、故障分析133、解決方法13(四)硬件故障應急預案141、工作目標142、工作程序14(五)系統軟件故障應急預案151、工作目標162、工作程序16(六)應用軟件故障應急預案171、工作目標172、工作程序17(七)病毒感染應急預案181、工作目標182、工作程序18(八)非法入侵應急預案191、工作目標192、工作程序19五、應急測試與演練19(一)應急測試201、測試內容202、測試流程20(二)應急演練201、模擬演練202、實戰演練21六、培訓21一、目標及適用范圍為保障*銀行股份有限公司(以下簡稱“*銀行”或“本行”)網上銀行系統運3、行的安全性、穩定性,降低事故發生的可能性,減少因事故發生而造成的損失,作為網上銀行系統托管方的#科技有限公司(以下簡稱“#”)與*銀行共同制定本持續性計劃及應急預案。本計劃及應急預案適用于網上銀行托管平臺所有系統運行的軟硬件設備、虛擬資源、相關管理制度、相關組織機構及人員。二、組織架構網上銀行應急處理的組織架構,包括安全管理委員會、應急處理小組、技術支持小組、事件宣告小組及相關公司。(一)信息安全管理委員會信息安全管理委員會由#管理層、有關部門總經理組成,負責審核應急處理小組提交的重大事件處理方案、業務持續性計劃及應急預案。聯系人部門職務聯系方式#副總經理#副總經理#運行部部門總經理#實施部部4、門總經理#技術顧問#技術顧問(二)應急處理小組應急處理小組由#運行部、#開發部相關人員組成,主要職責有:1、應急事件處理詳細記錄并分析網上銀行應急事件,在技術支持等小組的協助下,提出解決方案,并向信息安全管理委員會解釋應急事件及解決方案。解決方案通過委員會審核后,應急處理小組還應負責方案的實施,并在實施結束后提交“應急事件處理報告”。2、業務持續性計劃及應急預案優化負責上報產生的應急事件,評估網上銀行業務的持續性計劃及應急預案,當發現存在風險隱患時,對應急預案進行優化。優化后的業務持續性計劃及應急預案須提交信息安全管理委員會審核后實施。聯系人部門職務聯系方式#運行部業務支持工程師#運行部業務支5、持工程師#運行部業務支持工程師#運行部業務支持工程師#運行部業務支持工程師#運行部業務支持工程師(三)技術支持小組技術支持小組由#技術部、#開發部相關人員組成,負責通過遠程支持/現場支持的方式,協助應急處理小組提出技術解決方案。聯系人部門職務聯系方式#實施部大區經理#實施部大區經理#實施部大區經理#實施部專家組,項目經理#運行部項目成員#實施部專家組#實施部專家組#實施部網站組#實施部網站組(四)事件宣告小組網上銀行事件宣告小組由*銀行辦公室等相關部門組成,發生應急事件后,負責按指定的方式對外發布事件狀況、事件處理進度及事件處理結果。聯系人部門職務聯系方式*銀行辦公室主任*銀行辦公室副主任三、6、應急事件定義及響應流程(一)網上銀行事件分類根據對系統服務產生影響的程度,網上銀行事件可劃分為四種類型:事件分類事件描述A類生產系統遭到災難性毀滅,無法提供服務。B類核心業務設施(包括系統核心中間件服務器、WEB服務器、數據庫服務器及其他業務主機、核心網絡設備、磁盤存儲系統設備、網絡線路等)發生故障或性能嚴重下降,導致網上銀行系統服務出現響應速度異常、業務中斷、無法對外提供服務。C類非核心業務設施(如RA服務器、簽名驗簽服務器及其他非核心主機、熱備冗余主機、非核心硬件網絡設備等)發生故障或性能下降,導致部分所支持的網上銀行應用系統服務功能及性能受到影響。D類非核心其他設施(如IDS設備、備份系7、統、知識庫系統、網上銀行托管系統監控平臺、處于等待狀態的災備系統等)發生故障,或者外圍設備出現故障,但不會對網上銀行系統業務產生影響。(二)網上銀行事件級別根據各類事件導致網上銀行發生故障的時間長短,將事件劃分為四級,級別越高,時間越他,嚴重程度越高。事件分類事件級別一級二級三級四級A類發生即四級B類0-0.5小時0.5小時以上C類0-0.5小時0-1小時1小時以上D類0-0.5小時0.5-1小時1-4小時4小時以上(三)應急預案響應流程為保證系統安全,由#運行部人員7*24小時值守,對網上銀行系統運行情況實施無間斷監控。應急處理小組成員應保持7*24小時開機,出現緊急事件時,在第一時間趕赴現8、場,并協調相關資源,啟動應急預案。各個級別事件的處理流程:級別處理流程四級1、四級事件需由信息安全管理委員會全體成員參與討論并審核技術解決方案;2、事件處理完畢,由應急處理小組提交“應急事件處理報告”,并提交信息安全管理委員會審核;3、根據本次事件情況,應急處理小組應對業務持續性計劃與應急預案進行評估,如需優化,則在優化后提交信息安全管理委員會審核;4、根據“應急事件處理報告”,應急處理小組將本次事件的處理過程錄入知識庫系統。三級1、三級事件需由信息安全管理委員會中的部門總經理參與討論并審核技術解決方案;2、事件處理完畢,由應急處理小組提交“應急事件處理報告”,并提交信息安全管理委員會審核;39、根據本次事件情況,應急處理小組應對業務持續性計劃與應急預案進行評估,如需優化,則在優化后提交信息安全管理委員會審核;4、根據“應急事件處理報告”,應急處理小組將本次事件的處理過程錄入知識庫系統。二級1、二級事件需要由信息安全管理委員中的部門副總經理或以上人員審核技術解決方案;2、事件處理完畢,由應急處理小組提交“應急事件處理報告”,并提交信息安全管理委員會審核;3、根據本次事件情況,應急處理小組應對業務持續性計劃與應急預案進行評估,如需優化,則在優化后提交信息安全管理委員會審核;4、根據“應急事件處理報告”,應急處理小組將本次事件的處理過程錄入知識庫系統。一級1、一級事件需由信息安全管理委員10、會中的運營主管或以上級別人員審核技術解決方案;2、事件處理完畢,由應急處理小組提交“應急事件處理報告”,并提交信息安全管理委員會審核;3、根據本次事件情況,應急處理小組應對業務持續性計劃與應急預案進行評估,如需優化,則在優化后提交信息安全管理委員會審核;4、根據“應急事件處理報告”,應急處理小組將本次事件的處理過程錄入知識庫系統。(四)事故防范措施為防止網上銀行意外事故的發生,特制定以下措施:1、由#運行部人員7*24小時不間斷監控網上銀行系統,保證在出現災難或故障時能夠立即響應;2、生產系統所有的服務器、網絡設備和局域網絡通訊線路均采用主熱備方案,發生任意單點故障時可自動切換,不會影響業務;11、若主熱備同時發生故障,運維人員應緊急通知應急處理小組,由應急處理小組提供業務恢復計劃,經信息安全管理委員會同意后執行;3、為應對黑客入侵,生產系統安裝有“入侵檢測”軟件,當發現有惡意攻擊時會立即切斷網絡連接,保護生產系統;4、為保證系統正常運行,由運行部工程師每月將運行日志提交給運營維護團隊,由維護團隊實施業務持續性計劃與應急預案的優化;5、機房自備有柴油發電機和UPS電源,其中UPS電源采用雙路互備機制。當外部供電中斷時,由人工啟動柴油發電機繼續為生產系統供電,柴油儲備可至少使用24小時;6、機房采用封閉式結構,外部包有防電磁信號泄漏層,內部安裝有門禁、消防、閉路攝像、空調等物理環境控制系統12、。機房實施區域授權訪問控制制度,核心區域需至少兩人在場才能同時進入,以有效應對水災、火災以及非法闖入者的破壞。四、應急預案(一)意外災害應急預案1、工作目標(1)在災害及影響時間較長的情況下,立即啟用災備系統接管生產服務;(2)搶救重要資料和設備,在災情結束后使用備份數據恢復生產系統。2、工作程序(1)值守人員發現災情后,應立即向應急處理小組匯報情況;(2)應急處理小組在接到匯報后,在保證安全的情況下,立即趕赴現場,評估災難損失,并聯系技術支持小組及各相關公司,提出災難恢復方案;(3)災情控制后,應急處理小組立即開展系統恢復工作,檢查系統的損壞程度,根據具體情況采取相應措施:a、利用冗余設備進13、行系統恢復,或聯系設備供應商提供備用設備;b、出現線路故障,立即聯系網絡供應商啟用臨時線路;c、運行平臺中的所有主機均采用雙機熱備,當主節點出現故障時,由備節點接管服務。如果主備節點均故障,則立即聯系設備供應商提供備用主機;d、當磁盤陣列損毀,導致生產數據無法恢復時,應立即聯系設備供應商提供備用設備,并使用災備系統中實時備份的數據,恢復生產系統數據;(4)在確定短期內無法恢復生產系統的情況下,由應急處理小組啟用災備系統,接管生產服務;(5)對系統進行測試,測試結果正常由對外恢復系統使用;(6)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(7)根據本次事故情況,應14、急處理小組對應急預案進行評估與優化。(二)電力中斷應急預案1、工作目標(1)保證生產系統不受影響;(2)出現主供電線路電力中斷時,應及時聯系負責人,啟用備用供電系統;(3)機房備有柴油發電機和UPS電源,其中UPS電源采用雙路互備機制。當外部供電中斷時,由人工啟動柴油發電機繼續為生產系統供電,柴油儲備可至少使用24小時。2、工作程序(1)值守人員發現主供電線路電力中斷時,應立即聯系機房負責人,馬上啟用備用供電;(2)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(3)根據本次事件情況,應急處理小組對應急預案進行評估與優化。(三)網絡故障應急預案1、工作目標在最短時15、間內恢復生產運行。2、工作程序(1)值守人員按照系統監控手冊要求每隔2小時檢查網絡與主機設備運行狀況,出現故障立即向應急處理小組報告;(2)應急處理小組立即趕赴現場,并與網絡設備供應商、網絡線路供應商取得聯系,分析排查故障原因,提出解決方案;(3)若超過2小時仍無法恢復生產,應急處理小組應提交申請,啟用災備系統來接管生產服務;(4)生產系統恢復后,應急處理小組應組織相關人員校驗數據完整性,校驗通過后,將應用切換至生產系統;(5)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(6)根據事件情況,應急處理小組對應急預案進行評估及優化。3、系統組成設備種類設備名稱交換機16、互聯網段交換機交換機2網段交換機交換機3網段交換機交換機4網段交換機防火墻互聯網段防火墻防火墻2-3網段防火墻防火墻3-4網段防火墻路由器4網段路由器負載均衡器2網段負載均衡器4、故障種類及解決方法(1)網絡連接異常1、問題現象a、網絡線路或設備出現故障時,會導致服務器、設備無法連接,系統運行時出現如“提示頁面不存在”等錯誤;b、網絡線路故障時,也可能導致備份失敗。2、故障分析a、網絡線路異常導致網絡連接異常;b、網絡設備接口異常導致接入該接口的設備無法連接;c、服務器運行狀態異常導致該服務器無法連接;d、網絡設備故障導致接入該設備的服務器無法連接。3、解決方法a、確認異常將監控客戶端連接到相17、應網段交換機,根據各設備IP地址,進行PING操作,觀察設備是否可正常連接。b、異常排查若設備無法PING通,作相應的排查。當連接到交換機、路由器上的所有服務器都無法連接時,可判斷為交換機、路由器設備異常。先重啟交換機、路由器。若重啟后所有服務器仍無法連接,需要聯系技術支持小組、網絡設備供應商作進一步分析。若連接到該網絡設備的服務器,有部分可連接,部分不可連接,則有可能是接口異常或服務器異常。若更換接口后,連接正常,則為接口異常,可暫時更換接口解決問題。若更換接口后仍無法連接,則為服務器異常,此時應通過控制臺連接服務器,查看服務器狀態,若服務器已停止運行,重啟服務器。(2)專線網絡中斷a、問題18、現象專線網絡中斷,*銀行用戶無法登錄網上銀行。但#內部網絡仍可正常登錄系統。通過路由檢測會發現,*銀行無法正常路由至#服務器。b、故障分析該問題是由網絡線路供應商的網絡故障所致。c、解決方法聯系網絡線路供應商,分析排查網絡故障,在必要情況下,啟動備用專線網絡。(四)硬件故障應急預案1、工作目標在最短時間內恢復生產運行。2、工作程序(1)當服務器硬件設備出現故障,導致無法連接時,網上銀行托管系統監控平臺會自動報警。值守人員在接到報警后,立即聯系應急處理小組;(2)應急處理小組立即趕赴現場,并與服務器及硬件設備供應商取得聯系,分析排查故障原因,并提出解決方案;(3)如果超過2小時仍無法恢復生產,則19、由應急處理小組提交申請,啟用災備系統接管生產服務;(4)生產系統恢復后,應急處理小組應組織相關人員校驗數據完整性,校驗通過后,將應用切換至生產系統;(5)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(6)根據本次事故情況,應急處理小組對應急預案進行評估與優化。3、系統組成設備種類設備名稱WebServer服務器個人網上銀行WebServer服務器WebServer服務器企業網上銀行WebServer服務器WebServer服務器內部管理平臺WebServer服務器驗簽服務器格爾驗簽服務器Ra服務器Ra服務器中間件服務器Weblogic服務器數據庫服務器Oracl20、e服務器備份服務器VERITAS服務器光纖交換機IBM光纖交換機盤陣IBM盤陣帶庫IBM帶庫4、故障種類及解決方法(1)主機無法登錄a、現象描述telnet、控制臺均無法登錄主機,通過切換交換機接口測試,已排除交換機接口故障。b、故障分析可能是由于操作系統損壞或硬件故障等。c、應急措施先重啟服務器。若服務器無法正常重啟,應立即與應急技術支持小組、服務器供應商聯系,分析故障原因。(五)系統軟件故障應急預案1、工作目標在最短時間內恢復生產運行。2、工作程序(1)當系統軟件出現性能異常或故障時,網上銀行托管系統監控平臺會自動報警。值守人員在接到報警后,應立即聯系應急處理小組;(2)應急處理小組立即趕21、赴現場,并與系統軟件技術支持人員取得聯系,進行故障分析排查,并提出解決方案;(3)如果超過2小時仍無法恢復生產,則由應急處理小組提交申請,啟用災備系統接管生產服務;(4)生產系統恢復后,應急處理小組應組織相關人員校驗數據完整性,校驗通過后,將應用切換至生產系統;(5)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(6)根據本次事故情況,應急處理小組對應急預案進行評估與優化。3、系統組成設備名稱系統軟件個人網上銀行WebServerLinux RedHat AS4企業網上銀行WebServerLinux RedHat AS4內管WebServerLinux RedH22、at AS4Ra服務器Linux RedHat AS4Weblogic服務器AIX .0Oracle服務器AIX .0VERITAS服務器Windows 2003 Server4、故障種類及解決方法系統軟件主要故障種類為:CPU利用率異常、內存異常、IO異常、磁盤空間不足等。(六)應用軟件故障應急預案1、工作目標在最短時間內恢復生產運行。2、工作程序(1)當應用軟件出現性能異常或故障時,網上銀行托管系統監控平臺會自動報警。值守人員在接到報警后,應立即聯系應急處理小組;(2)應急處理小組立即趕赴現場,并與應用軟件廠商技術支持人員及#開發部、技術部取得聯系,分析排查故障原因,并提出解決方案;(3)23、如果超過2小時仍無法恢復生產,則由應急處理小組提交申請,啟用災備系統接管生產服務;(4)生產系統恢復后,應急處理小組應組織相關人員校驗數據完整性,校驗通過后,將應用切換至生產系統;(5)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(6)根據本次事故情況,應急處理小組對應急預案進行評估與優化。3、系統組成軟件種類軟件組成網上銀行托管服務平臺生產系統個人網上銀行WebServer企業網上銀行WebServer內管WebServer個人網上銀行AppServer企業網上銀行AppServer內管AppServerWeblogic管理服務器數據庫Ra系統Ra AppSe24、rverVeritasVeritas服務器4、故障種類及解決方法數據庫異常包括:歸檔日志空間不足、數據庫對象失效、數據庫無法連接、數據庫性能異常等。中間件異常包括:托管服務器無法連接、管理服務器無法連接、內存溢出、RA服務器異常等。網上銀行托管服務平臺異常包括:系統登錄異常、數據異常等。(七)病毒感染應急預案1、工作目標在最短時間內恢復生產系統運行。2、工作程序(1)當值守人員發現病毒警報時,應立即向應急處理小組報告;(2)應急處理小組立即趕赴現場,并隔離染毒的主機和網絡,使用備份機替換染毒的主機;(3)對染毒的主機及網絡查殺病毒;(4)應急處理小組提交“應急事件處理報告”,通過審核后,將相關25、信息錄入知識庫系統;(5)根據本次事故情況,應急處理小組對應急預案進行評估與優化。(八)非法入侵應急預案1、工作目標消除造成的威脅,避免和減少損失,并優化入侵檢測及攔截策略。2、工作程序(1)發現非法入侵后,應立即向應急處理小組報告;(2)應急處理小組根據當前的入侵檢測情況,估計可能的損失,判斷是否需要將系統離線,同時聯系技術支持小組、安全產品廠商及安全技術顧問。(3)分析入侵威脅的來源和方式,由技術支持小組、安全產品廠商、安全技術顧問等相關人員協同確定解決方案并實施。(4)應急處理小組提交“應急事件處理報告”,通過審核后,將相關信息錄入知識庫系統;(5)根據本次事故情況,應急處理小組對應急預26、案進行評估與優化。五、應急測試與演練通過合理、完善的測試,可及時發現應急預案存在的不足,并作相應優化。同時,為確保出現緊急事件時,各小組成員能高效、準確地按應急預案處理事件,需定期作應急演練。(一)應急測試1、測試內容(1)應急處理團隊各小組間配合協調情況;(2)故障解決方案的準確性;(3)生產系統恢復后,檢驗數據的正確性和運行效率;(4)災備系統接管后,檢驗數據的正確性與運行效率;(5)與各會員行間的協調情況;(6)外部資源的協調情況。2、測試流程(1)應急處理小組制定測試計劃,提交信息安全管理委員會審核。測試計劃應涵蓋應急預案中涉及到的各項內容;(2)各小組按照測試計劃作測試與演練,并提交測試演練報告;(3)根據測試演練報告,各小組評估應急預案存在的問題,由應急處理小組作相應優化。(二)應急演練1、模擬演練模擬演練在虛擬環境及測試環境進行。通過模擬演練,可以最大程度測試各災難場景的應急預案實施過程。模擬演練時,應根據實際情況設定場景,并由各小組按照應急預案,在虛擬環境及測試環境作仿真演習。模擬演練每年至少進行一次。2、實戰演練實戰演練目的在于在生產系統上測試系統的容災能力及災備切換能力。實戰演練前,必須充分評估風險,以保證不影響系統的正常運行。六、培訓為使應急處理小組各成員充分掌握業務持續性計劃及應急預案,保證應急預案順利執行,每年至少作一次培訓。