昆山塑膠公司突發事件應急響應預案(15頁).docx
下載文檔
上傳人:奈何
編號:568315
2022-09-02
14頁
171.34KB
1、應急響應管理程序1.目標為規范應急管理工作,建立健全應急機制,提高應對和防范風險與事故的能力,確保在事故發生后能迅速、有序地控制和處理事故,最大限度地減少事故所造成的損失和環境影響并將其控制在預期的、可接受的目標內,結合公司實際情況,特制定本制度。2.適用范圍突發事件包括通信線路和設備故障、主機(服務器)、存儲系統、網絡設備(各類網絡交換機、路由器、防火墻等)、電源故障運行中斷;重要系統資料、應用數據損壞貨丟失,或重要信息系統數據損壞或丟失;發生計算機程序、系統參數和數據被刪除等信息攻擊和破壞貨計算機病毒疫情導致信息系統不能提供正常服務;自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安2、全事件。3.要求 3.1 工作原則 預防為主:立足安全防護,加強預警,重點保護網絡設備、服務器等重要的信息系統,從預防、監控、應急處理、應急保障和防止失泄密等環節,在法律、管理、技術、人才等方面,采取多種措施,充分發揮各方面的作用,共同構筑網絡與信息安全保障體系。快速反應:在突發事件發生時,按照快速反應機制,及時獲取充分而準確的信息,跟蹤研判,果斷決策,迅速處置,最大程度地減少危害和影響。 分級負責:按照“誰主管誰負責”的原則,建立和完善運維部安全責任制及聯動工作機制。根據運維部的職能分工,各司其職,加強部門間的協調與配合,形成合力,共同履行應急處置工作的管理職責。常備不懈:加強技術儲備,規范3、應急處置措施與操作流程,定期進行預案演練,確保應急預案切實有效,實現突發事件應急處置的科學化、程序化與規范化。3.2 組織指揮機構與職責 公司成立應急協調小組(以下簡稱協調小組),應急協調小組成員由廠長、管理部主管、各車間主管組成。當發生突發事件時,管理部主管負責協調相應的各車間主管等人員成立應急事件響應小組,負責突發事件的應急處置工作。3.3 應急響應流程4.應急準備4.1 建立應急響應小組企業應急協調小組成員由廠長、管理部主管、各車間主管組成。4.2 職責劃分廠長職責:應急響應協調管理,統籌規劃管理部主管職責:應急預案的制定,負責評估應急響應的運維成本各車間主管:負責應急響應的實施,及應急4、人員能力的培訓不同的應急事件,成立專項應急小組,具體職責細化如下:1)應用系統應急小組:負責運維應用軟件發生錯誤或大面積故障時的響應;2)系統應急小組:負責對支撐應用運行的系統故障及數據庫故障的響應;3)網絡安全應急小組:負責對網絡問題及其設備發生故障的響應;4)硬件應急小組:負責對主機、存儲、外設、終端等設備發生故障時的響應;5)基礎環境應急小組:負責對電力,空調,消防等基礎類建設發生故障時的應急響應。4.3 應急處理前風險評估運維項目啟動后,應急小組應結合項目SLA要求及項目實際情況,進行風險評估,根據風險評估結果劃分應急響應事件等級,建立保障機制,建立回退機制。4.3.1風險評估根據風險5、項可能導致的應急事件劃分,設置三個關鍵指標,重要性、影響值、可能性,通過三個指標對可能導致應急事件的風險項進行分析,并最終給出風險等級。以下為主要風險評估內容:應急響應風險評估列表應急風險評估內容風險評估細項重要性風險點影響值可能性風險等級管理風險機構、制度、人員1容易因公司制度、人員問題導致項目管理風險,對公司生產經營造成損失。222日常維護1因日常操作不當造成的項目風險,對公司生產經營造成損失。322網絡脆弱性風險網絡設備脆弱性3因網絡設備脆弱造成的風險233操作系統脆弱性3因操作系統脆弱造成的風險233系統風險數據庫脆弱性3因數據庫脆弱造成的風險223網絡服務脆弱性2因網絡服務不規范、達6、不到SLA要求造成的風險222應急演練的風險應急預案及演練1因應急預案不完善、應急演練達不到預定要求的風險111(1)當發生突發事件時,管理部應做好先期應急處置工作,立即采取措施控制事態,同時向相關主管部門通報。(2)突發事件分為三級:(參見4.4)重大(級):設備在運行中出現整機系統癱瘓貨服務中斷,導致設備的基本功能不能實現或全面退化的故障;較大(級):設備在運行中出現的故障具有潛在的系統癱瘓或服務中斷的危險,并可能導致的基本功能不能實現或全面退化;一般(級):設備在運行安裝過程中,客戶對產品功能、配置等方面需要的信息和需求,對業務系統幾乎無影響。;4.6 應急預案流程圖4.7 培訓及考核47、.7.1培訓根據人事部相關規章制度中的員工培訓計劃,對應急負責人的應急能力進行相關培訓。4.7.2考核根據人事部相關規章制度中的員工績效考核中的相關能力的考核,對應急負責人員進行相關考核。5.監控預警5.1 目的為了防范突發應急事件的發生,維護系統長期高效穩定的運行,降低系統運行的風險,需要有一定的監控預警機制,防范于未然。5.2 例行監控5.2.1范圍1)應用系統煤炭運銷管理系統、煤炭物資供應管理系統、CMIS煤炭企業薪資信息管理系統、Portal門戶、財務核算子系統、資金管理子系統、人力資源管理子系統、綜合統計子系統、BQ商業智能子系統、數據管理平臺等2)支撐應用系統運行的系統軟件、工具軟8、件AIX操作系統、HACMP高可用服務、數據庫軟件服務、中間件軟件服務、備份管理軟件服務3)網絡及網絡設備交換機、路由器等網絡設備4)安全設備防火墻5)主機、存儲、外設、終端等設備IBM小型機、X86服務器、刀片服務器、磁盤陣列、NetApp存儲、臺式機、筆記本、掃描儀、打印機、復印機、傳真機、投影儀、視頻監控設備、電視電話會議設備等6)電力、空調、消防等基礎環境精密空調、UPS電源等5.2.2方法1)設立服務臺,保持監控長期健康運營2)建立知識庫,完善監控內容,保證監控工作的理論依據3)完善明確的監控制度,包括監控項目、監控時間、監控頻率、監控項目指標、監控結果反饋等4)確定監控人員及職責劃9、分運維人員可根據實際情況運用相關工具進行監控5.3 監控報告建立監控預警的記錄和報告,并根據規定完整填寫報告的內容,在應急事件發生后,監控責任人應該向應急事件響應小組提交監控報告應急事件響應責任人應對報告內容進行逐項核實,核實確認后,出具相關應急事件報告,應急事件報告應作為事件級別評估的輸入,重點時段保障需求也應作為事件級別評估的輸入。5.4 事件級別評估應急事件響應小組負責人應根據事件級別定義,初步確定應急事件所對應的事件級別,并將事件級別置于動態調整控制中。5.5 啟動應急預案組織架構下擁有建立、評審、審批應急預案的策略和程序,控制啟動預案的授權和實施。應急事件相關各方,包括服務提供商,需10、求方,廠商等,需要對應急預案達成一致。可根據先期處置要求進行應急響應預案的自動啟動,或由應急響應責任人或現場負責人啟動預案。應記錄應急響應預案啟動的過程和結果。應急事件現場負責人,應該向相關組織、單位告知預案啟動信息,內容大致如下:1)預案啟動的原因;2)事件級別;3)事件對應的預案;4)要求采取的技術應對措施或處置的目標;5)實現目標所應采取的保障措施,如人員、資金和設備等;6)對應急處置過程及結果的報告要求,如報告程序、報告內容、報告頻率等;7)信息通報的范圍和接收者。信息通報應選取適當的方式,如電話、郵件、傳真、書面文件等。所有相關利益方應對收到的通報信息進行確認和反饋。6.應急處置過程11、6.1 應急調度按照制定好的應急預案,組建應急事件響應小組,對發生的重大事故進行討論分析并制定應急處理方案,安排涉及應急響應的人員包括:運維工程師、項目經理、運維部經理、服務需求方負責人,服務廠商支撐。應急事件響應小組應結合項目SLA要求及項目實際情況,進行風險評估,并建立保障機制,建立回退機制。相關人員保證各自業務流程范圍內應急事件及時響應,保持持續跟蹤,直到應急事件結束。6.2 排查診斷流程:1)應急事件響應小組,組織相關專項應急小組成員,對現場進行故障排查;2)專項應急小組成員排查故障時,可使用各類工具,包括應用軟件、電子分析工具、知識庫等;3)專項應急小組成員在排查故障中,對于無法解決12、和確定的故障類別,需要及時聯系相關廠商,進行問題定位;4)專項應急小組成員應及時向應急事件響應負責人匯報故障排查情況、診斷信息、故障定位結果等;5)將故障排查診斷過程與結果進行整理歸納,提交服務臺;6)應急事件響應負責人應及時與相關利益方進行溝通,溝通的內容主要包括系統故障點、造成故障的原因、排查診斷狀況等;7)應急事件響應負責人應組織相關利益方對問題進行確認。6.3 處理恢復基于應急響應預案、配置管理數據庫、知識庫等進行故障處理和系統恢復,處理與恢復的原則包括:1)應在滿足事件級別處置時間要求的前提下,盡快恢復服務;2)采用的方法、手段不應造成次生、衍生事件的發生;3)必要時可啟用備品備件、13、災備系統等;4)應該對過程及結果信息進行記錄,并及時告知相關利益方;5)現場負責人應組織對處理與恢復的結果進行初步確認。6.4 事件升級6.4.1原則組織應建立、審議應急事件升級的策略和程序,以控制應急事件升級的授權和實施。當實際處置時間超過事件級別處置時間要求時,應作為事件升級的參考要素。組織應該對事件升級可能造成的影響進行評估,并在相關利益方之間達成一致。升級內容應包含預案調整、人員調整、資金調整以及設備調整。事件升級的實施授權應由現場應急事件響應小組負責人啟動。應該對事件升級的過程和結果信息進行整理與歸檔。6.4.2信息通報現場應急事件響應小組負責人應向相關利益方通報事件升級信息,內容應14、包括:1)事件升級的原因;2)事件升級后的級別;3)事件升級后與之對應的預案;4)對升級事件處置過程及結果的報告要求,如:報告程序、報告對象、報告內容、報告頻率等;5)信息通報的范圍和涉及的接收者。信息通報應選擇適當的方式,如電話、郵件、傳真、書面文件等形式。6.5 應急事件關閉6.5.1申請與核實組織應建立、審議事件關閉的策略和程序,以控制事件關閉的授權和實施。應該對應急事件處置的過程文檔進行整理。事件關閉申請應由相關的專項應急小組負責人提出,并提交相關文檔資料。事件關閉申請和文檔資料,應作為事件關閉核實的參考要素。現場應急事件響應小組負責人接到事件關閉申請后,應逐項核實報告內容,以判別應急15、事件處置過程和結果信息是否屬實。6.5.2關閉信息通報組織應建立、審議應急事件關閉信息通報制度。現場應急事件響應小組負責人應向相關利益方通報事件關閉信息,并將應急事件發生的原因、處置過程和方法應記入知識庫,事件關閉信息內容應包括:1)事件發生的原因、事件級別及影響范圍;2)事件對應的預案;3)事件的處置過程和方法;4)事件的調整升級情況(沒有則不填);5)持續性服務情況;6)事件處置評價;7)事件關閉申請的處理意見;8)關閉通報的范圍和涉及接收者。6.6 流程6.6.1應急響應流程1)項目經理接到用戶應急服務請求;2)根據應急預案,組建應急事件響應小組。客戶單位負責人配合處理,服務臺做好故障跟16、蹤并向用戶匯報;3)應急事件響應小組判斷事件是否可以獨立處理。如果不能獨立處理,協調廠家工程師診斷故障,廠商需要給出可行的應急預案并做好技術支撐;如果能獨立完成,則啟動應急預案;4)用戶審批我方的應急預案;5)我方實施應急預案,解決故障;6)用戶確認故障處理結果;7)拿到用戶反饋的故障處理結果,將處理結果返回服務臺;8)服務臺回訪用戶應急故障處理情況,并將反饋結果告知項目經理;9)根據客戶的反饋,完善優化應急預案。7.優化改進針對應急響應事件準備階段、監控階段、處置階段的不同工作內容,總結整個應急響應過程中的不足和在實際操作中暴露出的缺點,以及現場處理中應該改進及優化的地方,提出明確且有針對性17、的改進意見,具體可從以下幾方面入手進行優化改進:1)應急準備階段的工作是否完善,包括應急小組的成立和分工是否明確,小組在實際應急過程中的作用是否清晰可靠,職責劃分是否沒有異議且不重復,確保小組行動的高效性;2)應急準備階段,風險評估是否合理,是否能夠真實體現應急事件的情況和存在風險隱患的情況;3)應急事件等級劃分時應該涵蓋所有已知事件和未知但可能發生的事件的等級劃分定義,并且在實際應急事件中,對應事件的等級分值與事件實際級別相一致;4)在實際處理完應急響應事件后,應該就應急預案在實際情況中的表現,優點與不足之處,在事件結束后進行總結,結果作為優化預案的考量;5)對于應急事件的發生,是無可避免的,不過在應急事件發生后,可總結在例行監控中的不完善項,進行優化改進,從根源上降低應急事件的發生率;6)總結應急處置階段,應急調度是否具有及時性和高效性,對于制度的影響導致事件響應延后的情況進行優化改進;7)對于應急處置過程中,涉及具體排查診斷技術、處理恢復技術的情況,要求相關運維人員,對于實際操練過程中,多進行練習和摸索,在真實應急響應事件中,總結相關經驗和不足,優化運維人員的技術級別和現場處理問題的準確性、高效性。對于關閉階段的應急事件,由服務臺記錄,相關人員進行歸納總結,完善過程中的細節,改進流程管控中的不足之處。