公司數據庫系統修改維護制度及實現方法.doc
下載文檔
上傳人:職z****i
編號:1118525
2024-09-07
5頁
35.07KB
1、公司數據庫系統修改維護制度及實現方法編 制: 審 核: 批 準: 版 本 號: ESZAQDGF001 編 制: 審 核: 批 準: 版 本 號: 數據庫系統管理制度 第一章 總 則 第一條 為加強我司數據庫管理,保障數據庫正常、有效運行,確保數據庫安全,使數據庫能更好地服務于生產,特制定本管理制度。 第二條 公司數據庫管理員負責評級數據庫的日常維護和運行管理。 第三條 公司IT總監負責對數據庫使用者進行權限審批。第二章 數據庫系統的修改和維護第一條 數據庫系統的變更,指數據庫硬件或參數調整等;涉及到停機時,應征求業務部門對系統使用,并根據實際情況由部門負責人確定并發布停機時間后,在停機時間范2、圍內完成相關操作,同時數據庫管理人員應該評估風險后,再操作,并有相應的應急處理方案。第二條 數據庫業務數據的變更修改,指開發部門或業務部門關于數據庫業務表數據的變更修改;應由開發部門提供具體表和字段,或要求開發部門提供腳本,由數據庫管理人員執行操作;并且修改前先進行數據備份。第三條 數據庫系統的監控,應實時了解數據庫運行狀態,確保數據庫可用狀態。第四條 數據庫系統的健康檢查,應定期對數據庫的響應指標巡檢。并給出巡檢的報告。健康檢查應當定期執行,每周進行一次健康檢查。第五條 數據的備份恢復,備份的主要目的就是為了恢復,所以在一段時期應當數據庫進行恢復演練,以防止意外發生時數據不能恢復而造成損失。3、恢復演練應盡量避開數據庫生產環境,以免影響生產的運行。恢復演練應當定期執行,以季度為單位,每季度至少演練一次。第六條 數據庫故障處理,數據庫系統中常見的四種故障主要有事務內部的故障、系統故障、介質故障以及計算機病毒故障,對應于每種故障都有不同的解決方法。第三章 數據庫的安全管理 第一條 數據庫管理員負責數據庫系統的安全管理,保證安全管理軟件的及時升級。 第二條 數據庫應每周至少備份一次,數據庫管理員應在保證數據安全和保密的情況下,采取適當方式保存備份文件,保證數據庫出現異常時能快速恢復,避免或盡量減少數據丟失。 數據庫系統管理制度的實現方法第一條 數據庫變更l 數據庫系統變更 變更管理流程分為4、:需求調研、需求評審、變更申請、變更方案、變更審批、執行變更六個步驟:執行變更需求調研變更審批需求評審變更方案變更申請數據庫的調整應針對問題先進行調研評審,再定制變更方案及實施計劃回退方案后再進行實施。1需求調研:由數據庫管理員根據數據庫運行監控過程中發現的問題進行調研,確定問題解決方案。2需求評審:由數據庫管理員組織調研,由部門經理確定后,完成對變更需求的分析評審。3變更申請:由數據庫管理員根據變更需求,給出初步的方案建議。4變更方案:由部門負責人確定變更評審小組成員,評審中修改并確定變更的實施方案及應急回退方案。5變更審批:小型變更由部門負責人審批,大、中型變更由部門審批。6執行變更:由數5、據庫管理運維團隊執行系統變更的具體實現工作。l 業務表數據變更變更執行變更審批變更申請業務數據變更應由需求部門郵件申請,并由部門負責人進行審批后進行變更。1變更申請:由需求部門提出申請。2變更審批:由需求部門及運維部門負責人審批。3變更執行:確定變更需求后由數據庫管理員進行相關操作。第二條 數據庫系統的監控,應實時了解數據庫運行狀態。確保數據庫可用狀態。1) 第三方數據庫監控軟件。ZABBIX,APM2) 數據庫監控軟件。Oracle Enterprise Manager3) 手動獲取數據庫報表StatsPack、Automatic Workload Repository、Active Ses6、sion History第三條 數據庫系統的健康檢查,應定期對數據庫的響應指標巡檢。1) 數據庫管理員每天定時巡檢數據庫服務器,并填寫記錄表(見附錄一)。2) TOP前5執行慢的SQL語句進行優化跟蹤,并郵件提交給部門經理,抄送IT總監。第四條 核心數據的日常備份管理。1)數據庫應每周至少備份一次,數據庫管理員應在保證數據安全和保密的情況下,采取適當方式保存備份文件,保證數據庫出現異常時能快速恢復,避免或盡量減少數據丟失。2)為了節省磁盤空間,大型業務庫使用增量備份,周日全備,周一到六為增量備份。3)協助開發和業務部門做數據變更時,需提前備份好數據,再執行變更步驟。第五條 數據庫故障處理一、常7、見的四種故障 (1)事務內部的故障:事務內部故障可分為預期的和非預期的,其中大部分的故障都是非預期的。預期的事務內部故障是指可以通過事務程序本身發現的事務內部故障;非預期的事務內部故障是不能由事務程序處理的,如運算溢出故障、并發事務死鎖故障、違反了某些完整性限制而導致的故障等。 (2)系統故障:系統故障也稱為軟故障,是指數據庫在運行過程中,由于硬件故障、數據庫軟件及操作系統的漏洞、突然停電燈情況,導致系統停止運轉,所有正在運行的事務以非正常方式終止,需要系統重新啟動的一類故障。這類事務不破壞數據庫,但是影響正在運行的所有事務。 (3)介質故障:介質故障也稱為硬故障,主要指數據庫在運行過程中,由8、于磁頭碰撞、磁盤損壞、強磁干擾、天災人禍等情況,使得數據庫中的數據部分或全部丟失的一類故障。 (4)計算機病毒故障:計算機病毒故障是一種惡意的計算機程序,它可以像病毒一樣繁殖和傳播,在對計算機系統造成破壞的同時也可能對數據庫系統造成破壞(破壞方式以數據庫文件為主)。 二、四種故障的解決方法 (1)預期的事務內部故障:將事務回滾,撤銷對數據庫的修改。 (2)非預期的事務內部故障:強制回滾事務,在保證該事務對其他事務沒有影響的條件下,利用日志文件撤銷其對數據庫的修改。 (3)系統故障:待計算機重新啟動之后,對于未完成的事務可能寫入數據庫的內容,回滾所有未完成的事務寫的結果;對于已完成的事務可能部分9、或全部留在緩沖區的結果,需要重做所有已提交的事務(即撤銷所有未提交的事務,重做所有已提交的事務)。 (4)介質故障的軟件容錯:使用數據庫備份及事務日志文件,通過恢復技術,恢復數據庫到備份結束時的狀態。 (5)介質故障的硬件容錯:采用雙物理存儲設備,使兩個硬盤存儲內容相同,當其中一個硬盤出現故障時,及時使用另一個備份硬盤。 (6)計算機病毒故障:使用防火墻軟件防止病毒侵入,對于已感染病毒的數據庫文件,使用殺毒軟件進行查殺,如果殺毒軟件殺毒失敗,此時只能用數據庫備份文件,以軟件容錯的方式恢復數據庫文件。 這四類故障雖然有所不同,但是對數據庫的影響無外乎是對數據庫本身的破壞或對數據庫中數據的破壞,其恢復的基本原理概況起來也就是利用存儲在別處的冗余數據來重建數據庫中的數據。三、四種故障的解決流程故障處理流程分為:故障調查、回報情況和解決方法、領導審批、實施解決。實施解決領導審批回報情況和解決方法故障調查運維人員在故障發生后調查清楚故障原因,將原因和解決方法匯報上級領導,當領導批準方法可行后,立即解決所發生的故障1故障調查:運維人員調查故障。2回報情況和解決方法:將故障原因和解決方法匯報上級領導。3領導審批:取得領導對故障解決方案的同意。4實施解決:結合以上提供的方案,運維人員實施故障解決的方法。