亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Oracle_RAC宕機和hang分析處理流程

發布時間:2020-07-05 17:54:27 來源:網絡 閱讀:1494 作者:任志遠Ray 欄目:關系型數據庫

目的:分享一下公司的db故障處理流程,主要是思想。
事件描述及影響:
2018年9月30日04:43點,zabbix告警odsdb2數據庫疑似宕機,機房值班人員通過堡壘機無法登錄數據庫服務器,從其他機器也無法ssh登錄該機器,同時odsdb1數據庫也HANG住,通過命令無法登錄數據庫。根據數據庫業務流程圖初步分析影響的各業務。(涉及公司業務可忽略)

事件排查:
4:46,機房值班人員通知DBA及亦莊值班人員分析情況
4:57,按照公司流程在相關群通告故障
5:23,值班人員反應數據庫服務器已自動重啟,但一直卡在啟動界面
5:30,DBA到達現場協助問題排查
5:39,DBA發現ogg進程無法正常啟動,原因是數據庫連接進程達到上限(3000),數據庫無法連接
6:03, 數據分析室人員參與分析ODS問題,確認ods 1節點數據庫HANG住
6:56,機房值班人員嘗試手動重啟odsdb2服務器,仍然卡在啟動界面
7:40,嘗試通過封堵應用連接數據庫的端口的方式,減少應用連接數據庫的連接數
8:30,聯系HP廠商報障
9:20,kill odsdb1數據庫所有的外部連接(先保障主要業務)
9:30,對odsdb1數據庫做hang analyze,分析數據庫HANG住的原因
10:11,重啟oddsdb1數據庫實例
10:28,odsdb1恢復正常
10:30,ogg進程恢復正常
10:40,放開過封堵應用的端口

事件分析:
1、 odsdb2節點宕機重啟,且無法啟動,一直卡在啟動界面,懷疑由于數據庫硬件問題導致數據庫宕機重啟。通知服務器廠商進行報障
Oracle_RAC宕機和hang分析處理流程

2、 odsdb1數據庫HANG住無法正常提供服務,導致與ods數據庫相關的所有應用及ogg受到影響
3、 odsdb1達到設置的最大連接進程數(3000),導致數據庫無法登錄,無法分析情況。
Oracle_RAC宕機和hang分析處理流程

4、 分析哪個應用服務器連接ods數據庫,封堵其連接數據庫的端口,減少數據庫的外部連接

5、 數據庫無法登錄,需要kill odsdb1數據庫所有的外部連接后,可以登錄數據庫,但數據字典查詢緩慢,無法正常分析hang住的原因。且kill掉外部連接后,很快連接數又會漲到最大值。使用hang analyze做trace進行分析。
Oracle_RAC宕機和hang分析處理流程
通過hang analyze分析,數據庫是由于gc domain validation 及parallel recory coord wait for reply。
這兩個等待事件是數據庫節點2宕機后,節點1要接管節點2的服務,回滾節點2上未提交的數據,恢復節點2的數據時的等待事件。
Oracle_RAC宕機和hang分析處理流程
從上圖的的信息可以知道,SMON進程在進行節點2的數據恢復,但是等待了289min41sec。且該進行阻塞了1456個進程sessions,由些可以知道節點1是在恢復節點2的數據時SMON進程異常,導致數據庫1456個進程被阻塞。
查詢Oracle官方網站MOS,發現與gc domain validation相關的一些BUG
Oracle_RAC宕機和hang分析處理流程
6、 重啟數據庫,數據庫恢復正常,可以對外提供服務。進而ODS相關的應用也都恢復正常。

后續的優化方案:
1、定期對數據庫進行硬件檢查防止此類問題再次發生(節后與數據中心溝通,爭取每月做一次檢查)
2、后續增加對ODS數據庫的切換應急演練

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

锡林郭勒盟| 德保县| 长宁县| 江口县| 丰都县| 彭阳县| 大邑县| 呼玛县| 碌曲县| 安庆市| 庆阳市| 嫩江县| 万盛区| 白银市| 连州市| 洛浦县| 彩票| 长治市| 洛宁县| 九寨沟县| 元谋县| 云南省| 普格县| 博白县| 沁阳市| 电白县| 高安市| 北票市| 英吉沙县| 黔西县| 修武县| 突泉县| 阜康市| 新宾| 自治县| 石城县| 乌拉特中旗| 阜阳市| 印江| 老河口市| 临西县|