您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關使用云服務器可能宕機嗎,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
很有可能會,宕機是指操作系統無法從一個嚴重系統錯誤中恢復過來,或系統硬件層面出問題,以致系統長時間無響應,而不得不重新啟動計算機的現象。它屬于云服務器運作中一種比較常見的現象,任何服務器都有可能會出現這種情況。
用戶可以通過以下操作來準確發現云服務器宕機的情況,減少誤報。
1、異常排除
排除非物理機器,將系統中暫時不關注的VM等產生的異常信息排除掉。排除非業務狀態的機器,如裝機狀態中的,包括生產中、遷移中、重裝中、銷毀中,重啟中,無管控狀態,只監控正常狀態的機器。排除非正在工作的機器,如非working狀態機器。
2、網絡干擾排除
宕機分析中,較多誤報是由于網絡問題干擾,無法準確判斷出物理機是否宕機,有可能是網絡問題。排除上網絡設備異常導致的誤報,包括機房斷網演練,小面積網絡故障,上聯網絡故障,如通過探測丟包情況,使用一些邏輯初步判斷網絡問題。
服務器本身未丟包的誤報,除了需要過濾出網絡問題,還要通過丟包數據分析,過濾掉SA誤報問題,SA異常會上報心跳異常,被誤理解為宕機。icmp及tcp丟包分析,icmp采集頻率為固定數秒,tcp采集頻率固定數秒,包括多個不同大小包(16,32,64,128,256等)的丟包情況,根據分析時間窗內兩項數據的丟包情況。
3、特殊情況干擾排除
個別云主機機房有時候會出現大面積風暴式的無故心跳異常,同時網絡ping包異常,但上聯網絡設備ping包正常,這種誤報,一般根據具體case具體進行針對性的分析。如根據監控每個機房的上報頻率,排除干擾。
4、進一步識別誤報
大部分干擾已經過濾掉,但仍有一部分誤報隱藏其中。比如心跳異常,ping異常,都合乎宕機判斷的邏輯,會導致誤判成宕機。如網卡被打爆,或者重試率高,這是業務原因導致網絡異常,但業務認為不是異常,需要排除掉。服務器并沒有掛掉,但是IO延時和資源占用率各項指標都不正常等場景。要增加uptime判斷以及帶外日志分析排查。
5、長尾再次處理
未確認的待處理的,會加入到長尾列表中,像這種分鐘級的心跳異常,ping異常,但串口日志一直正常輸出的情況,一般就是某種死機,死到連網絡都不通的場景。會觀察一段時間,一個固定時間窗內仍未恢復或重啟的話,就暫時報宕機。后期會把這種死機單獨找劃分歸類。
上述就是小編為大家分享的使用云服務器可能宕機嗎了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。