係統粉 > IT資訊 > 微軟資訊

過去一年Azure三次嚴重宕機,微軟終於坐不住了

發布時間:2019-07-17    瀏覽數:

在互聯網時代的下半場,隨著大眾對雲服務需求的加強,雲服務也扮演著越來越重要的角色。然而,自互聯網誕生以來,網絡安全隱患一直都在,雲服務也不例外。頻發的宕機事件,讓許多企業的數據、交易和服務都受到了嚴重影響,帶來的損失無法估算。有人說,在這個時代,一家公司的雲端數據丟失基本等於倒閉。

對此,各大廠商都會在提供雲服務時都著力宣揚自己的安全性,如今微軟公司(Microsoft Corp.)表示,微軟正在采取各種措施,將Azure的可靠性在此前透露的99.995%的平均時間運行水平上再做進一步的提高。

過去一年Azure三次嚴重宕機,微軟終於坐不住了(1)


在今天的一篇博客中,其首席技術官Mark Russinovich指出Azure的可用性是如何受到過去12個月裏“三次獨特而重要的事件”的影響。

這些問題包括2018年9月美國中南部地區的數據中心停電;2018年11月背靠背Azure Active Directory多重身份驗證問題以及今年5月的DNS維護問題。(ps:這並沒有囊括過去一年Azure出現過的所有問題。在過去的12個月中,還有一些與Azure相關的事故發生,例如1月份的那次中斷。)

Russinovich說微軟在他的CTO辦公室創建了一個新的質量工程團隊。將與其網站可靠性工程(SRE)團隊合作,尋找使Azure更加可靠的新方法。Russinovich還表示,微軟正在開展其他一些旨在提高微軟雲服務彈性的舉措。

例如,該公司計劃到2021年在目前沒有可用性區域的10個最大的Azure區域中添加新的可用性區域。


過去一年Azure三次嚴重宕機,微軟終於坐不住了(2)



Russinovich說,最大的10個Azure區域已經有了可用性區域,這有助於防止數據中心級的故障。每個區域都位於Azure區域內,擁有自己獨立的電源、網絡和冷卻基礎設施。該公司還在擴展其安全部署實踐框架,該框架確保Azure中的所有代碼和配置更改必須通過一組嚴格的測試,然後才能推廣到不同的地區。該框架將被擴展,包括Azure中所有軟件定義的基礎設施更改,包括對其網絡和DNS基礎設施的更改。微軟還推出了預覽版,用戶可以在存儲層啟動自己的故障轉移,這是2018年9月美國中南部數據中心宕機的直接結果。

據悉,故障轉移是一種保護計算機係統不受故障影響的方法,當主係統發生故障時,備用設備自動接管。

Russinovich說:“因為我們的政策是優先考慮數據保留,而不是恢複時間,所以我們選擇忍受更長時間的停機,以確保我們能夠成功地恢複所有客戶數據。”“你們中的一些人告訴我們,希望為自己的組織提供更大的靈活性,因此我們通過預覽在存儲帳戶級別啟動自己的故障轉移的能力來增強客戶的能力。”CTO還討論了微軟的Project Tardigrade,這是一個即將推出的服務,旨在在硬件故障和內存泄漏發生之前檢測它們,並凍結受影響的虛擬機,以便將它們轉移到其他主機。

上一篇:微軟用量子計算讓腫瘤檢測快30%,精度提高25% 下一篇:Win10最沒用功能終於獨立:用戶爽翻

相關資訊

最新熱門應用

電腦問答