自古英雄難過(guò)美人關(guān)。英雄的卓越功勛在世人眼中是有目共睹的,但是惟獨(dú)過(guò)不了“美人”這一關(guān)。而如今,與此類似,、亞馬遜以及這樣的國(guó)際IT巨頭,一度是何等的威武,但是在面對(duì)“安全”這一關(guān),也顯得有些束手無(wú)策。從云計(jì)算服務(wù)誕生的那一天起,爆出一些安全事件,讓用戶本來(lái)就有些狐疑的心更加不安了。
就在上個(gè)月,云計(jì)算服務(wù)提供商Amazon(亞馬遜)公司爆出了史前最大的宕機(jī)事件。4月21日凌晨,亞馬遜公司在北弗吉尼亞州的云計(jì)算中心宕機(jī),這導(dǎo)致包括回答服務(wù)Quora、新聞服務(wù)Reddit、Hootsuite和位置跟蹤服務(wù)在內(nèi)的一些網(wǎng)站受到了影響。
這些網(wǎng)站都依靠亞馬遜的這個(gè)云計(jì)算中心提供服務(wù)。Quora網(wǎng)站周四上午和下午在英國(guó)都無(wú)法訪問(wèn)。這個(gè)網(wǎng)站完全由亞馬遜的EC2(彈性云計(jì)算)服務(wù)托管,就像FourSquare和許多其它網(wǎng)站一樣。
受到影響,Hootsuite網(wǎng)站的響應(yīng)速度很慢,而Reddit網(wǎng)站的搜索服務(wù)不能使用。Reddit網(wǎng)站稱,亞馬遜目前正出現(xiàn)服務(wù)下降的情況。亞馬遜云服務(wù)中斷持續(xù)將近4天,截止編者發(fā)稿時(shí),Hootsuite、Reddit、FourSquare、Quora等網(wǎng)站已經(jīng)基本恢復(fù)正常。
根據(jù)分析,亞馬遜的云計(jì)算狀態(tài)網(wǎng)頁(yè)目前顯示故障發(fā)生在北弗吉尼亞州的云計(jì)算中心。這個(gè)中心為許多公司提供服務(wù)。這次宕機(jī)故障發(fā)生在美國(guó)西海岸的大約凌晨1點(diǎn)40分,英國(guó)夏令時(shí)上午9點(diǎn)40分,并且從那時(shí)起一直有故障。
分析人士稱,北弗吉尼亞州云計(jì)算中心是亞馬遜經(jīng)營(yíng)的許多云計(jì)算中心之一,按照常規(guī),系統(tǒng)的設(shè)計(jì)之處應(yīng)用會(huì)考慮,一個(gè)中心宕機(jī)不會(huì)中斷其它的云計(jì)算中心,也不會(huì)影響使用那個(gè)服務(wù)的用戶。
此次,亞馬遜云計(jì)算中心沒(méi)有繞過(guò)北弗吉尼亞州云計(jì)算中心的故障把工作量轉(zhuǎn)移到許多其它的云計(jì)算中心,令人生疑。宕機(jī),這在人們預(yù)想當(dāng)中,沒(méi)有那么嚴(yán)重。最簡(jiǎn)單的,雙機(jī)熱備,一臺(tái)服務(wù)器宕機(jī),另外一臺(tái)服務(wù)器在短時(shí)間內(nèi)可以啟動(dòng),并不會(huì)影響用戶的服務(wù)。但是,亞馬遜的云計(jì)算中心這次不同,宕機(jī)影響了這么多用戶的正常云服務(wù),而且引起用戶服務(wù)中斷的,還是亞馬遜引以為傲的彈性云,這對(duì)于云計(jì)算服務(wù)商剛剛建立起來(lái)的信任,絕對(duì)是一次沉重的打擊。
經(jīng)過(guò)一番緊急的搶救,亞馬遜的云服務(wù)恢復(fù)了正常。但是,這個(gè)事件留給用戶的惡劣影響有些深遠(yuǎn),用戶大呼“傷不起”。
好在亞馬遜的態(tài)度還算坦誠(chéng)。4月30日,亞馬遜為宕機(jī)事件向用戶發(fā)表了5700多字的道歉信,聲稱亞馬遜公司已經(jīng)知道漏洞和設(shè)計(jì)缺陷所在的地方,它希望通過(guò)修復(fù)那些漏洞和缺陷提高EC2(亞馬遜ElasticComputeCloud服務(wù))的競(jìng)爭(zhēng)力。亞馬遜已經(jīng)對(duì)EC2做了一些修復(fù)和調(diào)整,并打算在未來(lái)幾周里擴(kuò)大部署,以便對(duì)所有的服務(wù)進(jìn)行改善,避免類似的事件再度出現(xiàn)。
在賠償方面,亞馬遜表示,將向在此次故障中受到影響的用戶提供10天服務(wù)的點(diǎn)數(shù)(Credit),這些點(diǎn)數(shù)將自動(dòng)充值到受影響的用戶帳號(hào)當(dāng)中。但是,對(duì)于以后如何避免出現(xiàn)類似事件,并沒(méi)有提到任何法律上的保證。
據(jù)了解,亞馬遜云服務(wù)中斷持續(xù)了近4天,但是在法律上卻沒(méi)有違反亞馬遜EC2服務(wù)的服務(wù)等級(jí)協(xié)議(簡(jiǎn)稱SLA)。亞馬遜的解釋是,亞馬遜出現(xiàn)故障的是EBS和RDS服務(wù),而不是EC2服務(wù),從法律上講,它并沒(méi)有違反服務(wù)等級(jí)協(xié)議。并且,對(duì)于亞馬遜提出的應(yīng)對(duì)宕機(jī)事件的建議——多點(diǎn)備份,僅僅是一個(gè)技術(shù)規(guī)范并非合同保障。這些,似乎都不能給云服務(wù)的用戶帶來(lái)信心。
表面看來(lái),亞馬遜宕機(jī)事件似乎有一個(gè)完美結(jié)局:廠商及時(shí)修復(fù)漏洞,書面道歉,賠償損失。但是,用戶心理上對(duì)云服務(wù)的恐懼似乎并不那么容易康復(fù),未來(lái),亞馬遜可能不僅僅要在技術(shù)上、還需要在制度和法律上給予用戶更多的保證,才能才能漸漸修復(fù)被此次宕機(jī)事件損壞的名聲。