攜程癱瘓12小時或損失上千萬
新京報訊 5月28日11時起,攜程官網(wǎng)及APP無法使用,直至當(dāng)天23時29分,才全面恢復(fù)正常。經(jīng)攜程技術(shù)排查,確認(rèn)此次事件是由于員工錯誤操作,刪除了生產(chǎn)服務(wù)器上的執(zhí)行代碼導(dǎo)致。 在攜程宕機之前,5月份以來,
新京報訊 5月28日11時起,攜程官網(wǎng)及APP無法使用,直至當(dāng)天23時29分,才全面恢復(fù)正常。經(jīng)攜程技術(shù)排查,確認(rèn)此次事件是由于員工錯誤操作,刪除了生產(chǎn)服務(wù)器上的執(zhí)行代碼導(dǎo)致。
在攜程宕機之前,5月份以來,已有網(wǎng)易、支付寶錢包等網(wǎng)絡(luò)服務(wù)出現(xiàn)短暫的無法正常使用的現(xiàn)象。其中,5月11日晚上8時許,網(wǎng)易突然出現(xiàn)大面積服務(wù)癱瘓問題,網(wǎng)易新聞、云音樂、易信、有道云筆記等多款移動應(yīng)用均無法正常刷新,網(wǎng)易名下的游戲也全線癱瘓,用戶長時間無法刷新和登錄。但第二天凌晨2點就已經(jīng)恢復(fù)。5月27日17時左右,支付寶錢包出現(xiàn)故障。支付寶1小時后就找到故障原因,是杭州蕭山一處光纜被挖斷。
而攜程此次宕機,從發(fā)現(xiàn)到全面修復(fù)超過了12個小時。互聯(lián)網(wǎng)企業(yè)宕機,修復(fù)時間如此長的情況,比較少見。
為什么恢復(fù)時間那么長?攜程從技術(shù)角度對新京報記者解釋道,攜程后臺是一個由SOA(面向服務(wù))架構(gòu)組成的龐大服務(wù)器集群,一個頁面背后由上千個應(yīng)用子系統(tǒng)以及上千個WebService組成,每個應(yīng)用子系統(tǒng)和每個WebService之間存在著相互調(diào)用的依賴關(guān)系。事件發(fā)生后,攜程除需要恢復(fù)生產(chǎn)服務(wù)器上的執(zhí)行代碼,還需要確保應(yīng)用子系統(tǒng)和WebService的功能正常,以及兩者間的調(diào)用關(guān)系正常執(zhí)行。這種驗證性的操作需要反復(fù)地、持續(xù)性地調(diào)試。
為杜絕此類事件的再次發(fā)生,攜程表示,已經(jīng)在系統(tǒng)上做了改進,規(guī)范并杜絕技術(shù)人員錯誤刪除生產(chǎn)服務(wù)器上代碼的操作。攜程再次保證,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損。
除了消費者,攜程自身受到的影響也非常慘重。以攜程今年第一季度財報的數(shù)據(jù)計算,凈營收23億元,28日攜程相當(dāng)于每小時損失106.5萬元的生意。以12小時計算,攜程大約少了1278萬元的業(yè)務(wù)收入。
■分析
互聯(lián)網(wǎng)脆弱企業(yè)該做什么?
不到一個月的時間里,主流互聯(lián)網(wǎng)企業(yè)中,就有網(wǎng)易、支付寶、攜程的服務(wù)器或系統(tǒng)先后“倒下”。對于互聯(lián)網(wǎng)賴以生存的網(wǎng)絡(luò)、設(shè)備、技術(shù)可能變“脆弱”的情況,企業(yè)應(yīng)該怎么做?
安天首席架構(gòu)師肖新光告訴記者,注意備份、備災(zāi)非常重要。通常來說,大的互聯(lián)網(wǎng)企業(yè)都會有比較成熟的備份機制和應(yīng)急預(yù)案等,通常可以做到小故障不影響用戶體驗(甚至讓用戶感知不到),局部故障可以快速恢復(fù)等等。
對于數(shù)據(jù),熱備份和冷備份都已經(jīng)是較為成熟的技術(shù)。通俗而言,熱備份是至少兩臺設(shè)備同時進行相同的數(shù)據(jù)操作,如果一個設(shè)備出現(xiàn)故障,可以快速切換到備用設(shè)備。冷備份是指,每隔一段時間進行一次數(shù)據(jù)復(fù)制,來確保一旦出現(xiàn)故障,至少可以恢復(fù)到接近當(dāng)前的某個時刻,但恢復(fù)需要更多時間。
技術(shù)與方法等是相對比較成熟的,但同時也要看企業(yè)對整個系統(tǒng)的設(shè)計是否得當(dāng)、投入是否足夠、管理是否有效。目前企業(yè)的相關(guān)投入更多對應(yīng)的是一些自然事故,如服務(wù)器損壞、線路中斷、包括機房遭遇水災(zāi)、火災(zāi)等,但對于惡意攻擊、內(nèi)部犯罪等防范的能力和防范投入往往還有一定欠缺。
對于重特大事故和事件(如長期策劃的蓄意入侵攻擊,特別是內(nèi)部的攻擊),從最開始的一片混亂到有效處理,可能需要更長的時間。多數(shù)企業(yè)缺少對最壞狀況的演練。同時,如果立足于防范極限情況,也需要付出更多的日常成本。
作者:趙嘉妮

責(zé)任編輯:大云網(wǎng)
免責(zé)聲明:本文僅代表作者個人觀點,與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
我要收藏
個贊
-
發(fā)電電力輔助服務(wù)營銷決策模型
2019-06-24電力輔助服務(wù)營銷 -
電力線路安全工作的組織措施和技術(shù)措施分別是什么?
-
兩會保電進行時丨陜西電力部署6項重點任務(wù)
-
發(fā)電電力輔助服務(wù)營銷決策模型
2019-06-24電力輔助服務(wù)營銷 -
繞過安卓SSL驗證證書的四種方式
-
網(wǎng)絡(luò)何以可能
2017-02-24網(wǎng)絡(luò)