2014年春節(jié),隨著華為IT容災(zāi)現(xiàn)場(chǎng)指揮的一聲令下,華為開始了數(shù)據(jù)中心帶業(yè)務(wù)容災(zāi)演練,將500多個(gè)IT系統(tǒng)從深圳總部數(shù)據(jù)中心切換到南京容災(zāi)中心,并在南京支撐全球業(yè)務(wù)正常運(yùn)行一天后,回切至深圳數(shù)據(jù)中心。
從結(jié)果看來(lái),演練切換和回切堪稱完美,這一過(guò)程中,沒(méi)有任何數(shù)據(jù)丟失和不一致。數(shù)據(jù)中心關(guān)鍵系統(tǒng)的切換和回切均在2小時(shí)內(nèi)完成,其余系統(tǒng)4小時(shí)內(nèi)全部完成。
華為數(shù)據(jù)中心帶業(yè)務(wù)容災(zāi)演練實(shí)施過(guò)程圖
據(jù)悉,在容災(zāi)中心運(yùn)行期間,有近2500人正常使用ERP等相關(guān)系統(tǒng),近13萬(wàn)人次訪問(wèn)企業(yè)BG官網(wǎng),有效支撐了業(yè)務(wù)連續(xù)性運(yùn)作。
這是一次很有挑戰(zhàn)的容災(zāi)演練。據(jù)華為企業(yè)業(yè)務(wù)BG規(guī)劃咨詢部部長(zhǎng)傅依林介紹,一是兩地之間的遠(yuǎn)距離,深圳數(shù)據(jù)中心和南京數(shù)據(jù)中心相距1300多公里;二是環(huán)境復(fù)雜,涉及切換的系統(tǒng)超過(guò)500多個(gè),各系統(tǒng)之間有復(fù)雜的集成關(guān)系;三是數(shù)據(jù)量巨大。
華為數(shù)據(jù)中心容災(zāi)規(guī)劃
華為從2001年開始,在數(shù)據(jù)中心與容災(zāi)的規(guī)劃、設(shè)計(jì)、建設(shè)與運(yùn)營(yíng)上積累了豐富的經(jīng)驗(yàn)。以三個(gè)階段劃分,為摸索階段、一主一備階段和未來(lái)的兩地三中心階段。
傅依林告訴記者,第一階段從2001年開始,華為在北京建立ERP等關(guān)鍵系統(tǒng)的數(shù)據(jù)容災(zāi),2005年建立關(guān)鍵系統(tǒng)的同城同步容災(zāi),2008年實(shí)現(xiàn)國(guó)內(nèi)外研究所重要研發(fā)數(shù)據(jù)異地容災(zāi)。第二階段進(jìn)行了系統(tǒng)性的規(guī)劃和設(shè)計(jì),2009年結(jié)合業(yè)界最佳實(shí)踐,華為發(fā)布了完整的容災(zāi)管理體系。2010年啟用南京容災(zāi)中心并整合容災(zāi)為異地互備模式,建立專業(yè)容災(zāi)運(yùn)維組織。2011年開始,陸續(xù)實(shí)施了多項(xiàng)容災(zāi)演練,包括PDM單系統(tǒng)帶業(yè)務(wù)容災(zāi)演練、LTC流程端到端集成容災(zāi)演練、數(shù)據(jù)中心集成功能演練和最近的數(shù)據(jù)中心異地帶業(yè)務(wù)容災(zāi)演練。
未來(lái)的容災(zāi)模式是兩地三中心,按照華為規(guī)劃,華為將建成兩地三中心容災(zāi)架構(gòu),實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)同城雙活容災(zāi)。傅依林介紹說(shuō),“深圳的數(shù)據(jù)中心是4000多平,往未來(lái)看,目前數(shù)據(jù)中心的容量是不能滿足未來(lái)10-15年的業(yè)務(wù)發(fā)展的。”
未來(lái)10-15年,隨著業(yè)務(wù)的發(fā)展,華為企業(yè)數(shù)據(jù)中心面積將需要達(dá)到10000平米。“目前,新數(shù)據(jù)中心已經(jīng)完成設(shè)計(jì)并開工建設(shè),預(yù)計(jì)在2016年7月投入使用。”
同時(shí),在松山湖華為另有一個(gè)1200平米的數(shù)據(jù)中心,以后作為同城的容災(zāi)中心。“因?yàn)楫惖氐娜轂?zāi)中心恢復(fù)的時(shí)間相對(duì)長(zhǎng)一些,主數(shù)據(jù)中心一旦出現(xiàn)問(wèn)題,可以在2小時(shí)內(nèi)借助同城容災(zāi)快速恢復(fù)關(guān)鍵業(yè)務(wù)。目標(biāo)實(shí)現(xiàn)同城雙活的‘零數(shù)據(jù)丟失’、‘業(yè)務(wù)無(wú)感知切換’。”傅依林說(shuō)。
南京依然作為異地容災(zāi)中心,整體看來(lái),華為兩地三中心的模式已經(jīng)完成了架構(gòu)設(shè)計(jì),并構(gòu)成了容災(zāi)路線圖。
華為容災(zāi)能力
對(duì)華為來(lái)說(shuō),IT容災(zāi)是公司業(yè)務(wù)持續(xù)運(yùn)行的基礎(chǔ)性保障,對(duì)內(nèi)支撐企業(yè)的長(zhǎng)期發(fā)展,對(duì)外支撐企業(yè)的社會(huì)責(zé)任以及客戶與行業(yè)的認(rèn)證要求。華為目前有15萬(wàn)員工,分布全球150個(gè)國(guó)家,700多個(gè)辦公地點(diǎn),共有16個(gè)研究所。保證業(yè)務(wù)的連續(xù)性,要求IT系統(tǒng)的高可用,是業(yè)務(wù)運(yùn)作與發(fā)展的首要內(nèi)在要求。
“另外,華為跟很多跨國(guó)的運(yùn)營(yíng)商打交道,例如BT、Vodafone等,他們對(duì)業(yè)務(wù)的連續(xù)性有很高要求,會(huì)到華為來(lái)認(rèn)證具不具備這種容災(zāi)能力。有了客戶要求,華為還要證明具不具備這種能力,自2005年以來(lái),華為就一直保持ISO20000、ISO 27001等有效認(rèn)證,目前正在進(jìn)行Cobit評(píng)估準(zhǔn)備等。”傅依林說(shuō)。
華為容災(zāi)以在規(guī)劃、設(shè)計(jì)、建設(shè)與運(yùn)營(yíng)方面已經(jīng)具備的全方位、端到端的數(shù)據(jù)中心與容災(zāi)能力為支撐,除了在布局、選址、性能容量、技術(shù)標(biāo)準(zhǔn)的規(guī)劃能力外,傅依林表示,在數(shù)據(jù)中心容災(zāi)系統(tǒng)設(shè)計(jì)上,華為沿公司主業(yè)務(wù)流分層分級(jí)構(gòu)建容災(zāi)環(huán)境,兼顧容災(zāi)效果與成本:劃分為公司生存攸關(guān)的為Vital級(jí)別,運(yùn)營(yíng)必須的為Critical級(jí)別,日常運(yùn)作需要的為Important級(jí)別。通過(guò)在業(yè)務(wù)上的一些重要性來(lái)確定IT系統(tǒng)的級(jí)別,從而來(lái)甄別這些IT系統(tǒng)的不同級(jí)別的容災(zāi)設(shè)計(jì)。
容災(zāi)網(wǎng)絡(luò)設(shè)計(jì)與建設(shè)是華為的強(qiáng)項(xiàng),華為在異地容災(zāi)網(wǎng)絡(luò)中,采用網(wǎng)絡(luò)高可用和網(wǎng)絡(luò)架構(gòu)雙冗余,骨干線路雙供應(yīng)商,分支機(jī)構(gòu)同時(shí)接入深圳數(shù)據(jù)中心和南京容災(zāi)中心。保證5級(jí)QoS,實(shí)現(xiàn)重點(diǎn)業(yè)務(wù)重點(diǎn)保障。同時(shí)讓容災(zāi)中心應(yīng)用的防火墻策略與生產(chǎn)環(huán)境一致,確保容災(zāi)中心應(yīng)用實(shí)時(shí)可用。
在運(yùn)營(yíng)上,“華為數(shù)據(jù)中心運(yùn)行管理瞄準(zhǔn)國(guó)際標(biāo)準(zhǔn)和最佳實(shí)踐,流程成熟度達(dá)到了持續(xù)改進(jìn)級(jí)。容災(zāi)管理完美融于與華為IT基于ITIL V3的IT運(yùn)行流程管理框架。”傅依林說(shuō)。
基于這一系列能力,即使面臨眾多挑戰(zhàn)下,華為如期完成數(shù)據(jù)中心容災(zāi)演練。傅依林強(qiáng)調(diào),“容災(zāi)演練成功本身就標(biāo)志著華為容災(zāi)能力得到驗(yàn)證,作為一個(gè)全球化運(yùn)作的企業(yè),這樣的成功案例本身就是一個(gè)很好的信息化建設(shè)樣板品,也對(duì)其他大型企業(yè)起到借鑒意義。”