建行智慧運維了解下(一)
建行智慧運維了解下(一)
覺得幹IT運維累嗎?
技術架構日新月異,資訊系統運維規模爆炸式增長,業務需求和監管要求持續提高,每天忙得焦頭爛額,工作沒有成就感,當然很累。
覺得幹IT運維苦嗎?
鋤禾日當午,運維真辛苦,一堆告警來,一解一上午。救火、背鍋、睡不了安穩覺,工作時效性強,心裏壓力大,寶寶心裏當然苦。
覺得幹IT運維Low嗎?
運維過程充滿了大量紛繁複雜的勞動,每一次問題的分析和故障的處置都面臨著挑戰,工作疲於應付,自然也就嗨不了。
相信許多幹運維的人都面臨著這些困惑!要想破局解困,就必須從過去的被動式運維向主動型運維轉變,從操作型向管理型轉變,從技術支撐到價值輸出轉變。那到底可以幹些啥呢?
數據中心還能這麼幹,你很建行嘛!
抗擊病毒靠藥方,高效運維有秘方
2020年,突然其來的新冠肺炎疫情對許多數據中心的安全運作帶來了前所未有的挑戰,值班替換人員短缺、緊急變更越來越多、投産版本壓力巨大。但在建行,一切都顯得井然有序、應對自如:數據中心北京園區依靠一體化運維體系方便地遠端接管了武漢園區的部分工作,並利用遠端接入開展運維;利用智慧運維敏捷投産和自動部署能力僅三個月就對300多套系統投産了1000余個版本,一天就搭建了可滿足1萬多人同時線上辦公的環境;通過智慧監控和漏洞挖掘技術,對幾十套系統進行滲透測試和漏洞掃描,發現和整改了數百個各類漏洞,為集團員工在疫情發生後居家辦公創造了安全可控的環境。
如果你在系統版本投産日或銀行業務系統年終結算日看到只有幾個值班人員在氣定神閒地邊聊天邊工作,不用懷疑,這就是建行的數據中心!以往那種靠人肉運維的喧囂場面已經看不見了。運籌帷幄的背後,其實是強大的智慧運維體系支撐:以運作數據為核心構建的智慧運維體系,利用數據與技術雙輪驅動運維工作創新,讓兩地三中心人員可以更加高效地響應業務需求、快速地處置問題。舉個例子,我們通過一鍵式自動化版本部署,可以支援變更自動協同、一鍵式回退,在2020年實施的1萬多次變更中,投産日應用版本的自動化部署率超過90%,大量的變更已經無須運維人員現場值守了。
還有更多的高效運維場景正在被解鎖,智慧運維,真香!
衝鴨!我為業務瘋狂打call
以往,我們面對“雙十一”活動、紀念幣預約等業務促銷場景,拿提心吊膽來形容也不為過,但現在就踏實多了。我們在新一代系統優勢的基礎上,通過不斷打磨全鏈路容量評估能力,採取秒級資源擴容、動態流控、故障自愈等技術,提前調配資源,可以實現分鐘級動態資源池擴縮容,增強了應用性能與應急處置能力,有效保障了大促期間系統的穩定運作。就説去年的“雙十一”活動吧,11月1日,全天線上支付交易總量2億多筆,交易峰值超過1萬筆/秒,交易金額700多億元,保持了同業領先;11月11日,線上支付交易總量和交易峰值再創新高。整個活動期間,建行交易筆數及金額蟬聯四大行第一,智慧運維能力的發揮功不可沒。
説完緊張的,再聊點兒相對輕鬆的。近年來,建行數據中心用實際行動全力支援全行“三大戰略”的推進,譬如快速穩妥地實施了可視化項目和總行多功能展示中心工作,承接了“創業者港灣”發佈會、人民大學戰略合作簽約、國務院發展研究中心調研等許多重要任務,成為建行展示戰略成果的重要窗口、總行簽約儀式和發佈會等重要活動的首選場所。這不,總行的展示中心快成“網紅打卡地點”了,真是圈粉哈!
同樣,在數字化經營IT運營保障方面,數據中心作為行內金融科技的最終落地部門,通過科技能力創新確保任務有效落實。一是通過優化整合資源供給服務流程,提升資源供給的完整性及供給效率的同時大幅減少人工環節,實現了包括虛機資源、物理機、存儲資源等所有超大批量基礎設施資源的按時供給,保障“戰機群”敏捷迭代。二是通過將流程與工具全面打通,實現了端到端的自動化,投産效率成倍提升,人為操作風險大幅降低,實現了去年數字化經營1000余次高頻投産零失誤的良好紀錄。三是率先實現了毫秒級採集、1秒級運算能力,保障了數字化經營源數據到達、指標時效性分析的數據採集及監控,以及關聯上下游數千個作業的監控,使監控與預測更加精準。
智慧運維,讓運維從幹苦力變成了生産力。