近日,匯付天下全新規(guī)劃與設(shè)計(jì)的NOC指揮中心在公司總部大樓圓滿落成!NOC即“Network Operations Center網(wǎng)絡(luò)運(yùn)營(yíng)中心”,在匯付已成立一年半有余。它肩負(fù)著為匯付的所有客戶提供交易、賬戶、資金系統(tǒng)穩(wěn)定保障的責(zé)任,圍繞“一切以客戶為中心”的企業(yè)文化理念,以數(shù)字化工具和手段來(lái)實(shí)現(xiàn)對(duì)系統(tǒng)的監(jiān)控、運(yùn)維和技術(shù)保障。
此次全新落成的NOC指揮中心,在原有實(shí)用主義的基礎(chǔ)上,充分挖掘了空間功能和價(jià)值,并兼具了美觀度,整體以金屬風(fēng)格為主,選取了“數(shù)字方舟”作為設(shè)計(jì)的靈感來(lái)源,最終形成一個(gè)純粹的數(shù)字空間。監(jiān)控室整體分為三塊區(qū)域,后方抬高的監(jiān)控和指揮官席位構(gòu)成駕駛艙,中間工作區(qū)域常駐運(yùn)維專家,還有靈活的辦公組成席位,可以在出現(xiàn)問(wèn)題時(shí)臨時(shí)有二線專家參與。指揮席位和工作席位形成三角形的布局,也寓意系統(tǒng)的穩(wěn)定。NOC指揮中心建立了一套數(shù)字化的監(jiān)控保障平臺(tái),以實(shí)現(xiàn)運(yùn)行和運(yùn)維數(shù)據(jù)的可觀測(cè)。主屏幕主要展示匯付支付相關(guān)的核心模塊功能,如核心架構(gòu)產(chǎn)品、網(wǎng)絡(luò)流量、安全防護(hù),交易穩(wěn)定性、核心產(chǎn)品交易成功率等數(shù)據(jù),可以實(shí)時(shí)監(jiān)測(cè)核心產(chǎn)品的波動(dòng)情況。副屏幕主要展現(xiàn)的是與變更、告警相關(guān)的內(nèi)容,用來(lái)輔助工程師對(duì)異常的提醒、判斷和決策。充分利用各類監(jiān)控工具,結(jié)合AIOPS理念指導(dǎo),將各IAAS層和PAAS層的各類指標(biāo)數(shù)字化、可視化,智能發(fā)現(xiàn)、定位異常。NOC工作人員以大屏和告警為主,配合自身的小屏幕實(shí)現(xiàn)多屏聯(lián)動(dòng),協(xié)同平臺(tái)實(shí)現(xiàn)數(shù)字化運(yùn)維,來(lái)整體實(shí)現(xiàn)NOC指揮中心的目標(biāo):為客戶提供穩(wěn)定可靠的服務(wù)。
隨著公司業(yè)務(wù)類型的不斷豐富,系統(tǒng)越來(lái)越復(fù)雜,業(yè)務(wù)故障難免發(fā)生。一旦發(fā)生故障,勢(shì)必對(duì)公司產(chǎn)生巨大影響,因此,提升對(duì)故障的定位能力、處理能力及恢復(fù)能力,成為生產(chǎn)工作中最核心的目標(biāo)。隨著公司業(yè)務(wù)進(jìn)入數(shù)字化轉(zhuǎn)型升級(jí)之中,同步完成數(shù)字化安全生產(chǎn)體系的建設(shè),也顯得尤為重要。
匯付的NOC指揮中心主要負(fù)責(zé)全局性應(yīng)急決策與指揮,對(duì)各業(yè)務(wù)提供及時(shí)準(zhǔn)確的告警、生產(chǎn)故障的全生命周期管理、重大故障時(shí)的快速切換以及線上問(wèn)題的升級(jí)支持,以有效縮短系統(tǒng)故障時(shí)長(zhǎng)和提升用戶體驗(yàn)。具體來(lái)說(shuō),它具備如下幾方面能力:
完善的監(jiān)控能力。NOC監(jiān)控體系包含IAAS、PAAS和SAAS的全方位監(jiān)控,各類監(jiān)控?cái)?shù)據(jù)可通過(guò)可視化和自動(dòng)化報(bào)警,能及時(shí)發(fā)現(xiàn)和快速定位問(wèn)題。
應(yīng)急處理能力。設(shè)立NOC指揮中心后,監(jiān)控大屏?xí)?shí)時(shí)展示基礎(chǔ)架構(gòu)和業(yè)務(wù)數(shù)據(jù),通過(guò)多維度監(jiān)控分析系統(tǒng)穩(wěn)定性。
建立指揮官應(yīng)急機(jī)制,結(jié)合OnCall值班制度,可7*24小時(shí)應(yīng)對(duì)異常突發(fā)情況。在異常發(fā)生后第一時(shí)間組建應(yīng)急處置小組介進(jìn)行處理,并及時(shí)發(fā)布故障處置過(guò)程和進(jìn)展情況。
不斷完善的應(yīng)急預(yù)案,提升了NOC的應(yīng)急切換能力。通過(guò)切換、降級(jí)、熔斷等各類手段進(jìn)行故障快速恢復(fù),縮短MTTR時(shí)長(zhǎng)。
重大業(yè)務(wù)和活動(dòng)保障能力。NOC中心具備活動(dòng)報(bào)備機(jī)制,能提前進(jìn)行容量評(píng)估與投入,確保生產(chǎn)活動(dòng)安全穩(wěn)定,并針對(duì)業(yè)務(wù)特點(diǎn)配置定制化的監(jiān)控大盤(pán)和進(jìn)行報(bào)警。
接下來(lái),通過(guò)NOC中心提供的能力建設(shè),將有效提高公司應(yīng)對(duì)故障的處置效率,確保系統(tǒng)穩(wěn)定性,最大程度地預(yù)防和減少故障時(shí)長(zhǎng)和損失,保障業(yè)務(wù)連續(xù)性,促進(jìn)業(yè)務(wù)發(fā)展。NOC團(tuán)隊(duì)也將對(duì)生產(chǎn)故障從被動(dòng)應(yīng)付型向主動(dòng)保障型、從傳統(tǒng)經(jīng)驗(yàn)型向高新技術(shù)型轉(zhuǎn)變,促進(jìn)匯付應(yīng)急體系健全發(fā)展、技術(shù)創(chuàng)新和迭代并行,全面提升故障應(yīng)急管理水平。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。