2023年8月至2024年5月,華為云GaussDB助力國家統(tǒng)計(jì)局順利完成第五次全國經(jīng)濟(jì)普查(簡稱“五經(jīng)普”)單位清查和普查登記數(shù)據(jù)采集處理工作。在此期間,全國200多萬名普查員通過手持終端設(shè)備,依托華為云GaussDB對(duì)全國范圍內(nèi)的1億多普查對(duì)象進(jìn)行普查數(shù)據(jù)采集與處理,為國家宏觀經(jīng)濟(jì)決策提供了重要基礎(chǔ)數(shù)據(jù)。
千挑萬選,落定GaussDB打造全局“一朵云”
“五經(jīng)普”是一項(xiàng)重要的國情國力調(diào)查,肩負(fù)著摸清我國經(jīng)濟(jì)家底、推動(dòng)高質(zhì)量發(fā)展的重要任務(wù)。國家統(tǒng)計(jì)局歷時(shí)三年建設(shè)的統(tǒng)計(jì)云技術(shù)平臺(tái),作為統(tǒng)計(jì)云建設(shè)工程的關(guān)鍵支撐,在統(tǒng)計(jì)數(shù)據(jù)的采集、審核、驗(yàn)收及匯總等關(guān)鍵業(yè)務(wù)場景中,首次在“五經(jīng)普”實(shí)現(xiàn)了大規(guī)模的應(yīng)用。
“五經(jīng)普”在數(shù)據(jù)采集方式上進(jìn)行了革新,通過部署在統(tǒng)計(jì)云技術(shù)平臺(tái)上的國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)采集處理系統(tǒng)直接進(jìn)行數(shù)據(jù)填報(bào),在業(yè)務(wù)高并發(fā)、海量數(shù)據(jù)處理和數(shù)據(jù)實(shí)時(shí)性、準(zhǔn)確性、一致性等方面,對(duì)應(yīng)用系統(tǒng)提出了更高要求。
作為支撐統(tǒng)計(jì)云業(yè)務(wù)運(yùn)行的重要基礎(chǔ)設(shè)施,選擇一款合適的數(shù)據(jù)庫至關(guān)重要,也并非易事。經(jīng)過深度市場調(diào)研和分析研究,華為云GaussDB在可用性、性能和遷移等方面,能夠較好地滿足國家統(tǒng)計(jì)局業(yè)務(wù)工作要求。
此外,華為公司與國家統(tǒng)計(jì)局有多年合作基礎(chǔ),華為終端、網(wǎng)絡(luò)、服務(wù)器和存儲(chǔ)產(chǎn)品已在第三次全國農(nóng)業(yè)普查、第四次全國經(jīng)濟(jì)普查、第七次全國人口普查等數(shù)據(jù)采集處理場景中得到應(yīng)用。隨著GaussDB在統(tǒng)計(jì)云工程中的成功應(yīng)用,更是實(shí)現(xiàn)了全局“一朵云”的架構(gòu),推動(dòng)了統(tǒng)計(jì)現(xiàn)代化改革發(fā)展。
“五經(jīng)普”多業(yè)務(wù)場景下細(xì)數(shù)GaussDB面臨的諸多挑戰(zhàn)
“五經(jīng)普”采集模式的創(chuàng)新與落地,離不開統(tǒng)計(jì)云技術(shù)平臺(tái)的強(qiáng)大資源支撐、多樣化的功能調(diào)用以及豐富的實(shí)踐經(jīng)驗(yàn)。其中,華為云GaussDB數(shù)據(jù)實(shí)時(shí)匯集與分析能力,更是支撐統(tǒng)計(jì)云平臺(tái)實(shí)現(xiàn)了“一網(wǎng)通辦,一云統(tǒng)管”。在“五經(jīng)普”業(yè)務(wù)保障過程中,GaussDB主要面臨兩大挑戰(zhàn):
?。ㄒ唬┎杉叻迤跇I(yè)務(wù)高并發(fā)導(dǎo)致系統(tǒng)壓力大。“五經(jīng)普”數(shù)據(jù)采集處理系統(tǒng)需確保全國200多萬普查員、168萬“一套表”單位(規(guī)模企業(yè))、26萬統(tǒng)計(jì)機(jī)構(gòu)人員用戶能夠高效、準(zhǔn)確地填報(bào)和處理1.2億普查對(duì)象的普查數(shù)據(jù)。
?。ǘ拔褰?jīng)普”業(yè)務(wù)邏輯要求在同一段時(shí)間內(nèi)完成數(shù)據(jù)的填報(bào)(寫入)和審核驗(yàn)收(讀?。┎僮?。“五經(jīng)普”普查登記數(shù)據(jù)采集時(shí)間是2024年1月1日至4月30日,在此期間,各級(jí)統(tǒng)計(jì)機(jī)構(gòu)用戶需要同步開展數(shù)據(jù)審核、驗(yàn)收和匯總。系統(tǒng)運(yùn)行時(shí),壓力主要集中在上午9點(diǎn)至12點(diǎn)和下午2點(diǎn)至5點(diǎn)。在實(shí)現(xiàn)數(shù)據(jù)的快速讀寫(業(yè)務(wù)的增刪改查SQL語句量約為每秒百萬條)的同時(shí),系統(tǒng)還需具備強(qiáng)大的數(shù)據(jù)分析能力,能夠完成上萬條數(shù)據(jù)的匯總分析任務(wù),以確保數(shù)據(jù)的實(shí)時(shí)性、準(zhǔn)確性和一致性。
華為云GaussDB提供更優(yōu)解決方案有效承載業(yè)務(wù)壓力
作為統(tǒng)計(jì)云技術(shù)平臺(tái)的有力基礎(chǔ)支撐,GaussDB通過分布式技術(shù)架構(gòu)部署與優(yōu)化策略,確保了數(shù)據(jù)采集任務(wù)的高效執(zhí)行與精確完成,為統(tǒng)計(jì)云技術(shù)平臺(tái)的穩(wěn)定運(yùn)行與高效運(yùn)作提供強(qiáng)力支持。
1. GaussDB分布式部署,頂住五經(jīng)普業(yè)務(wù)高峰壓力。
一是“五經(jīng)普”數(shù)據(jù)采集處理系統(tǒng)采用GaussDB分布式多節(jié)點(diǎn)(15節(jié)點(diǎn)),單庫容量最大支撐達(dá)到100TB,前期通過在線擴(kuò)容,實(shí)現(xiàn)對(duì)業(yè)務(wù)的最小化影響。
二是借助GaussDB分布式執(zhí)行框架,根據(jù)業(yè)務(wù)SQL生成最優(yōu)執(zhí)行計(jì)劃,并利用并行執(zhí)行等技術(shù),使得每秒事務(wù)處理數(shù)(TPS)輕松突破10萬大關(guān),顯著提升分布式執(zhí)行效率。
三是GaussDB多集群節(jié)點(diǎn)、線程池和連接池等技術(shù)能力,在高并發(fā)場景下,可實(shí)現(xiàn)毫秒級(jí)查詢響應(yīng),有效應(yīng)對(duì)業(yè)務(wù)高峰。同時(shí),針對(duì)分布式數(shù)據(jù)庫開展了一系列優(yōu)化,共包括134類慢SQL,有效地降低數(shù)據(jù)庫的運(yùn)行壓力,保障系統(tǒng)的穩(wěn)定運(yùn)行。
2. DRS數(shù)據(jù)實(shí)時(shí)同步,“兩”庫并行,保障數(shù)據(jù)高效入庫和實(shí)時(shí)分析。
華為云GaussDB采用采集庫與匯總庫分離策略,由采集庫存儲(chǔ)采集數(shù)據(jù),然后通過數(shù)據(jù)復(fù)制服務(wù)(DRS)將采集數(shù)據(jù)快捷匯聚到匯總庫,以便更加高效的執(zhí)行匯總?cè)蝿?wù)。在此過程中,DRS支持將其他數(shù)據(jù)庫遷移過來的全量數(shù)據(jù),一次性同步至GaussDB中。同時(shí),通過實(shí)時(shí)解析源庫日志,將解析到的增量數(shù)據(jù)轉(zhuǎn)換為DRS內(nèi)存存儲(chǔ)格式,達(dá)到100MB/s的數(shù)據(jù)處理速度,確保絕大多數(shù)情況下的秒級(jí)響應(yīng)時(shí)延,從而滿足業(yè)務(wù)對(duì)讀寫分離的需求。
GaussDB助力譜寫統(tǒng)計(jì)現(xiàn)代化改革新篇章
GaussDB高可用、高性能、易遷移等技術(shù)能力,保障了統(tǒng)計(jì)云圓滿完成統(tǒng)計(jì)業(yè)務(wù)工作,為上層統(tǒng)計(jì)核心業(yè)務(wù)系統(tǒng)提供合規(guī)保障,確保統(tǒng)計(jì)業(yè)務(wù)的連續(xù)性。在“五經(jīng)普”單位清查數(shù)據(jù)合并場景中,數(shù)據(jù)處理耗時(shí)從原來的18分鐘縮短至2分鐘;在“五經(jīng)普”普查登記數(shù)據(jù)采集場景中,高峰期單個(gè)節(jié)點(diǎn)的并發(fā)量突破了12000TPS,成功支撐超過30萬用戶同時(shí)在線,每秒處理業(yè)務(wù)量超過10萬筆,峰值查詢量達(dá)每秒120萬次,采集響應(yīng)時(shí)延低于20毫秒。
此外,在完成“五經(jīng)普”的數(shù)據(jù)采集任務(wù)后,GaussDB還支撐了國家統(tǒng)計(jì)局核心業(yè)務(wù)系統(tǒng)——聯(lián)網(wǎng)直報(bào)系統(tǒng),為數(shù)據(jù)的實(shí)時(shí)上報(bào)、高效處理和深度分析提供了堅(jiān)實(shí)的技術(shù)支撐。
統(tǒng)計(jì)云平臺(tái)創(chuàng)新成果在中國統(tǒng)計(jì)信息化建設(shè)史上開創(chuàng)了先河,實(shí)現(xiàn)了“多個(gè)首次”,全面承載國家統(tǒng)計(jì)局的核心業(yè)務(wù)系統(tǒng),以數(shù)字化轉(zhuǎn)型驅(qū)動(dòng)統(tǒng)計(jì)現(xiàn)代化改革。未來,華為云GaussDB將與國家統(tǒng)計(jì)局繼續(xù)攜手,共同推動(dòng)統(tǒng)計(jì)高質(zhì)量發(fā)展,以統(tǒng)計(jì)現(xiàn)代化更好服務(wù)中國式現(xiàn)代化。
“數(shù)智世界 一觸即達(dá)” 選擇華為,讓您的企業(yè)輕松數(shù)智化。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。