作為人工智能的“發(fā)動機(jī)”和核心驅(qū)動力,算力逐漸成為稀缺資源和競爭新高地,實現(xiàn)AI算力的高效利用與精準(zhǔn)調(diào)配成為亟待解決的問題。
“在AI大模型迅速發(fā)展的今天,算力成為了不可或缺的血液?!痹?025全球數(shù)字經(jīng)濟(jì)大會數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)國際交流合作體驗區(qū),北京超級云計算中心(以下簡稱“北京超算”)CTO甄亞楠在接受記者采訪時表示,在破解算力“供不上、用不起”問題上,北京超算目前正在為用戶精準(zhǔn)匹配算力資源,構(gòu)建更加開放、高效和靈活的算力平臺及生態(tài)系統(tǒng),讓算力資源的獲取、調(diào)度和使用變得更加容易,從而高效破解部分算力難題。
智能調(diào)度,讓算力資源利用最大化
大模型訓(xùn)練作為典型的大規(guī)模超算應(yīng)用,具有異構(gòu)計算、大規(guī)模并行計算等典型超算應(yīng)用特征,在當(dāng)下大模型訓(xùn)練算力需求爆發(fā)的時代,如何實現(xiàn)算力資源的最大化利用,成為關(guān)鍵問題。
圖:北京超級云計算中心展臺
甄亞楠介紹,北京超算推出按需構(gòu)建算力資源的創(chuàng)新模式,旨在通過算力租賃,讓用戶依據(jù)業(yè)務(wù)需求獲取彈性的計算資源,實現(xiàn)大規(guī)模的計算任務(wù)。
“用戶只需支付實際使用所需的計算量與計算時間,大幅降低運營成本,適用于各種大規(guī)模計算需求的場景。此外,還能夠在用戶業(yè)務(wù)運行中提升利用效率?!彼f。
甄亞楠隨即舉了一個典型案例:“某14B參數(shù)的模型優(yōu)化前GPU利用率只有75%,經(jīng)過我們的計算負(fù)載優(yōu)化后,GPU利用率提升到97%,整體性能提升了30%。”
同時,為了讓算力資源利用率實現(xiàn)最大化,北京超算采用超算架構(gòu)模式構(gòu)建智算資源,將分布在國內(nèi)的各大算力中心的資源加以整合,并利用成熟的算力網(wǎng)絡(luò)進(jìn)行調(diào)度,以滿足大規(guī)模訓(xùn)練所需的海量算力需求。例如,在與某科研機(jī)構(gòu)的合作中,通過整合資源,成功將大模型訓(xùn)練時間從原本的數(shù)月縮短至數(shù)周,切實地幫助用戶降本增效。
精準(zhǔn)選型,讓算力更好用
通過算力預(yù)測判斷用戶真正所需的算力資源,北京超算基于應(yīng)用運行特征分析進(jìn)行算力選型,幫助用戶適配更高性價比的算力資源。那么,如何讓算力更好用?
圖:北京超算CTO甄亞楠報告
“我們?yōu)橛脩籼峁┑牟⒎菃我患夹g(shù)、單一資源,而是一套滿足用戶綜合發(fā)展需求的行業(yè)解決方案?!闭鐏嗛嘎叮本┏憔邆淙f卡集群工程化能力,同時擁有長達(dá)14年的專業(yè)服務(wù)經(jīng)驗,有力保障大模型訓(xùn)練、推理業(yè)務(wù)的開展,實現(xiàn)算力資源從可用到好用再到降本。
舉個例子:北京智源人工智能研究院(以下簡稱“智源研究院”)推出的“悟界”系列大模型,多模態(tài)架構(gòu)突破數(shù)字物理邊界,引發(fā)全球關(guān)注。
這背后,北京超算出了“一份力”。
進(jìn)行大模型研究工作,智源研究院迫切需要大量的GPU算力資源進(jìn)行模型訓(xùn)練,十分關(guān)注模型訓(xùn)練的時間和執(zhí)行效率。
基于算力網(wǎng)絡(luò)服務(wù),北京超算AI智算云服務(wù)在短期內(nèi)快速為智源提供了基于“超算架構(gòu)”的A100算力資源,同時提供了基礎(chǔ)環(huán)境構(gòu)建、模型部署、應(yīng)用運行特征性能分析、7×24小時技術(shù)服務(wù)支持保障等服務(wù),通過“算力+大模型+技術(shù)服務(wù)”的結(jié)合,為智源打造了高效、穩(wěn)定的智算云算力底座。
無獨有偶。清華大學(xué)計算機(jī)系自然語言處理實驗室的大模型課題組急需使用上百塊高端GPU加速卡進(jìn)行大語言模型訓(xùn)練。但受限于供給關(guān)系影響,課題組在短期內(nèi)很難獲得足夠數(shù)量的高端GPU算力。
為此,該實驗室與北京超算展開深度合作。北京超算提供了上百塊A100 GPU的共享算力資源,有力支持了該實驗室的大語言模型的訓(xùn)練需求。
共享算力+模型服務(wù),幫用戶節(jié)省成本
作為2025全球數(shù)字經(jīng)濟(jì)大會重要活動,“首發(fā)首秀” 聚焦新技術(shù)研發(fā)成果、新產(chǎn)品迭代升級及場景化應(yīng)用解決方案。北京超算也在現(xiàn)場發(fā)布了匯集了40多個主流大模型的MaaS平臺。
一位深入了解MaaS平臺的AI產(chǎn)業(yè)鏈企業(yè)負(fù)責(zé)人表示:“通過這個平臺就能一站式獲取所需的大模型服務(wù),隨時隨地實現(xiàn)API調(diào)用,通過共享算力與AI模型的方式,企業(yè)無需自行購置硬件和部署AI模型,只需要進(jìn)行簡單的集成與調(diào)用,從而節(jié)省大量人力成本,將大幅度縮短產(chǎn)品開發(fā)周期和市場投放時間。”
“MaaS平臺不僅集成了DeepSeek全系列模型,還整合了智譜GLM、Qwen、ERNIE-4.5等國產(chǎn)優(yōu)秀模型?!痹诒本┏鉉TO 甄亞楠看來,這種多元化的模型選擇使民營企業(yè)能夠根據(jù)自身業(yè)務(wù)需求和算力預(yù)算,靈活選用最適合的AI能力,無需從零開始訓(xùn)練大模型,大幅節(jié)省了研發(fā)投入和時間成本。
MaaS平臺強大的性能得益于背后的算力支撐體系。據(jù)悉,北京超算擁有萬卡級GPU集群,涵蓋主流加速卡和國產(chǎn)自主芯片,通過智能調(diào)度系統(tǒng)實現(xiàn)算力資源的動態(tài)分配與高效利用?!斑@種強大的算力基礎(chǔ)設(shè)施,可以保證企業(yè)在進(jìn)行大規(guī)模模型訓(xùn)練或復(fù)雜推理任務(wù)時,也能獲得穩(wěn)定、高性能的計算支持?!闭鐏嗛岬?。
“算力如同基石般支撐著人工智能不斷前進(jìn)?!闭鐏嗛f。
據(jù)悉,北京超算成立于2011年,是由北京市政府主導(dǎo)、院市共建的北京超級云計算和國家重要信息化基礎(chǔ)平臺。目前已累計服務(wù)超過1000家科研機(jī)構(gòu)、高校及企業(yè)。
2020年至2024年,北京超算連續(xù)5年榮獲中國HPC TOP100“通用CPU算力性能第一名”;2023年6月,入選成為《北京市人工智能產(chǎn)業(yè)創(chuàng)新合作伙伴計劃》首批算力伙伴。2024年榮獲世界人工智能算力性能AIPerf 500大模型訓(xùn)練算力性能、AI推理延遲性能雙榜單第一。
目前,北京超算已與智源研究院、智譜AI、瀾舟科技、中科聞歌、深勢科技等模型伙伴等達(dá)成了算力合作,為國產(chǎn)大模型如智譜 GLM、孟子大模型等提供了算力服務(wù)支撐。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120230012 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0121673 增值電信業(yè)務(wù)經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關(guān)于我們 中宏網(wǎng)動態(tài) 廣告服務(wù) 中宏網(wǎng)版權(quán)所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.uokii.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟(jì)雜志社