雨天中,當(dāng)一輛智能網(wǎng)聯(lián)汽車駛過人車匆忙穿行、情況復(fù)雜的路口,它“看到”的不僅是自身傳感器捕捉到的模糊影像,還有“AI大腦”提供的上帝視角,實(shí)時(shí)計(jì)算著視野盲區(qū)之外的最優(yōu)通行路線和風(fēng)險(xiǎn)規(guī)避策略,此外,這個(gè)“AI大腦”還能讓城市交通管理者輕松掌握所轄區(qū)域內(nèi)的交通系統(tǒng)全局情況,做出更及時(shí)、更科學(xué)的分析預(yù)測(cè)和調(diào)控指揮。
這不是5-10年后的暢想,而是已在上海嘉定區(qū)落地的真實(shí)應(yīng)用案例,背后的技術(shù)方案來自蘑菇車聯(lián)。
近日,WAIC 2025展會(huì)期間,蘑菇車聯(lián)對(duì)外發(fā)布了首個(gè)物理世界認(rèn)知模型——MogoMind,成為本屆大會(huì)中備受關(guān)注的人工智能技術(shù)應(yīng)用之一,有趣的是,其展位與美國(guó)自動(dòng)駕駛代表特斯拉緊鄰,兩種不同的自動(dòng)駕駛發(fā)展范式交相呼應(yīng)。
進(jìn)入2025年以來,“世界模型”已成為AI頭部玩家必爭(zhēng)之地,國(guó)際廠商如英偉達(dá)、谷歌、Meta、World Labs等紛紛從不同技術(shù)維度出發(fā)大力推動(dòng)AI從數(shù)字世界向真實(shí)物理世界邁進(jìn),蘑菇車聯(lián)的MogoMind有何獨(dú)特之處?又能為行業(yè)帶來怎樣的創(chuàng)新價(jià)值?
補(bǔ)上“世界模型”的一大缺口
在發(fā)展多年的自動(dòng)駕駛領(lǐng)域,讓車輛準(zhǔn)確感知周圍環(huán)境,預(yù)測(cè)未來事件并評(píng)估其影響力對(duì)于安全性、通行效率和實(shí)時(shí)決策至關(guān)重要。
盡管隨著AI技術(shù)的發(fā)展如今的大模型都已經(jīng)非常智能,例如OpenAI的GPT
、谷歌Gemini、DeepSeek等等,一些領(lǐng)先模型在多模態(tài)分析處理方面也很強(qiáng),但它們的能力都僅限于數(shù)字世界,無法通過互聯(lián)網(wǎng)數(shù)據(jù)去預(yù)測(cè)實(shí)時(shí)變化的現(xiàn)實(shí)物理世界,在這樣的背景之下,世界模型由于其理解物理環(huán)境并具備與環(huán)境交互的能力,被視為是自動(dòng)駕駛領(lǐng)域的一種變革性方法,通過模擬人類感知和決策過程,讓車輛擁有預(yù)測(cè)和適應(yīng)動(dòng)態(tài)環(huán)境的本領(lǐng)。
不少業(yè)內(nèi)人士認(rèn)為,未來5~10年內(nèi)想要真正實(shí)現(xiàn)無人駕駛的大規(guī)模普及,世界模型是必然技術(shù)路徑。
業(yè)內(nèi)的一部分世界模型研究起初聚焦在游戲環(huán)境和模擬環(huán)境領(lǐng)域,后來逐漸向工業(yè)級(jí)物理AI方向邁進(jìn)。
如OpenAI推出的Sora模型被視為是“物理世界模擬器”,其核心能力突破了傳統(tǒng)視頻生成工具范疇,在物體動(dòng)力學(xué)、流體力學(xué)、空間幾何一致性方面表現(xiàn)出色,支持實(shí)時(shí)調(diào)整物理參數(shù)(如重力、摩擦力、材料屬性等),逐漸在自動(dòng)駕駛、工業(yè)設(shè)計(jì)等硬核領(lǐng)域開啟了數(shù)字孿生的應(yīng)用。
截至目前,國(guó)內(nèi)外眾多車企和自動(dòng)駕駛供應(yīng)商都紛紛公開表示引入“世界模型”技術(shù),一般而言,主要用于四個(gè)方面:
1、長(zhǎng)尾數(shù)據(jù)生成,世界模型可以生成包含極端環(huán)境、交通路況、行人和車輛的特殊偶發(fā)場(chǎng)景,彌補(bǔ)訓(xùn)練中真實(shí)數(shù)據(jù)缺少的問題;2、通過物理規(guī)律建模、多模態(tài)交互與動(dòng)態(tài)環(huán)境模擬,為對(duì)抗樣本的生成、防御和物理世界攻擊驗(yàn)證提供系統(tǒng)性解決方案;3、閉環(huán)仿真測(cè)試,驗(yàn)證系統(tǒng)在仿真虛擬環(huán)境中閉環(huán)運(yùn)行的能力,縮短研發(fā)周期降低真實(shí)路測(cè)成本;4、世界模型通過自監(jiān)督學(xué)習(xí)、無監(jiān)督強(qiáng)化學(xué)習(xí)等技術(shù),能夠高效利用無標(biāo)注數(shù)據(jù)提升復(fù)雜場(chǎng)景下的泛化能力。
不過,這些模型大多圍繞車輛本體的數(shù)據(jù)訓(xùn)練,例如特斯拉提出的世界模型整合了游戲引擎仿真技術(shù),利用合成數(shù)據(jù)訓(xùn)練FSD自動(dòng)駕駛系統(tǒng),減少對(duì)真實(shí)路測(cè)數(shù)據(jù)的依賴,但這仍缺乏對(duì)宏觀超視距交通情況判斷和真實(shí)世界實(shí)時(shí)駕駛情景的理解,而蘑菇車聯(lián)的MogoMind算是補(bǔ)上了這一行業(yè)缺口。
據(jù)了解,在模型訓(xùn)練數(shù)據(jù)方面,蘑菇車聯(lián)通過部署自研的通感算AI數(shù)字道路基站設(shè)備,能夠毫秒級(jí)捕捉道路上車輛行駛軌跡、速度變化、交通流量、行人動(dòng)態(tài)等實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),此外,還有旗下自動(dòng)駕駛車輛的多種車端感知設(shè)備數(shù)據(jù),以及融合智慧交通攝像頭、車路云系統(tǒng)、V2X通信等傳統(tǒng)交通基建系統(tǒng),實(shí)時(shí)采集了更立體化多維度的全城交通數(shù)據(jù)。
在此基礎(chǔ)上,MogoMind通過深度整合實(shí)時(shí)、海量的多模態(tài)交通數(shù)據(jù),能夠從物理世界的復(fù)雜數(shù)據(jù)中抽取意義、從經(jīng)驗(yàn)中學(xué)習(xí)規(guī)則、在不同場(chǎng)景中靈活決策,形成對(duì)交通環(huán)境的全局感知、深度認(rèn)知和實(shí)時(shí)推理決策能力,這樣可以為智能汽車提供實(shí)時(shí)數(shù)字孿生與深度理解服務(wù),讓自動(dòng)駕駛車輛突破“單點(diǎn)智能”向“全局智能”邁進(jìn),從“各自為戰(zhàn)”變?yōu)椤皡f(xié)同共生”。
一個(gè)多面手的“數(shù)字基座”
與其他世界模型對(duì)比來看,MogoMind算是首個(gè)能實(shí)時(shí)理解物理世界的一款獨(dú)特世界模型,或?qū)⑦M(jìn)一步拓展當(dāng)下自動(dòng)駕駛技術(shù)和應(yīng)用的能力邊界。
據(jù)蘑菇車聯(lián)方面介紹,MogoMind模型參數(shù)大小僅有70億,但其感知精度和認(rèn)知準(zhǔn)確度超過90%,多模態(tài)推理準(zhǔn)確率大于88%,該模型的六大核心能力與其他世界模型形成了顯著區(qū)別和優(yōu)勢(shì)互補(bǔ):
1、交通數(shù)據(jù)流實(shí)時(shí)全局感知。 部署在路口的通感算一體化設(shè)備可以全天候、不間斷捕捉車輛行駛軌跡、速度變化、交通流量、行人動(dòng)態(tài)等海量異構(gòu)數(shù)據(jù),MogoMind能快速整合、分類和標(biāo)準(zhǔn)化這些數(shù)據(jù),提取其中的關(guān)鍵要素,為分析和決策提供依據(jù),據(jù)悉,該模型能夠推演的交通場(chǎng)景數(shù)量超過800個(gè)。
2、物理信息認(rèn)知理解。 相對(duì)于數(shù)字世界,物理世界的多模態(tài)信息理解更為復(fù)雜,包含路面狀況、交通標(biāo)識(shí)、天氣變化、臨時(shí)施工或突發(fā)交通事故等等,MogoMind能對(duì)這些多源數(shù)據(jù)進(jìn)行深度融合分析和理解,例如,前方視距之外有臨時(shí)施工路障,模型能迅速識(shí)別并給到車輛合理的變道預(yù)判或繞行方案,亦或是暴雨天路段開始積水,模型可結(jié)合歷史事故數(shù)據(jù)評(píng)估潛在通行風(fēng)險(xiǎn),向交管部門或出行者提供疏導(dǎo)建議。
3、通行能力實(shí)時(shí)推理計(jì)算。 在城市交通早晚高峰階段或突發(fā)事故發(fā)生時(shí),MogoMind能迅速分析評(píng)估出該路段的通行能力變化趨勢(shì)和擁堵情況,讓交通管理者提前預(yù)判并采取更科學(xué)的應(yīng)對(duì)措施。
4、最優(yōu)路徑實(shí)時(shí)自主規(guī)劃。 基于對(duì)路面多維信息的實(shí)時(shí)感知、理解和推理,MogoMind可以做出精準(zhǔn)度更高的路況預(yù)判,幫助車輛提前規(guī)劃最佳的安全高效行駛路徑,而不是被動(dòng)應(yīng)對(duì)路況問題。
5、交通環(huán)境實(shí)時(shí)數(shù)字孿生。 基于多維度全量實(shí)時(shí)交通數(shù)據(jù),MogoMind可以構(gòu)建起對(duì)現(xiàn)實(shí)交通環(huán)境精準(zhǔn)映射的數(shù)字孿生環(huán)境,而且可交互可模擬能用于仿真實(shí)驗(yàn),假設(shè)城市管理者要落實(shí)新的道路管控策略,可以模擬出實(shí)施效果和潛在未知問題,讓決策從過往經(jīng)驗(yàn)驅(qū)動(dòng)變成科學(xué)數(shù)據(jù)決策驅(qū)動(dòng)。
6、道路風(fēng)險(xiǎn)實(shí)時(shí)預(yù)警提醒。 一旦識(shí)別到路上的風(fēng)險(xiǎn)事件,如個(gè)別車輛開始異常行駛、交通流量突變或道路設(shè)施損壞,MogoMind能迅速判斷風(fēng)險(xiǎn)類型和嚴(yán)重程度,并通過多渠道(如手機(jī)APP、車載終端、車聯(lián)網(wǎng)系統(tǒng)等)向交管部門、汽車駕駛者等發(fā)出實(shí)時(shí)預(yù)警信息。
據(jù)悉,在實(shí)際的落地案例中,MogoMind對(duì)長(zhǎng)尾場(chǎng)景處理綜合準(zhǔn)確率在85%以上,對(duì)于交通管理提效比例超過35%,目前已在北京、上海、沈陽、長(zhǎng)春、鄂爾多斯、桐鄉(xiāng)、南京、無錫、武漢、廣州等多個(gè)城市區(qū)域進(jìn)行落地驗(yàn)證和實(shí)地部署,讓當(dāng)?shù)卣w交通情況大幅改善,此外,搭載MogoMind系統(tǒng)的L4級(jí)RoboBus,在全國(guó)10個(gè)省份落地運(yùn)營(yíng),安全行駛里程突破200萬公里,服務(wù)乘客超過20萬人次。
加速萬億市場(chǎng)崛起的“新飛輪”
整體來看,MogoMind世界模型的本質(zhì)是賦予了車輛更加實(shí)時(shí)深度“理解真實(shí)世界”的能力,其價(jià)值不僅在于提升單個(gè)智能車輛的駕駛安全性,更有望重構(gòu)整個(gè)智能交通系統(tǒng)的底層邏輯。
對(duì)于交通管理者而言它可以是“科學(xué)決策中樞”,對(duì)于智能車輛而言它可以是擁有上帝視角的“AI領(lǐng)航員”,對(duì)于自動(dòng)駕駛技術(shù)向L4邁進(jìn)它則是更好的“數(shù)字基座”,無論是to G、to B還是to C,似乎都有著廣泛的應(yīng)用空間可以拓展。
未來的自動(dòng)駕駛世界,需要的不是廠商之間針鋒相對(duì)的孤立競(jìng)爭(zhēng),更多的是車路協(xié)同技術(shù)生態(tài)大融合。
據(jù)了解,蘑菇車聯(lián)致力于將MogoMind打造成一個(gè)開放的兼容性和可擴(kuò)展性平臺(tái),使之能夠無縫接入來自不同廠商、不同類型的交通設(shè)備與系統(tǒng),包括道路傳感器、車載終端、交通管理軟件等,進(jìn)而對(duì)多元異構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)一管理和分析處理。
此外,該模型還提供標(biāo)準(zhǔn)化接口,車企也可以接入MogoMind進(jìn)行功能適配與應(yīng)用開發(fā),類似智能網(wǎng)聯(lián)汽車的“安卓系統(tǒng)”,讓車企跳過對(duì)世界大模型的額外研發(fā)投入,更加聚焦產(chǎn)品和應(yīng)用,專注于用戶體驗(yàn)和服務(wù)的改進(jìn),政府部門、交管部門、車企等都能在MogoMind上找到適合自身需求的應(yīng)用場(chǎng)景,實(shí)現(xiàn)資源共享、優(yōu)勢(shì)互補(bǔ),共同助推AI科技與交通生態(tài)真正有機(jī)融合發(fā)展。
放眼未來,除了智能汽車和自動(dòng)駕駛,MogoMind世界模型的核心能力據(jù)悉也可延伸與無人機(jī)、具身機(jī)器人等結(jié)合,在低空經(jīng)濟(jì)和無人配送等領(lǐng)域發(fā)揮巨大技術(shù)想象空間。
隨著新質(zhì)生產(chǎn)力的滲透,中國(guó)正催生出多個(gè)新興的萬億級(jí)市場(chǎng),相關(guān)行業(yè)研報(bào)顯示,中國(guó)正在成為全球首個(gè)實(shí)現(xiàn)L3級(jí)智駕車輛大規(guī)模商用的國(guó)家,而大規(guī)模L4乃至L5級(jí)別的無人駕駛應(yīng)用或?qū)⒃谖磥?年左右落地,隨著產(chǎn)業(yè)鏈成熟和硬件成本的下降,自動(dòng)駕駛的普及速度正在加快,預(yù)計(jì)2025年市場(chǎng)規(guī)模將突破3000億元,年復(fù)合增長(zhǎng)率達(dá)30%-40%,到2030年,市場(chǎng)規(guī)模有望達(dá)到1.2萬億元。
此外,2025年我國(guó)低空經(jīng)濟(jì)的市場(chǎng)規(guī)模有望達(dá)到1.5萬億元,到2035年有望增長(zhǎng)至3.5萬億元,而具身智能機(jī)器人市場(chǎng)規(guī)模到2030年預(yù)計(jì)也將會(huì)達(dá)到1.55萬億元,市場(chǎng)前景可謂十分廣闊。
從大模型到協(xié)同網(wǎng)絡(luò)的實(shí)踐,從感知到認(rèn)知的演進(jìn),是構(gòu)建智能出行生態(tài)的關(guān)鍵路徑,從長(zhǎng)遠(yuǎn)來看,蘑菇車聯(lián)圍繞MogoMind的技術(shù)實(shí)踐獲得了一個(gè)絕佳的產(chǎn)業(yè)生態(tài)位,有望為萬億級(jí)新興市場(chǎng)的崛起提供加速增長(zhǎng)飛輪。
當(dāng)每輛車不再是信息孤島,當(dāng)?shù)缆烽_始學(xué)會(huì)思考,當(dāng)城市交通流得以全局優(yōu)化,我們迎來的不僅是更安全、更高效的智駕出行體驗(yàn),一個(gè)以數(shù)據(jù)和AI技術(shù)協(xié)同驅(qū)動(dòng)的全新交通文明形態(tài)也已然不遠(yuǎn)。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。