如今的 AI 看起來已經(jīng)無所不能,不僅能夠勝任感知、學(xué)習(xí)、推理、決策等不同層面的任務(wù),甚至可以打造虛擬數(shù)字分析,為人類帶來多模態(tài)AI交互體驗。近日, 新型社交平臺Soul App 在GITEX GLOBAL海灣信息技術(shù)博覽會上展出了其最新自研的多模態(tài)大模型,該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性,實現(xiàn)打破次元壁的互動,讓現(xiàn)場的觀眾們驚艷不已。
3D數(shù)字孿生,虛擬與現(xiàn)實的創(chuàng)新交互
Soul作為國內(nèi)較早將AI引入社交關(guān)系的互聯(lián)網(wǎng)平臺代表之一,此次攜最新自研的多模態(tài)大模型參展GITEX GLOBAL 2024,向世界展現(xiàn)了中國企業(yè)在社交領(lǐng)域的最新應(yīng)用實踐和數(shù)字娛樂的創(chuàng)新方案。此次是Soul首次亮相國際大型展會,其自研的多模態(tài)大模型集合文字、語音、動作交互等多模態(tài)方向,實現(xiàn)更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。
大會上,現(xiàn)場觀眾可以實現(xiàn)高相似度的3D虛擬人的AI建模,通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù),于幾秒鐘內(nèi),快速在3D世界精細(xì)化還原真實人臉的特征 ,打造專屬的虛擬化身。同時,基于實時的人體動作識別、數(shù)字還原以及多模態(tài)對話交互能力,實現(xiàn)3D虛擬人與真人的沉浸式互動。
多模態(tài)端到端大模型,超擬人的情感體驗
事實上,自成立以來Soul便一直聚焦于多模態(tài)大模型方向持續(xù)深耕。
在推出智能推薦引擎“靈犀”、以AI算法助力社交關(guān)系的發(fā)現(xiàn)沉淀環(huán)節(jié)后,2020年,Soul正式啟動對AIGC的技術(shù)研發(fā)工作,系統(tǒng)推進(jìn)在智能對話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作,并推動AI能力在社交場景的快速落地。
目前,Soul已先后上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達(dá)和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風(fēng)格語言,實現(xiàn)更接近生活日常的交互對話和“類真人”的情感陪伴體驗。
多模態(tài)端到端大模型的推出標(biāo)志著Soul對人機(jī)交互體驗的創(chuàng)新突破,同時,從文字、語音到視覺的模態(tài)升級,也意味著交互方式的顛覆式改變。在未來,Soul將持續(xù)加大對AI技術(shù)的投入,致力于通過AI技術(shù)更好地幫助用戶進(jìn)行社交破冰,助力人設(shè)搭建和認(rèn)知決策,提升社交溝通效率。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120230012 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0121673 增值電信業(yè)務(wù)經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關(guān)于我們 中宏網(wǎng)動態(tài) 廣告服務(wù) 中宏網(wǎng)版權(quán)所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.uokii.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟(jì)雜志社