亚洲成av人片在www色猫咪_精品剧情在线观看_国产欧美一区二区在线_欧美一卡2卡3卡4卡

SentiPulse攜手人大高瓴:開源交互式3D數(shù)字人框架SentiAvatar,領(lǐng)跑行業(yè)主流模型

2026-04-08 16:49:36來源:今日熱點網(wǎng)

3D數(shù)字人行業(yè)已陷入發(fā)展怪圈:全行業(yè)的競爭維度,始終困在“視覺上夠不夠像人”的顏值內(nèi)卷里。但行業(yè)集體忽略的是,再精致的建模、再逼真的渲染,都無法成為用戶長期深度交互的核心理由。

真正卡住數(shù)字人產(chǎn)業(yè)發(fā)展天花板的,從來不是視覺層面的“不像人”,而是其始終未能構(gòu)建起與人類相似自然的表達能力和更流暢的動作。很多時候,數(shù)字人看似嘴在動、手在揮,肢體動作卻與對話語義完全脫鉤,面部表情和臺詞情緒徹底割裂,這種深入骨髓的機械感與違和感,直接斬斷了人與數(shù)字人之間建立情感聯(lián)結(jié)、實現(xiàn)深度交互的所有可能。

人類真實溝通中,超70%的信息與情緒都藏在非語言信號里,聳肩的無奈、挑眉的質(zhì)疑,這些細節(jié)才是對話的靈魂。但這背后是行業(yè)面臨的三個瓶頸:一是中文對話場景高質(zhì)量數(shù)據(jù)荒,覆蓋全身動作的高質(zhì)量數(shù)據(jù)集近乎空白;二是復合語義下動作漂移,面對融合情緒的復雜表達,模型語義理解能力急劇退化;三是音畫節(jié)奏錯位,動作機械生硬,與語音重音、停頓完全脫節(jié)。

這三道枷鎖,把數(shù)字人困在“預設腳本播放機器”的定位里,始終邁不開從“能說話”、“能動”到“懂交流”的關(guān)鍵一步。而SentiPulse(思維光譜)聯(lián)合中國人民大學高瓴人工智能學院推出的SentiAvatar交互式3D數(shù)字人框架,正是為打破這些瓶頸而來。面向全球開源的3D動作生成完整解決方案,讓數(shù)字人跳出預設動作桎梏,實現(xiàn)貼合語境與情緒的自然實時交互,真正告別“提線木偶”式交互。

國內(nèi)首個交互式3D數(shù)字人框架,讓3D數(shù)字人動作有“靈魂”

針對行業(yè)底層痛點,SentiAvatar打造了3D動作生成新范式。

5--.png

在數(shù)據(jù)底座層,SuSuInterActs數(shù)據(jù)集圍繞單一角色SUSU(22歲,溫柔活潑,情感豐富)構(gòu)建。包含2.1萬段片段、37小時的多模態(tài)對話語料,涵蓋同步語音、行為標注文本、全身動作與面部表情,填補中文高質(zhì)量數(shù)據(jù)的空白。

為打破場景限制,讓數(shù)字人交互擺脫“腳本化”,團隊在預訓練階段引入了自研的Motion Foundation Model動作基礎(chǔ)模型,在200K+條異質(zhì)動作序列(約676小時)上訓練通用運動先驗,讓數(shù)字人的能力遠超對話場景本身。

此外,SentiAvatar創(chuàng)新提出plan-then-infill雙通道并行架構(gòu),在動作生成時,將身體動作與面部表情分開處理,先規(guī)劃“做什么動作”,再插入“如何逐幀執(zhí)行”,讓整體動作生成效果更流暢。

具體而言,第一階段,LLM語義規(guī)劃器接收行為標簽文本和稀疏音頻Token,輸出稀疏關(guān)鍵幀動作Token序列。為支持多輪流式連續(xù)生成,模型以前一句話的最后兩個關(guān)鍵幀音頻-動作Token對作為上下文前綴,從下一個關(guān)鍵幀位置續(xù)寫,實現(xiàn)無縫跨句過渡;第二階段,Body Infill Transformer在相鄰關(guān)鍵幀之間填入中間3幀,以逐幀 HuBERT連續(xù)特征(768維,20FPS)作為條件信號。模型采用5幀滑動窗口,首尾幀已知,預測中間3幀(12個動作Token)。推理時使用迭代置信度解碼策略(默認6步),逐步接受高置信度預測,避免一次性預測的質(zhì)量退化。

權(quán)威實驗結(jié)果顯示,SentiAvatar在SuSuInterActs和行業(yè)通用BEATv2兩個數(shù)據(jù)集上,多項核心指標均達到當前國際最優(yōu)水平(SOTA),性能全面領(lǐng)跑行業(yè)主流模型。

6-.png

在自建的SuSuInterActs測試集上,SentiAvatar的文本-動作檢索召回率R@1達到43.64%,幾乎是行業(yè)次優(yōu)基線的2倍;在跨數(shù)據(jù)集、跨語言的BEATv2評測集上,SentiAvatar以FGD 4.941、BC 8.078的成績,同時刷新兩項指標的SOTA紀錄,超越此前行業(yè)最優(yōu)方案,充分驗證了模型的跨場景、跨語言泛化能力。

基于自研高質(zhì)量數(shù)據(jù)集、動作基礎(chǔ)模型與核心架構(gòu),SentiAvatar實現(xiàn)了在0.3秒內(nèi)生成6秒動作序列,支持無限輪次的流式交互。這意味著數(shù)字人可以在實時對話中持續(xù)生成連貫的動作與表情,無需等待整句結(jié)束再批量處理,能直接解決數(shù)字人“交互卡頓”的問題。

構(gòu)建認知-表達閉環(huán),夯實數(shù)字人“交互底座”

SentiAvatar已正式上線GitHub開源平臺,面向全球科研機構(gòu)與開發(fā)者全面開放,相關(guān)技術(shù)報告也已同步發(fā)布于arXiv。開發(fā)者可基于這套開源框架,低成本打造專屬的3D數(shù)字人,也可拓展其在游戲交互、影視制作、機器人等領(lǐng)域的應用。

當數(shù)字人不再是冰冷機械的交互工具,它能讀懂你面部表情的隱喻并反饋同樣稀缺的情緒價值,變成能感知語境、理解情緒、主動表達的交互主體,下一代“數(shù)字生命”即將誕生。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!

關(guān)于我們 - 聯(lián)系方式 - 版權(quán)聲明 - 招聘信息 - 友鏈交換 - 網(wǎng)站統(tǒng)計
 

太平洋財富主辦 版權(quán)所有:太平洋財富網(wǎng)

?中國互聯(lián)網(wǎng)違法和不良信息舉報中心中國互聯(lián)網(wǎng)違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(wǎng)(www.avav001.com) All rights reserved.

未經(jīng)過本站允許 請勿將本站內(nèi)容傳播或復制 業(yè)務QQ:302 369 7155

 

主站蜘蛛池模板: 欧美日韩一区二区三区在线视频| 日日摸日日碰夜夜爽无码| 国产精品久久久久免费| 欧美精品卡一卡二| 国产精品视频免费在线| 狠狠色综合网站久久久久久久| 久久国产视频网站| 日韩精品一区二区三区丰满| 国产精品久久久久影院日本 | 久久亚洲免费| 欧美 日韩 国产 在线观看| 午夜精品在线观看| 99精品欧美一区二区三区| 国产精品久久不能| 蜜桃视频一区二区在线观看 | 欧洲精品久久久| 美女在线免费视频| 国产精品福利观看| 99视频在线播放| 精品国产第一页| 色综合久久av| 日本不卡一区二区三区视频| 久久躁狠狠躁夜夜爽| 欧美中文在线视频| 欧美xxxx综合视频| 国产欧美日本在线| 日韩精品视频久久| 国产精品一区二区在线观看| 久久久久欧美| 日本高清久久天堂| 久久天天躁狠狠躁夜夜躁| 久久riav| 久久久久国产精品免费网站| 日本一区二区三区视频在线播放| 99精品在线直播| 久久免费福利视频| 日本欧美国产在线| 精品国产日本| 国产日韩亚洲欧美在线| www.日本久久久久com.| 日本韩国在线不卡|