4月16日,阿里巴巴(BABA)ATH事業(yè)群正式推出開(kāi)放式世界模型產(chǎn)品“HappyOyster”,主打?qū)崟r(shí)世界創(chuàng)建與交互。這款產(chǎn)品可生成動(dòng)態(tài)三維環(huán)境,支持影視制作、游戲(881275)開(kāi)發(fā)等場(chǎng)景,標(biāo)志著阿里(BABA)ATH的技術(shù)布局從視頻生成延伸至交互式世界模型領(lǐng)域。目前產(chǎn)品已開(kāi)啟內(nèi)測(cè),用戶(hù)可通過(guò)官網(wǎng)happyoyster.cn加入候補(bǔ)名單。
從“生成視頻”到“實(shí)時(shí)造世界”,核心產(chǎn)品能力大幅提升
“HappyOyster”是一款可實(shí)時(shí)構(gòu)建和交互的開(kāi)放式世界模型產(chǎn)品。不同于傳統(tǒng)AI視頻生成工具“寫(xiě)prompt → 等渲染 → 收到成片”的一次性線性流程,HappyOyster在生成過(guò)程中可持續(xù)接收用戶(hù)指令,畫(huà)面實(shí)時(shí)響應(yīng)、持續(xù)演繹,交互性顯著增強(qiáng)。這意味著創(chuàng)作者不必在每一輪修改中從頭開(kāi)始等待渲染結(jié)果,而是可以在生成過(guò)程中隨時(shí)調(diào)整畫(huà)面元素、視角和動(dòng)態(tài)效果,極大縮短了創(chuàng)意迭代周期(883436)。
該產(chǎn)品可生成動(dòng)態(tài)三維環(huán)境,支持影視制作、游戲(881275)開(kāi)發(fā)等場(chǎng)景。在影視制作領(lǐng)域,導(dǎo)演和視效團(tuán)隊(duì)可通過(guò)自然語(yǔ)言或圖像輸入,實(shí)時(shí)構(gòu)建和調(diào)整三維場(chǎng)景,快速完成概念驗(yàn)證和預(yù)可視化工(850102)作;在游戲(881275)開(kāi)發(fā)領(lǐng)域,HappyOyster可幫助開(kāi)發(fā)者在原型階段快速生成可交互的三維環(huán)境,大幅降低前期美術(shù)和關(guān)卡設(shè)計(jì)的成本。
HappyOyster基于原生多模態(tài)架構(gòu),其背后是支持多模態(tài)輸入與音視頻聯(lián)合生成的流式生成世界模型。所謂“原生多模態(tài)架構(gòu)”,區(qū)別于傳統(tǒng)“視覺(jué)編碼器用于理解、變分自編碼器用于生成”的組合式設(shè)計(jì),而是從一開(kāi)始就以統(tǒng)一模型同時(shí)處理文本、圖像、音頻等多種模態(tài)的輸入與輸出,避免了模塊割裂帶來(lái)的協(xié)同與效率損耗。這一技術(shù)路線的優(yōu)勢(shì)在于,模型能夠?qū)崿F(xiàn)端到端的跨模態(tài)理解與生成,保證生成內(nèi)容在時(shí)空維度上的高度一致性。
“流式生成”是該產(chǎn)品的另一核心特征——模型在生成過(guò)程中持續(xù)接收用戶(hù)指令并實(shí)時(shí)響應(yīng),而非等待完整生成后再輸出結(jié)果。這種架構(gòu)使Happy Oyster在交互性和響應(yīng)速度上具備顯著優(yōu)勢(shì),更接近“實(shí)時(shí)世界模擬器”的愿景。
阿里ATH事業(yè)群持續(xù)發(fā)力
HappyOyster隸屬于阿里巴巴(BABA)ATH(AliBABA Token Hub)事業(yè)群旗下的AI創(chuàng)新事業(yè)部,與此前引發(fā)廣泛關(guān)注的視頻生成模型HappyHorse(快樂(lè)馬)同屬一個(gè)事業(yè)部。
ATH事業(yè)群由阿里巴巴(BABA)CEO吳泳銘于2026年3月16日親自?huà)鞄洺闪?,以“?chuàng)造Token、輸送Token、應(yīng)用Token”為核心目標(biāo),下設(shè)通義實(shí)驗(yàn)室、MaaS業(yè)務(wù)線、千問(wèn)事業(yè)部、悟空事業(yè)部及AI創(chuàng)新事業(yè)部,覆蓋從基礎(chǔ)模型研發(fā)到個(gè)人與企業(yè)端ai應(yīng)用(886108)的完整鏈條。
AI創(chuàng)新事業(yè)部此前已在視頻生成賽道取得突破——其研發(fā)的HappyHorse-1.0模型在Artificial Analysis視頻編輯方向排行榜中以1299分位列榜首,表現(xiàn)優(yōu)于Grok等國(guó)際主流模型。該模型采用150億參數(shù)、40層單流Transformer架構(gòu),實(shí)現(xiàn)了文本、圖像、音頻的統(tǒng)一模態(tài)建模,破解了AI視頻生成中時(shí)序混亂、畫(huà)質(zhì)不足、指令理解偏差三大痛點(diǎn)。
ATH創(chuàng)新事業(yè)部已啟動(dòng)一項(xiàng)“AI時(shí)代的全新交互方式探索計(jì)劃”,HappyHorse是該探索方向的一部分,更多產(chǎn)品會(huì)陸續(xù)推出。Happy Oyster的發(fā)布,正是這一計(jì)劃落地的又一關(guān)鍵節(jié)點(diǎn)。
從HappyHorse到HappyOyster,阿里(BABA)ATH事業(yè)群正以“世界模型”為錨點(diǎn),系統(tǒng)性地構(gòu)建AI時(shí)代的全新交互范式。
世界模型迎來(lái)爆發(fā)之年,應(yīng)用前景廣闊
HappyOyster的發(fā)布,恰逢世界模型賽道迎來(lái)全面爆發(fā)。英偉達(dá)(NVDA)機(jī)器人主管Jim Fan近日發(fā)文稱(chēng),2026年將成為大世界模型真正為機(jī)器人以及更廣義的多模態(tài)ai(886062)奠定基礎(chǔ)的第一年。行業(yè)共識(shí)正從語(yǔ)言模型轉(zhuǎn)向能理解物理規(guī)律的多模態(tài)世界模型——從“預(yù)測(cè)下一個(gè)詞”到“預(yù)測(cè)世界下一狀態(tài)”。
在產(chǎn)業(yè)層面,各大科技公司和研究機(jī)構(gòu)密集布局。騰訊(K80700)發(fā)布并開(kāi)源混元3D世界模型2.0,可直接生成可二次編輯的3D資產(chǎn)文件,導(dǎo)入游戲(881275)制作或具身仿真引擎實(shí)現(xiàn)真正可玩、可用;商湯(K80020)科技也發(fā)布了多模態(tài)理解生成一體化架構(gòu),劍指世界模型賽道。與此同時(shí),資本也加速涌入,生數(shù)科技獲阿里(BABA)領(lǐng)投2.9億美元研發(fā)通用世界模型,智象未來(lái)完成新一輪融資打造原生全模態(tài)世界模型。
在這一競(jìng)爭(zhēng)格局中,HappyOyster憑借原生多模態(tài)架構(gòu)和流式生成能力,展現(xiàn)出與競(jìng)爭(zhēng)對(duì)手的差異化優(yōu)勢(shì)。相較于騰訊(K80700)混元2.0側(cè)重3D資產(chǎn)導(dǎo)出和游戲(881275)工作流集成,HappyOyster更強(qiáng)調(diào)實(shí)時(shí)交互體驗(yàn);相較于PixVerse R1的通用視頻生成定位,HappyOyster更聚焦三維環(huán)境構(gòu)建與行業(yè)場(chǎng)景落地。
從更宏觀的視角看,世界模型被視為通往“物理AI”的必經(jīng)之路,其應(yīng)用范圍正從數(shù)字創(chuàng)作領(lǐng)域向自動(dòng)駕駛、機(jī)器人訓(xùn)練、工業(yè)仿真等物理世界場(chǎng)景延伸。HappyOyster的發(fā)布,既是對(duì)當(dāng)下創(chuàng)作者需求的響應(yīng),也為未來(lái)更廣闊的ai應(yīng)用(886108)場(chǎng)景奠定了技術(shù)基礎(chǔ)。
