国产欧美日韩一区,亚洲日本一区二区三区在线,一区免费在线观看,日一区二区,国产日韩欧美精品一区,一区二区在线免费观看,日韩在线播放一区

<var id="9sjmb"><delect id="9sjmb"><dfn id="9sjmb"></dfn></delect></var>

京東開源圖像模型，實(shí)測AI如何能真正“看懂”空間

2026-04-08 14:56:03

來源：新京報(bào)

分享

文章提及標(biāo)的

京東--

貝殼--

人工智能--

用AI做圖、修圖時(shí)，大眾經(jīng)常會(huì)遇到一些難題：想把圖中的杯子挪個(gè)位置，結(jié)果杯子變形了；想換個(gè)視角看看畫面，透視卻完全不對；想調(diào)整兩個(gè)物體的前后位置，也會(huì)出現(xiàn)遮擋混亂、比例失衡……

4月8日，新京報(bào)貝殼（BEKE）財(cái)經(jīng)記者從京東（JD）獲悉，京東（JD）探索研究院近日正式開源了自研的JoyAI-Image-Edit圖像模型，以解決上述難題。京東（JD）探索研究院稱該模型是業(yè)內(nèi)首個(gè)把“空間智能”刻進(jìn)骨子里的開源模型，讓AI終于能真正“看懂”空間、“編輯”空間，從原來的平面修圖，升級成了三維空間重塑，而且模型的推理代碼全部開放，開發(fā)者能直接拿來做應(yīng)用。

官方資料顯示，JoyAI-Image-Edit貼合真實(shí)世界空間規(guī)律，從空間位置關(guān)系、多視角一致性、相機(jī)感知到場景推理等維度全面建模，實(shí)現(xiàn)了相機(jī)坐標(biāo)視角變換、物體空間位移旋轉(zhuǎn)、幾何結(jié)構(gòu)精準(zhǔn)控制等多項(xiàng)空間編輯技術(shù)突破，將空間認(rèn)知能力深度融入文本與圖像生成流程，搭建了完整的空間理解數(shù)據(jù)與任務(wù)體系。

全面兼容15類通用編輯能力，擅長長文本精準(zhǔn)渲染

具體而言，該模型打破了AI“理解圖像”和“生成圖像”的壁壘，讓AI不僅能生成逼真的圖像外觀，更能精準(zhǔn)理解圖像背后的空間結(jié)構(gòu)，在編輯過程中穩(wěn)定保持主體形象與場景結(jié)構(gòu)完整，多視角空間布局高度一致。不管是移動(dòng)物體、換視角，還是調(diào)整物體間的關(guān)系，都能保持場景的幾何規(guī)律，遮擋、光影也都自然合理，不會(huì)再出現(xiàn)變形、錯(cuò)亂的情況。

京東（JD）探索研究院相關(guān)負(fù)責(zé)人對新京報(bào)貝殼（BEKE）財(cái)經(jīng)記者表示，JoyAI-Image-Edit的核心躍升，在于其攻克了此前開源模型難以逾越的空間理解難題，具備三大辨識度高的空間編輯能力：視角變換——用戶可通過自然語言指定相機(jī)的偏航角、俯仰角及縮放程度，模型在保持場景幾何一致性的前提下生成新視角圖像；空間漫游——支持連續(xù)的視角移動(dòng)，生成在空間中邏輯連貫的多視角圖像序列，類似于在三維場景中“走動(dòng)”；物體空間關(guān)系操控——在保持場景整體結(jié)構(gòu)穩(wěn)定的前提下，對特定物體進(jìn)行位移、縮放等空間變換，同時(shí)確保遮擋與光影關(guān)系自然合理。

在實(shí)現(xiàn)空間級突破的同時(shí)，JoyAI-Image-Edit全面兼容15類通用編輯能力，深度覆蓋內(nèi)容創(chuàng)作的高頻需求。無論是物體的替換、刪除、添加，還是整體風(fēng)格遷移、細(xì)節(jié)精修等操作，模型均實(shí)現(xiàn)了高性能覆蓋。結(jié)合頂尖的空間編輯技術(shù)，模型在長文本精準(zhǔn)渲染、多視角一致性生成等行業(yè)高難度任務(wù)中表現(xiàn)卓越，真正做到了全場景、無死角的高效創(chuàng)作。

京東（JD）高級副總裁何曉冬在接受新京報(bào)貝殼（BEKE）財(cái)經(jīng)記者采訪時(shí)表示，通用人工智能（885728）有兩個(gè)方向要走，一個(gè)方向是多模態(tài)，大模型必須具有視覺能力，未來甚至可以更進(jìn)一步延伸向嗅覺、觸覺；另外一個(gè)方向是走向具身智能，包括機(jī)器人、機(jī)械臂、無人車等，讓通用人工智能（885728）走向物理世界。

重點(diǎn)應(yīng)用于具身智能領(lǐng)域，模型還將探索多種場景

應(yīng)用層面，JoyAI-Image-Edit模型可廣泛應(yīng)用于電商內(nèi)容生產(chǎn)、創(chuàng)意設(shè)計(jì)制作、智能圖像處理、3D模型重建、具身智能視覺感知等多元領(lǐng)域，大幅提升AI圖像技術(shù)在復(fù)雜空間場景中的適配性與實(shí)用性。尤其是在具身智能領(lǐng)域，空間理解能力是機(jī)器人“理解世界”的核心基礎(chǔ)，而該模型的推出，也為相關(guān)技術(shù)研發(fā)提供了關(guān)鍵的底層能力。

具身智能相關(guān)測試圖。受訪者供圖

在具身智能實(shí)測領(lǐng)域，演示效果顯示：用戶僅需輸入自然語言提示詞（如“機(jī)器人左手舉起來”），并通過畫框框選目標(biāo)區(qū)域，即可對指定物體的動(dòng)作、姿態(tài)、旋轉(zhuǎn)角度進(jìn)行精細(xì)化操控。在機(jī)器人做家務(wù)的實(shí)拍場景中，模型在完整保留背景環(huán)境、物體空間關(guān)系與物理合理性的前提下，生成了機(jī)器人抬手的全新姿態(tài)。

2025年，京東（JD）在具身智能領(lǐng)域完成關(guān)鍵布局。其依托JoyAI大模型底層能力，正式推出JoyInside“附身智能”解決方案，面向智能家電、機(jī)器人等終端硬件植入高情商交互系統(tǒng)，將AI的認(rèn)知與情感能力深度嵌入硬件終端，實(shí)現(xiàn)更貼合人類習(xí)慣的自然交互。

此后，京東（JD）持續(xù)探索具身智能生態(tài)建設(shè)。一方面，圍繞JoyInside平臺(tái)迭代技術(shù)版本，升級語音、多模態(tài)感知等核心能力；另一方面，加快產(chǎn)業(yè)落地，通過開放接口、合作開發(fā)等模式，與多家家電及機(jī)器人企業(yè)達(dá)成合作，推動(dòng)具身智能技術(shù)在家庭陪伴、日常服務(wù)等場景的規(guī)?；瘧?yīng)用。

京東（JD）探索研究院相關(guān)負(fù)責(zé)人稱，此次JoyAI-Image-Edit的開源，是京東（JD）在AI多模態(tài)模型領(lǐng)域的重要布局，讓AI圖像編輯實(shí)現(xiàn)了從平面到空間的大跨越。未來該模型還將持續(xù)落地更多場景，不斷探索空間智能落地價(jià)值。

免責(zé)聲明：風(fēng)險(xiǎn)提示：本文內(nèi)容僅供參考，不代表同花順觀點(diǎn)。同花順各類信息服務(wù)基于人工智能算法，如有出入請以證監(jiān)會(huì)指定上市公司信息披露平臺(tái)為準(zhǔn)。如有投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)，同花順對此不承擔(dān)任何責(zé)任。

返回首頁

投資者關(guān)系

關(guān)于同花順

運(yùn)營許可

聯(lián)系我們

用戶體驗(yàn)計(jì)劃

不良信息舉報(bào)與個(gè)人信息保護(hù)咨詢專線：10100571違法和不良信息涉企侵權(quán)舉報(bào)涉算法推薦舉報(bào)專區(qū)涉青少年不良信息舉報(bào)專區(qū)

浙江同花順互聯(lián)信息技術(shù)有限公司版權(quán)所有

網(wǎng)站備案號：浙ICP備18032105號-4

證券投資咨詢服務(wù)提供：浙江同花順云軟件有限公司（中國證監(jiān)會(huì)核發(fā)證書編號：ZX0050）

不良信息舉報(bào)

浙江市場監(jiān)管

舉報(bào)

<big id="pq1x1"><em id="pq1x1"><div id="pq1x1"></div></em></big>

<big id="pq1x1"></big>