36 氪獲悉,近日,智象未來團(tuán)隊(duì)兩項(xiàng)創(chuàng)新成果入選 ICCV 2025,分別聚焦于圖像生成與視頻增強(qiáng)兩個(gè)方向。在圖像生成方面,智象未來團(tuán)隊(duì)提出了全新去噪掩碼自回歸生成范式 De-MAR,De-MAR 框架通過雙重令牌優(yōu)化機(jī)制,創(chuàng)新性引入擴(kuò)散頭與去噪頭模塊。實(shí)驗(yàn)顯示,De-MAR 在 ImageNet 和 MS-COCO 數(shù)據(jù)集上,F(xiàn)ID 指標(biāo)達(dá) 1.47 和 5.27,生成速度較 DiT-XL/2 快 45%。在視頻增強(qiáng)方面,團(tuán)隊(duì)則推出了創(chuàng)新的生成式視頻畫質(zhì)增強(qiáng)框架 GenVE,可生動(dòng)還原毛發(fā)、衣物褶皺等細(xì)節(jié),使視頻畫面更自然流暢。
36氪
昨天