ICC訊 9月24日,字節(jié)跳動旗下火山引擎發(fā)布兩款視頻生成大模型(豆包視頻生成-PixelDance、豆包視頻生成-Seaweed),首次面向企業(yè)市場開啟邀測。
火山引擎介紹,豆包視頻生成模型基于DiT架構(gòu),通過高效的DiT融合計算單元,能更充分地壓縮編碼視頻與文本,讓視頻在大動態(tài)與運鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標跟隨等多鏡頭語言能力。
此外,豆包視頻生成模型另外一大技術(shù)創(chuàng)新是全新設計的擴散模型訓練方法攻克了多鏡頭切換的一致性難題。該模型還使用深度優(yōu)化的Transformer結(jié)構(gòu),大幅提升視頻生成的泛化能力。
字節(jié)跳動透露,目前,新款豆包視頻生成模型正在即夢AI內(nèi)測版小范圍測試,未來將逐步開放給所有用戶。