5 月 14 日消息,據(jù)《科創(chuàng)板日報》報道,阿里巴巴正式開源通義萬相 Wan2.1-VACE,這是一款支持視頻生成與編輯的模型,單一模型可同時支持文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時長延展等全系列基礎(chǔ)生成和編輯能力。
據(jù)悉,本次共開源 1.3B 和 14B 兩個版本,其中 1.3B 版本可在消費級顯卡運行。
據(jù)IT之家了解,通義萬相是阿里云通義系列 AI 繪畫創(chuàng)作大模型,可輔助人類進行圖片創(chuàng)作,于 2023 年 7 月 7 日正式上線。在 2024 年 9 月 19 日的阿里云棲大會上,阿里發(fā)布了通義萬相視頻生成大模型。該模型可以生成影視級高清視頻,而且更能聽懂中國話。
值得注意的是,今年 1 月初通義萬相視頻生成模型宣布升級至 2.1 版,模型整體性能大幅提升,尤其是在處理復(fù)雜運動、還原真實物理規(guī)律、提升電影質(zhì)感及優(yōu)化指令遵循方面取得了顯著進展。2 月 25 日,阿里巴巴宣布全面開源旗下視頻生成模型萬相 2.1 模型。