6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。
上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡,并賦予她靈動的眼神交流,讓名畫中的人物活靈活現——這正是可靈圖生視頻功能的生動實踐。

給自己戴上墨鏡的“蒙娜麗莎”。 快手 供圖
此前,“可靈”在文生視頻方面已經展現出了創造逼真運動場景、精確模擬物理特性的能力,以及將復雜概念巧妙融合的“技藝”,其輸出堪比電影級畫質,并允許用戶自由調節視頻的縱橫比。而這些特性,如今都被融入到了圖生視頻模型。用戶只需上傳一張圖片,即能基于對圖像的解析變靜為動,賦予其5秒的鮮活生命力。
得益于其基礎模型架構中的3D時空聯合注意力機制,可靈在構建復雜時空運動方面也展現了實力。這使得模型在轉換靜態圖像為動態視頻時,能夠細膩、準確地實現大幅度運動場景。例如,上傳一張牧羊犬追球的靜止照片,模型就能生成一段牧羊犬奔跑追逐的視頻。同時,可靈圖生視頻模型還融入了提示詞融合技術,深化了對圖像語義與用戶指令的理解整合。這意味著,模型能夠根據用戶提供的不同文本指令變換視頻中的動態表現。
可靈大模型還新推出了視頻續寫功能,用戶只需一鍵操作,即可在已生成視頻的基礎上延續生成約5秒內容,該功能同時適用于文生視頻和圖生視頻。通過連續多次續寫,能夠最長生產約3分鐘的連貫視頻。
在近日于美國舉行的計算機視覺和模式識別大會(CVPR2024)上,快手發布了可靈大模型的圖生視頻和視頻續寫等功能,引起積極反響。據了解,今年快手共有8篇論文入選CVPR2024,彰顯了其在該領域的研究功底。
6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡......
6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡......
6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡......
6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡......
6月21日,快手的視頻生成大模型“可靈”再進化,正式推出圖生視頻功能,支持用任意靜態圖像生成5s視頻,并且可搭配不同的文本內容,實現豐富的視覺敘事。上傳經典油畫《蒙娜麗莎》,可靈能夠讓蒙娜麗莎戴上墨鏡......
近日,國內頭部短視頻平臺“快手”發布了首個“Sora級”的文生視頻大模型“可靈”,并宣布面向用戶開放。據快手方面介紹,可靈大模型為快手AI團隊自研,采用與Sora相似的技術路線,并結合多項自研技術,能......
2023年9月13日上午10時10分,湖南衡陽市祁東縣玉合街道綠野村,一臺挖掘機緩緩駛入生態保護紅線范圍內作業。12分鐘后,“鐵塔哨兵”發出監測預警,系統自動生成“告警卡”,經過內業人員判別后,于12......
4月28日,高校科普短視頻大賽在北京正式啟動。據介紹,高校科普短視頻大賽以鼓勵學生創造性的方式將術語和名詞呈現給大眾,讓科學、技術、社會和文化的知識更容易被大眾理解。大賽以科學技術名詞為切入點,以提高......
人工智能(AI)領域的巨頭OpenAI再次引發關注,其最新推出的視頻生成大模型Sora因其出色的逼真度和想象力廣受贊譽。相較于傳統視頻生成領域的平均4秒長度,Sora能夠生成長達60秒的視頻,這一創新......
候鳥掠出線影,年輪將添新紋,年末回首,身后的步履構成了我們生命年輪中珍貴的一環。且看來時的路,步步堅定。日月其邁,時不可忘。過往的每一步、每一個瞬間、每一次努力、每一次回憶……都值得被記錄。我們試圖將......