產(chǎn)品介紹
可靈大模型是由快手技術團隊精心研發(fā)的視頻生成解決方案,它利用先進的AI技術,幫助用戶無需復雜編輯技能即可產(chǎn)出引人入勝的藝術視頻內(nèi)容。

產(chǎn)品功能
可靈大模型支持從腳本到視頻的自動轉(zhuǎn)化,具備視頻內(nèi)容理解、情節(jié)生成、畫面渲染等全面功能,能夠根據(jù)用戶輸入的文本或概念快速生成高質(zhì)量的藝術風格視頻。
文生視頻
- 大幅度的合理運動,可靈采用3D時空聯(lián)合注意力機制,能夠更好地建模復雜時空運動,生成較大幅度運動的視頻內(nèi)容,同時能夠符合運動規(guī)律。
- 長達2分鐘的視頻生成,得益于高效的訓練基礎設施、極致的推理優(yōu)化和可擴展的基礎架構,可靈大模型能夠生成長達2分鐘的視頻,且?guī)蔬_到30fps。
- 模擬物理世界特性,基于自研模型架構及Scaling Law激發(fā)出的強大建模能力,可靈能夠模擬真實世界的物理特性,生成符合物理規(guī)律的視頻。
- 強大的概念組合能力,基于對文本-視頻語義的深刻理解和 Diffusion Transformer 架構的強大能力,可靈能夠?qū)⒂脩糌S富的想象力轉(zhuǎn)化為具體的畫面,虛構真實世界中不會出現(xiàn)的的場景。
- 電影級的畫面生成,基于自研3D VAE,可靈能夠生成1080p分辨率的電影級視頻,無論是浩瀚壯闊的宏大場景,還是細膩入微的特寫鏡頭,都能夠生動呈現(xiàn)。
- 支持自由的輸出視頻寬高比,可靈采用了可變分辨率的訓練策略,在推理過程中可以做到同樣的內(nèi)容輸出多種多樣的視頻寬高比,滿足更豐富場景中的視頻素材使用需求。
圖生視頻
可靈圖生視頻模型以卓越的圖像理解能力為基礎,將靜態(tài)圖像轉(zhuǎn)化為生動的5秒精彩視頻。配上創(chuàng)作者不同的文本輸入,即生成多種多樣的運動效果,讓您的視覺創(chuàng)意無限延展。
視頻續(xù)寫
可靈大模型支持對已經(jīng)生成的視頻進行一鍵續(xù)寫,單次讓視頻運動延續(xù)4.5秒,運動內(nèi)容合理、幅度顯著。得益于續(xù)寫中的文本控制,每一段續(xù)寫都能夠體現(xiàn)用戶的創(chuàng)意和想法。支持連續(xù)多次的續(xù)寫,最長可生成3分鐘的視頻,為創(chuàng)作者實現(xiàn)故事夢想提供了強有力的支持。
使用場景
適合短視頻創(chuàng)作者、廣告設計師、新媒體藝術家等,在內(nèi)容創(chuàng)作、品牌宣傳、社交媒體分享等多個場景下,快速產(chǎn)出創(chuàng)意視頻,提高工作效率。
























評論 ( 0 )