視頻大模型迎來Sora時(shí)刻,生產(chǎn)力工具蓄勢(shì)待發(fā)。自Sora發(fā)布以來,國(guó)內(nèi)外已有十多家公司發(fā)布或更新視頻生成模型。
客觀對(duì)比:與Sora差距縮小,搶占用戶或?yàn)槲磥碇骶。國(guó)內(nèi)外之間的差距正在逐步縮小,視頻時(shí)長(zhǎng)、分辨率等基礎(chǔ)功能具有復(fù) 制性,未來競(jìng)爭(zhēng)或向搶占用戶、提升粘性等方向遷移,從而需要保障生成質(zhì)量更高的可用視頻,使得視頻一致性更高、文本指 令遵循更準(zhǔn)確、物理真實(shí)模擬能力更強(qiáng)。
主觀對(duì)比:視頻質(zhì)量提升顯著,離物理世界模擬器仍有距離。文生視頻領(lǐng)域,視頻畫面普遍清晰,而在動(dòng)作幅度與物理還原度 方面差異較大,我國(guó)Vidu、清影或已處于視頻生成大模型第一梯隊(duì),生成時(shí)間相對(duì)其他模型倍數(shù)減少,且在動(dòng)作幅度、物理還 原度等復(fù)雜任務(wù)完成性較好;圖生視頻領(lǐng)域,整體效果優(yōu)于文生視頻,國(guó)內(nèi)與國(guó)外差距進(jìn)一步縮小。
視頻大模型具備商用潛力,下游應(yīng)用正在儲(chǔ)能。未來隨著用戶習(xí)慣的培育以及算力基礎(chǔ)設(shè)施的完善,視頻大模型的或者辦公、 廣告、電影、游戲等多領(lǐng)域具有廣闊的前景。
算法、算力、數(shù)據(jù)三要素,視頻大模型通往AGI的必經(jīng)之路。
算法:視頻生成模型算法主要由基于SD逐幀生成和基于時(shí)空Patches兩種范式構(gòu)成,是效率與效益的比拼。前者模型更容易訓(xùn)練, 而視頻內(nèi)容一致性要差一些,長(zhǎng)視頻訓(xùn)練存在困難;后者訓(xùn)練成本更高,但是生成視頻的長(zhǎng)度與一致性更容易得到保障。
算力:以Sora為例,一定條件下測(cè)算,Sora訓(xùn)練算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。
數(shù)據(jù):高質(zhì)量數(shù)據(jù)是模型能力的保障,而用戶數(shù)量或?yàn)殚_啟模型迭代“數(shù)據(jù)飛輪”的關(guān)鍵。
投資建議:建議關(guān)注(1)視頻大模型廠商:科大訊飛、商湯、云從科技、格靈深瞳、拓爾思、昆侖萬維等。(2)算力:海光 信息、寒武紀(jì)、景嘉微、中科曙光、浪潮信息、工業(yè)富聯(lián)、神州數(shù)碼、拓維信息、四川長(zhǎng)虹等。(3)接入大模型的應(yīng)用標(biāo)的: 金山辦公、萬興科技、福昕軟件、虹軟科技、彩訊股份、焦點(diǎn)科技、潤(rùn)達(dá)醫(yī)療、金證股份、泛微網(wǎng)絡(luò)、金蝶國(guó)際等。
商用機(jī)器人 Disinfection Robot 展廳機(jī)器人 智能垃圾站 輪式機(jī)器人底盤 迎賓機(jī)器人 移動(dòng)機(jī)器人底盤 講解機(jī)器人 紫外線消毒機(jī)器人 大屏機(jī)器人 霧化消毒機(jī)器人 服務(wù)機(jī)器人底盤 智能送餐機(jī)器人 霧化消毒機(jī) 機(jī)器人OEM代工廠 消毒機(jī)器人排名 智能配送機(jī)器人 圖書館機(jī)器人 導(dǎo)引機(jī)器人 移動(dòng)消毒機(jī)器人 導(dǎo)診機(jī)器人 迎賓接待機(jī)器人 前臺(tái)機(jī)器人 導(dǎo)覽機(jī)器人 酒店送物機(jī)器人 云跡科技潤(rùn)機(jī)器人 云跡酒店機(jī)器人 智能導(dǎo)診機(jī)器人 |