首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

視頻大模型 快手美圖殊途同歸

2024年6月14日 07:04  北京商報(bào)  作 者:魏蔚

有圖像視頻業(yè)務(wù)傍身的互聯(lián)網(wǎng)企業(yè),加速奔向大模型。近日,快手正式上線視頻大模型“可靈”并開(kāi)始邀測(cè),用戶(hù)輸入一段文字即可生成視頻。美圖宣布將在7月底上線新品MOKI,該產(chǎn)品基于美圖奇想大模型的視頻生成能力,可幫助用戶(hù)生成AI短片。不論是做視頻還是做短片,都是通過(guò)大模型輔助用戶(hù)創(chuàng)作,契合自己的主營(yíng)業(yè)務(wù)。目前,獲得內(nèi)測(cè)資格的用戶(hù)可以免費(fèi)使用可靈,其他AI功能以限時(shí)免費(fèi)、限次免費(fèi)等方式向用戶(hù)開(kāi)放。美圖相關(guān)人士并未透露KOMI的變現(xiàn)計(jì)劃,但付費(fèi)會(huì)員、單次付費(fèi)等變現(xiàn)模式已是美圖成熟的商業(yè)模式。

不約而同

“今天你‘可靈’了嗎?”6月12日晚間,快手通過(guò)官方公眾號(hào)向用戶(hù)“安利”自家的視頻生成大模型“可靈”。為了證明實(shí)力,快手不光拿出一條由快手可靈生成的一分鐘預(yù)告片,還放出一系列首批獲得測(cè)試資格的創(chuàng)作者生成的視頻,如一朵花綻放的過(guò)程、復(fù)活成語(yǔ)故事《對(duì)牛彈琴》等。

打開(kāi)快手的視頻剪輯App快影,進(jìn)入主頁(yè)的“AI玩法”,再點(diǎn)擊“AI生成視頻”模塊填寫(xiě)問(wèn)卷,即可以申請(qǐng)免費(fèi)的內(nèi)測(cè)資格。根據(jù)內(nèi)測(cè)網(wǎng)友提供的信息,用戶(hù)可以輸入一段200字以?xún)?nèi)的文字描述,自行選擇超現(xiàn)實(shí)主義、極簡(jiǎn)等風(fēng)格,再等待約3分鐘,就能看到由可靈生成的一段5秒視頻。

來(lái)自快手的最新數(shù)據(jù)顯示,截至目前,在快影App上申請(qǐng)文生視頻內(nèi)測(cè)資格的人數(shù)已超6萬(wàn),圖生視頻功能將于近期上線。

同樣瞄準(zhǔn)視頻大模型出手的還有美圖!澳壳笆袌(chǎng)上的AI視頻產(chǎn)品傾向于提供文生視頻等能力,我們認(rèn)為只有深度理解創(chuàng)作者的需求,提煉有共性的視頻場(chǎng)景,才能打造輔助內(nèi)容創(chuàng)作的工具!泵缊D創(chuàng)始人吳欣鴻談到MOKI時(shí)說(shuō),“MOKI聚焦于AI短片創(chuàng)作,專(zhuān)注于動(dòng)畫(huà)短片、網(wǎng)文短劇、故事繪本和MV等視頻場(chǎng)景!

具體的工作流程是:在腳本、視覺(jué)風(fēng)格、角色等前期設(shè)定完成后,AI自動(dòng)生成分鏡圖并轉(zhuǎn)為視頻素材,通過(guò)智能剪輯、AI配樂(lè)、AI音效、自動(dòng)字幕等功能串聯(lián)素材并實(shí)現(xiàn)成片。MOKI的上述能力即基于美圖奇想大模型。

熱度升溫

除了快手、美圖,近日視頻生成的網(wǎng)紅應(yīng)用Pika、聯(lián)合清華大學(xué)發(fā)布視頻大模型Vidu的生數(shù)科技,也為視頻大模型賽道添了一把柴。

Pika不久前通過(guò)官網(wǎng)宣布,Pika已完成總額8000萬(wàn)美元的B輪融資,由Spark Capital領(lǐng)投,Greycroft、Lightspeed Venture Partners以及Jared Leto參投。Pika團(tuán)隊(duì)表示,這一輪融資將加快公司構(gòu)建最佳視頻模型的進(jìn)程,同時(shí)幫助公司聘用優(yōu)秀的人才。

成立于2023年4月,爆火于2023年11月,早在Sora出世前,Pika就依靠AI生成和編輯3D動(dòng)畫(huà)、動(dòng)漫等多種風(fēng)格的視頻,成為網(wǎng)紅應(yīng)用。

生數(shù)科技僅比Pika早成立一個(gè)月,主要業(yè)務(wù)集中在圖像、3D、視頻等原生多模態(tài)大模型的研發(fā)。2024年4月,生數(shù)科技聯(lián)合清華大學(xué)發(fā)布的視頻大模型Vidu,支持一鍵生成16秒、分辨率1080P的高清視頻內(nèi)容。

6月初,生數(shù)科技宣布,已完成數(shù)億元Pre-A輪融資,由百度、北京市人工智能產(chǎn)業(yè)投資基金領(lǐng)投,此前這家創(chuàng)業(yè)公司還獲得了來(lái)自螞蟻集團(tuán)、智譜AI等的投資。生數(shù)科技稱(chēng),將在本輪融資完成后堅(jiān)持其原生通用多模態(tài)技術(shù)路線,持續(xù)迭代優(yōu)化自研大模型,并加速產(chǎn)品開(kāi)發(fā)與市場(chǎng)拓展。

“近期視頻大模型活躍,說(shuō)明大模型最早形成的一些技術(shù)壁壘在被打破!蔽臏Y智庫(kù)創(chuàng)始人王超告訴北京商報(bào)記者,“我認(rèn)為能超過(guò)GPT-4的中國(guó)大模型可能在年中就會(huì)出現(xiàn)。中國(guó)的算力、能源和人才,支持著中國(guó)大模型持續(xù)追趕。”

談及視頻大模型的門(mén)檻,中經(jīng)傳媒智庫(kù)專(zhuān)家張書(shū)樂(lè)向北京商報(bào)記者表示,“視頻生成不是將一堆AI繪畫(huà)連在一起變成動(dòng)畫(huà)片,除了考慮形象一致、符合描述、光影分割、分鏡表現(xiàn)等,還要具有對(duì)劇情的理解能力、再創(chuàng)造能力,這些都需要對(duì)視頻結(jié)構(gòu)、內(nèi)容解析等多個(gè)垂直領(lǐng)域進(jìn)行深度學(xué)習(xí),難度高于聊天、繪畫(huà)或棋類(lèi)等靠主要數(shù)據(jù)堆積和用戶(hù)糾錯(cuò)完成的功能”。

跟著業(yè)務(wù)走

2022年底OpenAI的ChatGPT讓國(guó)內(nèi)科技巨頭在生成式大模型賽道扎堆,且大多瞄準(zhǔn)對(duì)話式互動(dòng)形式,2024年OpenAI又推出文生視頻模型Sora。和一擁而上的大語(yǔ)言模型競(jìng)爭(zhēng)相比,在視頻大模型領(lǐng)域比拼的主角更多是圖像視頻類(lèi)互聯(lián)網(wǎng)公司。

站在技術(shù)的角度,王超認(rèn)為,“這兩種大模型雖然都是AGI(通用人工智能),但技術(shù)路線不同,OpenAI兩個(gè)都做,但不是每個(gè)企業(yè)都有這樣的能力”。

在視頻大模型賽道,“快手和美圖的最大優(yōu)勢(shì)在于用戶(hù)積累、算法和數(shù)據(jù)處理等方面的經(jīng)驗(yàn)”,深度科技研究院院長(zhǎng)張孝榮表示。

張書(shū)樂(lè)的看法是,“快手、美圖擁有可以讓人工智能深度學(xué)習(xí)的‘學(xué)習(xí)資料’,且可以規(guī)避一定的版權(quán)問(wèn)題。這兩家企業(yè)在視頻領(lǐng)域的內(nèi)容積累、垂直細(xì)分的標(biāo)簽標(biāo)注,能讓大模型更好地‘檢索’知識(shí)”。

不過(guò)第三方觀察者也提醒,做視頻大模型的難度比大語(yǔ)言模型更高,前景還不明確,“這是沒(méi)多少?lài)?guó)內(nèi)大模型創(chuàng)業(yè)公司進(jìn)入視頻大模型賽道的原因,連巨頭都沒(méi)那么積極”,王超說(shuō)。“視頻大模型的變現(xiàn)比大語(yǔ)言模型困難!睆埿s補(bǔ)充。

快手和美圖正通過(guò)各種手段吸引更多用戶(hù)使用AI,并尋找AI變現(xiàn)的路徑。以快影的AI創(chuàng)作功能為例,快影向用戶(hù)提供AI舞王、AI小說(shuō)轉(zhuǎn)漫畫(huà)、AI變裝、AI頭像壁紙等十幾種服務(wù),其中AI舞王提供免費(fèi)5次的使用機(jī)會(huì)、AI變裝限時(shí)免費(fèi)、AI小說(shuō)轉(zhuǎn)漫畫(huà)是VIP會(huì)員的權(quán)益。

美圖相關(guān)人士并未向北京商報(bào)記者透露MOKI可能的變現(xiàn)模式,但吳欣鴻在介紹美圖新品時(shí)多次提到產(chǎn)品的商業(yè)化數(shù)據(jù),在他看來(lái),“如果AI幫用戶(hù)創(chuàng)收,用戶(hù)是很愿意為能創(chuàng)造價(jià)值的AI產(chǎn)品付費(fèi)的”。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
鄔賀銓?zhuān)捍竽P拖鲁恋绞謾C(jī) 將激活萬(wàn)億元規(guī)模手機(jī)產(chǎn)業(yè)
精彩專(zhuān)題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤(pán)點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像