掃碼手機(jī)端閱讀
歡迎關(guān)注
經(jīng)濟(jì)網(wǎng)小程序
掃碼訂閱
微信掃碼分享
掃碼手機(jī)端閱讀
歡迎關(guān)注
經(jīng)濟(jì)網(wǎng)小程序
掃碼訂閱
微信掃碼分享
隨著Sora推出可基于任意文字生成視頻的功能,AI大模型也為用戶帶來了全新玩法。目前,已經(jīng)有國內(nèi)外很多大模型加入這個(gè)“大家庭”,包括Runway的Gen系列、微軟的Nuwa、Meta的Emu、谷歌的Phenaki/VideoPoet、CogVideo等。
“所有用戶,都能通過清影(Ying)體驗(yàn)AI文生視頻、圖生視頻能力?!痹?月26日舉行的智譜Open Day上,智譜AI CEO張鵬宣布推出全新大模型產(chǎn)品清影(Ying)。據(jù)介紹,只要你有好的創(chuàng)意(幾個(gè)字到幾百個(gè)字),再加上一點(diǎn)點(diǎn)耐心(30秒),清影就能生成6秒時(shí)長,1440x960清晰度,3:2比例的高精度視頻。
大模型能真正讓用戶用上,才更加“大有可玩”。即日起,清影上線清言App,面向所有用戶開放。輸入一段文字后(俗稱Prompt),用戶可以選擇自己想要生成的風(fēng)格,包括卡通3D、黑白、油畫、電影感等,配上清影自帶的音樂,就生成了充滿AI想象力的視頻片段。
除了文本生成視頻,也可以到清影上玩圖片生成視頻。圖生視頻帶來了更多的新玩法,包括表情包梗圖、廣告制作、劇情創(chuàng)作、短視頻創(chuàng)作等。同時(shí),基于清影的“老照片動起來”小程序也會同步上線,只需一步上傳老照片,AI就能讓凝練在舊時(shí)光中的照片靈動起來。
此外,清影API也同步上線大模型開放平臺bigmodel.cn,企業(yè)和開發(fā)者通過調(diào)用API的方式,體驗(yàn)和使用文生視頻以及圖生視頻的模型能力。新型DiT模型架構(gòu),更高效地壓縮視頻信息,以及更充分地融合文本和視頻內(nèi)容,讓清影在復(fù)雜指令遵從能力、內(nèi)容連貫性、大幅的畫面調(diào)度上具有一定獨(dú)到之處。
張鵬特別強(qiáng)調(diào),在生成式視頻模型的研發(fā)中,Scaling Law繼續(xù)在算法和數(shù)據(jù)兩方面發(fā)揮作用。“我們積極在模型層面探索更高效的scaling方式。隨著算法、數(shù)據(jù)不斷迭代,相信Scaling Law將繼續(xù)發(fā)揮強(qiáng)有力作用?!彼f。
“本次清影底座的視頻生成模型是CogVideoX,它能將文本、時(shí)間、空間三個(gè)維度融合起來,參考了Sora的算法設(shè)計(jì),它也是一個(gè)DiT架構(gòu),通過優(yōu)化,CogVideoX相比前代CogVideo的推理速度提升了6倍。我們將繼續(xù)努力迭代,在后續(xù)版本中,陸續(xù)推出更高分辨率、更長時(shí)長的生成視頻功能。”張鵬表示。
智譜AI方面表示,清影的研發(fā)得到北京市的大力支持。當(dāng)前,北京正在打造人工智能產(chǎn)業(yè)高地,海淀區(qū)是智譜AI總部所在地,為智譜AI開展大模型研發(fā)提供了產(chǎn)業(yè)投資、算力補(bǔ)貼、應(yīng)用場景示范、人才等全方位支持。
清影的訓(xùn)練依托亦莊高性能算力集群,受益于亦莊良好的人工智能產(chǎn)業(yè)生態(tài)。清影在北京亦莊算力集群誕生,未來也將應(yīng)用于北京亦莊廣闊的高精尖產(chǎn)業(yè)集群,形成大模型賦能實(shí)體經(jīng)濟(jì)的新業(yè)態(tài)。
嗶哩嗶哩作為合作伙伴也參與了清影的技術(shù)研發(fā)過程,并致力于探索未來可能的應(yīng)用場景。同時(shí),合作伙伴華策影視也參與了模型共建。
目前,人工智能行業(yè)對多模態(tài)模型的探索還處于初級的階段。智譜AI透露,清影還將不斷迭代,智譜AI將持續(xù)努力打造對標(biāo)世界先進(jìn)水平的模型產(chǎn)品矩陣,致力于通過大模型鏈接物理世界的億級用戶,為千行百業(yè)帶來持續(xù)創(chuàng)新與變革,加速邁向通用人工智能時(shí)代。
編輯:孫冰