很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請(qǐng)把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會(huì)有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒?qǐng)聯(lián)系:鳥哥筆記小羽毛(ngbjxym)
昨天凌晨,Sora上線了。
很多小伙伴都是鐵桿粉,熬夜不睡,為了第一時(shí)間追這個(gè)熱點(diǎn)。我也沒(méi)例外,熬到12點(diǎn)半,但眼皮實(shí)在撐不住,就決定先去睡覺(jué)了。
早上一睜眼,趕緊打開電腦,直接去sora官網(wǎng)。映入眼簾的是24個(gè)視頻,它們排列得整整齊齊,這些視頻非常豐富。
有的展示了人物風(fēng)采,有的描繪了大海的壯麗,讓我印象最深的是一個(gè)視頻:一顆小種子在泥土中破土而出,發(fā)芽、生長(zhǎng)的過(guò)程被拍得很細(xì)致,種子上的小毛孔都能看得很清楚,特別逼真。
迫不及待想親自體驗(yàn)一下這種震撼,但當(dāng)我嘗試用谷歌賬戶登錄時(shí),它卻提醒我,因?yàn)橛脩袅刻?,sora賬戶無(wú)法使用。
哎,這就像大夏天想喝冰鎮(zhèn)可樂(lè),卻發(fā)現(xiàn)杯子里什么都沒(méi)有,既期待又失落。我相信身邊也有很多朋友想體驗(yàn)但沒(méi)能體驗(yàn)到。
不過(guò),沒(méi)關(guān)系,這里有幾款A(yù)I視頻生成模型做出來(lái)的效果,并不比sora差。在我心中排在第一位的,你猜是哪款?騰訊混元文生視頻。
為什么呢?
想必上一周,你也刷到了騰訊混元文生視頻開放的信息,它在GitHub、Hugging Face和各大技術(shù)報(bào)告中都能找到。
如果想親自體驗(yàn),可以直接去官網(wǎng)試用。在官網(wǎng)上,你能看到很多逼真的人物視頻。不過(guò),要注意,這些展示視頻可能經(jīng)過(guò)了多次調(diào)整。
目前,騰訊混元的視頻模型,雖然只能實(shí)現(xiàn)文字生成視頻的功能,但它在很多方面表現(xiàn)出色,比如畫面質(zhì)量、鏡頭切換效果、物體運(yùn)動(dòng)表現(xiàn),以及對(duì)提示詞的理解等。
你只要輸入一段文字描述,它就能生成一段5秒鐘的視頻。中文和英文的提示詞都可以使用,生成的視頻畫面非常真實(shí),看起來(lái)就像電影一樣。
剛內(nèi)測(cè)時(shí),我測(cè)試了近景、中景、廣景、特寫等類別。現(xiàn)在這些視頻還在空間里。我給近景的提示詞是「一只貓?jiān)诓莸厣仙⒉降膱?chǎng)景」。
我選擇了寫實(shí)風(fēng)格,配上自然光效果,用專業(yè)鏡頭拍攝,追求高質(zhì)量畫面。最終的效果非常真實(shí),完全能以假亂真。
特寫方面,我在成都一個(gè)熱鬧的小吃街上,主播穿著四川特色的服裝,頭上戴著可愛(ài)的熊貓耳朵發(fā)箍。她正在品嘗麻辣串串,背景是熙熙攘攘的小吃街,還有各種誘人的美食。生成的效果也不錯(cuò),不至于讓人感到不適。
至于其他類別,你可以自己試試。我發(fā)現(xiàn),騰訊在產(chǎn)品細(xì)節(jié)方面做得很不錯(cuò),它能把風(fēng)格、標(biāo)簽、類型、氛圍和光線都展示得很清楚。
從提示詞來(lái)看,騰訊做得比其他產(chǎn)品好,其他產(chǎn)品的提示詞可能讓你寫一段話再生成,但生成的內(nèi)容往往和你想要的有差距。在這方面,騰訊的產(chǎn)品設(shè)計(jì)更人性化。
現(xiàn)在它每天以速度優(yōu)先能生成5個(gè)視頻,以質(zhì)量?jī)?yōu)先能生成2個(gè)。但我覺(jué)得,在質(zhì)量和速度上,兩者的差異并不大。
第二個(gè)產(chǎn)品是什么呢?字節(jié)的即夢(mèng)AI。
即夢(mèng)AI,真的很懂我想要什么,不用復(fù)雜的提示詞,都能搞定一切。
說(shuō)到即夢(mèng),不能不提兩個(gè)軟件。一個(gè)是剪映,很多剪視頻的人都用過(guò)。它簡(jiǎn)單易用,就像剪輯界的“傻瓜相機(jī)”。無(wú)論是新手還是老手,大家都挺喜歡的。
我記得早些年時(shí),即夢(mèng)不叫即夢(mèng),叫「Dreamina」,那時(shí)它還是剪映里的一個(gè)功能,后來(lái)才獨(dú)立出來(lái),并同時(shí)推出了一些新功能。
另一個(gè)要提到的是抖音。我不知道你有沒(méi)有刷到過(guò)那些把古典影視劇剪輯成搞笑段子的視頻,還有AI生成的寫真照,這些基本都來(lái)自即夢(mèng)的小工具。
至于能力上,文生視頻、文生圖自然是不可缺失一部分,拿文生圖來(lái)說(shuō),我小綠書上所有的圖片幾乎都是用它制作而成。
在視頻上,即夢(mèng)AI目前有四個(gè)模型,分別是視頻S2.0、視頻2.0PRO、視頻P2.0Pro和視頻1.2。我試過(guò)這幾個(gè)模型,它們各有特點(diǎn)。
S2.0擅長(zhǎng)捕捉流暢感,可以把一張圖的色彩和細(xì)節(jié)平滑過(guò)渡到視頻里。2.0PRO則更擅長(zhǎng)把圖片變成視頻,做得更精細(xì);P2.0Pro能理解復(fù)雜指令,在一句提示下實(shí)現(xiàn)多個(gè)鏡頭切換,同時(shí)保持視頻的形象、風(fēng)格和氛圍一致。
至于視頻1.2模型,主要在運(yùn)鏡和時(shí)長(zhǎng)上下功夫。
最近,1.2模型正在測(cè)試一個(gè)新功能,叫動(dòng)效畫板,這個(gè)功能很強(qiáng)大,因?yàn)樗茏屇慵?xì)致調(diào)整視頻中物體的運(yùn)動(dòng)軌跡和最終狀態(tài),就像在視頻里給物體設(shè)定一套動(dòng)作。
具體來(lái)說(shuō),動(dòng)效畫板能做很多事情。比如:
單主體形變、多主體運(yùn)動(dòng)、主體互動(dòng)、主體與背景互動(dòng)、自定義軌跡、自動(dòng)框選主體或背景等等,一開始,我看著術(shù)語(yǔ)也有點(diǎn)暈,實(shí)際用起來(lái)發(fā)現(xiàn)并不復(fù)雜。
對(duì)了,如果你想用在商業(yè)上,字節(jié)旗下的「即創(chuàng)」是不錯(cuò)的選擇。它在電商領(lǐng)域特別受歡迎,功能包括智能剪輯、數(shù)字人制作視頻、AI視頻腳本、圖文工具和直播工具等等。
所以,我覺(jué)得在電商這塊,「即創(chuàng)」比「即夢(mèng)」用得更高頻,至于“即夢(mèng)”,可能更適合娛樂(lè)場(chǎng)合,你都可以試試看。
第三個(gè)要提到的AI視頻工具是:Kimi。
要找到Kimi,得在聊天界面下面留意一下,那兒有個(gè)不太顯眼的按鈕,上面寫著:Kimi創(chuàng)作空間。點(diǎn)進(jìn)去,就能看到它的宣傳語(yǔ):“你喜歡的歌都有它的視頻”。
我們可以把Kimi的這個(gè)功能叫做:文生音視頻。如果拿Kimi和即夢(mèng)AI比較,從整體產(chǎn)品來(lái)看,Kimi可能不如即夢(mèng)AI,它們之間的差別挺大的。
但是,Kimi也有自己優(yōu)勢(shì),它能細(xì)致到視頻的每一幀。
比如:我要做一個(gè)10秒的視頻,在Kimi后臺(tái)可以看到,這10秒的視頻可能包含10幀或者12幀,每一幀都是一張圖片。
如果對(duì)某一幀圖片不滿意,我可以調(diào)整提示詞,讓它重新生成。所以,我覺(jué)得Kimi在細(xì)節(jié)處理上做得挺好的。
第四個(gè)要說(shuō)的工具是騰訊智影,它也是騰訊推出的。
我現(xiàn)在覺(jué)得,AI視頻工具大概分兩類:一類是用來(lái)玩的,比如做藝術(shù)照、藝術(shù)視頻、國(guó)風(fēng)短片、科幻視頻這些。
另一類更偏向?qū)嵱茫热缂粢曨l、識(shí)別字幕、摳圖、做動(dòng)態(tài)漫畫、去掉背景,還有制作視頻解說(shuō)等等。
騰訊智影更偏向?qū)嵱?,它里面的小工具用起?lái)很方便,很多人想找AI數(shù)字人,騰訊智影是個(gè)不錯(cuò)的選擇。你只需要選個(gè)角色,輸入文字,它就能幫你生成數(shù)字人播報(bào)的視頻。
還有一點(diǎn),騰訊有個(gè)很大的優(yōu)勢(shì),就是它手里有很多視頻素材的版權(quán)。像那些流行的劇短片、短劇里的素材,都能直接在騰訊智影里找到,而且是免費(fèi)的。
這一點(diǎn)比其他平臺(tái)強(qiáng),至少不用擔(dān)心版權(quán)問(wèn)題,我每次找不到素材,就會(huì)去騰訊智影里搜一搜。
最后一個(gè)要提到的是可靈。可靈是快手推出AI視頻工具,現(xiàn)在有兩個(gè)模型,一個(gè)是可靈 1.0,一個(gè)是可靈 1.5;它沒(méi)有明確區(qū)分場(chǎng)景和人物,我用的時(shí)候也搞不清哪個(gè)模型適合近景、遠(yuǎn)景或者人物。
它支持文字生成視頻和圖文轉(zhuǎn)視頻,但用下來(lái)感覺(jué)有些地方還不夠好。比如,生成的視頻看起來(lái)還有點(diǎn)AI味道,這方面的確有提升空間。
不過(guò),如果是用來(lái)做短視頻創(chuàng)作,只要提示詞寫得好,生成的效果基本能滿足日常需求。
我也用過(guò)不少國(guó)外的工具,說(shuō)實(shí)話,國(guó)外產(chǎn)品在多模態(tài)功能上確實(shí)比國(guó)內(nèi)的一些強(qiáng),但網(wǎng)絡(luò)問(wèn)題太麻煩了。
我試過(guò)好幾款,每次上傳幾十兆的視頻或者十幾兆的照片,都要等很久。等它生成完視頻再下載,時(shí)間耗光不說(shuō),耐心也沒(méi)了。
后來(lái)我就想,能不能試試國(guó)內(nèi)的工具?現(xiàn)在看來(lái),完全沒(méi)問(wèn)題。國(guó)內(nèi)的AI視頻生成技術(shù)已經(jīng)很強(qiáng)了,甚至用起來(lái)比國(guó)外的還更順手。
說(shuō)到這,我想起前兩天看到一篇國(guó)外的文章,講的是為什么AI做的藝術(shù)看起來(lái)那么廉價(jià)。文章提到,像DALL-E和Midjourney這樣的AI,需要用大量數(shù)據(jù)來(lái)學(xué)習(xí),但光靠提示詞是不夠的。
比如:
AI要畫「宇航員騎馬」這種圖,還是會(huì)有挺多問(wèn)題,看著怪里怪氣的,不夠真實(shí)。
這些AI做出來(lái)的圖,不管是顯眼的地方還是不明顯的地方,都可能有問(wèn)題。因?yàn)锳I太依賴數(shù)據(jù),它沒(méi)法準(zhǔn)確畫出人的手到底長(zhǎng)啥樣。
心理學(xué)家和AI評(píng)論家加里·馬庫(kù)斯(Gary Marcus)也說(shuō)過(guò):AI處理不了數(shù)據(jù)里沒(méi)有的東西,這部分是人類想象力的領(lǐng)域。就算是最新的AI模型,你讓它畫「宇航員騎馬」,它畫出來(lái)的圖還是會(huì)帶著一種很明顯的“2020年代中期”的風(fēng)格。
你玩得越多,就越明白,要從AI視頻里得到真正有趣的原創(chuàng)內(nèi)容有多難;所以,AI最擅長(zhǎng)的,可能就是讓網(wǎng)上充滿了那種平庸、短暫的藝術(shù)作品。
藝術(shù)家戴爾·沃克(Del Walker)在X平臺(tái)上寫道:用AI圖片做營(yíng)銷,就等于告訴大家你沒(méi)預(yù)算,就像背了個(gè)假的香奈兒包,品牌形象一下子就low了。
所以,我覺(jué)得,文生視頻的競(jìng)爭(zhēng)力就在這些細(xì)節(jié)上。
不管是Sora還是其他工具,大家評(píng)價(jià)一個(gè)視頻有沒(méi)有藝術(shù)感,主要看細(xì)節(jié);而這些細(xì)節(jié),一部分可以交給AI處理,但另一部分還得靠人類的創(chuàng)意和后期加工。
上述提到的騰訊混元文生視頻、即夢(mèng)AI、Kimi、騰訊智影、可靈,是我用著還不錯(cuò);當(dāng)然,清影AI、viduAI、HaiperAI也算領(lǐng)頭羊,都可以試試看。
本文為作者獨(dú)立觀點(diǎn),不代表鳥哥筆記立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對(duì)文章、圖片、字體等版權(quán)有疑問(wèn),請(qǐng)點(diǎn)擊 反饋舉報(bào)
我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實(shí)、專業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對(duì)憲法所確定的基本原則;
2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購(gòu)買或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營(yíng)銷內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷;
8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過(guò)頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢;
4)問(wèn)自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
5)通過(guò)「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)