作者 | 云飛揚
最近,抖音的某個本地生活類賬號進(jìn)行了兩場帶貨直播。據(jù)新榜旗下抖音數(shù)據(jù)平臺新抖數(shù)據(jù)統(tǒng)計,該賬號兩場直播的預(yù)估銷售額均在7萬元上下。數(shù)據(jù)看起來不高,但這兩場直播全程由數(shù)字人完成,單日成本僅190元,不需要場地以及燈光、攝像頭等硬件投入,只需要一臺電腦即可,且?guī)ж洺煽兒痛饲暗恼嫒酥鞑ハ嗖畈淮蟆?/span>
要知道,帶貨主播現(xiàn)在已經(jīng)是實實在在的高薪行業(yè)。以杭州為例,月薪1.5萬元都不一定能吸引到合適的主播,更何況一個直播間至少還需要承擔(dān)運營等人力成本,以及燈光、場地等固定成本。
又便宜、又能7x24小時工作的數(shù)字人主播真出現(xiàn)了?
數(shù)字人公司硅基智能相關(guān)負(fù)責(zé)人羅峰(化名)告訴新榜編輯部,這種數(shù)字人屬于2D超寫實數(shù)字人。據(jù)介紹,硅基智能克隆數(shù)字人前需要主播先提供一段3-5分鐘的真人出鏡口播視頻,以及30秒的真人出鏡靜默視頻、純綠幕視頻、錄音文件。
“這些素材輸入到后臺,我們的代碼就能調(diào)用算力讓數(shù)字人根據(jù)對應(yīng)文本動起來,同時做好音畫同步的修正。”
羅峰強調(diào),數(shù)字人最好根據(jù)應(yīng)用場景來提供素材,如果想要讓數(shù)字人的應(yīng)用場景更通用,還可以提供比較通用的肢體動作素材。數(shù)字人從需求提交到克隆完成一般只需要5-7天即可。“得益于對嘴唇、身體動作等的精準(zhǔn)控制,硅基智能的數(shù)字人的聲音還原度可以達(dá)到80%-90%,擬真度最高能達(dá)到99%,外表基本上看不太出來”。
硅基智能采用的核心技術(shù)。圖源:受訪者
倒映有聲聯(lián)合創(chuàng)始人、CTO李驍補充,目前業(yè)內(nèi)的數(shù)字人公司主要有兩種技術(shù)路線:一種是紋理式,通過拼接聲音、口型、動作等讓數(shù)字人動起來;一種則是生成式,把數(shù)字人作為一個整體整個驅(qū)動起來。
籠統(tǒng)地說,區(qū)別于柳夜熙等3D超寫實數(shù)字人,以及A-soul等2D二次元數(shù)字人,2D超寫實數(shù)字人就是以真人為基礎(chǔ),制作出一個有動作、有聲音的二維圖片。李驍強調(diào):“對于數(shù)字人來說,最終是否足夠逼真是非常關(guān)鍵的一點。”
圖源:抖音
在最近的《劉潤年度演講2022:進(jìn)化的力量》中,潤米咨詢創(chuàng)始人劉潤爆料,今年10月1日開始,自己發(fā)布在社交平臺的視頻有不少都是由數(shù)字人完成的。利用數(shù)字人技術(shù),博主似乎不需要再化妝、背臺本、拍攝,只需要輸入一段文本就可以輸出一段以假亂真的短視頻。
羅峰透露,目前國內(nèi)提供類似服務(wù)的至少有4-5家,單單硅基智能就為抖音上的3萬多位博主制作了數(shù)字人。據(jù)了解,目前博主使用數(shù)字人時一般會穿插使用,有時間時就自己拍攝,外地出差時則在高鐵上編輯好文本,直接使用數(shù)字人。
據(jù)觀察,目前包括“劉潤”“崔磊·為思考點贊”“駱駱整理說”“大巫聊裝修”等博主的視頻并未因為使用數(shù)字人而出現(xiàn)明顯數(shù)據(jù)下滑。
從帶貨主播到短視頻博主,數(shù)字人真能代替真人嗎?
2D超寫實,數(shù)字人的新解法?
數(shù)字人很多人應(yīng)該不陌生,此前新榜編輯部在系列文章《造價從100元到100萬,虛擬人究竟是什么?》《90%玩家處在早期階段,虛擬人靠什么賺錢?》《虛擬人四大難題:技術(shù)、產(chǎn)品、市場、中之人》中也做了相關(guān)報道。
3D超寫實數(shù)字人的優(yōu)勢非常明顯,不僅極具科技感,還能搭上元宇宙概念股,但劣勢同樣突出:價錢太貴,門檻太高。一個標(biāo)準(zhǔn)線以上的3D超寫實數(shù)字人,市場報價普遍在百萬級別,且產(chǎn)能有限。這也是為什么3D超寫實數(shù)字人更多活躍在短視頻甚至是圖片中。
2D二次元數(shù)字人的優(yōu)勢是便宜,能吸引二次元用戶,但卻很難幫品牌覆蓋更大范圍的用戶。有業(yè)內(nèi)人士表示,二次元數(shù)字人太小眾了。早在去年,韓束等品牌就開始在淘寶直播間使用2D二次元數(shù)字人帶貨,但更多是為了填充凌晨之后的“垃圾時間”。
圖源:抖音、淘寶
擬真度高,能降低觀眾接受難度之外,2D超寫實數(shù)字人的另一個特點就是便宜。
以硅基智能為例,數(shù)字人形象+聲音克隆的費用為1.6萬元/年。數(shù)字人如果用于拍攝短視頻,只需要再支付大約6元/分鐘的時長費;如果用于直播帶貨,則需要再支付5500元/月的服務(wù)費。
“中小商家使用素材庫中199元/月的通用數(shù)字人,直播費用最低可以壓縮到5699元/月,有些通用數(shù)字人還是免費的。”
羅峰透露,為了滿足中小商家的需求,硅基智能和模特經(jīng)紀(jì)公司合作,集中采購了一批模特的形象授權(quán)用于制作通用數(shù)字人。“通用數(shù)字人我們會盡量選得寬一些,各個行業(yè)都有,且不斷補充更新,另外還會有外國人形象的數(shù)字人用于英文直播。”
圖源:硅語元宇宙App
事實上,目前業(yè)內(nèi)已經(jīng)出現(xiàn)不少2D超寫實數(shù)字人創(chuàng)業(yè)公司,核心賣點就是便宜。比如“磊哥說同城運營”在直播中就表示,數(shù)字人主播的費用可以低至13.66元/小時,每月穩(wěn)定產(chǎn)出500條短視頻。
不同的數(shù)字人服務(wù)商。圖源:抖音
總得來說,不同城市、不同類目、不同直播間的成本差異極大,不同數(shù)字人公司給出的報價也不盡相同,但數(shù)字人主播比真人主播便宜,是沒什么問題的。
數(shù)字人做帶貨、拍視頻靠譜嗎?
從資本角度,數(shù)字人往往和元宇宙聯(lián)系在一起,數(shù)字人的價值取決于能否講出一個漂亮的、著眼未來的故事,但從直播、短視頻角度,判斷數(shù)字人價值的標(biāo)準(zhǔn)很簡單:能不能帶貨、有沒有流量。
需要具備一定的靈性,能和觀眾進(jìn)行深度的情感互動,同時必須進(jìn)行大量機械勞動,比如同樣的話術(shù)反復(fù)說無數(shù)次,這是帶貨主播少而貴的內(nèi)在原因。
以目前的技術(shù),數(shù)字人大概率代替不了董宇輝、李佳琦等個人風(fēng)格強烈的主播,但如果是在強調(diào)“貨帶人”的品牌直播間呢?觀眾不需要和主播進(jìn)行情感互動,產(chǎn)品好,價格便宜,還能把相關(guān)信息講清楚就行。
羅峰透露,大品牌的數(shù)字人通常在非熱門時段使用,熱門時段仍需要真人主播拉人氣。這個時候,數(shù)字人的定位更多是為了輔助主播,承擔(dān)一部分機械性勞動,以便支撐起24小時直播間。
至于中小商家,基本都是平播,提前錄好0.5-1小時的語音后,就可以配合數(shù)字人在直播間循環(huán)播放。這個時候,數(shù)字人的角色定位更像是圖像版智能客服。

面向淘寶商家的智能客服曾是一個垂直創(chuàng)業(yè)賽道,數(shù)字人主播像是直播電商時代的智能客服。圖源:網(wǎng)絡(luò)
數(shù)字人主播算是介于貨架電商和真人主播帶貨之間的一個新解決方案。
做個選擇題,你能分辨出來劉潤的哪條視頻是真人拍攝,哪條視頻是用數(shù)字人拍攝嗎?
單就我的個人體驗,在快節(jié)奏的刷屏場景下,真人和數(shù)字人的視頻觀看體驗差別并不大。
劉潤和崔磊的共同特點都是口播博主,他們的視頻特點是:場景固定,機位固定,動作固定,且更強調(diào)知識輸出而非個人表演。對這類博主來說,只要保證文本質(zhì)量,同時視頻觀看體驗不太差,流量并不會有太大變化。
倒映有聲為陶勇醫(yī)生制作的數(shù)字人分身
圖源:騰訊視頻“眼科醫(yī)生陶勇”
對于數(shù)字人博主,自媒體人倪叔曾提出兩個問題:當(dāng)觀眾知道博主是數(shù)字人的時候,他們還有觀看、互動的動力嗎?當(dāng)知道博主的視頻只要輸入一段語音就能生成卻報價10萬元時,品牌方還愿意給錢嗎?
這里有個微妙的地方在于,我們可以說博主輸出的內(nèi)容質(zhì)量沒有變,視頻的流量也沒變,但觀眾和品牌的感受也不會變嗎?這個沒有絕對的對與錯,但需要時間來給出答案。羅峰提到,不少使用數(shù)字人的博主都和硅基智能簽署了保密協(xié)議??磥恚┲鱾兛赡芤矒?dān)心這一點。
總得來說,數(shù)字人最明顯的優(yōu)勢就是能降低真人的時間成本、團(tuán)隊成本,提高他們的勞動產(chǎn)出。羅峰說:“我們想做的就是通過數(shù)字分身幫客戶躺著賺錢。”
此外,李驍認(rèn)為,數(shù)字人的另一大優(yōu)勢是可以進(jìn)行能力遷移,數(shù)字人既可以瞬間學(xué)會英語、法語等多國語言,還可以加載唱歌、跳舞等技能。“更像真人,還能做一些真人做不到的事情,這會是數(shù)字人未來的兩個發(fā)展方向。”
數(shù)字人能讓人躺賺嗎?
幾年前,“睡后收入”概念曾流行一時,簡單來說,一個人什么都不用干,每天睡醒就能看到銀行卡里的錢越來越多,通過金融、IP等方式獲得大量非勞動性收入。
業(yè)內(nèi)對數(shù)字人的追捧,表面上是因為博主時間太緊,沒時間拍視頻,主播價錢太貴,商家支付不起,但更深層次的原因是,業(yè)內(nèi)希望能用數(shù)字人完成視頻拍攝、直播帶貨等勞動,進(jìn)而實現(xiàn)低成本、無限制的效率產(chǎn)出。
想法很美好,但目前的數(shù)字人技術(shù)仍然存在一定局限。李驍表示,數(shù)字人最難的就是肢體動作的精準(zhǔn)匹配。“如何根據(jù)語義對動作進(jìn)行推斷,如何把動作渲染出來,尤其是復(fù)雜環(huán)境下的運動預(yù)判,目前還是一個比較難的問題。”
正因如此,目前的數(shù)字人還無法快速、低成本地滿足劇情、搞笑、顏值等博主的視頻拍攝要求,而更多聚焦動作變化不大,且主要展示上半身的口播主播。據(jù)了解,目前2D超寫實數(shù)字人創(chuàng)業(yè)公司的主要客群就是想轉(zhuǎn)型口播博主的律師、醫(yī)生、會計、心理咨詢師等專業(yè)人士。
當(dāng)然,隨著技術(shù)進(jìn)步,我相信數(shù)字人的智能程度會越來越高、相關(guān)成本會越來越低。但是,數(shù)字人也存在3個根本性問題:
第一,數(shù)字人只能解決效率問題,無法解決內(nèi)容問題、產(chǎn)品問題。劉潤可以靠數(shù)字人省去視頻拍攝的時間,但數(shù)字人說什么,仍然來自他對行業(yè)、人性、世界的思考;商家可以靠數(shù)字人獲得一定的成本優(yōu)勢,但當(dāng)大部分商家用上數(shù)字人后,決定貨能不能賣出去的,仍然是產(chǎn)品是否有足夠的競爭力。
倒映有聲聯(lián)合創(chuàng)始人、CMO何培成認(rèn)為:“如果最后數(shù)字人的效果不好,是怪自己的運營能力還是怪?jǐn)?shù)字人?通過解放重復(fù)性勞動來壓縮人力成本,這才是數(shù)字人能解決的核心問題。”
第二,數(shù)字人尚未跑出成熟、可復(fù)制的商業(yè)模式。巨量引擎數(shù)據(jù)顯示,2022年直播電商行業(yè)至少有378萬的人才缺口。如果數(shù)字人能解決直播電商行業(yè)的勞動力問題,應(yīng)該會有不錯的商業(yè)前景。
在何培成看來,數(shù)字人的未來一定是面向廣大普通人,但很多人可能并沒有想清楚數(shù)字人到底有什么用。“我們現(xiàn)在主要聚焦廣電融媒體等B端用戶,一個原因就是B端用戶客單價更高,需求也更明確,相反,C端用戶并沒有太高的付費意愿。”
此外,一旦數(shù)字人被證明可行,行業(yè)會迅速從卷真人變成卷數(shù)字人。最后,整個行業(yè)的競爭態(tài)勢很可能并不會發(fā)生根本性變化。
第三,數(shù)字人可以滿足博主、商家的需求,但未必能滿足觀眾的需求。觀眾可能因為新鮮感圍觀少數(shù)幾個數(shù)字人,但無數(shù)科幻電影也描述了一種擔(dān)憂:相比帶來的便利,人類更厭惡數(shù)字人帶給生活的虛幻感。“純手工”為什么能成為營銷標(biāo)簽?因為很多人更愿意為一個有血有肉的人付費,向一個活生生的人投入感情。

數(shù)字人真正的難題是能否俘獲人類的感情
圖源:《銀翼殺手2049》
因為用戶需求,平臺也未必會允許數(shù)字人的大規(guī)模應(yīng)用。
數(shù)字人帶貨屬于抖音明文禁止的“錄播”行為嗎?新榜編輯部就此向幾大直播帶貨平臺詢問,截至發(fā)稿前,幾大平臺均未給出明確回復(fù)。此前有相關(guān)從業(yè)者表示,淘寶、京東這類純電商平臺不會限制數(shù)字人帶貨,但抖音、快手等內(nèi)容電商平臺,可能會在流量上做出一定限制。
圖源:抖音電商
據(jù)了解,目前的數(shù)字人直播通常會配備一個運營,運營既可以在后臺實時輸入文本,操作數(shù)字人回答觀眾提問,也可以以助理的身份幫助數(shù)字人回答問題。“我們的數(shù)字人不僅支持中之人模式,還可以實現(xiàn)數(shù)字人、真人的聯(lián)合直播”,羅峰補充。
短期內(nèi),如果能把技術(shù)、市場問題解決好,數(shù)字人主播/博主應(yīng)該能成為一個不錯的效率工具,但能否撐得上一個更大的故事,未來會不會被證明是泡沫,只能等更多市場反饋。
“說實話,數(shù)字人行業(yè)的真正需求我們也在持續(xù)深挖,更多的應(yīng)用場景也在嘗試落地;但毋庸置疑,在元宇宙和Web3.0的世界里,數(shù)字人是必定需要的底層基礎(chǔ)設(shè)施”,何培成說。
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實、專業(yè)的平臺氛圍,我們團(tuán)隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)