很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經錄用會有專人和您聯(lián)系
咨詢如何成為春羽作者請聯(lián)系:鳥哥筆記小羽毛(ngbjxym)
“大模型廠商價格戰(zhàn)停不下來,反映的恰恰是對未來的焦慮。在這場大模型的軍備競賽中,豆包想要上演“大力出奇跡”的戲碼。”
@科技新知 原創(chuàng)
作者丨思原 編輯丨蕨影
大模型賽道打了一年的價格戰(zhàn),還在繼續(xù)……
就在新年前一天,阿里云宣布2024年度第三輪大模型降價,通義千問視覺理解模型全線降價超80%。
同樣,前不久火山引擎的Force大會上,除了大力宣傳豆包外,最值得關注的還是價格的再次下降。目前豆包視覺理解模型輸入價格為0.003元/千tokens,1塊錢可處理284張720P的圖片。
此前去年5月份,豆包通用模型pro-32k版,推理輸入價格為0.0008元/千tokens,價格不到1厘。此舉迫使阿里云對其三款通義千問核心模型進行新一輪降價,降幅高達90%。而百度智能云則更為激進,宣布文心大模型旗下的兩款主打產品——ENIRE Speed與ENIRE Lite,將全面免費開放。
按照火山引擎總裁譚待的說法,“市場需要充分競爭,降低成本是技術優(yōu)化的結果,做得最好才能活下來”。顯然,在這場大模型的軍備競賽中,豆包想要上演“大力出奇跡”的戲碼。
但在字節(jié)大肆內卷之下,也有質疑不斷:豆包的價格真的足夠便宜嗎?為什么大模型要卷價格?未來價格還會成為企業(yè)拿單重點嗎?
想要理解大模型商家的套路,就需要了解大模型的商業(yè)模式。據(jù)“遠川科技評論”梳理,目前來看各家提供的服務主要可分為三種:
一是包含模型推理的基礎服務,指的是根據(jù)輸入的信息內容,給出回答的過程。簡單來說就是“實際使用”模型的過程。這部分各家都有不同的模型標準。
二是模型精調,廠商可以根據(jù)客戶需求按token使用量(訓練文本*訓練迭代次數(shù))計費,訓練完成后出賬,按量后付費。
第三種便是模型部署,就相當于一個客戶獨占了一部分算力資源,屬于大客戶,其收費模式,也是按照消耗的計算資源或者模型推理的token數(shù)量以量計價。
這3種收費模式,代表的也是大模型開發(fā)由淺入深的過程。而各大科技公司瘋狂砍價的,其實是第一種基礎服務,即標準版模型的推理費用。而這部分定價又分成了“輸入”和“輸出”兩部分。簡單來說,輸入就是用戶提問的內容,而輸出則是大模型的回答。
在調用大模型時往往會根據(jù)輸入和輸出的token數(shù)量,進行雙向計費。這種細微差異,很容易成為大模型公司的套路。
例如,豆包的通用模型Doubao Pro-32k,輸入價格為“0.8元/百萬tokens”,按照官方說法是比行業(yè)便宜了99.3%,一些主流模型也都開始了降價,比如阿里云三款通義千問主力模型Qwen-Turbo價格較之前直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max的輸入價格分別再降價80%和50%,分別為0.8元/百萬tokens和20元/百萬tokens。
但輸出價格方面有所差別,2元/百萬tokens的價格與Qwen-Plus、DeepSeek-V2等同行持平,甚至比比Qwen-Turbo、GLM-4-9B等一些同行產品價格更高。
再看最新的豆包視覺理解模型Doubao-vision-pro-32k,輸入化為每百萬tokens的售價為3元,大概是0.4美元,輸出直接來到了9元,大概為1.23美元。按照豆包說法,這個售價比行業(yè)平均價格便宜85%。
但對比幾個直接競爭者:阿里的多模態(tài)模型Qwen-VL系列在最近降價后與其價格一致;多模態(tài)的Gemini 1.5 Flash模型每百萬輸入tokens報價為0.075 美元、每百萬輸出tokens成本為0.3美元,對于較小的上下文(小于128k)還另有折扣價;GPT-4o mini則是輸入0.15美元,輸出0.6美元。
不過不止豆包,國內其他廠商基本也都有類似的降價“套路”。例如百度宣布免費的ERNIE-Speed-8K,如果實際部署,收費就變成了5元/百萬tokens。還有阿里的Qwen-Max,實際與字節(jié)跳動的豆包通用模型Pro-32k一樣,只是降低了輸入的價格。
值得一提的是,標準模型推理的降價確實可以讓中小開發(fā)者降低成本,但只要稍微更進一步的使用,就涉及到了模型微調和模型部署,然而這兩項服務一直都不是價格戰(zhàn)的主角,并且也沒有太大降價幅度。
簡單來說,各家降價最狠的其實都是輕量級的預置模型;相比之下,性能更強悍的“超大杯”模型,實際降價幅度沒有那么夸張。例如精調的Doubao-pro系列的價格都在50元/百萬tokens,比阿里、騰訊這些廠商的旗艦主力模型價格更高。
各大廠商風風火火的掀起的價格戰(zhàn),就像是打網游,用各種形式吸引玩家,再在游戲中加上各種玩法,總之就是想要變強就要氪金。當然,即便如此,各個大廠也算是真金白銀的付出很多,那么為什么這些廠商在一直圍繞價格大費周章呢?
縱觀大模型行業(yè),字節(jié)跳動一定算不上起跑最快的那一批選手,甚至今年年初,字節(jié)跳動CEO梁汝波在內部講話中提到“遲鈍”二字,直指字節(jié)對大模型的敏感度不如創(chuàng)業(yè)公司。
“直到2023年才開始討論GPT,而業(yè)內做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的。”他說。
后來者往往是最需要內卷的那個,字節(jié)跳動也是如此。從今年年中開始,便開始制造一輪又一輪熱度。
除了上文所說的,豆包在B端的讓利降價意圖明顯外,C端市場豆包也是全力出擊。
面向C端,無論是線上平臺,還是線下公開場所,都能看到豆包的身影。據(jù)“連線Insight”援引AppGrowing統(tǒng)計,截至11月15日,國內十款AI原生應用中,Kimi和豆包是投放最瘋狂的兩個產品,分別投放了5.4億元和4億元。
拉長時間線看,豆包的投流顯然更猛烈。據(jù)AppGrowing統(tǒng)計,2024年4月—5月,豆包投放金額預計為1500萬元-1750萬元。6月上旬,豆包再次啟動新一輪大規(guī)模的廣告投放活動,投放金額高達1.24億元。
除了投流外,豆包還有抖音這一流量池,字節(jié)幾乎屏蔽了除了豆包以外所有AI應用在抖音上的投放。目的也很明確,就是要徹底解決大模型應用的“用戶焦慮”。
然而,現(xiàn)實往往事與愿違。據(jù)“智能涌現(xiàn)”報道,字節(jié)內部反思——豆包目前的用戶活躍度并不算高。豆包每周僅活躍2至3天,且每天用戶發(fā)送消息輪次僅為5到6次,單次2分鐘左右,用戶人均使用時長僅為10分鐘左右。上述這些數(shù)據(jù)在過去一年中的增長幅度并不顯著。
簡單來說,不計成本的投流,雖然讓豆包成了國內用戶數(shù)量斷層式第一的AI軟件,但仍然算不上是一款killer app。
字節(jié)管理層對此的判斷是,像豆包這樣的AI對話類產品可能只是AI產品的“中間態(tài)”。字節(jié)內部判斷,付費訂閱模式在中國不太可能走通。而時長和輪次太低,又導致潛在的廣告空間較小,這都構成了這類產品的隱形天花板。
所以長期來看,更低門檻、更“多模態(tài)”的產品形式更具落地可能,剪映和即夢可能是合適的入口,這也是此次大會豆包將部分重點放在視頻模型的本質原因。
但站在用戶角度,根據(jù)“財經雜志”報道,大部分用戶買單的原因是產品和服務能帶來價值,價值不光是解決具體問題,如提升工作效率、提供情感陪伴等,市場上還有一類價值是“符合政策方向”。更重要的要具備找到具體客戶并交付的能力,這考驗的是AI公司在技術和產品之外的能力,甚至在很多時候,這項能力比技術實力更能幫助AI公司成長。
中國的AI市場和美國不同,很難通過平臺銷售軟件的模式打開市場,大部分時候需要抓住一個個的項目和工程來實現(xiàn)商業(yè)化。而這些項目和工程的來源,往往與自身熱度有關。
“一家成熟的企業(yè)在布局大模型時,很難會去考慮一個不成熟的產品或者企業(yè)。在不考慮成本的情況下,大品牌往往是首選,這不僅是技術上的信任,更多是服務、整體質量的信任”,一位科技企業(yè)管理人員向「科技新知」表示,“畢竟小廠的風險還是有的,就像買車,開著開著車廠倒閉了,那就損失大了”。
初創(chuàng)公司大肆制造熱點新聞,大概率是為了融資,是為了活下去,而豆包這種本就有背景的,則是想要靠著熱度去找到并且固定更多客戶,但圈內一個默認的事實就是,無論是誰、無論技術多厲害,都要善于保持熱度,畢竟酒好也怕巷子深。
其實不止豆包,目前市面上所有二線及以下的大模型廠商,都處在花錢買流量的階段,為的是留住用戶。因為這一場不折不扣的“卷王秀”背后,是瘋狂的產品能力和研發(fā)速度,更意味著這場關于“擠泡沫”的大模型服務商淘汰賽,再次吹響了號角。
2024年已經經歷了一輪淘汰賽洗禮,讓大模型去九存一,產業(yè)格局更加合理,只留下了約10%的大模型進入決賽圈。
然而,這并不是結束,而是開始。只是在「科技新知」看來,新一輪淘汰賽的重點,價格不再是主導因素而是技術。
目前科技公司們也開始陸續(xù)意識到,僅發(fā)布一個免費的應用,并不能為公司帶來直接收益,C端用戶量很難增長,獲客成本已經明顯提升。更重要的是去直接觸及那些愿意付費的B 端客戶,例如金融、政務、汽車等行業(yè)。
但是通常有大量公司集中進入某個行業(yè)時,會出現(xiàn)持久的價格戰(zhàn),因為各家都需要打造一個標桿客戶,來為之后的市場拓展鋪路。簡單粗暴的價格戰(zhàn)會讓一些公司主動或被動退出,待市場穩(wěn)定后,再將價格恢復常態(tài)。
但矛盾之處在于,“有錢”的領域大家都想進入。而長久的價格戰(zhàn)下,技術成本變成了制勝關鍵,簡單來說,同樣的解決方案和報價下,誰的技術成本更低,誰就能虧得更少,活得更久。
而技術成本取決于企業(yè)的硬件成本和算法邏輯,這點目前國內主流的大模型廠商基本處在同一水準,并且迭代和互相追趕的速度也不相上下,但這不代表可以高枕無憂。
今年9月,OpenAI的“王炸”o1模型的問世也讓各家看到了差距,與現(xiàn)有的大模型相比,o1最大的特點就是“推理式AI”,它在回答復雜問題時會花費更多時間來逐步推演問題。這種延時思考并不是缺點,反而讓o1更接近人類真實的邏輯推理方式。
從“生成式AI”到“推理式AI”,o1的推出預示著AI進入了一個全新的階段。而更令人震驚的是,在o1發(fā)布的3個月后,下一代o系列產品o3便橫空出世,并且o3有完整版和mini版,新功能是可將模型推理時間設置為低、中、高,模型思考時間越高,效果越好。mini版更精簡,針對特定任務進行了微調,將在1月底推出,之后不久推出o3完整版。
這也意味著快速迭代下,目前主流的生成式AI,即將成為歷史產品。
“價格是影響大模型企業(yè)的因素,但更重要的還是技術能力,”一位大模型應用開發(fā)者向「科技新知」表示,“目前國內如阿里、昆侖萬維等企業(yè)也都推出類o1模型,雖然有差距,但也代表了他們也都認同這一趨勢。”
一位業(yè)內專家也表示,國內企業(yè)走的思路是集成思維鏈、用搜索方式提升深度推理能力、加入反思策略和算法提升邏輯推理性能,但目前還未完全超過OpenAI。
值得一提的是,國內最近比較火的DeepSeek-V3,采用的蒸餾技術給行業(yè)提供了新思路,但同時也陷入“優(yōu)化GPT”的爭論。
而針對AI訓練可能使用合成數(shù)據(jù)(大模型生成數(shù)據(jù))這一話題,倫敦大學學院(UCL)名譽教授和計算機科學家彼得·本特利表達了擔憂,稱“如果繼續(xù)在其他AI的輸出上訓練AI,結果可能是模型崩潰。確保高質量AI的唯一方法是,為其提供人類的高質量內容。”
“缺乏參照的現(xiàn)成開源架構,不清楚o1模型做后訓練時強化學習的方式以及使用的數(shù)據(jù)集,樹搜索、COT未開源,訓練數(shù)據(jù)污染、國產模型推理性能提升困難,這些都是目前國內企業(yè)的難點,”該專家補充道,“不過若有支持o1架構的開源模型出現(xiàn)會加速這一過程,過程中會有兩三家先跑,其他家后跟進。”
如果根據(jù)以往GPT系列的發(fā)展節(jié)奏,全廠商跟上o系列的步伐大概率會在2025年上半年到來,而在這之后,目前的技術也將逐漸退出歷史舞臺,所以對于大模型廠商來說,與其坐等被淘汰,不如在淘汰之前讓迭代技術發(fā)揮更大作用。
總的來看,未來價格雖仍會是影響企業(yè)拿單的因素之一,但隨著技術的快速迭代和行業(yè)的發(fā)展,技術能力將越發(fā)關鍵,只有不斷提升技術、降低成本、優(yōu)化服務,大模型廠商才能在即將到來的淘汰賽中存活下來。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據(jù)《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)