很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
“DeepSeek-R1如同當(dāng)年蘇聯(lián)搶發(fā)的第一顆衛(wèi)星,成為AI開啟新時代的斯普特尼克時刻。”
2025年春節(jié)前,DeepSeek比除夕那天的煙花先一步在世界上空綻放。
離年夜飯僅剩幾個小時,國內(nèi)某家云服務(wù)器的工程師突然被拉入工作群,接到緊急任務(wù),要求其快速調(diào)優(yōu)芯片,以適配最新的DeepSeek-R1模型。該工程師告訴我們,“從接入到完成,整個過程不到一周”。
大年初二,一家從事Agent To B業(yè)務(wù)的廠商負責(zé)人電話被打爆,客戶的要求簡單粗暴:第一時間驗證模型真實性能,盡快把部署提上日程。
節(jié)前大模型,節(jié)后只有DeepSeek。DeepSeek-R1就像一道分水嶺,重新書寫了中國大模型的敘事邏輯。
以2022年11月,OpenAI發(fā)布基于GPT-3.5的ChatGPT應(yīng)用為起點,國內(nèi)自此走上了追趕OpenAI的道路。2023年,大模型如雨后春筍般冒出頭,無大模型不AI,各廠商你追我趕,百模大戰(zhàn)初見端倪。
你方唱罷我登場,2024年的主人公變成了“AI六小虎”,AI創(chuàng)業(yè)成為新的故事腳本。僅一年的時間,智譜累計完成40億元人民幣融資,月之暗面融資總額超13億美元。在資本拋出橄欖枝后,他們站到了聚光燈下,一躍成為明星獨角獸公司。
新的轉(zhuǎn)折點發(fā)生在DeepSeek-R1爆火后,曾有一段時間內(nèi)行業(yè)陷入了“一半火焰,一半海水”的境地,即一邊積極擁抱學(xué)習(xí)R1,一邊陷入了深深的自省。
徘徊是短暫的,隨著百度、阿里、字節(jié)、騰訊、科大訊飛等廠商紛紛發(fā)布最新的推理模型,2025年的AI敘事主題呼之欲出:“六大推理模型迎戰(zhàn)OpenAI”。
回看OpenAI的模型發(fā)布時間線,在基礎(chǔ)模型方向,可以分為GPT系列和o系列,2024年OpenAI所發(fā)布的o1是一個里程碑式的轉(zhuǎn)向。
GPT系列是OpenAI最早構(gòu)建的模型體系,聚焦自然語言處理、對話系統(tǒng)與文本生成,強調(diào)語言流暢性與上下文理解能力。o系列是OpenAI于2023年新設(shè)立的模型家族,核心聚焦“結(jié)構(gòu)化推理”能力,強調(diào)模型的邏輯、分析、工具調(diào)用能力,是對GPT系列“語言偏重”路線的補充與擴展。
未來GPT系列或?qū)⒅饾u退出歷史舞臺。OpenAI在更新日志中宣布,自2025年4月30日起,GPT4將在ChatGPT中退役,將完全被GPT4o取代。
如果只是OpenAI自身技術(shù)選擇,o系列和DeepSeek-R1并不會帶來如此強大的影響。以底層模型架構(gòu)舉例,有公司選擇傳統(tǒng)的Transformer架構(gòu),也有公司選擇自研架構(gòu)。
o系列崛起有一個大背景,即大模型范式的改變,從傳統(tǒng)預(yù)訓(xùn)練階段模型參數(shù)的Scaling Law,轉(zhuǎn)移到強化學(xué)習(xí)推理計算帶來新Scaling Law。這一點在OpenAI的o3開發(fā)過程中得到了驗證,OpenAI觀察到大規(guī)模強化學(xué)習(xí)表現(xiàn)出與GPT系列預(yù)訓(xùn)練中觀察到的趨勢相同,計算量越大,性能越好。
簡而言之,就是讓AI自己規(guī)劃、學(xué)習(xí)、反饋和完成任務(wù),這與如今大熱的Agent所需具備的能力一致。
有技術(shù)人員告訴光子星球,o1以后所發(fā)布的“Deep Research”Agent,完全基于模型從頭訓(xùn)練,且未公開思維鏈推理過程。“這意味著底座模型能力直接決定了Agent的落地效果”,想要在大模型第二程變得有競爭力,推理模型幾乎成為了必選。
站在公司和技術(shù)一號位角度,第一時間跟進o1和DeepSeek-R1是一種判斷和眼光,但同時也代表著重投入與高風(fēng)險。
我們了解到國內(nèi)的很多公司,名義上有自研大模型,但實則是“套殼”。o系列站在GPT的肩膀上誕生,這導(dǎo)致地基不牢的公司只能望而卻步。另一方面,融資和商業(yè)化變現(xiàn)的壓力,又淘汰了一批公司。
于是,我們發(fā)現(xiàn)去年星光暗淡的大廠們,成為了反應(yīng)最快,跟進最及時的代表。
以DeepSeek-R1(2025年1月20日發(fā)布)為時間基準線,當(dāng)月科大訊飛就發(fā)布了深度推理大模型——訊飛星火X1;3月,百度發(fā)布文心大模型X1,阿里發(fā)布通義千問Qwen-QwQ-32B推理模型,騰訊發(fā)布混元T1深度思考模型;4月,字節(jié)豆包1.5深度思考模型上線,同時訊飛星火X1迎來升級,發(fā)布“快思考、慢思考統(tǒng)一模型”。
上述廠商有一些共同之處,跟上了每一次的模型能力升級進度,在轉(zhuǎn)向推理方向前,其基礎(chǔ)模型能力基本都達到了GPT-4的水平。以此作為參照,這可能是邁入大模型第二階段的基本條件。
o3目前是OpenAI最強大的推理模型。網(wǎng)上流傳的一張大模型IQ圖顯示,人類平均IQ為100,o3智商達到了驚人的136。
測試數(shù)據(jù)顯示,o3在多項基準測試中超越了o1的性能,特別在分析圖像、圖表和圖形等視覺任務(wù)中表現(xiàn)尤為出色。
在外部專家的評估中,o3在困難的現(xiàn)實任務(wù)中比o1犯的重大錯誤減少20%,在編程、商業(yè)、咨詢和創(chuàng)意構(gòu)思等領(lǐng)域都有不錯的表現(xiàn)。
需要承認的是,OpenAI存貨確實有兩把刷子,繼o1之后,o3又成為了新的大模型性能攀登高峰。但國內(nèi)各大模型廠商的跟進速度并不慢,若以DeepSeek-R1為參考標準,百度、阿里、科大訊飛、字節(jié)、騰訊后面所發(fā)布的推理模型水平相差不大,部分在一些測試指標上甚至有超越。
截至目前,國產(chǎn)六大推理模型各有千秋。
DeepSeek-R1的意義不言而喻,完整的技術(shù)報告和開源部署,給予了行業(yè)推理大模型訓(xùn)練思路。打開了OpenAI閉源的“黑匣子”,成功復(fù)刻出了性能相差無幾的o1。R1突出的特點是“花小錢辦大事”,高效且追求極致性價比。在非常有限的算力、數(shù)據(jù)等資源投入的情況下,訓(xùn)練成本卻僅為560萬美元,遠低于美國AI公司的數(shù)千萬美元乃至數(shù)億美元投入。
一位知情人士告訴我們,DeepSeek-R1和一些國產(chǎn)推理大模型不構(gòu)成直接競爭對手。在B端業(yè)務(wù)中,目前阿里開源的千問系列模型占比更重。“全尺寸和全模型,就像一個全家桶,可以供客戶選擇。32B的模型大小,跑起來成本也不是很高”。
百度在這波中從生態(tài)層面接入了DeepSeek,這給了用戶更多選擇權(quán),開源和免費的策略或?qū)⒛芪嘤脩?。文心大模型X1采用“思維鏈-行動鏈”協(xié)同訓(xùn)練,在復(fù)雜任務(wù)中自動拆解為二十多個推理步驟,同時可以調(diào)用十幾種的工具鏈,以此來增強Agent的能力。
有參與過與百度合作的人士告訴光子星球,在金融、醫(yī)療、政務(wù)等一些垂類領(lǐng)域,百度會“牽線搭橋”,把一些相關(guān)業(yè)務(wù)的公司攢到一個局。“百度提供基礎(chǔ)模型,我們提供另一方所需的技術(shù),最后直接跟百度核算”。通過這種方式,百度正不斷縮小To B大模型市場與科大訊飛之間的差距。
科大訊飛的星火X1,是當(dāng)前業(yè)界唯一基于全國產(chǎn)算力訓(xùn)練的深度推理大模型。
正是基于全棧國產(chǎn)、自主可控的優(yōu)勢,科大訊飛的星火大模型倍受央國企和政府客戶的青睞,保持行業(yè)端領(lǐng)先。4月21日,星火X1升級提升了通用能力,也同步增強了面向行業(yè)的解決方案能力。在重點行業(yè),如教育、醫(yī)療、司法等領(lǐng)域的測試中,都獲得了超過OpenAI和DeepSeek的分數(shù),這些能力無疑會在今年大模型訂單中有所體現(xiàn)。
星火X1一個模型同時支持兩種思考模式,提升了模型處理不同復(fù)雜度任務(wù)的能力,滿血版星火X1僅需4張卡(華為910B)即可部署。與華為的深度合作,以及不斷迭代的底座大模型能力和強大的行業(yè)大模型落地體系,已經(jīng)成為科大訊飛在一眾大廠圍剿中突出重圍的三大利器。
國內(nèi)閉源大模型中,豆包模型被評價為“有一定價格競爭力”。一位做AI玩具的廠商告訴我們,他的產(chǎn)品接入了多家大模型,在用戶使用過程中,優(yōu)先使用各家的免費Token額度,“一旦超過后,優(yōu)先切換豆包,價格能控制在比較低的成本”。
去年,豆包參與主導(dǎo)了價格戰(zhàn),豆包大模型價格降至0.0008元/千Tokens,豆包視覺理解模型定價0.003元/千Tokens,均低于當(dāng)時行業(yè)平均水平。此外,豆包大模型是技術(shù)落地AI應(yīng)用產(chǎn)品值得借鑒的案例,端到端的實時語音技術(shù)、多模態(tài)、Agent技術(shù)都能在第一時間介入豆包應(yīng)用端,這也是支撐其快速迭代更新的原因之一。
騰訊混元入場較晚。有員工曾向我們表示,混元團隊成員大部分以前是搜索推薦廣告出身,跟通義、字節(jié)或許有一定差距,“趕鴨子上架,好像也沒什么明確方向,東一下西一下”,“一群外行人指導(dǎo)內(nèi)行人”。加之人員的流逝,導(dǎo)致了混元曾一度處于停滯狀態(tài)。
借著DeepSeek崛起的東風(fēng),元寶已經(jīng)悄然實現(xiàn)了逆襲。至少從數(shù)據(jù)層面看,已經(jīng)取得階段性成果。一位內(nèi)部人士告訴我們,2025年春節(jié)以來的這幾個月,騰訊傾注了整個集團資源對元寶進行推廣,無論線下活動資源,還是微信導(dǎo)流或者預(yù)算投入,對于元寶都是重點傾斜,通過這種大力出奇跡的方式,逆轉(zhuǎn)了此前完全被動的局面。
從目前各公司的市場反饋來看,云端多模調(diào)用已經(jīng)逐漸被認可,各家模型并存,用戶按需調(diào)取才是未來。在現(xiàn)實情況中,客戶最終是否選用一款大模型,模型性能只是一項衡量標準,背后可能還涉及數(shù)據(jù)、生態(tài)等多方面的考量。
自DeepSeek-R1開始,國產(chǎn)推理大模型成為了各榜單的??停珹I開源社區(qū)的用戶以真實的下載量和Star數(shù)來支持中國AI的發(fā)展。
即便如此,當(dāng)前大模型仍面臨著或多或少的“卡脖子”的問題。
近期,有消息稱,英偉達已通過非正式渠道通知其AIC合作伙伴(如七彩虹、影馳、同德等),暫停GeForce RTX 5090D的銷售和出貨。這一舉措被認為是英偉達在應(yīng)對國際環(huán)境變化的預(yù)防性措施。
盡管英偉達尚未發(fā)布正式公告,但業(yè)內(nèi)普遍認為,RTX 5090D的供應(yīng)已進入“暫停狀態(tài)”,這僅僅才只是開始。
若從源頭上被限制,英偉達必將遭遇更加巨額的損失,而美國之外國家的大模型發(fā)展將遭遇不確定性,追趕OpenAI的步伐也將受到一定的阻礙。
在此背景下,全國產(chǎn)化技術(shù)路徑將越來越成為大家的備選項。這其中,科大訊飛做了較為充分的準備。據(jù)了解,科大訊飛與合作伙伴聯(lián)合通過四大核心技術(shù)優(yōu)化,實現(xiàn)MoE模型集群推理性能翻倍提升。
根據(jù)最新測試集評測結(jié)果,星火X1在通用任務(wù)效果評測中全面對標OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識問答等方面表現(xiàn)突出,這表明在技術(shù)自主可控的道路上,中國AI已具備與國際頂尖模型同臺競技的實力。
去年風(fēng)光無限的AI六小虎,如今早已各奔東西,境遇迥然。被DeepSeek擊碎“AGI理想”“學(xué)術(shù)天才創(chuàng)業(yè)”和“明星AI產(chǎn)品”的月之暗面,回歸到低調(diào)的技術(shù)研發(fā)中;將底層技術(shù)和產(chǎn)品解綁后的MiniMax,加大了對技術(shù)的投入,方向同樣為Agent和推理模型;六小虎中的智譜終于盼來了即將IPO的好消息,不過其整體營收、估值以及能否順利實現(xiàn)IPO,仍充滿變數(shù)。
去年,Kimi、海螺AI等AI應(yīng)用的出圈,短暫地迎來了AI公司的高光時刻。但今年,推理模型已經(jīng)成為了國內(nèi)各大廠商角逐的重要方向,AI六小虎的方向與大廠高度重合,而決定他們能否生存下去的“口糧”則握在大廠們的手上。
如今,隨著六大推理大模型的全面崛起,以及國際環(huán)境的不確定性加劇,全棧國產(chǎn)化大模型有望將成為一種新的主流。
從半導(dǎo)體、工業(yè)軟件與信創(chuàng)再到今天的AI芯片,歷史的經(jīng)驗告訴我們,想要擺脫被制約的現(xiàn)狀就得實現(xiàn)獨立自主,將命運牢牢掌握在自己手中?;蛟S在不久的將來,越來越多的國產(chǎn)大模型將走上全棧國產(chǎn)化對抗OpenAI們的道路。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)