來(lái)源| 海克財(cái)經(jīng)

產(chǎn)業(yè)化落地是關(guān)鍵。

12月7日，醞釀已久的谷歌正式發(fā)布了Gemini多模態(tài)大模型。

官宣Gemini 1.0版本中包含Gemini Ultra、Gemini Pro、Gemini Nano這3個(gè)不同尺寸，Gemini Nano主要應(yīng)用于設(shè)備端，Gemini Pro適用于在各種任務(wù)中擴(kuò)展，功能最為強(qiáng)悍的Gemini Ultra仍在進(jìn)行信任和安全檢查，并進(jìn)行微調(diào)和基于人類反饋的強(qiáng)化學(xué)習(xí)，預(yù)計(jì)2024年初向開(kāi)發(fā)人員和企業(yè)客戶推出。

國(guó)產(chǎn)大模型往哪兒去？

在此之前，IBM宣布聯(lián)合Meta與AMD、英特爾、甲骨文、康奈爾大學(xué)、耶魯大學(xué)、加州大學(xué)伯克利分校等合作推出“AI聯(lián)盟”，共同支持AI的開(kāi)放創(chuàng)新。IBM董事長(zhǎng)阿爾溫德·克里希納表示，IBM希望通過(guò)合作，讓AI聯(lián)盟能夠在安全性、責(zé)任性和科學(xué)嚴(yán)謹(jǐn)?shù)幕A(chǔ)上推進(jìn)創(chuàng)新型AI的議程。

頗為顯眼的是，AI聯(lián)盟的合作機(jī)構(gòu)名單中并無(wú)谷歌以及ChatGPT背后公司OpenAI的身影。不少業(yè)內(nèi)人士認(rèn)為，這是在“抱團(tuán)”抗衡巨頭。

由ChatGPT掀起的大模型浪潮早已席卷而至。ChatGPT問(wèn)世已有1年，國(guó)內(nèi)外均是“百模大戰(zhàn)”。據(jù)《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(shū)》，截至2023年10月，國(guó)內(nèi)10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家。

其中開(kāi)源大模型的發(fā)展尤為令人矚目。

國(guó)內(nèi)槍聲先響的是原搜狗CEO王小川創(chuàng)立的百川智能。2023年6月，百川智能發(fā)布可免費(fèi)商用的70億參數(shù)開(kāi)源語(yǔ)言模型Baichuan-7B，1個(gè)月后又發(fā)布了130億參數(shù)語(yǔ)言模型Baichuan-13B及對(duì)話模型Baichuan-13B-Chat。9月，百川智能宣布將調(diào)整后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本開(kāi)源。

另一位重磅開(kāi)源玩家是阿里云。

自2023年8月起，阿里云陸續(xù)開(kāi)源了70億參數(shù)通用模型Qwen-7B、對(duì)話模型Qwen-7B-Chat、視覺(jué)語(yǔ)言模型Qwen-VL、140億參數(shù)模型Qwen-14B及其對(duì)話模型Qwen-14B-Chat。12月1日，阿里云又宣布開(kāi)源720億參數(shù)模型Qwen-72B，一同開(kāi)源的還有18億參數(shù)模型Qwen-1.8B和音頻模型Qwen-Audio。

至此，通義千問(wèn)開(kāi)源參數(shù)規(guī)模遍及18億、70億、140億和720億，加之視覺(jué)理解、音頻理解兩款多模態(tài)模型，可謂實(shí)現(xiàn)了“全尺寸、全模態(tài)”的開(kāi)源。

阿里云官宣要做“AI時(shí)代最開(kāi)放的云”，自然要以開(kāi)源大模型押注生態(tài)建設(shè)，而通義千問(wèn)正以自身迭代和演進(jìn)繪制出新的落地圖景。

01模型開(kāi)與閉

業(yè)內(nèi)早有共識(shí)，大模型的開(kāi)源與閉源各有長(zhǎng)板。

開(kāi)源能帶來(lái)豐富的資源和反饋，使大模型加速迭代并快速形成生態(tài)，Meta推出的LLaMA、LLaMA 2，通義千問(wèn)開(kāi)源“全家桶”，智普AI與清華KEG實(shí)驗(yàn)室推出的ChatGLM2-6B，百川部分大模型均在此列。

閉源則可以更好地保護(hù)企業(yè)的核心技術(shù)，由此提供更為獨(dú)特的商業(yè)化解決方案和服務(wù)，如ChatGPT、文心一言、百川智能發(fā)布的Baichuan 53B等。

以LLaMA為例，其于2023年2月推出后便帶動(dòng)了一大批AI企業(yè)和機(jī)構(gòu)：Stability AI推出了類似ChatGPT的Stable Chat，Stable Chat基于開(kāi)源語(yǔ)言模型Stable Beluga，正是由LLaMA精調(diào)而來(lái)；斯坦福大學(xué)推出的Alpaca，加州大學(xué)伯克利分校主導(dǎo)推出的Vicuna，均是基于LLaMA的開(kāi)源模型。

開(kāi)放包容，發(fā)展生態(tài)，正是開(kāi)源的意義。

國(guó)產(chǎn)大模型往哪兒去？

與LLaMA 2同樣開(kāi)源至700億參數(shù)級(jí)別的通義千問(wèn)在影響力方面亦與之看齊。Qwen-7B開(kāi)源后迅速?zèng)_上模型庫(kù)HuggingFace、開(kāi)發(fā)者社區(qū)Github的trending即趨勢(shì)榜單。

據(jù)2023年11月1日云棲大會(huì)公布的數(shù)據(jù)，阿里云的AI大模型開(kāi)源社區(qū)魔搭已聚集了2300多個(gè)模型，吸引了超過(guò)280萬(wàn)開(kāi)發(fā)者，模型下載量突破1億。用戶可以在魔搭社區(qū)直接體驗(yàn)Qwen系列模型效果，也能通過(guò)阿里云靈積平臺(tái)調(diào)用模型API（應(yīng)用程序編程接口），或基于阿里云百煉平臺(tái)定制大模型應(yīng)用。

更重要的是，Qwen-72B基于3T tokens高質(zhì)量數(shù)據(jù)訓(xùn)練，于10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中奪得開(kāi)源模型最優(yōu)成績(jī)，各項(xiàng)成績(jī)均優(yōu)于LLaMA2-70B，部分測(cè)評(píng)則超越了ChatGPT-3.5和ChatGPT-4。

在英語(yǔ)任務(wù)上，Qwen-72B在MMLU基準(zhǔn)測(cè)試取得開(kāi)源模型最高分；而中文任務(wù)方面，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準(zhǔn)得分超越GPT-4；在數(shù)學(xué)推理上，Qwen-72B在GSM8K、MATH測(cè)評(píng)中斷層式領(lǐng)先其他開(kāi)源模型；再看代碼理解，Qwen-72B在HumanEval、MBPP等測(cè)評(píng)中的表現(xiàn)大幅提升，代碼能力有了質(zhì)的飛躍。

中文的復(fù)雜語(yǔ)意理解是個(gè)典型案例。將涉及“意思意思”“不夠意思”“真有意思”“不好意思”等圍繞“意思”不同含義的短語(yǔ)組成對(duì)話并提問(wèn)，通義千問(wèn)能夠準(zhǔn)確地剖析出每個(gè)短語(yǔ)在該語(yǔ)句或段落內(nèi)的意義，譬如“不夠意思”可能指對(duì)方禮物不夠豐厚，“小意思”指謙虛，“不好意思”是道歉。

針對(duì)邏輯推理問(wèn)題，通義千問(wèn)能夠展開(kāi)假設(shè)來(lái)講解答案。例如經(jīng)典的“兩個(gè)門衛(wèi)”邏輯問(wèn)題，即如何只通過(guò)一次提問(wèn)，向一個(gè)說(shuō)真話的門衛(wèi)和一個(gè)說(shuō)假話的門衛(wèi)獲取哪扇門才正確的答案。在回答出向任一門衛(wèi)提問(wèn)“如果我詢問(wèn)另一個(gè)門衛(wèi)，對(duì)方會(huì)說(shuō)哪扇門正確”這個(gè)要點(diǎn)后，大模型分別假設(shè)了提問(wèn)真話門衛(wèi)和假話門衛(wèi)的情況，完整地表述了答題的邏輯。

Qwen-72B可以處理最多32k的長(zhǎng)文本輸入，在長(zhǎng)文本理解測(cè)試集LEval上取得了超越ChatGPT-3.5-16k的效果。Qwen-72B的指令遵循、工具使用等技能均已優(yōu)化，這使其能夠更好地被下游應(yīng)用集成。而且，Qwen-72B搭載了強(qiáng)大的系統(tǒng)指令能力，用戶只需要使用一句提示詞就能夠定制AI助手。

據(jù)?？素?cái)經(jīng)觀察，輸入“冷艷御姐”，大模型便會(huì)給出“有事快說(shuō)，別浪費(fèi)我時(shí)間”“給我放尊重一點(diǎn)”之類的語(yǔ)氣；要求“二次元萌妹”，大模型則會(huì)在回答時(shí)加入各種符號(hào)表情，表述非常柔軟；甚至點(diǎn)名影視角色，如《亮劍》中的李云龍，大模型還能將其說(shuō)話方式和經(jīng)典臺(tái)詞應(yīng)用到回復(fù)中。

國(guó)產(chǎn)大模型往哪兒去？

開(kāi)源與閉源的路線之別，就像手機(jī)操作系統(tǒng)的iOS和Android之爭(zhēng)，Android憑借開(kāi)源打法形成了獨(dú)特的生態(tài)，達(dá)到高市占率。由通義千問(wèn)的表現(xiàn)來(lái)看，開(kāi)源大模型已經(jīng)邁出了重要的一步。

02商業(yè)多路徑

開(kāi)源大模型可以幫助用戶簡(jiǎn)化模型訓(xùn)練和部署的過(guò)程。

用戶不必從頭開(kāi)始訓(xùn)練，只需要下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào)，就能快速構(gòu)建高質(zhì)量的模型。這一面降低了各行各業(yè)進(jìn)入大模型領(lǐng)域的門檻，一面也能反過(guò)來(lái)使具體行業(yè)促進(jìn)大模型技術(shù)的進(jìn)步。

國(guó)內(nèi)應(yīng)用于心理學(xué)場(chǎng)景的MindChat即是如此。

MindChat是一款心理咨詢工具，可以說(shuō)是AI心理咨詢師，能夠便捷且及時(shí)地為用戶提供心理評(píng)估等服務(wù)。用戶有任何煩惱或困惑都可以對(duì)MindChat傾訴，甚至可以語(yǔ)音輸入。MindChat會(huì)共情用戶，通過(guò)文字內(nèi)容和語(yǔ)音語(yǔ)調(diào)分析用戶的情感和心理狀態(tài)，再給出相應(yīng)的建議。這些建議也包括是否需要現(xiàn)實(shí)中的專家或心理醫(yī)生介入。

用MindChat開(kāi)發(fā)者顏鑫的話來(lái)說(shuō)，他希望用簡(jiǎn)單易用的界面提供服務(wù)，讓孤獨(dú)的人找到情緒出口，保持與社會(huì)的連接。

2023年本科畢業(yè)的顏鑫是華東理工大學(xué)心動(dòng)實(shí)驗(yàn)室成員，團(tuán)隊(duì)專注于社會(huì)計(jì)算和心理情感領(lǐng)域的AI應(yīng)用開(kāi)發(fā)。他發(fā)現(xiàn)心理服務(wù)是非常適合大模型的場(chǎng)景——社會(huì)對(duì)這類服務(wù)有巨大需求，但整體供給匱乏且往往價(jià)格不菲，大模型技術(shù)可以把服務(wù)變得普惠。如今MindChat已為20多萬(wàn)人累計(jì)提供了超過(guò)100萬(wàn)次的問(wèn)答服務(wù)。

顏鑫和團(tuán)隊(duì)一直在追蹤開(kāi)源領(lǐng)域大模型的發(fā)展，此前也試用過(guò)ChatGLM、Baichuan、InternLM等大模型。Qwen-7B、Qwen-14B推出后，他們用內(nèi)部數(shù)據(jù)和benchmark做了測(cè)評(píng)，認(rèn)定通義千問(wèn)是這一場(chǎng)景下開(kāi)源模型里的最優(yōu)解，才選擇以之為基座。除了MindChat，他們團(tuán)隊(duì)還開(kāi)發(fā)了基于通義千問(wèn)的醫(yī)療健康大模型Sunsimiao（孫思邈）、教育/考試大模型 GradChat（錦鯉）。

顏鑫表示，他本人和團(tuán)隊(duì)都是堅(jiān)定的開(kāi)源支持者，所以心動(dòng)實(shí)驗(yàn)室一部分模型對(duì)外開(kāi)源，反哺開(kāi)源社區(qū)，另一部分適用于真實(shí)場(chǎng)景的模型以閉源API的方式對(duì)外提供服務(wù)。

國(guó)產(chǎn)大模型往哪兒去？

個(gè)人開(kāi)發(fā)者陶佳同樣認(rèn)可大模型與具體場(chǎng)景的適配性。

陶佳就職于中國(guó)能源建設(shè)集團(tuán)浙江省電力設(shè)計(jì)院有限公司，主要負(fù)責(zé)新型電力系統(tǒng)、綜合能源的宏觀分析、規(guī)劃研究和前期優(yōu)化工作。他說(shuō)，從行業(yè)角度看，大模型在電力領(lǐng)域的應(yīng)用前景從從初階的領(lǐng)域知識(shí)問(wèn)答系統(tǒng)到高階的電力調(diào)度數(shù)學(xué)優(yōu)化等，都很值得探索。因此，他嘗試?yán)猛x千問(wèn)開(kāi)源模型搭建文檔問(wèn)答相關(guān)應(yīng)用。

電力領(lǐng)域的場(chǎng)景有相當(dāng)?shù)奶厥庑裕３Ｐ枰獜膸资f(wàn)甚至上百萬(wàn)字的文檔中查找內(nèi)容。陶佳使用通義千問(wèn)做了基于私有知識(shí)庫(kù)的檢索問(wèn)答類應(yīng)用，即給定一個(gè)英文文檔，告訴大模型需要查找的內(nèi)容，讓大模型根據(jù)文檔目錄回答哪個(gè)目錄項(xiàng)下有答案。

專業(yè)領(lǐng)域的文檔檢索和解讀對(duì)內(nèi)容準(zhǔn)確性和邏輯嚴(yán)謹(jǐn)性要求極高。陶佳表示，在他嘗試過(guò)的開(kāi)源模型中通義千問(wèn)效果最好，回答準(zhǔn)確且沒(méi)有那些稀奇古怪的bug。

于陶佳而言，閉源模型如OpenAI盡管能力強(qiáng)，但API調(diào)用不便，更不適合像他這樣的B端用戶自行定制；開(kāi)源模型如LLaMA可以使用，其中文能力卻一般。因此，在Qwen-14B已經(jīng)能做到70%以上精準(zhǔn)度的情況下，陶佳對(duì)Qwen-72B充滿了期待。

這種期待正在變成現(xiàn)實(shí)。12月8日，HuggingFace公布了最新的開(kāi)源大模型排行榜。榜單收錄了全球上百個(gè)開(kāi)源大模型，測(cè)試維度涵蓋閱讀理解、邏輯推理、數(shù)學(xué)計(jì)算等，通義千問(wèn)超越LLaMA2等國(guó)內(nèi)外開(kāi)源大模型登上榜首。

無(wú)論是從個(gè)人、組織還是從行業(yè)角度而言，開(kāi)源都有利于形成更開(kāi)放的生態(tài)。這既能令更多研究者或開(kāi)發(fā)者來(lái)豐富應(yīng)用和服務(wù)，也能推動(dòng)大模型持續(xù)優(yōu)化，不斷向前。

03生態(tài)新范式

大模型的浪潮之下亦有難題。

調(diào)研機(jī)構(gòu)IDC發(fā)布的《2023-2024中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》提及，中國(guó)企業(yè)認(rèn)可AIGC（生成式人工智能）在加速?zèng)Q策、提高效率、優(yōu)化用戶和員工體驗(yàn)等維度帶來(lái)的價(jià)值，67%的中國(guó)企業(yè)已經(jīng)開(kāi)始探索生成式人工智能在企業(yè)內(nèi)的應(yīng)用機(jī)會(huì)或已經(jīng)進(jìn)行相關(guān)投入；與此同時(shí)，企業(yè)也需要直面計(jì)算、存儲(chǔ)等資源短缺、行業(yè)大模型可用性待提升以及投入成本高等問(wèn)題帶來(lái)的壓力。

國(guó)產(chǎn)大模型往哪兒去？

顏鑫就坦誠(chéng)，他們沒(méi)有資源從頭訓(xùn)練基座模型，因此在滿足場(chǎng)景需求的情況下希望選擇主流、穩(wěn)定的模型架構(gòu)以匹配上下游的環(huán)境，更在意開(kāi)源模型背后的廠商能否持續(xù)投入基座模型和生態(tài)建設(shè)。

未來(lái)速度聯(lián)合創(chuàng)始人兼CEO秦續(xù)業(yè)對(duì)此也有類似看法。秦續(xù)業(yè)表示，開(kāi)源大模型安全、可控、可定制，還更具性價(jià)比，推理成本可能只有閉源收費(fèi)大模型的五十分之一。未來(lái)速度推出的Xinference平臺(tái)即基于通義千問(wèn)開(kāi)源模型，內(nèi)置分布式推理框架，幫助企業(yè)用戶在計(jì)算集群上輕松部署并管理模型。

經(jīng)過(guò)簡(jiǎn)單微調(diào)，開(kāi)源大模型便能滿足很多B端場(chǎng)景需求。秦續(xù)業(yè)的公司接觸的用戶大部分使用的是較小尺寸模型，如Qwen-7B，使用場(chǎng)景如外接知識(shí)庫(kù)做問(wèn)答應(yīng)用，通過(guò)大模型召回?cái)?shù)據(jù)，放到上下文中進(jìn)行總結(jié)并給出答案。

也就是說(shuō)，通義千問(wèn)提供的“全尺寸”開(kāi)源模型能夠讓大模型觸及更多用戶。盡管大模型本身是開(kāi)源的，企業(yè)仍可以在這個(gè)基礎(chǔ)上提供多種形式的服務(wù)，包括定制開(kāi)發(fā)、技術(shù)支持等。這不僅為自身，也為上下游企業(yè)帶來(lái)了更多商業(yè)化可能性，是從生態(tài)到商業(yè)，再由商業(yè)回饋生態(tài)的正向循環(huán)。

在2023年11月的云棲大會(huì)上，阿里董事會(huì)主席蔡崇信表示，不開(kāi)放就沒(méi)有生態(tài)，沒(méi)有生態(tài)就沒(méi)有未來(lái)，而只有站在更先進(jìn)、更穩(wěn)定的技術(shù)能力之上，才有更大的開(kāi)放底氣。

一直以來(lái)，阿里都有技術(shù)開(kāi)放的傳統(tǒng)，在操作系統(tǒng)、云原生、數(shù)據(jù)庫(kù)、大數(shù)據(jù)等領(lǐng)域均有自主開(kāi)源項(xiàng)目。至此，通義千問(wèn)開(kāi)源的邏輯就更加清晰——既是傳承，也是在通過(guò)開(kāi)源方式提供更多技術(shù)產(chǎn)品，以此帶動(dòng)阿里云更長(zhǎng)遠(yuǎn)的發(fā)展。

要知道，云和AI都離不開(kāi)算力，大模型則對(duì)算力有更高要求。已經(jīng)具備全?；疉I能力的阿里云在更充分地利用自己數(shù)據(jù)、算力、存儲(chǔ)等資源長(zhǎng)項(xiàng)，以開(kāi)源大模型吸引更多用戶進(jìn)入阿里云體系。就像微軟也在擴(kuò)大開(kāi)源模型的MaaS（模型即服務(wù)），依靠連接產(chǎn)業(yè)鏈各端來(lái)形成規(guī)模化和平臺(tái)化的生態(tài)。

據(jù)海克財(cái)經(jīng)了解，在官宣Qwen-72B開(kāi)源的同時(shí)，阿里云還舉辦了首屆“通義千問(wèn)AI挑戰(zhàn)賽”，參賽者可免費(fèi)暢玩包括Qwen-72B在內(nèi)的通義千問(wèn)開(kāi)源“全家桶”。

賽事分為算法和Agent兩塊：算法聚焦通義千問(wèn)大模型的微調(diào)訓(xùn)練，希望通過(guò)高質(zhì)量數(shù)據(jù)，探索開(kāi)源模型的代碼能力上限；Agent則鼓勵(lì)開(kāi)發(fā)者基于通義千問(wèn)大模型和魔搭社區(qū)的Agent-Builder框架，開(kāi)發(fā)新一代AI應(yīng)用，促進(jìn)大模型在各行各業(yè)的落地應(yīng)用。主辦方提供了價(jià)值50萬(wàn)元的免費(fèi)云上算力和豐厚獎(jiǎng)金。

比賽同樣彰顯了阿里云立足開(kāi)源的決心。這意味著通義千問(wèn)乃至阿里云正在以多元化、全方位的技術(shù)服務(wù)推進(jìn)AI的生態(tài)繁榮，在拓寬自身邊界的同時(shí)也在推進(jìn)整個(gè)行業(yè)的發(fā)展。

本文系作者： ?？素?cái)經(jīng) 授權(quán)發(fā)表，鳥(niǎo)哥筆記平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

本文為作者獨(dú)立觀點(diǎn)，不代表鳥(niǎo)哥筆記立場(chǎng)，未經(jīng)允許不得轉(zhuǎn)載。

《鳥(niǎo)哥筆記版權(quán)及免責(zé)申明》如對(duì)文章、圖片、字體等版權(quán)有疑問(wèn)，請(qǐng)點(diǎn)擊反饋舉報(bào)

關(guān)鍵詞

AI領(lǐng)域

chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

01模型開(kāi)與閉

02商業(yè)多路徑

03生態(tài)新范式