很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經錄用會有專人和您聯(lián)系
咨詢如何成為春羽作者請聯(lián)系:鳥哥筆記小羽毛(ngbjxym)
來源| 海克財經
產業(yè)化落地是關鍵。
AI領域又添波瀾。
12月7日,醞釀已久的谷歌正式發(fā)布了Gemini多模態(tài)大模型。
官宣Gemini 1.0版本中包含Gemini Ultra、Gemini Pro、Gemini Nano這3個不同尺寸,Gemini Nano主要應用于設備端,Gemini Pro適用于在各種任務中擴展,功能最為強悍的Gemini Ultra仍在進行信任和安全檢查,并進行微調和基于人類反饋的強化學習,預計2024年初向開發(fā)人員和企業(yè)客戶推出。
在此之前,IBM宣布聯(lián)合Meta與AMD、英特爾、甲骨文、康奈爾大學、耶魯大學、加州大學伯克利分校等合作推出“AI聯(lián)盟”,共同支持AI的開放創(chuàng)新。IBM董事長阿爾溫德·克里希納表示,IBM希望通過合作,讓AI聯(lián)盟能夠在安全性、責任性和科學嚴謹?shù)幕A上推進創(chuàng)新型AI的議程。
頗為顯眼的是,AI聯(lián)盟的合作機構名單中并無谷歌以及ChatGPT背后公司OpenAI的身影。不少業(yè)內人士認為,這是在“抱團”抗衡巨頭。
由ChatGPT掀起的大模型浪潮早已席卷而至。ChatGPT問世已有1年,國內外均是“百模大戰(zhàn)”。據《北京市人工智能行業(yè)大模型創(chuàng)新應用白皮書》,截至2023年10月,國內10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計254家。
其中開源大模型的發(fā)展尤為令人矚目。
國內槍聲先響的是原搜狗CEO王小川創(chuàng)立的百川智能。2023年6月,百川智能發(fā)布可免費商用的70億參數(shù)開源語言模型Baichuan-7B,1個月后又發(fā)布了130億參數(shù)語言模型Baichuan-13B及對話模型Baichuan-13B-Chat。9月,百川智能宣布將調整后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本開源。
另一位重磅開源玩家是阿里云。
自2023年8月起,阿里云陸續(xù)開源了70億參數(shù)通用模型Qwen-7B、對話模型Qwen-7B-Chat、視覺語言模型Qwen-VL、140億參數(shù)模型Qwen-14B及其對話模型Qwen-14B-Chat。12月1日,阿里云又宣布開源720億參數(shù)模型Qwen-72B,一同開源的還有18億參數(shù)模型Qwen-1.8B和音頻模型Qwen-Audio。
至此,通義千問開源參數(shù)規(guī)模遍及18億、70億、140億和720億,加之視覺理解、音頻理解兩款多模態(tài)模型,可謂實現(xiàn)了“全尺寸、全模態(tài)”的開源。
阿里云官宣要做“AI時代最開放的云”,自然要以開源大模型押注生態(tài)建設,而通義千問正以自身迭代和演進繪制出新的落地圖景。
業(yè)內早有共識,大模型的開源與閉源各有長板。
開源能帶來豐富的資源和反饋,使大模型加速迭代并快速形成生態(tài),Meta推出的LLaMA、LLaMA 2,通義千問開源“全家桶”,智普AI與清華KEG實驗室推出的ChatGLM2-6B,百川部分大模型均在此列。
閉源則可以更好地保護企業(yè)的核心技術,由此提供更為獨特的商業(yè)化解決方案和服務,如ChatGPT、文心一言、百川智能發(fā)布的Baichuan 53B等。
以LLaMA為例,其于2023年2月推出后便帶動了一大批AI企業(yè)和機構:Stability AI推出了類似ChatGPT的Stable Chat,Stable Chat基于開源語言模型Stable Beluga,正是由LLaMA精調而來;斯坦福大學推出的Alpaca,加州大學伯克利分校主導推出的Vicuna,均是基于LLaMA的開源模型。
開放包容,發(fā)展生態(tài),正是開源的意義。
與LLaMA 2同樣開源至700億參數(shù)級別的通義千問在影響力方面亦與之看齊。Qwen-7B開源后迅速沖上模型庫HuggingFace、開發(fā)者社區(qū)Github的trending即趨勢榜單。
據2023年11月1日云棲大會公布的數(shù)據,阿里云的AI大模型開源社區(qū)魔搭已聚集了2300多個模型,吸引了超過280萬開發(fā)者,模型下載量突破1億。用戶可以在魔搭社區(qū)直接體驗Qwen系列模型效果,也能通過阿里云靈積平臺調用模型API(應用程序編程接口),或基于阿里云百煉平臺定制大模型應用。
更重要的是,Qwen-72B基于3T tokens高質量數(shù)據訓練,于10個權威基準測評中奪得開源模型最優(yōu)成績,各項成績均優(yōu)于LLaMA2-70B,部分測評則超越了ChatGPT-3.5和ChatGPT-4。
在英語任務上,Qwen-72B在MMLU基準測試取得開源模型最高分;而中文任務方面,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準得分超越GPT-4;在數(shù)學推理上,Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型;再看代碼理解,Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升,代碼能力有了質的飛躍。
中文的復雜語意理解是個典型案例。將涉及“意思意思”“不夠意思”“真有意思”“不好意思”等圍繞“意思”不同含義的短語組成對話并提問,通義千問能夠準確地剖析出每個短語在該語句或段落內的意義,譬如“不夠意思”可能指對方禮物不夠豐厚,“小意思”指謙虛,“不好意思”是道歉。
針對邏輯推理問題,通義千問能夠展開假設來講解答案。例如經典的“兩個門衛(wèi)”邏輯問題,即如何只通過一次提問,向一個說真話的門衛(wèi)和一個說假話的門衛(wèi)獲取哪扇門才正確的答案。在回答出向任一門衛(wèi)提問“如果我詢問另一個門衛(wèi),對方會說哪扇門正確”這個要點后,大模型分別假設了提問真話門衛(wèi)和假話門衛(wèi)的情況,完整地表述了答題的邏輯。
Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。Qwen-72B的指令遵循、工具使用等技能均已優(yōu)化,這使其能夠更好地被下游應用集成。而且,Qwen-72B搭載了強大的系統(tǒng)指令能力,用戶只需要使用一句提示詞就能夠定制AI助手。
據海克財經觀察,輸入“冷艷御姐”,大模型便會給出“有事快說,別浪費我時間”“給我放尊重一點”之類的語氣;要求“二次元萌妹”,大模型則會在回答時加入各種符號表情,表述非常柔軟;甚至點名影視角色,如《亮劍》中的李云龍,大模型還能將其說話方式和經典臺詞應用到回復中。
開源與閉源的路線之別,就像手機操作系統(tǒng)的iOS和Android之爭,Android憑借開源打法形成了獨特的生態(tài),達到高市占率。由通義千問的表現(xiàn)來看,開源大模型已經邁出了重要的一步。
開源大模型可以幫助用戶簡化模型訓練和部署的過程。
用戶不必從頭開始訓練,只需要下載預訓練好的模型并進行微調,就能快速構建高質量的模型。這一面降低了各行各業(yè)進入大模型領域的門檻,一面也能反過來使具體行業(yè)促進大模型技術的進步。
國內應用于心理學場景的MindChat即是如此。
MindChat是一款心理咨詢工具,可以說是AI心理咨詢師,能夠便捷且及時地為用戶提供心理評估等服務。用戶有任何煩惱或困惑都可以對MindChat傾訴,甚至可以語音輸入。MindChat會共情用戶,通過文字內容和語音語調分析用戶的情感和心理狀態(tài),再給出相應的建議。這些建議也包括是否需要現(xiàn)實中的專家或心理醫(yī)生介入。
用MindChat開發(fā)者顏鑫的話來說,他希望用簡單易用的界面提供服務,讓孤獨的人找到情緒出口,保持與社會的連接。
2023年本科畢業(yè)的顏鑫是華東理工大學心動實驗室成員,團隊專注于社會計算和心理情感領域的AI應用開發(fā)。他發(fā)現(xiàn)心理服務是非常適合大模型的場景——社會對這類服務有巨大需求,但整體供給匱乏且往往價格不菲,大模型技術可以把服務變得普惠。如今MindChat已為20多萬人累計提供了超過100萬次的問答服務。
顏鑫和團隊一直在追蹤開源領域大模型的發(fā)展,此前也試用過ChatGLM、Baichuan、InternLM等大模型。Qwen-7B、Qwen-14B推出后,他們用內部數(shù)據和benchmark做了測評,認定通義千問是這一場景下開源模型里的最優(yōu)解,才選擇以之為基座。除了MindChat,他們團隊還開發(fā)了基于通義千問的醫(yī)療健康大模型Sunsimiao(孫思邈)、教育/考試大模型 GradChat(錦鯉)。
顏鑫表示,他本人和團隊都是堅定的開源支持者,所以心動實驗室一部分模型對外開源,反哺開源社區(qū),另一部分適用于真實場景的模型以閉源API的方式對外提供服務。
個人開發(fā)者陶佳同樣認可大模型與具體場景的適配性。
陶佳就職于中國能源建設集團浙江省電力設計院有限公司,主要負責新型電力系統(tǒng)、綜合能源的宏觀分析、規(guī)劃研究和前期優(yōu)化工作。他說,從行業(yè)角度看,大模型在電力領域的應用前景從從初階的領域知識問答系統(tǒng)到高階的電力調度數(shù)學優(yōu)化等,都很值得探索。因此,他嘗試利用通義千問開源模型搭建文檔問答相關應用。
電力領域的場景有相當?shù)奶厥庑?,常常需要從幾十萬甚至上百萬字的文檔中查找內容。陶佳使用通義千問做了基于私有知識庫的檢索問答類應用,即給定一個英文文檔,告訴大模型需要查找的內容,讓大模型根據文檔目錄回答哪個目錄項下有答案。
專業(yè)領域的文檔檢索和解讀對內容準確性和邏輯嚴謹性要求極高。陶佳表示,在他嘗試過的開源模型中通義千問效果最好,回答準確且沒有那些稀奇古怪的bug。
于陶佳而言,閉源模型如OpenAI盡管能力強,但API調用不便,更不適合像他這樣的B端用戶自行定制;開源模型如LLaMA可以使用,其中文能力卻一般。因此,在Qwen-14B已經能做到70%以上精準度的情況下,陶佳對Qwen-72B充滿了期待。
這種期待正在變成現(xiàn)實。12月8日,HuggingFace公布了最新的開源大模型排行榜。榜單收錄了全球上百個開源大模型,測試維度涵蓋閱讀理解、邏輯推理、數(shù)學計算等,通義千問超越LLaMA2等國內外開源大模型登上榜首。
無論是從個人、組織還是從行業(yè)角度而言,開源都有利于形成更開放的生態(tài)。這既能令更多研究者或開發(fā)者來豐富應用和服務,也能推動大模型持續(xù)優(yōu)化,不斷向前。
大模型的浪潮之下亦有難題。
調研機構IDC發(fā)布的《2023-2024中國人工智能計算力發(fā)展評估報告》提及,中國企業(yè)認可AIGC(生成式人工智能)在加速決策、提高效率、優(yōu)化用戶和員工體驗等維度帶來的價值,67%的中國企業(yè)已經開始探索生成式人工智能在企業(yè)內的應用機會或已經進行相關投入;與此同時,企業(yè)也需要直面計算、存儲等資源短缺、行業(yè)大模型可用性待提升以及投入成本高等問題帶來的壓力。
顏鑫就坦誠,他們沒有資源從頭訓練基座模型,因此在滿足場景需求的情況下希望選擇主流、穩(wěn)定的模型架構以匹配上下游的環(huán)境,更在意開源模型背后的廠商能否持續(xù)投入基座模型和生態(tài)建設。
未來速度聯(lián)合創(chuàng)始人兼CEO秦續(xù)業(yè)對此也有類似看法。秦續(xù)業(yè)表示,開源大模型安全、可控、可定制,還更具性價比,推理成本可能只有閉源收費大模型的五十分之一。未來速度推出的Xinference平臺即基于通義千問開源模型,內置分布式推理框架,幫助企業(yè)用戶在計算集群上輕松部署并管理模型。
經過簡單微調,開源大模型便能滿足很多B端場景需求。秦續(xù)業(yè)的公司接觸的用戶大部分使用的是較小尺寸模型,如Qwen-7B,使用場景如外接知識庫做問答應用,通過大模型召回數(shù)據,放到上下文中進行總結并給出答案。
也就是說,通義千問提供的“全尺寸”開源模型能夠讓大模型觸及更多用戶。盡管大模型本身是開源的,企業(yè)仍可以在這個基礎上提供多種形式的服務,包括定制開發(fā)、技術支持等。這不僅為自身,也為上下游企業(yè)帶來了更多商業(yè)化可能性,是從生態(tài)到商業(yè),再由商業(yè)回饋生態(tài)的正向循環(huán)。
在2023年11月的云棲大會上,阿里董事會主席蔡崇信表示,不開放就沒有生態(tài),沒有生態(tài)就沒有未來,而只有站在更先進、更穩(wěn)定的技術能力之上,才有更大的開放底氣。
一直以來,阿里都有技術開放的傳統(tǒng),在操作系統(tǒng)、云原生、數(shù)據庫、大數(shù)據等領域均有自主開源項目。至此,通義千問開源的邏輯就更加清晰——既是傳承,也是在通過開源方式提供更多技術產品,以此帶動阿里云更長遠的發(fā)展。
要知道,云和AI都離不開算力,大模型則對算力有更高要求。已經具備全?;疉I能力的阿里云在更充分地利用自己數(shù)據、算力、存儲等資源長項,以開源大模型吸引更多用戶進入阿里云體系。就像微軟也在擴大開源模型的MaaS(模型即服務),依靠連接產業(yè)鏈各端來形成規(guī)?;推脚_化的生態(tài)。
據??素斀浟私猓诠傩鸔wen-72B開源的同時,阿里云還舉辦了首屆“通義千問AI挑戰(zhàn)賽”,參賽者可免費暢玩包括Qwen-72B在內的通義千問開源“全家桶”。
賽事分為算法和Agent兩塊:算法聚焦通義千問大模型的微調訓練,希望通過高質量數(shù)據,探索開源模型的代碼能力上限;Agent則鼓勵開發(fā)者基于通義千問大模型和魔搭社區(qū)的Agent-Builder框架,開發(fā)新一代AI應用,促進大模型在各行各業(yè)的落地應用。主辦方提供了價值50萬元的免費云上算力和豐厚獎金。
比賽同樣彰顯了阿里云立足開源的決心。這意味著通義千問乃至阿里云正在以多元化、全方位的技術服務推進AI的生態(tài)繁榮,在拓寬自身邊界的同時也在推進整個行業(yè)的發(fā)展。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)