很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
出品 | 微果醬
作者 | 陳出木&zhou大紅
科技圈上一次這么“瘋狂”,還要回到2007年1月9日。蘋果聯(lián)合創(chuàng)始人兼CEO的史蒂夫·喬布斯(Steve Jobs)在舊金山Moscone中心發(fā)布第一代iPhone,標志著智能手機時代的來臨,也加速了移動互聯(lián)網(wǎng)時代的騰飛。
而今天,曾經(jīng)掀起科技海嘯的ChatGPT推出迭代產(chǎn)品——GPT-4,會否再一次改變世界
今天凌晨一點,OpenAI的首席執(zhí)行官Sam Altman在社交媒體上發(fā)文,官宣推出“GPT-4”(openai.com/research/gpt-4):
一石激起千層浪。
國外,華爾街日報、紐約時報等各大媒體聞風而動,BBC用上的標題是《OpenAI announces ChatGPT successor GPT-4》,直接將GPT-4稱為ChatGPT的“繼任者”。
國內(nèi)同樣大受震動,各家媒體爭相報道。一時之間,““未來”似乎真的已來。
這種科技應用熱浪已經(jīng)很久沒看到過了,甚至頗有2007年喬布斯發(fā)布會的激動既視感。
彼時,喬布斯在臺上向人們講解為什么要花499美元買iPhone。盡管他語氣平靜,但臺下掌聲雷動,媒體們也像今天這般蜂擁跟進。而直到現(xiàn)在,16年后,互聯(lián)網(wǎng)上仍然持續(xù)銘記并懷念著那場劃時代的發(fā)布會。
因為正如喬布斯所說,“蘋果要重新定義手機。”那天之后,我們逐漸用上智能機,正式步入了移動互聯(lián)網(wǎng)時代。
當前很難斷定GPT-4是否能像iPhone那般改變世界,畢竟連“ChatGPT之父”Sam Altman也表示,其仍有缺陷。但毋庸置疑的是,它正在加速這種改變。
以下是Open AI關于GPT-4新能力的介紹:
根據(jù)GPT-4的官網(wǎng)消息,相比GPT-3.5,GPT-4的能力將在任務復雜性達到足夠的閾值時顯現(xiàn)出來,會更可靠、更具創(chuàng)造力,并且能夠處理更細微的指令。
相當于說,問題越難,GPT-4越能一展身手,而普通交談上,GPT-4和GPT-3.5差異不大。這個結論是基于,OpenAI讓兩個模型在各種為人類設計的模擬考試上進行的實驗。
此外,GPT-4優(yōu)于現(xiàn)有的大型語言模型及大多數(shù)SOTA模型。且在測試的 26 種語言的24種中,GPT-4優(yōu)于GPT-3.5和其他大語言模型(Chinchilla、PaLM)的英語語言性能。
根據(jù)官方技術文檔,GPT-4的新功能具體包括:
GPT-4可以接受文本和圖像的prompt(javascript語言中的一個方法,主要用于顯示提示對話框),這與純文本設置并行,允許用戶指定任何視覺或語言任務。
具體來說,當用戶給定由穿插的文本和圖像組成的輸入,GPT-4可以生成文本輸出,包括了自然語言、代碼等。換言之,輸入帶有文本和照片的文檔、圖表或屏幕截圖,GPT-4已經(jīng)可以表現(xiàn)出與純文本輸入類似的功能。
此外,它還可以通過為純文本語言模型開發(fā)的測試時間技術來增強,包括少量鏡頭和思維鏈prompt。
舉個例子,當你問GPT-4:“這張照片有什么好笑的?逐一描述。”面對問題中同時出現(xiàn)了文本和圖片的情況,GPT-4識別之后,絲毫不慌地給出三個理由。
再來個圖文并茂的物理題,GPT-4不僅成功跨語種,讀懂法語題目并給出了完整解答過程。
GPT-4還能站在人類角度理解到圖片的不同尋常之處。
甚至對于更加具有主觀創(chuàng)造性的“梗圖”和漫畫,GPT-4也能說出個一二三四。
User:你能解釋一下這個迷因嗎?(圖中文字翻譯:有時我只是從太空看地球的照片,想象這一切是多么美好)
GPT-4:這是一個笑話,它結合了兩個無關的東西——來自太空的地球圖片和雞塊。其文字表明,下圖是一張來自太空的地球圖片,而這張圖片實際上是雞塊,被排列成模糊的世界地圖。其中的幽默來自于文本和圖像的意外并置。文本設定了一個宏偉的地球形象的期望,但這個形象實際上是世俗和愚蠢的。
在Open AI發(fā)布的GPT-4開發(fā)者直播視頻中,開發(fā)人員還演示了利用GPT-4,將他筆記本上的草圖圖像創(chuàng)建了一個網(wǎng)站。
盡管官方表示,圖像輸入仍然是一個研究預覽,無法公開。但無疑,這樣的人工智能程度是足以令人心驚的。
而開發(fā)者還不斷發(fā)現(xiàn)GPT-4能處理的新的任務,并計劃很快發(fā)布進一步的分析和評估數(shù)據(jù),并對測試時間技術的影響進行徹底調(diào)查。
OpenAI一直致力于定義AI行為的各個方面,其中一項就是可操縱性。
官方表示,開發(fā)人員(以及很快的ChatGPT用戶)可以通過在“系統(tǒng)”消息中描述方向來設定他們的AI風格和任務,而不像傳統(tǒng)的ChatGPT,具有固定的冗長語調(diào)和風格。
這一個功能的意思是,系統(tǒng)消息允許API用戶在一定范圍內(nèi)自定義用戶體驗,即是用戶可以在系統(tǒng)中設定GPT-4的角色,并在這個基礎上進行AI問答,而GPT-4的回答將基于這個設定展開。
在官方示例中,使用者在system(系統(tǒng))設定GPT-4是“一個總以蘇格拉底式風格回應的導師,永遠不會給學生答案,但總是試著提出正確的問題......”可以看到,在隨后的對話中,GPT-4遵守著這一設定,不斷提出問題引導使用者。
盡管GPT-4強大如斯,但其實局限性與早期GPT模型相似。最重要的是,它仍然不完全可靠(它“幻覺”了事實并犯了推理錯誤),只是相比此前模型已經(jīng)減少了“幻覺”,在內(nèi)部對抗性真實性評估中,GPT-4的得分比GPT-3.5高40%。
GPT-4在TruthfulQA等外部基準上取得進展。比如在測試模型將事實與一組錯誤陳述區(qū)分開來的能力,GPT-4僅略優(yōu)于GPT-3.5。但經(jīng)過RLHF(reinforcement learning from human feedback,強化學習人類反饋)訓練后,差距就明顯起來了。
在官方示例中,GPT-4開始拒絕選擇常見的說法(你不能教老狗新的技巧),但它仍可能錯過一些微妙的細節(jié)(埃爾維斯·普雷斯利不是演員的兒子)。
根據(jù)一些近期的博客文章,OpenAI的目標是使構建的人工智能系統(tǒng)具有合理的默認行為,以反映廣泛的用戶價值觀。
但官方也承認,GPT-4通常缺乏對絕大多數(shù)數(shù)據(jù)中斷(2021年9月)后發(fā)生的事件的了解,也沒有從中吸取經(jīng)驗教訓,有時會犯一些簡單的推理錯誤,或者輕信用戶的虛假陳述。
這便是有趣之處,基礎預訓練模型經(jīng)過高度校準(其對答案的預測置信度通常與正確的概率相匹配),但通過OpenAI目前的后訓練(post-training)過程,校準減少了。
GPT-4與此前的模型具有類似的風險,例如生成有害建議、錯誤代碼或不準確的信息,再加上新功能帶來的新風險,都有可能為其未來埋下重雷。
所以,OpenAI通過預培訓數(shù)據(jù)的選擇和過濾、評估和專家參與、模型安全改進以及監(jiān)控和執(zhí)行,來提高GPT-4的安全性能,并在RLHF訓練期間加入了額外的安全獎勵信號。團隊收集了多樣化數(shù)據(jù)集,在允許和不允許的類別上應用安全獎勵信號(有正值或負值),以減少有害輸出和防止拒絕有效請求。
這些措施改善了GPT-4的安全性能。與GPT-3.5相比,模型對不允許內(nèi)容的請求響應傾向降低82%,對敏感請求(如醫(yī)療建議和自我傷害)的響應符合政策的頻率提高29%。
與此前的GPT模型一樣,GPT-4基礎模型被訓練為預測文檔中的下一個單詞,并使用公開可用的數(shù)據(jù)(如互聯(lián)網(wǎng)數(shù)據(jù))以及我們許可的數(shù)據(jù)進行訓練。所以,這個數(shù)據(jù)集包括了數(shù)學問題的正確答案和錯誤答案、弱推理和強推理、自相矛盾和一致的陳述等。
這就導致模型的響應可能與用戶的意圖相去甚遠。為了緩解這種情況,OpenAI使用RLHF來微調(diào)模型的行為。但GPT-4的能力似乎主要來自預訓練過程。RLHF不會提高甚至降低考試成績。但模型的控制來自后訓練過程,基礎模型甚至需要及時的工程設計來回答問題。
GPT-4官方強調(diào)了這個新項目的重點之一,是構建了一個可預測擴展的深度學習堆棧,因為廣泛的特定模型調(diào)整對于GPT-4這樣的大型訓練不可行。
研發(fā)團隊開發(fā)的基礎設施和優(yōu)化在多種規(guī)模下都有可預測的行為。為了驗證這種可擴展性,他們通過使用相同方法但計算量少10000倍的模型中進行外推,提前準確預測GPT-4在內(nèi)部代碼庫(不是訓練集的一部分)的最終損失。
從GPT-4更新的這六項能力里,我們可以在一定程度上看到人工智能的發(fā)展水平。
OpenAI表示公司內(nèi)部也在使用GPT-4,所以也關注大型語言模型在內(nèi)容生成、銷售和編程等方面的應用效果,并將使用GPT-4輔助人們評估AI輸出,這也是OpenAI對其策略的第二階段。
GPT-4這一波來勢洶洶,壓力給到了碰巧計劃明天發(fā)布文心一言的百度。
但如果細究GPT-4會否改變世界,卻很難一言以蔽之。
誠然,GPT-4的推出可以在一定程度上標志著人工智能水平的進一步拔高??梢灶A見,在其完全開放之后對各個行業(yè)的沖擊,因為連圖文都能夠進行解讀的AI,必然能夠輸出更加細膩的內(nèi)容。
這顯然會讓世界范圍內(nèi)追趕ChatGPT的友商再次虎軀一震,于是“站隊”也提前到來,是接入還是硬剛——
GPT-4正式官宣后,微軟也確認新的Bing正在GPT-4上運行,「這是我們?yōu)樗阉鞫ㄖ频摹埂?/p>
而 GPT-4的上新,距離2月8日微軟發(fā)布由ChatGPT和GPT-3.5提供支持的全新搜索引擎必應(Bing)和Edge瀏覽器,僅僅過去了一個月多。
為了保住自己的行業(yè)老大哥地位,谷歌在AI方面也沒閑著。
2月7日,谷歌官宣其基于2021年5月推出的大語言模型LaMDA而打造的一代對話AI系統(tǒng)Bard;
谷歌正在為開發(fā)人員提供其最先進的人工智能語言模型之一:PaLM。這家搜索巨頭正在為 PaLM 推出一個 API以及一些人工智能企業(yè)工具,據(jù)稱這將幫助企業(yè)“從簡單的自然語言提示中生成文本、圖像、代碼、視頻、音頻等。”
3月14日,谷歌開放AI語言模型PaLM API,企業(yè)和開發(fā)人員將能夠在該系統(tǒng)的基礎上構建自定義聊天機器人等。
除了推出 PaLM API 外,谷歌還在其 Vertex AI 平臺中擴大對生成 AI 的支持;并推出了一個名為Generative AI App Builder的新平臺,該平臺“允許開發(fā)人員快速發(fā)布新體驗,包括機器人、聊天界面、自定義搜索引擎、數(shù)字助理等。
而在3月16日(也就是明天),百度的大模型新項目文心一言(ERNIE Bot),也將迎來正式揭曉的時刻。盡管還不知道它長什么樣子、具備怎樣的“超能力”,鋪墊了一個多月也吊足了大家的胃口。
但話又說回來,OpenAI發(fā)布的這篇“Technical Report”,說是技術報告,不如說是產(chǎn)品廣告+免責聲明。畢竟官方無時無刻不在強調(diào),GPT-4仍有局限、缺陷和風險。有AI專家直言,“是一次推廣特征更為明顯的廣告行為”。
GPT-4是站在巨人的肩膀上,用此前的技術積累完成迭代,其整體技術相比此前,并沒有非常里程碑式的突破,只能說均有優(yōu)化。
更值得注意的是,OpenAI還在官宣GPT-4的內(nèi)容最后表示,正在開源OpenAI Evals,該軟件框架系用于創(chuàng)建和運行評估GPT-4等模型的基準,支持編寫新的類來實現(xiàn)自定義的評估邏輯,廣邀用戶體驗。
如此看來,GPT-4推出的最大意義或許不在于具體如何改變世界,更在于加快科技發(fā)展的進程,向世人展示人工智能的更多可能性,以及為OpenAI打了一波成功廣告。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內(nèi)容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)