很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
作者|吳狄
編輯|胡展嘉
運營|陳佳慧
出品|零態(tài)LT(ID:LingTAI_LT)
要說全世界戲最多的AI,非OpenAI莫屬。
這家公司簡直就是熱搜制造機,剛推出新產(chǎn)品,就送走老領導,剛和蘋果結盟,就逼跌谷歌股價;連OpenAI高管的一個離職動態(tài),都能引發(fā)網(wǎng)上的OpenAI離職潮。
短短幾天時間,以OpenAI為中心,接連引發(fā)地震級別的事件。不僅可能對OpenAI這家公司的未來產(chǎn)生重大影響,甚至有可能導致整個科技行業(yè)的重新洗牌。
美國時間5月13日,OpenAI推出了全新旗艦產(chǎn)品GPT-4o。在發(fā)布會上,OpenAI僅僅展示了GPT-4o的語音對話能力,沒有炫酷的視覺效果、沒有狂拽的新功能,但仍然再次引發(fā)了一波行業(yè)地震,因為GPT-4o向全世界展示了其它AI產(chǎn)品可能敢想,但沒敢干的事情。
用上GPT-4o后,用戶可以隨時打斷AI的施法,不要額外任何操作。而AI則能夠根據(jù)新的對話內(nèi)容,結合上下文繼續(xù)進行交流,甚至可以通過語氣腔調(diào)來識別用戶的情緒,并以此給出反饋。
用過AI對話產(chǎn)品的家人,應該對下面那個“終止”按鈕不陌生。
這個按鈕是用來讓AI閉嘴的。比如你讓AI講個故事,聽了個開頭想讓它換一個,就需要用到這個按鈕。如果是隔空喊話的AI,則需要喊出一個“安全詞”,比如“hey siri”“小度小度”等。
這種體驗對日常交互來說非常難受,但還有難受的。
用過AI產(chǎn)品的家人,應該對AI那種塵世閑游級別的響應速度不陌生。
舉個例子,GPT-3.5的延遲大概是2.8秒,GPT-4的延遲高達5.4秒。相比而言,特斯拉Model 3的百公里加速是2.1秒。
這是因為以前的工作流程是先由一個語音轉文字的模型,將輸入的語音轉成文字,再由負責生成答案的模型輸出文字內(nèi)容,最后由文字轉語音的模型把文字轉成語音。這三個模型互不干涉。這就導致在整個過程中,大量背景信息丟失了。
看過綜藝節(jié)目里的“傳聲筒”游戲吧?
AI比這個更搞笑。因為文字不能展示語音語調(diào),所以當很多人一起說話的時候,GPT沒辦法判斷說“俺也一樣”的是關羽還是張飛,也不知道“我在5點20睡覺13點14準時醒”是生活習慣還是歌詞。
如果你想讓AI根據(jù)聲音給出反饋,比如讓GPT-4幫忙判斷一下深呼吸做的到不到位,它只會甩給你一篇教程,讓你自己對照體會。
這其實是目前是市面上AI的通病,但GPT-4o的出現(xiàn),讓事情發(fā)生了巨大的轉變。
技術層面,GPT-4o把3個互不相關的模型整合成了一個Omni模型,文字、圖像、聲音的輸入和輸出均由這個模型進行處理。這樣就提高了GPT的響應速度,根據(jù)OpenAI官方介紹,GPT-4o對音頻輸入的平均響應時間只有0.3秒。實際體驗是,和GPT-4o對話的時候,基本感覺不到延遲。
不僅如此,因為GPT-4o掌握了所有背景信息,從而能夠識別說話主體,甚至還能識別情緒,并根據(jù)情感狀態(tài)給出反饋。
換句話說,AI從此具備了“察言觀色”的能力。想象一下,以后AI能根據(jù)你說話的語氣判斷你的情緒,聽到你聲音虛弱馬上幫你想好請假話術;男/女朋友在場的時候自動屏蔽前任信息提示;甚至在你翹班蹦迪的時候,模仿你的腔調(diào)去應付老板…
這么智能的AI目前OpenAI也不敢想。實際上,他們在官網(wǎng)上謙虛的表示,公司頭一次嘗試GPT-4o這種模式,自己也在摸索這個模型的能力和短板。
目前GPT-4o已經(jīng)可以被用戶使用了,不過免費用戶每天使用GPT-4o的次數(shù)是有限的,而GPT-3.5則是不限量供應。兩者的區(qū)別在于,可能不是那么容易感受出區(qū)別。另外ChatGPT也將迎來桌面端app,用戶在電腦上也可以和ChatGPT對話了。
就在OpenAI為新產(chǎn)品造勢的時候,團隊創(chuàng)始成員之一、奧特曼罷免風波關鍵人物、OpenAI超對齊項目創(chuàng)始人、首席科學家Ilya Sutskever宣布退出。幾個小時后,超對齊項目負責人Jan Leike宣布離職。
Leike的離職動態(tài)迅速引發(fā)了一股“I resigned from @OpenAI”的“離職潮”,更具體的內(nèi)容可以觀看我們的視頻。
而離開OpenAI后的第一天,也就是美國時間5月17日下午,Leike發(fā)了一連串動態(tài),表示自己一直都非常熱愛自己的團隊和工作,此次無奈離職,是因為和現(xiàn)在核心管理層的理念分歧到達了無可調(diào)和的地步。
他說自己來OpenAI是沖著這里的學術氛圍和對AI安全的宏愿,然而現(xiàn)在的OpenAI高層只在乎出爆款。
他還表達了對OpenAI走向AGI的擔憂,強調(diào)OpenAI必須是一個安全先行的AGI公司,話里話外都透露出了絲絲苦澀。
安全,同樣也是Ilya的執(zhí)念。正是出于對AGI不可知的未來的擔憂,才有了OpenAI的超對齊項目。
如今,隨著兩位負責人的離開,超對齊項目組已經(jīng)徹底解散,項目組成員被拆散到不同研究領域。相當于是為現(xiàn)在每個研究領域,都配備了一個安保人員。
相比Leike,Ilya的理由平平無奇。他表示“將投身于某個對我個人來說,具有非凡意義的項目”,項目細節(jié)將會在未來公開。
在分手信中,Ilya不出意外的表揚了薩姆奧特曼、Greg Brockman、Mira Murita對OpenAI的貢獻,同時也“堅信在三位的領導下,OpenAI將會構建一個安全高效的AGI”。
這句話現(xiàn)在聽起來,既是客氣,也是懇求。
而奧特曼在夸獎了Ilya并表示遺憾后,宣布Ilya的位置將有上圖中左一Jakub Pachocki接手。
盡管分手雙方都表現(xiàn)出了應有的風度,不過經(jīng)歷了種種風波后,相信各位看官應該都心照不宣。
緊接著,Google AI老大Jeff Dean就在Ilya下面回復了一條非常曖昧的評論:我好喜歡和你相遇,即便只是一起喝杯咖啡。
看得出,Google這次是真的有點著急。
曾經(jīng)一度是AI領頭羊的Google,如今卻被OpenAI吊打:只要OpenAI趕在Google后面推出新產(chǎn)品,Google必然被搶風頭;只要Google晚OpenAI一步推出新產(chǎn)品,必然淹沒在GPT的熱浪中。
就在OpenAI推出GPT-4o的第二天,谷歌在Google I/O上推出了Gemini 1.5 Pro。相比OpenAI的Spring Update,Google I/O要正式的多,推出了對標Sora的視頻生成工具Veo等,并展示了被Gemini 1.5 pro加強后的產(chǎn)品,包括Google助手、搜索、Photos等等。
首席執(zhí)行官Sundar Pichai表示,新產(chǎn)品“提供了迄今為止所有基礎模型中最長的上下文窗口”。
谷歌副總裁兼Gemini體驗總經(jīng)理Sissie Hsiao表示,Gemini 1.5 Pro很快將能夠處理一小時的視頻內(nèi)容或超過3萬行的代碼庫。
Google AI助手的新功能Project Astra讓人印象深刻。通過手機攝像頭,智能助手可以識別出鏡頭中的物體,無論桌面上的橘子、電腦屏幕里的代碼,還是手繪在白板上的圖案。
尤其是在問了一圈AI各種問題后,演示人員突然問AI“你看見我的眼鏡了嗎?”AI表示看見了,并且指出了位置,瞬間引爆全場。
更讓人激動的是,現(xiàn)在我們有機會在Google搜索體驗AI功能了,只不過可能需要一點小法術才能召喚出來。
然而,他們最有熱度的消息,是讓Gemini觀看GPT-4o的發(fā)布會。
或許Gemini最能證明自己、最能刷出存在感的途徑,就是整合到iPhone中。這樣一來,蘋果提升了產(chǎn)品的AI濃度,Gemini也實現(xiàn)了破圈。但跟蘋果的談判八字還沒一撇呢,又被OpenAI截胡了。
據(jù)彭博社報道,蘋果即將與OpenAI達成合作協(xié)議,蘋果用戶有望在iOS 18上用上被GPT加強過的Siri。消息一出,Google股價大跌。
可想而知,一旦OpenAI和蘋果建立合作關系,作為OpenAI背后的最大金主,微軟必將給Google的搜索業(yè)務帶來更大的長期風險。
不過,在OpenAI沒有完全搞明白GPT的思維邏輯之前,預言Google的敗局似乎還為時過早。
GPT-4o中的o,是拉丁文Omni的首字母,意為“全部的”“每一個”或“全面的”,意味著該產(chǎn)品在處理多種語言和模態(tài)(如文本、音頻和視覺)方面,具有十分全面的能力。
盡管OpenAI表示,GPT-4o的出現(xiàn),標志著我們向“更自然的人機交互”又近了一步。然而其背后的運行方式、思維邏輯仍然成謎,OpenAI自己對GPT突然獲得“指數(shù)級進化”的預測能力,毫無頭緒。
于是你就看到了這樣的搞笑一幕。
當你用英文詢問GPT“第一頭游過英吉利海峽的大象是誰”,GPT會煞有介事的告訴你,是一只叫做Jumbo的亞洲象。但同一個問題,換成中文就會得到一個十分合理的回答。
也就是說,盡管GPT可以在不同語言之間自由切換,但它們理解一個問題的方式似乎存在著差異,不免讓人對Omni產(chǎn)生懷疑。
尤其是當你用同樣的問題問另外一個AI,它卻給出了完全合理的回答的時候。
類似的奇怪回答層出不窮,比如問它圓周率最后5位數(shù)字,是這么回答的。
盡管OpenaI很快修復了這些“熱門bug”,但也不免讓人產(chǎn)生一個疑問:GPT-4o背后,到底有多少只能多少人工?GPT-4o到底是離AGI更近了一步,還是圍著AGI又繞了一圈呢?
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)