很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
文:王智遠
關(guān)于ChatGPT做搜索的新聞,我一直挺感興趣。
上個月25號,OpenAI在當?shù)赝瞥隽艘粋€新產(chǎn)品,名叫“SearchGPT”。官方說,產(chǎn)品能給用戶提供帶鏈接的搜索結(jié)果,用戶還可以繼續(xù)問問題,系統(tǒng)會根據(jù)上下文給出回答。
我看到消息后,馬上申請內(nèi)測。但一個月過去,官方還沒給我權(quán)限;現(xiàn)在網(wǎng)上辦法多。我就通過特殊朋友渠道,弄到了一個測試賬號,體驗了一把。
體驗之后什么感覺呢?
一句話總結(jié)即:perplexity AI解決不了的問題,SearchGPT也解決不了。
比如:AI幻覺。一千個觀眾有一千個哈姆雷特,不同的人看同一信息可能得出不同的結(jié)論。就算是同一個人,今天看到的東西和明天可能理解也會有所不同。
這就像AI面對復雜、多變的人類思維一樣,如果AI不能真正地“站在你的角度”去理解問題,感受你的感受,那它很難獨立地給出人們真正想要的答案。
因此,除非AI能達到這樣高級的理解和適應(yīng)能力,不然,AI永遠無法避開幻覺問題。所以,怎么辦呢?
來看看另一個新聞:
不久前,Twitter上有個名叫@iruletheworldmo的用戶頻繁爆料,談到Project Strawberry(草莓計劃),這是OpenAI的一個項目,以前叫Q-Star。
這個計劃目標是讓AI變得更聰明,更能自主。簡單來說,他們希望訓練出來的AI能自己處理很多事,不太要人來監(jiān)督。
這意味著,AI將能自己搜索信息,深入研究問題,甚至自己創(chuàng)造數(shù)據(jù),這樣就能減少對人類的依賴。也就是說,AI可能會變得更像人,更會思考。
這條推文引起了不少人的關(guān)注,大家都在猜到底是不是OpenAI內(nèi)部信息,但還沒等到官方回復,就有人跳出來了,這人叫Div Garg,是MultiOn公司的創(chuàng)始人。
他說:
OpenAI的“Q”還沒正式出來,但我們已經(jīng)推出了一個新的智能體,叫“Agent Q”,并且邀請大家來試試,很多人懷疑他在利用OpenAI的秘密項目來做廣告。
我查了查,發(fā)現(xiàn)MultiOn這家公司確實在2023年接受了OpenAI、DeepMind等公司、高管個人的投資;所以,讓人不禁猜想,OpenAI做的搜索項目,和他們到底有沒有關(guān)系?
好吧。姑且,不論這事,來看看MultiOn這家公司。
MultiOn專門做AI智能體,目標是,通過智能體幫助人們完成日常任務(wù),比如:網(wǎng)頁瀏覽、網(wǎng)購和郵件處理,他們希望構(gòu)建一個能在數(shù)字世界里,能自主完成復雜任務(wù)的AI系統(tǒng)。
這么一看,兩者之間確實有些相似。相似在哪呢?
我們換個角度:
請問,你解決不了AI搜索幻覺的問題,還要不要解決?作為普通人的我們當然覺得,要。必須解決。其實,單一視角往往會限制我們。
系統(tǒng)科學家羅素·艾可夫(Russell L. Ackoff),在作品《問題解決的藝術(shù)》中提到:
復雜問題往往源于問題定義本身,如果能夠以新的視角、新框架重新定義問題,有時能發(fā)現(xiàn)原本看似復雜的問題,其實有更簡單的解決之道,或者,原本的問題根本就不需要以傳統(tǒng)的方式解決。
也就是說:解決一個復雜問題,最好的辦法是,繞開把它轉(zhuǎn)成一個非問題。
舉個通俗的例子:
想象一下,你家廚房每次做完飯都一團糟。通常,你可能會選擇在烹飪后進行一次大掃除,這樣雖然能清理干凈,但每次要花費大量時間和精力。
如果你換一個角度來看就不一樣了。類似,重新組織廚房物品,把常用的廚具、調(diào)料放在容易拿到的地方,不常用的東西則收好。
改進烹飪流程,做飯時,邊做邊清洗用過的器具,甚至,在操作臺上放一個垃圾桶,用于臨時收集廚余和垃圾。
這樣,是不是做飯過程中就能持續(xù)保持廚房整潔了?這就是,非問題化;重新定義問題和調(diào)整處理方式,使原本要解決的問題變得不再是問題。
那么,這和搜索與智能體之間有什么關(guān)系呢?來看看,OpenAI首席執(zhí)行官Sam Altman在2024年4月25日斯坦福大學的演講。
他說,AI實現(xiàn)通用人工智能(AGI)要經(jīng)過五個階段:
一級:能夠進行對話交互的人工智能; 二級:系統(tǒng)能夠解決博士級別的問題。三級:系統(tǒng)能夠代表用戶工作幾天;四級:人工智能能夠開發(fā)創(chuàng)新。五級:人工智能系統(tǒng)可以執(zhí)行組織的工作。
他并指出,目前OpenAI處于第一級,接近第二級。
考慮到進展,請思考一下,這樣一個AI行業(yè)巨頭,如何從當前階段過渡到更高級階段,比如“三級或四級,或者說,如何讓弱人工智能到強人工智能?讓技術(shù)更能滿足每個用戶第一場景使用情況?
答案很明顯:AI智能體。
因為,智能體是過度解決問題的最好辦法。想象一下,在理想狀態(tài)下,面對億萬用戶時,如果能夠展示數(shù)千萬個AI解決方案,來幫助大家解決各種問題,那么,無疑是最有效的。
畢竟,每個人都能找到符合自己需求的解決方案,極大提到了解決問題的效率和質(zhì)量。
為什么是智能體?
昨天,一個朋友抱怨說,買房后要還貸款,未來幾十年每月都要還幾千塊錢;他讓我?guī)兔λ阋凰悖侥壳盀橹?,他一共還了多少本金和利息,如果他想提前還款,根據(jù)現(xiàn)在的政策,可以節(jié)省多少錢。
這種復雜的問題我怎么能解決?于是,我把它給了豆包。
我先描述基本情況,讓豆包記住,然后,再把其他想法和訴求告訴它。大概幾十輪的對話后,豆包幫我詳細計算了出來,并生成一份大約600字的詳細分析報告。
這份報告包括了完整的背景信息、我的具體訴求、計算過程和對比分析等。
你用過豆包,或者其他可以和AI對話的工具么?不知道你有沒有發(fā)現(xiàn),現(xiàn)在此類對話工具,連續(xù)上下文邏輯能力變強了。
我再說一個貼身經(jīng)歷:
最近幾天,經(jīng)常接到一些奇怪的電話,涉及內(nèi)容如貸款、房產(chǎn)購買、京東優(yōu)惠等。
這些電話中,上來就問需要、不需要、行或者不行。我發(fā)現(xiàn),對方語氣很像真人,但當我給出它們設(shè)定范圍以外的問題時,它無法回答了。
這說明,智能體已經(jīng)在不知不覺中融入了日常生活,它們,能夠在特定的環(huán)境中模仿人類的互動方式。
所以,一個完整智能體,能夠充分與環(huán)境互動,這包括智能體自身和它所處的環(huán)境兩個部分;就像人類在物理世界中的行為一樣,智能體在其“外部環(huán)境”中也能執(zhí)行任務(wù)。
說白了,我可以與它交互,也能設(shè)定好指令,界定范圍,讓它幫我完成目標。
對比下來,是不是不難看出,智能體無疑是繞過AI搜索中幻覺問題、并成功商用的有效方式之一?
為什么這么說?
你想想看,考慮傳統(tǒng)AI搜索和提問時,AI搜索直接給出答案,這種答案比較扁平化,不具備連貫性。換言之,你提出一個問題,AI直接給你一個結(jié)論,結(jié)論會引用來自多個信息源的數(shù)據(jù)。就結(jié)束了。
智能體工作方式不同。
它不僅對單一問題做出反應(yīng),還會引入外部信息,在一連串多輪問答中,會反復接受來自你的信號,通過這種互動,它更能理解你的訴求。
在解決問題之后,它能生成一篇簡短的文章、總結(jié)方案,把整個互動過程指標串聯(lián)在一起;很明顯,智能體不是一個簡單的AI提問、總結(jié)工具,是一個完全符合每個人需求的系統(tǒng)。
因此,智能體能完美繞過AI幻覺,畢竟過程中,你不滿意時,能一次次糾正它的錯誤。
縱觀國內(nèi)市場,目前誰在做智能體呢?我查閱了一下,據(jù)說有超過4500家,比如:大家耳熟能詳?shù)陌俣?、科大訊飛、云從科技、字節(jié)跳動和騰訊等。
所以,誰在做智能體,這個問題不好解答。與其這樣,不如換種思考方式:智能體類型有哪些?我們通過類型看各家所在的生態(tài)位。
我盤點結(jié)果是:
智能體(Agent)平臺大體上分為兩類:一類基于知識庫和數(shù)據(jù)庫的。就像聊天機器人(Chatbot)這種簡單的平臺;另一類是用來解決更復雜問題的。這種平臺有多工作流編排的能力,比較高級。
國外Orkes Conductor、ControlFlow by Team Prefect、和 Flyte等平臺,就是專為復雜工作流和數(shù)據(jù)處理設(shè)計的。
這些平臺主要用戶包括數(shù)據(jù)科學家、工程師、開發(fā)者,他們用平臺來建立和優(yōu)化復雜的工作流程,提高數(shù)據(jù)處理的效率和自動化水平。
國內(nèi)也有類似的平臺。像扣子Coze、百度智能云的千帆AgentBuilder、科大訊飛的星火智能體平臺,還有騰訊的元氣和阿里云的AgentScope等。
他們利用大模型搭建 AI 原生應(yīng)用工作臺,給開發(fā)者提供 RAG、Agent、GBI 等應(yīng)用框架,賦能他們開發(fā)出來文生文、對話、文生表等垂直應(yīng)用,以幫助企業(yè)和個人解決問題。
我根據(jù)對象、流程和代碼復雜程度,把它細分成三類:
面向公眾和非開發(fā)人員
面向開發(fā)者的平臺
企業(yè)級開發(fā)平臺
第一種,主要偏向低代碼平臺,不要你懂太多編程。
像GPTs這樣的工具,提供很標準的操作界面和流程,主要用來做基于知識庫的聊天機器人。給你一個模板,你按步驟填信息就行,不用自己調(diào)整太多東西。
字節(jié)跳動的扣子(國內(nèi)版),就是被設(shè)計來幫助人們輕松創(chuàng)建下一代的AI聊天機器人。
第二種平臺功能更強大,可以讓開發(fā)者用各種API、第三方庫,還能自己編寫代碼和調(diào)整參數(shù),來精細控制智能體的行為。
Coze海外版很受歡迎,它的功能全面,支持很多高級操作。像百度、阿里和亞馬遜也提供這樣的平臺,讓開發(fā)者可以用各種AI模型來做更復雜的應(yīng)用。
企業(yè)開發(fā)平臺,專為企業(yè)設(shè)計,重點是幫助企業(yè)自動化他們的工作流程。
比如:
實在智能的TARS-RPA-Agent和壹沓科技的“數(shù)字員工團隊”CubeAgent,它們是用來自動化企業(yè)日常操作的。
還有國外的Torq和國內(nèi)瀾碼科技的AskXbot平臺,也提供了大模型結(jié)合企業(yè)知識庫的解決方案,幫助企業(yè)自動化處理更多復雜任務(wù)。
三種類型各有千秋,這么說,是不是更清楚一些?那么,站在AI搜索和智能體中間來看,智能體屬于那種呢?
解答該問題,不妨站在行業(yè)結(jié)構(gòu)視角看。我盤了一下,智能體(Agent)行業(yè)結(jié)構(gòu)有四層,分別為:基礎(chǔ)工具層、運營平臺層、開發(fā)工具層,以及服務(wù)與培訓平臺層。
組件是做智能體必不可少的基礎(chǔ)。有各種智能模塊、記憶模塊,比如語言模型、數(shù)據(jù)庫,還有一些安全工具和通信工具,就像蓋房子的磚塊和水泥。
運營層,包括制作Agent組件的廠商和各種運營集成平臺。如GitHub這樣的Agent框架發(fā)布平臺,它們提供必要的環(huán)境和服務(wù),支持智能體運行。
開發(fā)層相對容易理解了。
像Agent工具集成平臺AgentLego、或提供專屬云環(huán)境及沙盒環(huán)境的平臺等,它們使開發(fā)者能夠構(gòu)建、測試和部署智能體。
值得一提的是,像NexusGPT、Relevance AI等平臺,它們提供數(shù)字員工Agent的訓練服務(wù),目的幫助企業(yè)把智能體整合進現(xiàn)有的工作流程中,或者幫助個人創(chuàng)建能自動完成任務(wù)的AI團隊,這反而是目前很多企業(yè)剛需。
國內(nèi)也有類似的公司。例如:
金柚網(wǎng)的梧桐數(shù)字員工、壹沓科技的數(shù)字員工平臺1Data Agent,以及實在智能的RPA Agent。
這些平臺的特點是允許用戶通過聊天,輕松與智能體互動,管理和優(yōu)化各種業(yè)務(wù)流程,使智能體理解和執(zhí)行復雜任務(wù),讓日常更高效。
不論怎么說,從短期發(fā)展看,智能體要解決兩個問題:
一,豐富通用工作流和場景工作流,類似于AI搜索下的大搜,還要在處理數(shù)據(jù)訓練、多輪對話的準確性上下功夫。
二,讓智能體成為知識專家,形成可持續(xù)的服務(wù)能力。有點像針對特定領(lǐng)域進行深入挖掘。
比如,假設(shè)我是做消費品營銷的,如果有一個專門的智能體,它學了很多關(guān)于社交媒體趨勢、消費者行為的知識,那么,它就能真正幫到業(yè)務(wù)。
當然,智能體在其他行業(yè)也在不斷爆發(fā),像游戲,金融、醫(yī)療等,總體上說,基于LLM的能力,下一步基礎(chǔ)智能體必將是繞不開的一步。
讓它光思考,遠遠不夠。
想實現(xiàn)真正全面AGI,得把對話模型變成基本智能體,讓它參與到實際使用中去;就像人們常說的,從實踐中來,到實踐中去一樣。
所以,AI生成避免不了幻覺,但智能體的輪番交互,可以微調(diào),可以解決具體問題,至少,使用場景下,這是閉環(huán)的正向反饋動作。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)