我算比較資深的 Agent 開發(fā)者:ChatGPT中,用量最大的 Plugin 和用量最大的華人捏的 Bot,可能都是我做的。 之前寫過一篇實操教程:《保姆級教程:Coze 打工你躺平》,今天想從 Agent 的發(fā)展脈絡(luò),來更深入談?wù)劇?/span> Agent 的起源不做詞義追源,僅從大眾角度,這個事兒是去年初開始的,也就是 2023 年 2-3 月。標(biāo)志性事件包括:
《AI 學(xué)會使用工具了》 2023年2月14日,報道自賽博禪心 現(xiàn)在的 Agent時至今日,對于 Agent 是什么,可能還沒有一個標(biāo)準(zhǔn)的定義。 一個常見的觀點是,Agent 是一種讓 AI 以類似人的工作和思考方式,來完成一系列的任務(wù)。一個 Agent 可以是一個 Bot,也可以是多個 Bot 的協(xié)同。就像是職場里,簡單的工作獨立完成,復(fù)雜的工作協(xié)作完成一樣。 對于每個 Bot 來說,可能會包括:
再具象一點,這里我從 GPTs 里截了個圖: 對于 GPTs,通常被認為是由 OpenAI 設(shè)計的簡化版的 Agent。默認情況下,只能進行單 Bot 交互:
OpenAI 的 Agent 演進以 OpenAI 為例,我們看看 Agent 是如何一步步演進的。 去年 3 月底,OpenAI 宣布了插件計劃,并在 5 月上線了插件商店,這也標(biāo)志了 OpenAI 揭開 Agent 戰(zhàn)局的第一步。 在當(dāng)時 OpenAI 給開發(fā)者發(fā)送的指引中,給了這樣的 Todo:
如果你做過 OpenAI API 的開發(fā),可能會覺得這個文檔有些熟悉,這不就是 Fuction Call 嗎? 沒錯,在 2023 年 6 月 13 日,OpenAI 發(fā)布了 Function Call 模式,讓大模型可以來調(diào)用外部工具,用的就是非常類似的方案。 再往后,OpenAI 的相關(guān)工作人員做了一系列的 Research,關(guān)于 Agent 的最佳實踐。同時的,也發(fā)布了 Custom Instruction 指令的相關(guān)功能。 之后,ChatGPT 推出了 All Tools 功能。也就是回答用戶問題時,不再需要用戶自主的來選擇工具,這可以視作是“自動版的Plugin”,覆蓋了三款官方工具:Browsing, Advanced Data Analysis 和 DALL·E。 時間推移,在2023 年 11 月 6 日的時候,在 OpenAI 開發(fā)者大會上,Sam Altman 宣布了 GPTs,這通常被認為是 OpenAI 推出了其第一個正式版的 AI Agent。在最初的版本中,包括以下功能
同時,在11月06日的時候,OpenAI 也更新了幾個影響深遠的接口:
在最近 GPTs 體系上線了 GPT Store,有些媒體稱其為 OpenAI 的 App Store 時刻,但其實并不相同。在 GPT Store 里,用戶可以搜索和使用為各項任務(wù)所開發(fā)的 GPTs。 緊隨 GPT Store 上線的,還有 @GPTs 功能,也就是在任何的對話中,你都可以手動的讓某個 GPTs 接管這個對話內(nèi)容,做出更好的輸出。 值得一提的是,由于 GPT Store 沒有開放支付入口,所以目前幾乎所有的 GPTs 都是免費的。對此,OpenAI 也承諾了會給頭部開發(fā)者提供激勵:《GPTs 商店,要發(fā)錢了!?。?/strong>》。 其它 Agent 平臺之前和 OpenAI 的相關(guān)負責(zé)人聊過,ChatGPT 的主要定位是“開箱即用的消費級產(chǎn)品”。那這里,自然給“較為復(fù)雜的生產(chǎn)級產(chǎn)品”留下了生態(tài)空間。這里,我們也來探討下這類產(chǎn)品。 主要的 AI 玩家都會對這方面有所涉足,也各有側(cè)重。比如來傳統(tǒng)大廠自字節(jié)扣子/coze,百度的靈境矩陣,也比如來自 AI 初創(chuàng)公司的 Dify 等等。 以扣子為例,對比與 GPTs Store,主要的體感區(qū)別包括:
其中后兩條極為核心。 我的 Agent 的實戰(zhàn)一個設(shè)計良好的 Agent 可以提供極大的生產(chǎn)力,并創(chuàng)造極高的價值。 前幾天大火的 Devin,被稱為“第一位由 AI 擔(dān)任的軟件工程師”,它可以自主的去學(xué)會如何使用不熟悉的技術(shù),自主的生成代碼、調(diào)試bug和部署應(yīng)用。 Agent 也可以替代現(xiàn)有的很多軟件工具,去完成工作中繁瑣的任務(wù)。舉個例子,我正打算開一個專欄,叫做“乘風(fēng)破浪的少年們”,去講述和記錄那些在這次 AI 浪潮中,登上世界舞臺的中國人,用對話的形式。類似這種:《奧特曼專訪:關(guān)于 GPT-5、Sora、Ilya、Q*、AGI、外星人等等一切》。 這里對我來講的一個很大挑戰(zhàn):我需要整理大量的文字稿,并且把它排版出來,這并不輕松,也很占時間。我希望有一個 Agent 來幫我做這件事情。 昨天下午,我和 Owen(沉浸式翻譯的作者)去參加了一個 Hackathon,現(xiàn)場有了靈感,并梳理出了這個 Agent 的思路:
|
|
來自: 長沙7喜 > 《智能技術(shù)》