自治AI代理:Auto-GPT、BabyAGI、AgentGPT、JARVIS / HuggingGPT

ChatGPT和許多其它當(dāng)前的基礎(chǔ)模型都很棒,可以回答無數(shù)的問題,生成與人類藝術(shù)作品幾乎沒有區(qū)別的AI藝術(shù)、分析照片等都表現(xiàn)得不輸人類。
只有一件事是它們做不到的,即完成由大量非常不同的獨立步驟組成的任務(wù),這些步驟加在一起需要很長時間才能處理。
這些模型有點像還不是很獨立的練習(xí)生,必須始終保持聯(lián)系,以提高輸出,解釋需要完成的任務(wù)并采取下一步行動。
AI 代理可以自主地做到這一點,接受用戶輸入,在llm的幫助下將其分解為許多小的獨立任務(wù)并進(jìn)行處理。它們存儲單獨的結(jié)果,在必要時進(jìn)行檢查,然后將其用作后續(xù)步驟的輸入。這允許處理更復(fù)雜的任務(wù)并訪問不同的基礎(chǔ)模型(語言、代碼、視頻、語音等)和資源(搜索引擎、公共數(shù)據(jù)API、計算工具等)。
自治代理 AI
如何才能獲得一個模型來完成一項多步驟的工作,例如創(chuàng)建一副新的 52 張牌,其中包括武俠英雄形象,如郭靖或者
張無忌。
雖然語言模型可以編制風(fēng)格和形象列表,但至少需要另一種類型的模型(AI 藝術(shù)模型)來生成視覺效果。可能需要額外的系統(tǒng)來搜索互聯(lián)網(wǎng)或存儲內(nèi)容。
可以編寫一個批處理腳本來完成這一切。
或者代理 AI ,告訴想要做什么,然后代理編寫批處理腳本,執(zhí)行它并監(jiān)控結(jié)果。
通常,代理使用單個步驟(為單個卡片選擇藝術(shù)家)和框架任務(wù)(生成任務(wù)列表)外部模型,將思考步驟外包,只保留信息存儲、任務(wù)跟蹤、界面管理和編排。
代理或自主 AI 在最近幾周才出現(xiàn),但它們正在以驚人的速度發(fā)展。現(xiàn)在,微軟已經(jīng)加入了 Jarvis / HuggingGPT 的行列。
AgentGPT
在瀏覽器中組裝、配置和部署自主 AI 代理。無需安裝配置好 OpenAI 密鑰即可輕松使用。
特征:
- 基于瀏覽器
- 簡單易用的代理
- 基于 OpenAI 模型
- 測試使用不需要 OpenAI 密鑰
使用網(wǎng)站: https://agentgpt.reworkd.ai/
Auto-GPT
基于 GPT-4 的實驗性和開源代理庫,它將 LLM 的思想鏈接在一起,以自主實現(xiàn)設(shè)定的任何目標(biāo)。作為 GPT-4 完全自主運行的首批示例之一,Auto-GPT 突破了 AI 的可能性界限。
特征:
- 支持通過 Internet 訪問搜索和收集信息
- 長期和短期內(nèi)存管理
- 用于文本生成的 GPT-4 實例
- 訪問流行的網(wǎng)站和平臺
- 使用 GPT-3.5 進(jìn)行文件存儲和匯總
GITHUB: https://github.com/Significant-Gravitas/Auto-GPT
Baby AGI
人工智能驅(qū)動的任務(wù)管理系統(tǒng),該系統(tǒng)使用 OpenAI 和 Pinecone API 來創(chuàng)建任務(wù)、確定任務(wù)的優(yōu)先級和執(zhí)行任務(wù)。該系統(tǒng)背后的主要思想是它根據(jù)先前任務(wù)的結(jié)果和預(yù)定義的目標(biāo)創(chuàng)建任務(wù)。
工作方式:
- 從任務(wù)列表中提取第一個任務(wù)。
- 將任務(wù)發(fā)送給執(zhí)行代理,執(zhí)行代理使用 OpenAI 的 API(和 Llama)根據(jù)上下文完成任務(wù)。
- 豐富結(jié)果并將其存儲在 Pinecone 中。
- 創(chuàng)建新任務(wù)并根據(jù)目標(biāo)和先前任務(wù)的結(jié)果重新排列任務(wù)列表的優(yōu)先級。
GITHUB: https://github.com/yoheinakajima/babyagi
JARVIS / HuggingGPT
一個協(xié)作系統(tǒng),由作為控制器的 LLM 和作為協(xié)作執(zhí)行者的眾多專家模型組成(來自 Hugging Face Hub)。代理可以使用 LLM 和其他模型。系統(tǒng)的工作流程包括四個階段:
- 任務(wù)規(guī)劃:使用ChatGPT分析用戶的請求,了解意圖,并將其拆解成可能解決的任務(wù)。
- 模型選擇:為解決計劃任務(wù),ChatGPT 根據(jù)描述選擇托管在 Hugging Face 上的專家模型。
- 任務(wù)執(zhí)行:調(diào)用并執(zhí)行每個選定的模型并將結(jié)果返回給 ChatGPT。
- 響應(yīng)生成 : 最后使用ChatGPT整合所有模型的預(yù)測,生成響應(yīng)。
GITHUB:https://github.com/microsoft/JARVIS
總結(jié)
人工智能代理不僅僅是更好的基礎(chǔ)模型,還增加了一個新的維度。無法比經(jīng)典基礎(chǔ)模型更好地執(zhí)行一項小的單一任務(wù),但能夠?qū)⒁豁椄蟮娜蝿?wù)分解成許多更小的任務(wù)。如果未來基礎(chǔ)模型變得更好,它們不會取代 AI 代理,而是會讓它們變得更強(qiáng)大。
自治代理可以
- 集成不同類型的模型(語言、代碼、人工智能藝術(shù)、策略等等)
- 集成非基礎(chǔ)模型組件,如搜索引擎、計算引擎等。
- 分叉到任務(wù)子分支
- 通過另一個模型驗證/重寫一個模型的輸出
- 嘗試一些東西,檢查結(jié)果,接受它或嘗試不同的東西
- 連續(xù)運行并處理連續(xù)輸入(例如,可以隨時間控制正在運行的系統(tǒng))
未來如果一個代理連接到互聯(lián)網(wǎng),它可能會做它認(rèn)為完成任務(wù)所必需的事情,但不是人類用戶想要做的,比如侵入云系統(tǒng)以獲取信息。如果代理能夠訓(xùn)練模型或配置自身的未來實例以完成任務(wù),則可能會演變出一個巨大的 AI 問題:可能會出現(xiàn)遠(yuǎn)遠(yuǎn)超出人類控制的系統(tǒng)。