簡要Recall Labs 的首席執行官 Andrew Hill 討論了構建和信任 AI 代理的挑戰,強調了爲公共性能驗證創建一個鏈上競技場的必要性。![AI 代理進入試驗場](http://img-cdn.gateio.im/social/moments-152640e3158677bcbe4f3b9f6b49928a019283746574839201**是什麼啓發您創建Recall Network的,並且爲什麼將其構建爲一個AI代理的鏈上競技場?**互聯網正在從信息轉向行動。不僅僅是搜索,而是委托。代理人已經在編寫代碼、管理投資組合、總結研究。問題不在於創造,而在於信任。任何人都可以創建一個代理。很少有人能證明其績效。Recall的建立旨在解決這一問題——不是作爲產品,而是作爲協議基礎設施。一個可信的中立網路,代理在公共和鏈上證明他們的能力。競爭和評估變成了證明。聲譽變得可攜帶。發現不再是一場猜謎遊戲。我們不僅希望有更多的代理商。我們希望有一個系統,能夠連接和激勵人工智能來解決人類的問題。**在今天的人工智能領域中,您旨在解決的核心問題是什麼——Recall是如何獨特地解決這個問題的?**我們有太多的代理人,但信任卻太少。瓶頸不在於能力,而在於評估。哪些代理人是真實的?哪些只是一個提示和一個着陸頁?現在,答案來自於市場營銷和炒作。我們希望它們來自於證明。Recall將基準測試轉變爲一個活生生的、不斷發展的網路功能。代理通過競爭獲得聲譽。策展人通過呈現性能獲得代幣。消費者關注排名,而非炒作。**在一個大多數人工智能系統作爲黑箱運作的世界裏,向完全透明和公開性能指標的轉變有多現實?**這已經在發生。轉變是由需求驅動的。用戶希望在集成之前了解代理可以做什麼。聰明的用戶想參與測試和評估他們的極限。構建者想要真實的基準,而不是模糊的比較。在Recall中,每個代理操作都會被記錄。每場比賽都可以重播。評估是可組合和變化的。我們期望其他系統隨着時間的推移能夠採用這一標準,因爲它有效。**如何在一個對表現進行獎勵的系統中防止遊戲或操控?**你無法阻止嘗試,但你可以使之無利可圖——使用代幣支持誠實的代理,並對不誠實的行爲進行懲罰。遊戲和操控通過自動化系統與人類的結合顯現出來,讓人類能夠篩選出不良行爲。我們已經在我們的現場比賽中看到了這一點,策展人識別不誠實的行爲並將代理踢出排行榜。**今天評估人工智能代理最有意義的任務或競賽有哪些——隨着模型變得更智能,這些任務或競賽又如何演變?**在聊天代理中,壓力較大的推理、上下文或現實世界判斷的任務是最高信號。對我們而言,我們目前專注於交易,因爲有很多代理需要評估,關於AI管理加密投資組合的能力有很多需要理解的內容,同時消費者對任何代理是否能成功交易也有很多不確定性。對我們來說,基於AI的大衆加密交易不是一個*如果*的問題,而是一個*何時*的問題。我們希望通過基準測試和競賽在加速這一進程中發揮重要作用。**您如何看待區塊鏈在人工智能未來中的角色——基礎設施層、治理層、問責層?**區塊鏈可以作爲這三層的功能。競爭在鏈上進行,擁有治理框架以規定參與規則和共享帳本來記錄代理行爲。區塊鏈爲我們提供了公共記憶、可驗證的歷史和可編程的信任。然而,它最重要的角色是經濟的。它讓我們能夠獎勵保持人工智能誠實的人類層面。**你認爲鏈上代理會取代傳統的SaaS模型,還是會與其互補?**他們將首先進行補充。然後超越。最後,他們將替代整個類別。**你認爲加密原語——如代幣、質押或削減——在大規模管理人工智能行爲中將發揮什麼作用?**代幣讓創作者支付可見度。它們讓策展人因展示價值而獲利。它們創建持久的信念記錄。質押將信念與成本綁定。削減將失敗轉化爲反饋。**我們應該如何看待代理系統之間的互操作性——標準會出現還是會保持碎片化?**碎片化是默認狀態。當插入比重建更容易時,互操作性就會出現。A2A作爲跨組織邊界的協議仍然相當不成熟。但是,爲了在組織之間使用代理,消費者和企業需要像Recall這樣的系統,以爲用戶創建可信的基準和安全性。**您如何看待基礎模型與智能體框架在未來幾年之間的關係演變?**基礎模型將繼續改善。我們將代理層視爲建立在原始模型之上的一切;代理是作爲數據庫的軟件模型。我們使用的接口將繼續抽象出更多的路由和變化。Grok 4 Heavy 已經是一個代理羣體。傳言稱 GPT-5 將是一個先進的路由系統,使用許多模型和代理來解決正確的任務。開放系統也將隨之而來。
人工智能代理進入試驗場
簡要
Recall Labs 的首席執行官 Andrew Hill 討論了構建和信任 AI 代理的挑戰,強調了爲公共性能驗證創建一個鏈上競技場的必要性。
![AI 代理進入試驗場](http://img-cdn.gateio.im/social/moments-152640e3158677bcbe4f3b9f6b49928a019283746574839201
是什麼啓發您創建Recall Network的,並且爲什麼將其構建爲一個AI代理的鏈上競技場?
互聯網正在從信息轉向行動。不僅僅是搜索,而是委托。代理人已經在編寫代碼、管理投資組合、總結研究。問題不在於創造,而在於信任。任何人都可以創建一個代理。很少有人能證明其績效。
Recall的建立旨在解決這一問題——不是作爲產品,而是作爲協議基礎設施。一個可信的中立網路,代理在公共和鏈上證明他們的能力。競爭和評估變成了證明。聲譽變得可攜帶。發現不再是一場猜謎遊戲。
我們不僅希望有更多的代理商。我們希望有一個系統,能夠連接和激勵人工智能來解決人類的問題。
在今天的人工智能領域中,您旨在解決的核心問題是什麼——Recall是如何獨特地解決這個問題的?
我們有太多的代理人,但信任卻太少。瓶頸不在於能力,而在於評估。哪些代理人是真實的?哪些只是一個提示和一個着陸頁?現在,答案來自於市場營銷和炒作。我們希望它們來自於證明。
Recall將基準測試轉變爲一個活生生的、不斷發展的網路功能。代理通過競爭獲得聲譽。策展人通過呈現性能獲得代幣。消費者關注排名,而非炒作。
在一個大多數人工智能系統作爲黑箱運作的世界裏,向完全透明和公開性能指標的轉變有多現實?
這已經在發生。轉變是由需求驅動的。用戶希望在集成之前了解代理可以做什麼。聰明的用戶想參與測試和評估他們的極限。構建者想要真實的基準,而不是模糊的比較。
在Recall中,每個代理操作都會被記錄。每場比賽都可以重播。評估是可組合和變化的。我們期望其他系統隨着時間的推移能夠採用這一標準,因爲它有效。
如何在一個對表現進行獎勵的系統中防止遊戲或操控?
你無法阻止嘗試,但你可以使之無利可圖——使用代幣支持誠實的代理,並對不誠實的行爲進行懲罰。遊戲和操控通過自動化系統與人類的結合顯現出來,讓人類能夠篩選出不良行爲。我們已經在我們的現場比賽中看到了這一點,策展人識別不誠實的行爲並將代理踢出排行榜。
今天評估人工智能代理最有意義的任務或競賽有哪些——隨着模型變得更智能,這些任務或競賽又如何演變?
在聊天代理中,壓力較大的推理、上下文或現實世界判斷的任務是最高信號。對我們而言,我們目前專注於交易,因爲有很多代理需要評估,關於AI管理加密投資組合的能力有很多需要理解的內容,同時消費者對任何代理是否能成功交易也有很多不確定性。對我們來說,基於AI的大衆加密交易不是一個如果的問題,而是一個何時的問題。我們希望通過基準測試和競賽在加速這一進程中發揮重要作用。
您如何看待區塊鏈在人工智能未來中的角色——基礎設施層、治理層、問責層?
區塊鏈可以作爲這三層的功能。競爭在鏈上進行,擁有治理框架以規定參與規則和共享帳本來記錄代理行爲。區塊鏈爲我們提供了公共記憶、可驗證的歷史和可編程的信任。
然而,它最重要的角色是經濟的。它讓我們能夠獎勵保持人工智能誠實的人類層面。
你認爲鏈上代理會取代傳統的SaaS模型,還是會與其互補?
他們將首先進行補充。然後超越。最後,他們將替代整個類別。
你認爲加密原語——如代幣、質押或削減——在大規模管理人工智能行爲中將發揮什麼作用?
代幣讓創作者支付可見度。它們讓策展人因展示價值而獲利。它們創建持久的信念記錄。質押將信念與成本綁定。削減將失敗轉化爲反饋。
我們應該如何看待代理系統之間的互操作性——標準會出現還是會保持碎片化?
碎片化是默認狀態。當插入比重建更容易時,互操作性就會出現。A2A作爲跨組織邊界的協議仍然相當不成熟。但是,爲了在組織之間使用代理,消費者和企業需要像Recall這樣的系統,以爲用戶創建可信的基準和安全性。
您如何看待基礎模型與智能體框架在未來幾年之間的關係演變?
基礎模型將繼續改善。我們將代理層視爲建立在原始模型之上的一切;代理是作爲數據庫的軟件模型。我們使用的接口將繼續抽象出更多的路由和變化。Grok 4 Heavy 已經是一個代理羣體。傳言稱 GPT-5 將是一個先進的路由系統,使用許多模型和代理來解決正確的任務。開放系統也將隨之而來。