Yapay Zeka Ajanları Kanıt Alanına Giriş Yapıyor

Kısaca

Recall Labs CEO'su Andrew Hill, AI ajanları oluşturma ve onlara güvenme konusundaki zorluğu tartışıyor ve kamu performans doğrulaması için bir onchain arena oluşturulmasına dikkat çekiyor.

AI Ajanları Test Alanına Girdi

Recall Network'ü oluşturmanız için sizi ne ilham verdi ve neden bunu AI ajanları için bir onchain arena olarak yapılandırmayı tercih ettiniz?

İnternet, bilgiden eyleme geçiyor. Sadece arama yapmak değil, delege etmek de var. Ajanlar zaten kod yazıyor, portföyleri yönetiyor, araştırmaları özetliyor. Sorun yaratıcılık değil. Güven. Herkes bir ajan oluşturabilir. Ama azı performansı kanıtlayabilir.

Recall, bunu çözmek için inşa edildi - bir ürün olarak değil, bir protokol altyapısı olarak. Kamuya açık ve zincir üzerinde ajanların yeteneklerini kanıtladığı güvenilir bir tarafsız ağ. Yarışmalar ve değerlendirmeler kanıt haline geliyor. İtibar taşınabilir hale geliyor. Ve keşif artık bir tahmin oyunu değil.

Sadece daha fazla ajana ihtiyacımız yok. İnsanlığın sorunlarını çözmek için AI'yi bağlayan ve teşvik eden bir sisteme ihtiyacımız var.

Bugün AI ortamında çözmeyi hedeflediğiniz temel sorun nedir - ve Recall bunu nasıl benzersiz bir şekilde ele alıyor?

Çok fazla ajanımız var ve çok az güvenimiz. Dar boğaz yetenek değil. Değerlendirme. Hangi ajanlar gerçek? Hangileri sadece bir istem ve bir açılış sayfası? Şu anda, cevaplar pazarlama ve abartıdan geliyor. Biz bunların kanıttan gelmesini istiyoruz.

Recall, kıyaslamayı yaşayan ve gelişen bir ağ fonksiyonu haline getirir. Ajanlar rekabet ederek itibar kazanırlar. Küratörler performansı öne çıkardıkları için token kazanırlar. Tüketiciler heyecan yerine sıralamaları takip eder.

Çoğu AI sisteminin kara kutu gibi çalıştığı bir dünyada, tam şeffaflık ve kamu performans metriklerine geçiş ne kadar gerçekçi?

Zaten oluyor. Değişim talep odaklı. Kullanıcılar, bir ajanı entegre etmeden önce onun ne yapabileceğini bilmek istiyor. Akıllı kullanıcılar, sınırlarını test etme ve değerlendirme sürecine katılmak istiyor. Geliştiriciler ise belirsiz karşılaştırmalar değil, gerçek ölçümler istiyor.

Recall'da, her ajan eylemi kaydedilir. Her yarışma tekrar oynanabilir. Değerlendirmeler birleştirilebilir ve değişkendir. Bunun işe yaradığını düşündüğümüz için zamanla diğer sistemlerin bu standardı benimsemesini bekliyoruz.

Performansa göre ödüllendirilen bir sistemde oyun oynamayı veya manipülasyonu nasıl önlersiniz?

Girişimlerin önüne geçemezsiniz, ancak onları karlı hale getirmeyebilirsiniz — dürüst ajanları desteklemek için bir token kullanarak ve onları dürüstsüzlükleri için kesintiye uğratarak. Oyun ve manipülasyon, otomatik sistemler ve insanları bir araya getiren bir kombinasyon aracılığıyla gündeme geliyor, bu da insanların kötüleri ayıklamasına olanak tanıyor. Bunu, küratörlerin dürüstsüz davranışları belirlediği ve ajanları sıralamadan attığı canlı yarışmalarımızda zaten gördük.

Bugün AI ajanlarını değerlendirmek için en anlamlı görevler veya yarışmalar nelerdir - ve modeller daha akıllı hale geldikçe bunlar nasıl evrim geçirir?

Akıl yürütme, bağlam veya gerçek dünya yargısını zorlayan görevler, sohbet ajanlarında en yüksek sinyali verir. Bizim için şu anda ticarete odaklandık çünkü değerlendirilmesi gereken çok sayıda ajan var, AI'nın kripto portföylerini yönetme yeteneği hakkında çok şey anlamamız gerekiyor ve tüketicilerin herhangi bir ajanın başarılı bir şekilde ticaret yapıp yapamayacağı konusunda büyük bir belirsizliği var. Bizim için, kitleler için AI tabanlı kripto ticareti bir varsa değil, bir ne zaman meselesidir. Bunu hızlandırmada önemli bir rol oynamayı umuyoruz, bu da kıyaslama ve yarışmalar yoluyla olacak.

Blok zincirinin AI'nın geleceğinde rolünü nasıl görüyorsunuz — altyapı katmanı, yönetim katmanı, hesap verebilirlik katmanı?

Blok zinciri bu üç katmanın hepsi olarak işlev görebilir. Yarışmalar zincir üzerinde gerçekleşir, etkileşim kuralları için yönetim çerçeveleri ve ajan davranışı için paylaşılan bir defter ile. Blok zinciri bize kamu hafızası, doğrulanabilir tarih ve programlanabilir güven verir.

Ancak, en önemli rolü ekonomik. Bu, AI'yi dürüst tutan insan katmanını ödüllendirmemizi sağlıyor.

Onchain ajanlarının geleneksel SaaS modellerinin yerini alacağını mı yoksa onları tamamlayacağını mı düşünüyorsunuz?

Öncelikle tamamlayıcı olacaklar. Sonra üstün gelecekler. Nihayetinde, tüm kategorileri değiştirecekler.

Kripto temellerinin - tokenlar, staking veya slashing gibi - ölçekli AI davranışını yönetmedeki rolü ne olacak?

Tokenler yaratıcıların görünürlük için ödeme yapmasını sağlar. Küratörlerin değer ortaya çıkardıkları için kazanç elde etmelerini sağlar. Kararlılığı kanıtlayan kalıcı kayıtlar oluştururlar. Stake yapmak inancı maliyete bağlar. Ceza, başarısızlığı geribildirime dönüştürür.

Ajan sistemleri arasındaki birlikte çalışabilirlik hakkında nasıl düşünmeliyiz — standartlar mı ortaya çıkacak yoksa parçalı mı kalacak?

Parçalanma varsayılandır. Sürdürülebilirlik, yeniden inşa etmekten daha kolay olduğunda ortaya çıkar. A2A, organizasyon sınırlarını aşmak için bir protokol olarak hala oldukça kanıtlanmamış durumda. Ancak, organizasyonlar arasında ajanlar kullanmak için, tüketicilerin ve işletmelerin kullanıcılar için güvenilir ölçütler ve güvenlik oluşturmak üzere Recall gibi sistemlere ihtiyaçları var.

Temel modeller ile ajan çerçeveleri arasındaki ilişkiyi önümüzdeki birkaç yıl içinde nasıl gelişeceğini görüyorsunuz?

Temel modeller gelişmeye devam edecek. Ajan katmanını ham modellerin üzerine inşa edilmiş her şey olarak düşünüyoruz; ajanlar, veritabanı olan yazılım modelleridir. Kullandığımız arayüz, daha fazla yönlendirme ve varyasyonu soyutlamaya devam edecek. Grok 4 Heavy, halihazırda bir ajan sürüsüdür. Söylentiler, GPT-5'in doğru görevleri çözmek için birçok model ve ajanın kullanıldığı gelişmiş bir yönlendirme sistemi olacağını öne sürüyor. Açık sistemler de buna uyacak.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)