Yupp引領AI評估新範式:區塊鏈激勵重塑模型評估體系

AI評估新範式:Yupp基於區塊鏈與激勵機制重塑模型評估

在人工智能應用日益普及的背景下,如何準確評估模型性能並提升用戶信任度成爲了亟待解決的問題。傳統的集中化評測方法難以覆蓋多樣化場景,也無法真實反映用戶偏好。同時,模型"幻覺"問題頻發,用戶在選擇時往往陷入信息繭房。

Yupp作爲一家新興平台,正試圖通過獨特的衆包模式和激勵機制,重塑AI模型的發現、比較與使用方式,爲AI評估領域帶來一場變革。本文將深入分析Yupp的核心機制、技術特點、團隊背景及其對AI生態的潛在影響。

團隊背景與融資

Yupp致力於構建一個"去信任"的AI反饋市場,讓多元化的用戶反饋在區塊鏈和加密經濟激勵的保障下自由流通,形成可擴展、公平且透明的模型評估層。通過激勵高質量人工標注數據的分發,Yupp能夠及時捕捉用戶在不同場景下的真實需求和偏好,幫助AI開發者迭代優化模型性能。

該項目由Pankaj Gupta和Gilad Mishne於2024年6月創立,首席科學家Jimmy Lin也參與其中。三人曾在Twitter共事,並在Google和一些加密貨幣平台積累了豐富經驗。

由於其去中心化、數據價值透明化的願景滿足了AI廠商對可信評估和用戶參與的需求,加上核心團隊的豐富履歷,Yupp獲得了業內知名人士和頂級風投的認可。

近期,Yupp完成了3300萬美元種子輪融資,由某知名風投合夥人領投,其他投資方包括Google首席科學家、Twitter聯合創始人、Pinterest聯合創始人、斯坦福大學多位教授等45位知名天使及企業高管。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

核心功能與用戶體驗

作爲一個AI評估平台,Yupp秉持"人人共享的AI"理念,讓用戶輕鬆發現、比較並使用最新的AI模型。與傳統單一響應不同,Yupp針對每個提示同時返回多個模型的答案,形成一個"AI議會"。這種設計不僅滿足了用戶對多樣化選擇的需求,更能有效甄別模型可能出現的"幻覺",幫助用戶通過對比做出更明智的決策。

平台現已支持500多款AI模型,涵蓋文本與圖像生成領域,包括多個知名模型以及衆多新興模型。爲進一步優化體驗,Yupp還推出了"QuickTake"功能,可將冗長回復提煉爲簡潔的概要。

此外,Yupp高度重視用戶隱私:所有聊天記錄默認私密,除非用戶主動公開;即使公開分享,也不透漏任何個人信息。用戶可隨時控制分享內容及範圍。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

經濟模型與激勵機制

Yupp將免費使用與用戶反饋結合,通過"Yupp積分"系統衡量模型使用情況。新用戶註冊即獲5000積分,後續可通過對模型回復打分、選擇偏好並闡述理由來賺取更多積分。反饋質量越高,獎勵越豐厚,確保用戶可持續免費使用包括高端模型在內的各類AI服務。

用戶每次提問後會獲得兩份模型回答,並通過反饋贏取"數字刮刮卡",獎勵0-250不等的Yupp積分。每1000積分可兌換1美元,用戶每日最高可提現10美元、月度最高50美元。積分支持兌換多種貨幣,並集成了多個區塊鏈網路,爲全球用戶提供即時、低費用的獎勵。

爲激勵更多人參與,Yupp還設立了推薦獎勵計劃,推薦人和被推薦人都能獲得額外積分。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

Yupp VIBE評分:AI評估的新標準

爲解決現有排行榜存在的問題,Yupp推出了測試版AI排行榜和"Yupp VIBE Score"評分系統。該系統匯聚全球用戶在自然交互中產生的偏好數據,力求提供穩健且可信賴的評估結果。

Yupp的評估原則包括穩健性(覆蓋多樣場景、反映真實需求、抵御惡意行爲)和可信賴性(公平中立、透明公開、嚴謹科學)。

平台不僅收集二元偏好,還鼓勵用戶指出回復的優缺點,並根據用戶的背景信息進行分羣分析,展現不同羣體的偏好差異。

在技術層面,Yupp正在探索利用區塊鏈、密碼學原語及零知識證明等技術,確保評估過程的公正、透明和可驗證。同時,平台已與專業AI數據提供商合作,通過多重驗證機制確保數據質量。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

發展歷程與未來展望

Yupp於2025年6月正式上線,此前進行了六個月內部測試。自上線以來,產品持續迭代,包括:

  • 多模態支持:接入多個圖像生成模型,支持用戶上傳圖像/PDF提問
  • 交互方式拓展:新增語音輸入與語音朗讀功能
  • 模型更新:引入多個新模型及"MAX模型"類別
  • 實時信息:支持在線查詢並提供引文
  • 支付升級:新增多種提現方式及貨幣支持
  • 分享導出:支持多種格式的導出和分享
  • 社區活動:舉辦AI提示挑戰賽等活動,完善社交功能

Yupp的使命是"賦能人類塑造AI的未來"。通過多視角AI回應和用戶反饋,Yupp不僅助力用戶更好決策,也爲AI進化提供持續動力。

總的來說,Yupp以衆包模式、激勵機制與真實用戶偏好驅動的評估系統,開闢了AI評估的新路徑。它不僅爲用戶提供免費、多樣的AI互動體驗,更將用戶反饋轉化爲高價值訓練數據,推動模型持續優化。憑藉經驗豐富的團隊和資本支持,Yupp有望在未來AI生態中扮演關鍵角色,實現"人人皆享AI,人人塑造AI"的願景。

然而,Yupp仍面臨諸多挑戰,包括如何在大規模用戶參與下持續確保數據質量、抵御潛在的作弊行爲,以及在商業化與用戶激勵之間取得平衡。這些都將是其未來發展中需要不斷探索和優化的方向。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 4
  • 分享
留言
0/400
airdrop_whisperervip
· 8小時前
割韭菜又来了啊?
回復0
瀑布式抄底vip
· 8小時前
区块链 + AI 现在火的都离谱了
回復0
ProveMyZKvip
· 8小時前
有手就行,听着不难
回復0
ValidatorVikingvip
· 8小時前
终于有了一个将模型验证视为正常运行时间指标的协议……说实话,这是一个经过严峻考验的稳固方法。
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)