Yupp引领AI评估新范式:区块链激励重塑模型评估体系

AI评估新范式:Yupp基于区块链与激励机制重塑模型评估

在人工智能应用日益普及的背景下,如何准确评估模型性能并提升用户信任度成为了亟待解决的问题。传统的集中化评测方法难以覆盖多样化场景,也无法真实反映用户偏好。同时,模型"幻觉"问题频发,用户在选择时往往陷入信息茧房。

Yupp作为一家新兴平台,正试图通过独特的众包模式和激励机制,重塑AI模型的发现、比较与使用方式,为AI评估领域带来一场变革。本文将深入分析Yupp的核心机制、技术特点、团队背景及其对AI生态的潜在影响。

团队背景与融资

Yupp致力于构建一个"去信任"的AI反馈市场,让多元化的用户反馈在区块链和加密经济激励的保障下自由流通,形成可扩展、公平且透明的模型评估层。通过激励高质量人工标注数据的分发,Yupp能够及时捕捉用户在不同场景下的真实需求和偏好,帮助AI开发者迭代优化模型性能。

该项目由Pankaj Gupta和Gilad Mishne于2024年6月创立,首席科学家Jimmy Lin也参与其中。三人曾在Twitter共事,并在Google和一些加密货币平台积累了丰富经验。

由于其去中心化、数据价值透明化的愿景满足了AI厂商对可信评估和用户参与的需求,加上核心团队的丰富履历,Yupp获得了业内知名人士和顶级风投的认可。

近期,Yupp完成了3300万美元种子轮融资,由某知名风投合伙人领投,其他投资方包括Google首席科学家、Twitter联合创始人、Pinterest联合创始人、斯坦福大学多位教授等45位知名天使及企业高管。

a16z领投3300万美元种子轮,Yupp如何基于区块链与激励重塑AI评估模式?

核心功能与用户体验

作为一个AI评估平台,Yupp秉持"人人共享的AI"理念,让用户轻松发现、比较并使用最新的AI模型。与传统单一响应不同,Yupp针对每个提示同时返回多个模型的答案,形成一个"AI议会"。这种设计不仅满足了用户对多样化选择的需求,更能有效甄别模型可能出现的"幻觉",帮助用户通过对比做出更明智的决策。

平台现已支持500多款AI模型,涵盖文本与图像生成领域,包括多个知名模型以及众多新兴模型。为进一步优化体验,Yupp还推出了"QuickTake"功能,可将冗长回复提炼为简洁的概要。

此外,Yupp高度重视用户隐私:所有聊天记录默认私密,除非用户主动公开;即使公开分享,也不透漏任何个人信息。用户可随时控制分享内容及范围。

a16z领投3300万美元种子轮,Yupp如何基于区块链与激励重塑AI评估模式?

经济模型与激励机制

Yupp将免费使用与用户反馈结合,通过"Yupp积分"系统衡量模型使用情况。新用户注册即获5000积分,后续可通过对模型回复打分、选择偏好并阐述理由来赚取更多积分。反馈质量越高,奖励越丰厚,确保用户可持续免费使用包括高端模型在内的各类AI服务。

用户每次提问后会获得两份模型回答,并通过反馈赢取"数字刮刮卡",奖励0-250不等的Yupp积分。每1000积分可兑换1美元,用户每日最高可提现10美元、月度最高50美元。积分支持兑换多种货币,并集成了多个区块链网络,为全球用户提供即时、低费用的奖励。

为激励更多人参与,Yupp还设立了推荐奖励计划,推荐人和被推荐人都能获得额外积分。

a16z领投3300万美元种子轮,Yupp如何基于区块链与激励重塑AI评估模式?

Yupp VIBE评分:AI评估的新标准

为解决现有排行榜存在的问题,Yupp推出了测试版AI排行榜和"Yupp VIBE Score"评分系统。该系统汇聚全球用户在自然交互中产生的偏好数据,力求提供稳健且可信赖的评估结果。

Yupp的评估原则包括稳健性(覆盖多样场景、反映真实需求、抵御恶意行为)和可信赖性(公平中立、透明公开、严谨科学)。

平台不仅收集二元偏好,还鼓励用户指出回复的优缺点,并根据用户的背景信息进行分群分析,展现不同群体的偏好差异。

在技术层面,Yupp正在探索利用区块链、密码学原语及零知识证明等技术,确保评估过程的公正、透明和可验证。同时,平台已与专业AI数据提供商合作,通过多重验证机制确保数据质量。

a16z领投3300万美元种子轮,Yupp如何基于区块链与激励重塑AI评估模式?

发展历程与未来展望

Yupp于2025年6月正式上线,此前进行了六个月内部测试。自上线以来,产品持续迭代,包括:

  • 多模态支持:接入多个图像生成模型,支持用户上传图像/PDF提问
  • 交互方式拓展:新增语音输入与语音朗读功能
  • 模型更新:引入多个新模型及"MAX模型"类别
  • 实时信息:支持在线查询并提供引文
  • 支付升级:新增多种提现方式及货币支持
  • 分享导出:支持多种格式的导出和分享
  • 社区活动:举办AI提示挑战赛等活动,完善社交功能

Yupp的使命是"赋能人类塑造AI的未来"。通过多视角AI回应和用户反馈,Yupp不仅助力用户更好决策,也为AI进化提供持续动力。

总的来说,Yupp以众包模式、激励机制与真实用户偏好驱动的评估系统,开辟了AI评估的新路径。它不仅为用户提供免费、多样的AI互动体验,更将用户反馈转化为高价值训练数据,推动模型持续优化。凭借经验丰富的团队和资本支持,Yupp有望在未来AI生态中扮演关键角色,实现"人人皆享AI,人人塑造AI"的愿景。

然而,Yupp仍面临诸多挑战,包括如何在大规模用户参与下持续确保数据质量、抵御潜在的作弊行为,以及在商业化与用户激励之间取得平衡。这些都将是其未来发展中需要不断探索和优化的方向。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 分享
评论
0/400
airdrop_whisperervip
· 15小时前
割韭菜又来了啊?
回复0
瀑布式抄底vip
· 15小时前
区块链 + AI 现在火的都离谱了
回复0
ProveMyZKvip
· 15小时前
有手就行,听着不难
回复0
ValidatorVikingvip
· 15小时前
终于有了一个将模型验证视为正常运行时间指标的协议……说实话,这是一个经过严峻考验的稳固方法。
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)