Nueva Paradigma de Evaluación AI: Yupp remodela la evaluación del modelo basado en Cadena de bloques e incentivos.
En el contexto de la creciente popularidad de las aplicaciones de inteligencia artificial, cómo evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente por resolver. Los métodos de evaluación centralizados tradicionales son difíciles de aplicar en escenarios diversos y no pueden reflejar verdaderamente las preferencias del usuario. Al mismo tiempo, el problema de "ilusión" del modelo ocurre con frecuencia, y los usuarios a menudo caen en cámaras de eco al elegir.
Yupp, como una plataforma emergente, está tratando de reconfigurar la forma en que se descubren, comparan y utilizan los modelos de IA a través de un modo de crowdsourcing único y mecanismos de incentivos, trayendo una revolución al campo de la evaluación de IA. Este artículo analizará en profundidad los mecanismos centrales de Yupp, sus características tecnológicas, el trasfondo del equipo y su impacto potencial en el ecosistema de IA.
Antecedentes del equipo y financiación
Yupp se dedica a construir un mercado de retroalimentación de IA "sin confianza", permitiendo que la retroalimentación diversa de los usuarios fluya libremente bajo la protección de la Cadena de bloques y los incentivos de la economía criptográfica, formando una capa de evaluación de modelos escalable, justa y transparente. A través de la distribución de datos etiquetados de alta calidad incentivados, Yupp puede capturar de manera oportuna las verdaderas necesidades y preferencias de los usuarios en diferentes escenarios, ayudando a los desarrolladores de IA a iterar y optimizar el rendimiento del modelo.
El proyecto fue fundado por Pankaj Gupta y Gilad Mishne en junio de 2024, y el científico jefe Jimmy Lin también estuvo involucrado. Los tres trabajaron juntos en Twitter y han acumulado una amplia experiencia en Google y en algunas plataformas de criptomonedas.
Debido a que su visión de descentralización y transparencia del valor de los datos satisface las necesidades de evaluación confiable y participación de los usuarios por parte de los fabricantes de IA, junto con la rica trayectoria del equipo central, Yupp ha obtenido el reconocimiento de figuras destacadas de la industria y de capital de riesgo de primer nivel.
Recientemente, Yupp completó una ronda de financiación inicial de 33 millones de dólares, liderada por un conocido socio de capital riesgo, con otros inversores que incluyen al científico jefe de Google, cofundador de Twitter, cofundador de Pinterest y varios profesores de la Universidad de Stanford, entre otros 45 conocidos ángeles e ejecutivos de empresas.
Funciones principales y experiencia del usuario
Como una plataforma de evaluación de IA, Yupp se adhiere al concepto de "IA compartida por todos", permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de las respuestas únicas tradicionales, Yupp devuelve simultáneamente las respuestas de múltiples modelos para cada aviso, formando una "asamblea de IA". Este diseño no solo satisface la necesidad de diversidad de elecciones de los usuarios, sino que también puede identificar eficazmente las "ilusiones" que pueden surgir en los modelos, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación.
La plataforma ahora admite más de 500 modelos de IA, que abarcan los campos de generación de texto e imagen, incluidos varios modelos conocidos y numerosos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede resumir respuestas extensas en un resumen conciso.
Además, Yupp valora mucho la privacidad del usuario: todos los registros de chat son privados por defecto, a menos que el usuario decida hacerlos públicos; incluso si se comparten públicamente, no se revela ninguna información personal. Los usuarios pueden controlar en cualquier momento el contenido y el alcance de lo que comparten.
Modelo económico e incentivos
Yupp utilizará de forma gratuita la combinación de comentarios de los usuarios, a través del sistema de "puntos Yupp" para medir el uso del modelo. Los nuevos usuarios que se registren recibirán 5000 puntos, y posteriormente podrán ganar más puntos al calificar las respuestas del modelo, seleccionar preferencias y explicar sus razones. Cuanto mayor sea la calidad de los comentarios, mayores serán las recompensas, asegurando que los usuarios puedan utilizar de forma sostenible y gratuita diversos servicios de IA, incluidos modelos de alta gama.
Los usuarios recibirán dos respuestas del modelo después de cada pregunta y podrán ganar una "tarjeta de rascar digital" a través de sus comentarios, con recompensas de entre 0 y 250 puntos Yupp. Cada 1000 puntos se pueden canjear por 1 dólar, y los usuarios pueden retirar un máximo de 10 dólares diarios y hasta 50 dólares mensuales. Los puntos se pueden canjear por múltiples monedas y están integrados en varias redes de bloques, proporcionando recompensas instantáneas y de bajo costo para usuarios de todo el mundo.
Para incentivar a más personas a participar, Yupp también ha establecido un programa de recompensas por recomendación, donde tanto el recomendador como el recomendado pueden obtener puntos adicionales.
Calificación Yupp VIBE: El nuevo estándar de evaluación de IA
Para abordar los problemas existentes en las clasificaciones, Yupp ha lanzado una versión beta de la clasificación de IA y el sistema de puntuación "Yupp VIBE Score". Este sistema reúne los datos de preferencias generados por usuarios de todo el mundo en interacciones naturales, con el objetivo de proporcionar resultados de evaluación sólidos y fiables.
Los principios de evaluación de Yupp incluyen la robustez (cubrir diversos escenarios, reflejar necesidades reales, resistir comportamientos maliciosos) y la confiabilidad (justo y neutral, transparente y público, riguroso y científico).
La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar las ventajas y desventajas de las respuestas, y realiza un análisis de agrupamiento basado en la información de antecedentes de los usuarios para mostrar las diferencias en las preferencias de los diferentes grupos.
En el nivel técnico, Yupp está explorando el uso de la Cadena de bloques, primitivos criptográficos y pruebas de conocimiento cero, para garantizar que el proceso de evaluación sea justo, transparente y verificable. Al mismo tiempo, la plataforma ha colaborado con proveedores de datos AI profesionales para asegurar la calidad de los datos a través de mecanismos de verificación múltiple.
Desarrollo y perspectivas futuras
Yupp se lanzará oficialmente en junio de 2025, habiendo realizado seis meses de pruebas internas. Desde su lanzamiento, el producto ha estado en continua iteración, incluyendo:
Soporte multimodal: acceso a múltiples modelos de generación de imágenes, permite a los usuarios subir imágenes/PDF para preguntar
Ampliación de los métodos de interacción: se añaden funciones de entrada por voz y lectura en voz alta.
Actualización del modelo: se introducen varios nuevos modelos y la categoría "modelo MAX"
Información en tiempo real: admite consultas en línea y proporciona citas
Actualización de pagos: Nuevos métodos de retiro y soporte de múltiples monedas
Compartir exportación: soporte para exportar y compartir en varios formatos
Actividades comunitarias: organizar competencias de desafíos de IA y otras actividades, mejorar las funciones sociales
La misión de Yupp es "empoderar a la humanidad para dar forma al futuro de la IA". A través de respuestas de IA de múltiples perspectivas y comentarios de los usuarios, Yupp no solo ayuda a los usuarios a tomar mejores decisiones, sino que también proporciona un impulso continuo para la evolución de la IA.
En general, Yupp ha abierto un nuevo camino para la evaluación de IA mediante un sistema de evaluación impulsado por la colaboración, mecanismos de incentivos y las preferencias reales de los usuarios. No solo ofrece a los usuarios una experiencia de interacción con IA gratuita y variada, sino que también convierte los comentarios de los usuarios en datos de entrenamiento de alto valor, impulsando la optimización continua del modelo. Con un equipo experimentado y apoyo de capital, Yupp tiene la esperanza de desempeñar un papel clave en el futuro ecosistema de IA, logrando la visión de "IA para todos, todos moldean la IA".
Sin embargo, Yupp aún enfrenta numerosos desafíos, incluyendo cómo garantizar la calidad de los datos de manera continua con la participación masiva de usuarios, resistir comportamientos de trampa potenciales, y encontrar un equilibrio entre la comercialización y los incentivos para los usuarios. Estas serán direcciones que necesitarán ser exploradas y optimizadas continuamente en su desarrollo futuro.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 me gusta
Recompensa
15
4
Compartir
Comentar
0/400
airdrop_whisperer
· hace16h
¿Ser engañados otra vez?
Ver originalesResponder0
CascadingDipBuyer
· hace16h
Cadena de bloques + AI ahora está increíblemente popular.
Ver originalesResponder0
ProveMyZK
· hace16h
Con tener manos es suficiente, no suena difícil.
Ver originalesResponder0
ValidatorViking
· hace16h
finalmente un protocolo que trata la validación del modelo como métricas de tiempo de actividad... enfoque sólido probado en batalla, para ser honesto
Yupp lidera un nuevo paradigma de evaluación de IA: la Cadena de bloques de incentivos remodela el sistema de evaluación de modelos
Nueva Paradigma de Evaluación AI: Yupp remodela la evaluación del modelo basado en Cadena de bloques e incentivos.
En el contexto de la creciente popularidad de las aplicaciones de inteligencia artificial, cómo evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente por resolver. Los métodos de evaluación centralizados tradicionales son difíciles de aplicar en escenarios diversos y no pueden reflejar verdaderamente las preferencias del usuario. Al mismo tiempo, el problema de "ilusión" del modelo ocurre con frecuencia, y los usuarios a menudo caen en cámaras de eco al elegir.
Yupp, como una plataforma emergente, está tratando de reconfigurar la forma en que se descubren, comparan y utilizan los modelos de IA a través de un modo de crowdsourcing único y mecanismos de incentivos, trayendo una revolución al campo de la evaluación de IA. Este artículo analizará en profundidad los mecanismos centrales de Yupp, sus características tecnológicas, el trasfondo del equipo y su impacto potencial en el ecosistema de IA.
Antecedentes del equipo y financiación
Yupp se dedica a construir un mercado de retroalimentación de IA "sin confianza", permitiendo que la retroalimentación diversa de los usuarios fluya libremente bajo la protección de la Cadena de bloques y los incentivos de la economía criptográfica, formando una capa de evaluación de modelos escalable, justa y transparente. A través de la distribución de datos etiquetados de alta calidad incentivados, Yupp puede capturar de manera oportuna las verdaderas necesidades y preferencias de los usuarios en diferentes escenarios, ayudando a los desarrolladores de IA a iterar y optimizar el rendimiento del modelo.
El proyecto fue fundado por Pankaj Gupta y Gilad Mishne en junio de 2024, y el científico jefe Jimmy Lin también estuvo involucrado. Los tres trabajaron juntos en Twitter y han acumulado una amplia experiencia en Google y en algunas plataformas de criptomonedas.
Debido a que su visión de descentralización y transparencia del valor de los datos satisface las necesidades de evaluación confiable y participación de los usuarios por parte de los fabricantes de IA, junto con la rica trayectoria del equipo central, Yupp ha obtenido el reconocimiento de figuras destacadas de la industria y de capital de riesgo de primer nivel.
Recientemente, Yupp completó una ronda de financiación inicial de 33 millones de dólares, liderada por un conocido socio de capital riesgo, con otros inversores que incluyen al científico jefe de Google, cofundador de Twitter, cofundador de Pinterest y varios profesores de la Universidad de Stanford, entre otros 45 conocidos ángeles e ejecutivos de empresas.
Funciones principales y experiencia del usuario
Como una plataforma de evaluación de IA, Yupp se adhiere al concepto de "IA compartida por todos", permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de las respuestas únicas tradicionales, Yupp devuelve simultáneamente las respuestas de múltiples modelos para cada aviso, formando una "asamblea de IA". Este diseño no solo satisface la necesidad de diversidad de elecciones de los usuarios, sino que también puede identificar eficazmente las "ilusiones" que pueden surgir en los modelos, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación.
La plataforma ahora admite más de 500 modelos de IA, que abarcan los campos de generación de texto e imagen, incluidos varios modelos conocidos y numerosos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede resumir respuestas extensas en un resumen conciso.
Además, Yupp valora mucho la privacidad del usuario: todos los registros de chat son privados por defecto, a menos que el usuario decida hacerlos públicos; incluso si se comparten públicamente, no se revela ninguna información personal. Los usuarios pueden controlar en cualquier momento el contenido y el alcance de lo que comparten.
Modelo económico e incentivos
Yupp utilizará de forma gratuita la combinación de comentarios de los usuarios, a través del sistema de "puntos Yupp" para medir el uso del modelo. Los nuevos usuarios que se registren recibirán 5000 puntos, y posteriormente podrán ganar más puntos al calificar las respuestas del modelo, seleccionar preferencias y explicar sus razones. Cuanto mayor sea la calidad de los comentarios, mayores serán las recompensas, asegurando que los usuarios puedan utilizar de forma sostenible y gratuita diversos servicios de IA, incluidos modelos de alta gama.
Los usuarios recibirán dos respuestas del modelo después de cada pregunta y podrán ganar una "tarjeta de rascar digital" a través de sus comentarios, con recompensas de entre 0 y 250 puntos Yupp. Cada 1000 puntos se pueden canjear por 1 dólar, y los usuarios pueden retirar un máximo de 10 dólares diarios y hasta 50 dólares mensuales. Los puntos se pueden canjear por múltiples monedas y están integrados en varias redes de bloques, proporcionando recompensas instantáneas y de bajo costo para usuarios de todo el mundo.
Para incentivar a más personas a participar, Yupp también ha establecido un programa de recompensas por recomendación, donde tanto el recomendador como el recomendado pueden obtener puntos adicionales.
Calificación Yupp VIBE: El nuevo estándar de evaluación de IA
Para abordar los problemas existentes en las clasificaciones, Yupp ha lanzado una versión beta de la clasificación de IA y el sistema de puntuación "Yupp VIBE Score". Este sistema reúne los datos de preferencias generados por usuarios de todo el mundo en interacciones naturales, con el objetivo de proporcionar resultados de evaluación sólidos y fiables.
Los principios de evaluación de Yupp incluyen la robustez (cubrir diversos escenarios, reflejar necesidades reales, resistir comportamientos maliciosos) y la confiabilidad (justo y neutral, transparente y público, riguroso y científico).
La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar las ventajas y desventajas de las respuestas, y realiza un análisis de agrupamiento basado en la información de antecedentes de los usuarios para mostrar las diferencias en las preferencias de los diferentes grupos.
En el nivel técnico, Yupp está explorando el uso de la Cadena de bloques, primitivos criptográficos y pruebas de conocimiento cero, para garantizar que el proceso de evaluación sea justo, transparente y verificable. Al mismo tiempo, la plataforma ha colaborado con proveedores de datos AI profesionales para asegurar la calidad de los datos a través de mecanismos de verificación múltiple.
Desarrollo y perspectivas futuras
Yupp se lanzará oficialmente en junio de 2025, habiendo realizado seis meses de pruebas internas. Desde su lanzamiento, el producto ha estado en continua iteración, incluyendo:
La misión de Yupp es "empoderar a la humanidad para dar forma al futuro de la IA". A través de respuestas de IA de múltiples perspectivas y comentarios de los usuarios, Yupp no solo ayuda a los usuarios a tomar mejores decisiones, sino que también proporciona un impulso continuo para la evolución de la IA.
En general, Yupp ha abierto un nuevo camino para la evaluación de IA mediante un sistema de evaluación impulsado por la colaboración, mecanismos de incentivos y las preferencias reales de los usuarios. No solo ofrece a los usuarios una experiencia de interacción con IA gratuita y variada, sino que también convierte los comentarios de los usuarios en datos de entrenamiento de alto valor, impulsando la optimización continua del modelo. Con un equipo experimentado y apoyo de capital, Yupp tiene la esperanza de desempeñar un papel clave en el futuro ecosistema de IA, logrando la visión de "IA para todos, todos moldean la IA".
Sin embargo, Yupp aún enfrenta numerosos desafíos, incluyendo cómo garantizar la calidad de los datos de manera continua con la participación masiva de usuarios, resistir comportamientos de trampa potenciales, y encontrar un equilibrio entre la comercialización y los incentivos para los usuarios. Estas serán direcciones que necesitarán ser exploradas y optimizadas continuamente en su desarrollo futuro.