Autor: contribuidor principal de Biteye @anci_hu49074
"Estamos en una era de competencia global para construir los mejores modelos básicos. La potencia de cálculo y la arquitectura del modelo son importantes, pero la verdadera ventaja competitiva es los datos de entrenamiento"
—Sandeep Chinchali, Director de IA, Story
Hablemos sobre el potencial de AI Data track desde la perspectiva de Scale AI
El mayor chisme en el círculo de la IA este mes es que Meta ha mostrado su capacidad monetaria. Zuckerberg reclutó talentos por todas partes y formó un lujoso equipo de Meta AI compuesto principalmente por talentos de investigación científica chinos. El líder del equipo es Alexander Wang, que solo tiene 28 años y fundó Scale AI. Fundó Scale AI y actualmente tiene un valor de 29 mil millones de dólares. Los objetos de servicio incluyen al ejército de los EE. UU., así como OpenAI, Anthropic, Meta y otros gigantes de la IA competidores, todos los cuales dependen de los servicios de datos proporcionados por Scale AI. El negocio principal de Scale AI es proporcionar una gran cantidad de datos etiquetados precisos.
¿Por qué puede Scale AI destacarse entre un grupo de unicornios?
La razón es que descubrió la importancia de los datos en la industria de la IA desde el principio.
El poder de cómputo, los modelos y los datos son los tres pilares de los modelos de IA. Si el gran modelo se compara con una persona, entonces el modelo es el cuerpo, el poder de cómputo es la comida y los datos son conocimiento/información.
En los años desde el surgimiento de LLM, el enfoque de desarrollo de la industria también ha cambiado de modelos a poder de cómputo. Hoy en día, la mayoría de los modelos han establecido transformadores como el marco del modelo, con innovaciones ocasionales como MoE o MoRe. Los grandes gigantes han construido sus propios Super Clusters para completar la Gran Muralla del poder de cómputo, o han firmado acuerdos a largo plazo con poderosos servicios en la nube como AWS. Una vez que se cumple el poder de cómputo básico, la importancia de los datos ha ido ganando protagonismo.
A diferencia de las empresas de grandes datos To B tradicionales con una reputación destacada en el mercado secundario como Palantir, Scale AI, como su nombre indica, se compromete a construir una base de datos sólida para modelos de IA. Su negocio no se limita a la minería de datos existentes, sino que también se centra en un negocio de generación de datos a largo plazo. También intenta formar un equipo de entrenadores de IA a través de expertos artificiales en diferentes campos para proporcionar datos de entrenamiento de mejor calidad para el entrenamiento de modelos de IA.
Si no estás de acuerdo con este negocio, veamos cómo se entrena el modelo.
El entrenamiento del modelo se divide en dos partes: pre-entrenamiento y ajuste fino.
La parte de preentrenamiento es un poco como el proceso por el cual los bebés humanos aprenden gradualmente a hablar. Lo que normalmente necesitamos es alimentar al modelo de IA con una gran cantidad de texto, código y otra información obtenida de rastreadores en línea. El modelo aprende estos contenidos por sí mismo, aprende a hablar el idioma humano (académicamente llamado lenguaje natural), y tiene habilidades básicas de comunicación.
La parte de ajuste fino es similar a ir a la escuela, donde generalmente hay respuestas y direcciones claras de correcto e incorrecto. Las escuelas entrenarán a los estudiantes en diferentes talentos según su respectiva posición. También utilizaremos algunos conjuntos de datos preprocesados y específicos para entrenar al modelo para que tenga las capacidades que esperamos.
En este punto, es posible que hayas descubierto que los datos que necesitamos también se dividen en dos partes.
Algunos datos no necesitan ser procesados demasiado, con suficiente es suficiente, generalmente provienen de datos de rastreadores de grandes plataformas UGC como Reddit, Twitter, Github, bases de datos de literatura pública, bases de datos privadas corporativas, etc.
La otra parte, como los libros de texto profesionales, requiere un diseño y una selección cuidadosos para garantizar que las cualidades específicas y excelentes del modelo puedan ser cultivadas. Esto requiere que realicemos algunos trabajos necesarios como la limpieza de datos, la selección, el etiquetado y la retroalimentación manual.
Estos dos conjuntos de datos constituyen el núcleo de la pista de Datos de IA. No subestimes estos conjuntos de datos aparentemente de baja tecnología. La opinión actual predominante es que, a medida que la ventaja de potencia de cálculo en las leyes de escalado se vuelve gradualmente ineficaz, los datos se convertirán en el pilar más importante para que diferentes fabricantes de modelos grandes mantengan su ventaja competitiva.
A medida que las capacidades de los modelos continúan mejorando, los datos de entrenamiento más sofisticados y profesionales se convertirán en variables clave que influyen en las capacidades del modelo. Si comparamos aún más el entrenamiento de modelos con la formación de maestros de artes marciales, entonces los conjuntos de datos de alta calidad son los mejores secretos de las artes marciales ( para completar esta metáfora, también podemos decir que la potencia de cálculo es la panacea y el modelo es la calificación en sí misma ).
Desde una perspectiva vertical, los Datos de IA también son una pista a largo plazo con la capacidad de acumularse. Con la acumulación del trabajo previo, los activos de datos también tendrán la capacidad de componer, y se volverán más populares a medida que envejecen.
Web3 DataFi: El terreno fértil elegido para los datos de IA
En comparación con el equipo de etiquetado manual remoto de cientos de miles de personas de Scale AI en Filipinas, Venezuela y otros lugares, Web3 tiene una ventaja natural en el campo de los datos de IA, y nació el nuevo término DataFi.
Idealmente, las ventajas de Web3 DataFi son las siguientes:
Soberanía de datos, seguridad y privacidad garantizadas por contratos inteligentes
En una etapa en la que los datos públicos existentes están a punto de ser desarrollados y agotados, cómo seguir extrayendo datos no divulgados, incluso datos privados, es una dirección importante para obtener y expandir las fuentes de datos. Esto enfrenta un importante problema de elección de confianza: ¿elige un sistema de compra de contratos de una gran empresa centralizada y vende sus datos; o elige el método de blockchain, continúa manteniendo la IP de los datos en sus manos y entiende claramente a través de contratos inteligentes: quién utiliza sus datos, cuándo y con qué propósito?
Al mismo tiempo, para información sensible, puedes utilizar zk, TEE y otros métodos para garantizar que tus datos privados solo sean manejados por máquinas que mantienen la boca cerrada y no serán filtrados.
Ventaja de arbitraje geográfico natural: arquitectura distribuida libre para atraer la fuerza laboral más adecuada
Quizás sea hora de desafiar la relación tradicional de producción laboral. En lugar de buscar mano de obra barata por todo el mundo como Scale AI, es mejor aprovechar las características distribuidas de la blockchain y permitir que la fuerza laboral dispersa por el mundo participe en la contribución de datos a través de incentivos abiertos y transparentes garantizados por contratos inteligentes.
Para tareas intensivas en mano de obra, como el etiquetado de datos y la evaluación de modelos, el uso de Web3 DataFi es más propicio para la diversidad de participantes que el enfoque centralizado de establecer fábricas de datos, lo que también tiene un significado a largo plazo para evitar sesgos en los datos.
Las claras ventajas de incentivos y liquidación de la blockchain
¿Cómo evitar la tragedia de la "Fábrica de Cuero de Jiangnan"? Naturalmente, debemos utilizar el sistema de incentivos con etiquetas de precios claras en los contratos inteligentes para reemplazar la oscuridad de la naturaleza humana.
En el contexto de la inevitable desglobalización, ¿cómo podemos continuar logrando arbitraje geográfico de bajo costo? Es evidentemente más difícil abrir empresas en todo el mundo, así que ¿por qué no eludir las barreras del viejo mundo y abrazar el método de liquidación en cadena?
Contribuye a construir un mercado de datos "todo en uno" más eficiente y abierto.
"Los intermediarios que obtienen ganancias de la diferencia de precios" son un dolor eterno para ambos lados: la oferta y la demanda. En lugar de permitir que una empresa de datos centralizada actúe como intermediario, es mejor crear una plataforma en la cadena, a través de un mercado abierto como Taobao, para que los lados de oferta y demanda de datos puedan conectarse de manera más transparente y eficiente.
Con el desarrollo del ecosistema de IA en cadena, la demanda de datos en cadena se volverá más vigorosa, segmentada y diversa. Solo un mercado descentralizado puede digerir eficientemente esta demanda y transformarla en prosperidad ecológica.
Para los inversores minoristas, DataFi es también el proyecto de IA más descentralizado que es más propicio para la participación de los inversores minoristas comunes.
Aunque la aparición de herramientas de IA ha reducido el umbral de aprendizaje hasta cierto punto, y la intención original de la IA descentralizada es romper el actual monopolio del negocio de la IA por parte de gigantes; sin embargo, hay que admitir que muchos de los proyectos actuales no son muy accesibles para los inversores minoristas sin antecedentes técnicos - participar en la minería de redes de computación descentralizada a menudo conlleva una costosa inversión inicial en hardware, y el umbral técnico del mercado de modelos puede desanimar fácilmente a los participantes comunes.
En contraste, es una de las pocas oportunidades que los usuarios ordinarios pueden aprovechar en la revolución de la IA. Web3 te permite participar en ello al completar diversas tareas simples, que incluyen proporcionar datos, etiquetar y evaluar modelos basados en la intuición y el instinto del cerebro humano, o utilizar además herramientas de IA para realizar algunas creaciones simples, participar en transacciones de datos, etc. Para los viejos conductores del Partido Mao, el valor de dificultad es básicamente cero.
El potencial de los proyectos de Web3 DataFi
Donde fluye el dinero, ahí está la dirección. Además de que Scale AI recibió una inversión de $14.3 mil millones de Meta y el precio de las acciones de Palantir se disparó más de 5 veces en un año en el mundo Web2, DataFi también tuvo un muy buen desempeño en la financiación de Web3. Aquí damos una breve introducción a estos proyectos.
Sahara AI, @SaharaLabsAI, recaudó 49 millones de dólares
El objetivo final de Sahara AI es construir una super infraestructura de inteligencia artificial descentralizada y un mercado de comercio. El primer sector que se probará es el de Datos de IA. La versión beta pública de su Plataforma de Servicios de Datos DSP ( se lanzará el 22 de julio. Los usuarios pueden obtener recompensas en tokens al contribuir con datos, participar en el etiquetado de datos y otras tareas.
Link: app.saharaai.com
)# Yupp, @yupp_ai, recaudó 33 millones de dólares
Yupp es una plataforma de retroalimentación de modelos de IA que recopila la retroalimentación de los usuarios sobre la salida del modelo. La tarea principal actual es que los usuarios pueden comparar la salida de diferentes modelos para el mismo aviso, y luego seleccionar el que consideran mejor. Completar la tarea puede ganar puntos Yupp, que se pueden canjear por stablecoins fiat como USDC.
Enlace:
Vana, @vana, recaudó 23 millones de dólares
Vana se centra en convertir los datos personales de los usuarios ###, como las actividades en redes sociales, el historial de navegación, etc. ( en activos digitales monetizables. Los usuarios pueden autorizar la carga de sus datos personales al correspondiente fondo de liquidez de datos )DLP( en DataDAOs. Estos datos se agruparán y se utilizarán para participar en tareas como el entrenamiento de modelos de IA, y los usuarios también recibirán recompensas en tokens correspondientes.
Enlace:
)# Chainbase, @ChainbaseHQ, recauda 16.5 millones de dólares
El negocio de Chainbase se centra en los datos en cadena y actualmente cubre más de 200 blockchains, convirtiendo las actividades en cadena en activos de datos estructurados, verificables y monetizables para el desarrollo de dApps. El negocio de Chainbase se obtiene principalmente a través de la indexación multicadena y otros métodos, y los datos se procesan a través de su sistema Manuscript y el modelo de IA Theia. Actualmente, los usuarios comunes no están muy involucrados.
Sapien, @JoinSapien, recaudó 15.5 millones de dólares
Sapien tiene como objetivo convertir el conocimiento humano en datos de entrenamiento de IA de alta calidad a gran escala. Cualquiera puede realizar la anotación de datos en la plataforma y asegurar la calidad de los datos a través de la verificación por pares. Al mismo tiempo, se anima a los usuarios a construir una reputación a largo plazo o hacer compromisos a través de la participación para ganar más recompensas.
Enlace:
Prisma X, @PrismaXai, recauda $11 millones
Prisma X quiere ser una capa de coordinación abierta para robots, donde la recolección de datos físicos es clave. Este proyecto se encuentra actualmente en sus primeras etapas. Según el reciente documento técnico publicado, la participación puede incluir invertir en robots para recolectar datos, operar datos de robots de forma remota, etc. Actualmente, hay un cuestionario basado en el documento técnico abierto, y puedes participar para ganar puntos.
Enlace:
Masa, @getmasafi, recaudó 8.9 millones de dólares
Masa es uno de los principales proyectos de subred en el ecosistema Bittensor, y actualmente opera la Subred de Datos No. 42 y la Subred de Agentes No. 59. La subred de datos se compromete a proporcionar acceso en tiempo real a los datos. Actualmente, los mineros principalmente rastrean datos en tiempo real en X/Twitter a través de hardware TEE. Para los usuarios comunes, la dificultad y el costo de participación son relativamente altos.
Irys, @irys_xyz, recaudó 8.7 millones de dólares
Irys se centra en el almacenamiento de datos y la computación programable, con el objetivo de proporcionar soluciones eficientes y de bajo costo para IA, aplicaciones descentralizadas ###dApps( y otras aplicaciones intensivas en datos. En términos de contribución de datos, los usuarios ordinarios no pueden participar mucho en la actualidad, pero hay múltiples actividades para participar en la etapa actual de la testnet.
Enlace:
)# ORO, @getoro_xyz, recaudó 6 millones de dólares
Lo que ORO quiere hacer es empoderar a las personas comunes para que participen en la contribución de IA. Los métodos de apoyo incluyen: 1. Vincular tu cuenta personal para contribuir con datos personales, incluyendo cuentas sociales, datos de salud, cuentas de comercio electrónico y financieras; 2. Completar tareas de datos. La red de prueba ya está en línea y puedes participar.
Enlace: app.getoro.xyz
Gata, @Gata_xyz, recaudó 4 millones de dólares
Posicionado como una capa de datos descentralizada, Gata actualmente tiene tres productos clave en los que participar: 1. Agente de Datos: una serie de Agentes de IA que pueden ejecutar y procesar datos automáticamente siempre que el usuario tenga abierta la página web; 2. Chat AII-in-one: un mecanismo similar a la evaluación del modelo de Yupp para ganar recompensas; 3. GPT-to-Earn: un complemento de navegador que recopila los datos de conversación de los usuarios en ChatGPT.
Enlace:
¿Cómo ves estos proyectos actuales?
En la actualidad, las barreras de entrada para estos proyectos generalmente no son altas, pero debe reconocerse que una vez que se acumulan usuarios y adherencia ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, en las primeras etapas, los esfuerzos deben centrarse en incentivos y experiencia del usuario. Solo atrayendo a suficientes usuarios se puede hacer viable el negocio de grandes datos.
Sin embargo, como proyectos intensivos en mano de obra, estas plataformas de datos también deben considerar cómo gestionar la mano de obra y garantizar la calidad de la salida de datos mientras atraen mano de obra. Después de todo, un problema común de muchos proyectos de Web3 es que la mayoría de los usuarios en la plataforma son solo buscadores de ganancias. A menudo sacrifican la calidad por beneficios a corto plazo. Si se les permite convertirse en los principales usuarios de la plataforma, el mal dinero inevitablemente expulsará al buen dinero, y en última instancia, la calidad de los datos no podrá ser garantizada y no se podrán atraer compradores. En la actualidad, hemos visto que proyectos como Sahara y Sapien han enfatizado la calidad de los datos y se esfuerzan por establecer una relación de cooperación a largo plazo y saludable con la mano de obra en la plataforma.
Además, la falta de transparencia es otro problema de los proyectos en cadena actuales. De hecho, el triángulo imposible de la blockchain ha obligado a muchos proyectos a tomar el camino de "la centralización impulsa la descentralización" en la fase de inicio. Pero ahora, cada vez más proyectos en cadena dan la impresión de "viejos proyectos Web2 con apariencia de Web3" - hay muy pocos datos públicos que se pueden rastrear en la cadena, e incluso la hoja de ruta es difícil de ver en cuanto a la determinación a largo plazo de apertura y transparencia. Esto es sin duda tóxico para el desarrollo saludable a largo plazo de Web3 DataFi, y también esperamos que más proyectos mantengan siempre sus intenciones originales y aceleren el ritmo de apertura y transparencia.
Finalmente, el camino hacia la adopción masiva de DataFi también debe dividirse en dos partes: una es atraer a suficientes participantes de toC para unirse a la red, formando una nueva fuerza para la ingeniería de recolección/generación de datos y consumidores de la economía de IA, formando un ciclo ecológico cerrado; la otra es obtener el reconocimiento de las actuales empresas de toB. Después de todo, a corto plazo, ellos son la principal fuente de grandes pedidos de datos con sus profundos bolsillos. En este sentido, también hemos visto que Sahara AI, Vana, etc. han hecho buenos progresos.
Conclusión
Para ser más fatalista, DataFi se trata de utilizar la inteligencia humana para cultivar la inteligencia de las máquinas a largo plazo, mientras se utilizan contratos inteligentes como un contrato para garantizar que el trabajo de la inteligencia humana sea rentable y, en última instancia, disfrute de la retroalimentación de la inteligencia de las máquinas.
Si estás ansioso por la incertidumbre de la era de la IA, y si aún tienes ideales de blockchain en medio de los altibajos del mundo de las criptomonedas, entonces seguir los pasos de un grupo de gigantes del capital y unirte a DataFi es una buena elección para ir con la tendencia.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Los datos son activos: DataFi está abriendo un nuevo océano azul
Autor: contribuidor principal de Biteye @anci_hu49074
"Estamos en una era de competencia global para construir los mejores modelos básicos. La potencia de cálculo y la arquitectura del modelo son importantes, pero la verdadera ventaja competitiva es los datos de entrenamiento"
—Sandeep Chinchali, Director de IA, Story
Hablemos sobre el potencial de AI Data track desde la perspectiva de Scale AI
El mayor chisme en el círculo de la IA este mes es que Meta ha mostrado su capacidad monetaria. Zuckerberg reclutó talentos por todas partes y formó un lujoso equipo de Meta AI compuesto principalmente por talentos de investigación científica chinos. El líder del equipo es Alexander Wang, que solo tiene 28 años y fundó Scale AI. Fundó Scale AI y actualmente tiene un valor de 29 mil millones de dólares. Los objetos de servicio incluyen al ejército de los EE. UU., así como OpenAI, Anthropic, Meta y otros gigantes de la IA competidores, todos los cuales dependen de los servicios de datos proporcionados por Scale AI. El negocio principal de Scale AI es proporcionar una gran cantidad de datos etiquetados precisos.
¿Por qué puede Scale AI destacarse entre un grupo de unicornios?
La razón es que descubrió la importancia de los datos en la industria de la IA desde el principio.
El poder de cómputo, los modelos y los datos son los tres pilares de los modelos de IA. Si el gran modelo se compara con una persona, entonces el modelo es el cuerpo, el poder de cómputo es la comida y los datos son conocimiento/información.
En los años desde el surgimiento de LLM, el enfoque de desarrollo de la industria también ha cambiado de modelos a poder de cómputo. Hoy en día, la mayoría de los modelos han establecido transformadores como el marco del modelo, con innovaciones ocasionales como MoE o MoRe. Los grandes gigantes han construido sus propios Super Clusters para completar la Gran Muralla del poder de cómputo, o han firmado acuerdos a largo plazo con poderosos servicios en la nube como AWS. Una vez que se cumple el poder de cómputo básico, la importancia de los datos ha ido ganando protagonismo.
A diferencia de las empresas de grandes datos To B tradicionales con una reputación destacada en el mercado secundario como Palantir, Scale AI, como su nombre indica, se compromete a construir una base de datos sólida para modelos de IA. Su negocio no se limita a la minería de datos existentes, sino que también se centra en un negocio de generación de datos a largo plazo. También intenta formar un equipo de entrenadores de IA a través de expertos artificiales en diferentes campos para proporcionar datos de entrenamiento de mejor calidad para el entrenamiento de modelos de IA.
Si no estás de acuerdo con este negocio, veamos cómo se entrena el modelo.
El entrenamiento del modelo se divide en dos partes: pre-entrenamiento y ajuste fino.
La parte de preentrenamiento es un poco como el proceso por el cual los bebés humanos aprenden gradualmente a hablar. Lo que normalmente necesitamos es alimentar al modelo de IA con una gran cantidad de texto, código y otra información obtenida de rastreadores en línea. El modelo aprende estos contenidos por sí mismo, aprende a hablar el idioma humano (académicamente llamado lenguaje natural), y tiene habilidades básicas de comunicación.
La parte de ajuste fino es similar a ir a la escuela, donde generalmente hay respuestas y direcciones claras de correcto e incorrecto. Las escuelas entrenarán a los estudiantes en diferentes talentos según su respectiva posición. También utilizaremos algunos conjuntos de datos preprocesados y específicos para entrenar al modelo para que tenga las capacidades que esperamos.
En este punto, es posible que hayas descubierto que los datos que necesitamos también se dividen en dos partes.
Estos dos conjuntos de datos constituyen el núcleo de la pista de Datos de IA. No subestimes estos conjuntos de datos aparentemente de baja tecnología. La opinión actual predominante es que, a medida que la ventaja de potencia de cálculo en las leyes de escalado se vuelve gradualmente ineficaz, los datos se convertirán en el pilar más importante para que diferentes fabricantes de modelos grandes mantengan su ventaja competitiva.
A medida que las capacidades de los modelos continúan mejorando, los datos de entrenamiento más sofisticados y profesionales se convertirán en variables clave que influyen en las capacidades del modelo. Si comparamos aún más el entrenamiento de modelos con la formación de maestros de artes marciales, entonces los conjuntos de datos de alta calidad son los mejores secretos de las artes marciales ( para completar esta metáfora, también podemos decir que la potencia de cálculo es la panacea y el modelo es la calificación en sí misma ).
Desde una perspectiva vertical, los Datos de IA también son una pista a largo plazo con la capacidad de acumularse. Con la acumulación del trabajo previo, los activos de datos también tendrán la capacidad de componer, y se volverán más populares a medida que envejecen.
Web3 DataFi: El terreno fértil elegido para los datos de IA
En comparación con el equipo de etiquetado manual remoto de cientos de miles de personas de Scale AI en Filipinas, Venezuela y otros lugares, Web3 tiene una ventaja natural en el campo de los datos de IA, y nació el nuevo término DataFi.
Idealmente, las ventajas de Web3 DataFi son las siguientes:
En una etapa en la que los datos públicos existentes están a punto de ser desarrollados y agotados, cómo seguir extrayendo datos no divulgados, incluso datos privados, es una dirección importante para obtener y expandir las fuentes de datos. Esto enfrenta un importante problema de elección de confianza: ¿elige un sistema de compra de contratos de una gran empresa centralizada y vende sus datos; o elige el método de blockchain, continúa manteniendo la IP de los datos en sus manos y entiende claramente a través de contratos inteligentes: quién utiliza sus datos, cuándo y con qué propósito?
Al mismo tiempo, para información sensible, puedes utilizar zk, TEE y otros métodos para garantizar que tus datos privados solo sean manejados por máquinas que mantienen la boca cerrada y no serán filtrados.
Quizás sea hora de desafiar la relación tradicional de producción laboral. En lugar de buscar mano de obra barata por todo el mundo como Scale AI, es mejor aprovechar las características distribuidas de la blockchain y permitir que la fuerza laboral dispersa por el mundo participe en la contribución de datos a través de incentivos abiertos y transparentes garantizados por contratos inteligentes.
Para tareas intensivas en mano de obra, como el etiquetado de datos y la evaluación de modelos, el uso de Web3 DataFi es más propicio para la diversidad de participantes que el enfoque centralizado de establecer fábricas de datos, lo que también tiene un significado a largo plazo para evitar sesgos en los datos.
¿Cómo evitar la tragedia de la "Fábrica de Cuero de Jiangnan"? Naturalmente, debemos utilizar el sistema de incentivos con etiquetas de precios claras en los contratos inteligentes para reemplazar la oscuridad de la naturaleza humana.
En el contexto de la inevitable desglobalización, ¿cómo podemos continuar logrando arbitraje geográfico de bajo costo? Es evidentemente más difícil abrir empresas en todo el mundo, así que ¿por qué no eludir las barreras del viejo mundo y abrazar el método de liquidación en cadena?
"Los intermediarios que obtienen ganancias de la diferencia de precios" son un dolor eterno para ambos lados: la oferta y la demanda. En lugar de permitir que una empresa de datos centralizada actúe como intermediario, es mejor crear una plataforma en la cadena, a través de un mercado abierto como Taobao, para que los lados de oferta y demanda de datos puedan conectarse de manera más transparente y eficiente.
Con el desarrollo del ecosistema de IA en cadena, la demanda de datos en cadena se volverá más vigorosa, segmentada y diversa. Solo un mercado descentralizado puede digerir eficientemente esta demanda y transformarla en prosperidad ecológica.
Para los inversores minoristas, DataFi es también el proyecto de IA más descentralizado que es más propicio para la participación de los inversores minoristas comunes.
Aunque la aparición de herramientas de IA ha reducido el umbral de aprendizaje hasta cierto punto, y la intención original de la IA descentralizada es romper el actual monopolio del negocio de la IA por parte de gigantes; sin embargo, hay que admitir que muchos de los proyectos actuales no son muy accesibles para los inversores minoristas sin antecedentes técnicos - participar en la minería de redes de computación descentralizada a menudo conlleva una costosa inversión inicial en hardware, y el umbral técnico del mercado de modelos puede desanimar fácilmente a los participantes comunes.
En contraste, es una de las pocas oportunidades que los usuarios ordinarios pueden aprovechar en la revolución de la IA. Web3 te permite participar en ello al completar diversas tareas simples, que incluyen proporcionar datos, etiquetar y evaluar modelos basados en la intuición y el instinto del cerebro humano, o utilizar además herramientas de IA para realizar algunas creaciones simples, participar en transacciones de datos, etc. Para los viejos conductores del Partido Mao, el valor de dificultad es básicamente cero.
El potencial de los proyectos de Web3 DataFi
Donde fluye el dinero, ahí está la dirección. Además de que Scale AI recibió una inversión de $14.3 mil millones de Meta y el precio de las acciones de Palantir se disparó más de 5 veces en un año en el mundo Web2, DataFi también tuvo un muy buen desempeño en la financiación de Web3. Aquí damos una breve introducción a estos proyectos.
Sahara AI, @SaharaLabsAI, recaudó 49 millones de dólares
El objetivo final de Sahara AI es construir una super infraestructura de inteligencia artificial descentralizada y un mercado de comercio. El primer sector que se probará es el de Datos de IA. La versión beta pública de su Plataforma de Servicios de Datos DSP ( se lanzará el 22 de julio. Los usuarios pueden obtener recompensas en tokens al contribuir con datos, participar en el etiquetado de datos y otras tareas.
Link: app.saharaai.com
)# Yupp, @yupp_ai, recaudó 33 millones de dólares
Yupp es una plataforma de retroalimentación de modelos de IA que recopila la retroalimentación de los usuarios sobre la salida del modelo. La tarea principal actual es que los usuarios pueden comparar la salida de diferentes modelos para el mismo aviso, y luego seleccionar el que consideran mejor. Completar la tarea puede ganar puntos Yupp, que se pueden canjear por stablecoins fiat como USDC.
Enlace:
Vana, @vana, recaudó 23 millones de dólares
Vana se centra en convertir los datos personales de los usuarios ###, como las actividades en redes sociales, el historial de navegación, etc. ( en activos digitales monetizables. Los usuarios pueden autorizar la carga de sus datos personales al correspondiente fondo de liquidez de datos )DLP( en DataDAOs. Estos datos se agruparán y se utilizarán para participar en tareas como el entrenamiento de modelos de IA, y los usuarios también recibirán recompensas en tokens correspondientes.
Enlace:
)# Chainbase, @ChainbaseHQ, recauda 16.5 millones de dólares
El negocio de Chainbase se centra en los datos en cadena y actualmente cubre más de 200 blockchains, convirtiendo las actividades en cadena en activos de datos estructurados, verificables y monetizables para el desarrollo de dApps. El negocio de Chainbase se obtiene principalmente a través de la indexación multicadena y otros métodos, y los datos se procesan a través de su sistema Manuscript y el modelo de IA Theia. Actualmente, los usuarios comunes no están muy involucrados.
Sapien, @JoinSapien, recaudó 15.5 millones de dólares
Sapien tiene como objetivo convertir el conocimiento humano en datos de entrenamiento de IA de alta calidad a gran escala. Cualquiera puede realizar la anotación de datos en la plataforma y asegurar la calidad de los datos a través de la verificación por pares. Al mismo tiempo, se anima a los usuarios a construir una reputación a largo plazo o hacer compromisos a través de la participación para ganar más recompensas.
Enlace:
Prisma X, @PrismaXai, recauda $11 millones
Prisma X quiere ser una capa de coordinación abierta para robots, donde la recolección de datos físicos es clave. Este proyecto se encuentra actualmente en sus primeras etapas. Según el reciente documento técnico publicado, la participación puede incluir invertir en robots para recolectar datos, operar datos de robots de forma remota, etc. Actualmente, hay un cuestionario basado en el documento técnico abierto, y puedes participar para ganar puntos.
Enlace:
Masa, @getmasafi, recaudó 8.9 millones de dólares
Masa es uno de los principales proyectos de subred en el ecosistema Bittensor, y actualmente opera la Subred de Datos No. 42 y la Subred de Agentes No. 59. La subred de datos se compromete a proporcionar acceso en tiempo real a los datos. Actualmente, los mineros principalmente rastrean datos en tiempo real en X/Twitter a través de hardware TEE. Para los usuarios comunes, la dificultad y el costo de participación son relativamente altos.
Irys, @irys_xyz, recaudó 8.7 millones de dólares
Irys se centra en el almacenamiento de datos y la computación programable, con el objetivo de proporcionar soluciones eficientes y de bajo costo para IA, aplicaciones descentralizadas ###dApps( y otras aplicaciones intensivas en datos. En términos de contribución de datos, los usuarios ordinarios no pueden participar mucho en la actualidad, pero hay múltiples actividades para participar en la etapa actual de la testnet.
Enlace:
)# ORO, @getoro_xyz, recaudó 6 millones de dólares
Lo que ORO quiere hacer es empoderar a las personas comunes para que participen en la contribución de IA. Los métodos de apoyo incluyen: 1. Vincular tu cuenta personal para contribuir con datos personales, incluyendo cuentas sociales, datos de salud, cuentas de comercio electrónico y financieras; 2. Completar tareas de datos. La red de prueba ya está en línea y puedes participar.
Enlace: app.getoro.xyz
Gata, @Gata_xyz, recaudó 4 millones de dólares
Posicionado como una capa de datos descentralizada, Gata actualmente tiene tres productos clave en los que participar: 1. Agente de Datos: una serie de Agentes de IA que pueden ejecutar y procesar datos automáticamente siempre que el usuario tenga abierta la página web; 2. Chat AII-in-one: un mecanismo similar a la evaluación del modelo de Yupp para ganar recompensas; 3. GPT-to-Earn: un complemento de navegador que recopila los datos de conversación de los usuarios en ChatGPT.
Enlace:
¿Cómo ves estos proyectos actuales?
En la actualidad, las barreras de entrada para estos proyectos generalmente no son altas, pero debe reconocerse que una vez que se acumulan usuarios y adherencia ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, en las primeras etapas, los esfuerzos deben centrarse en incentivos y experiencia del usuario. Solo atrayendo a suficientes usuarios se puede hacer viable el negocio de grandes datos.
Sin embargo, como proyectos intensivos en mano de obra, estas plataformas de datos también deben considerar cómo gestionar la mano de obra y garantizar la calidad de la salida de datos mientras atraen mano de obra. Después de todo, un problema común de muchos proyectos de Web3 es que la mayoría de los usuarios en la plataforma son solo buscadores de ganancias. A menudo sacrifican la calidad por beneficios a corto plazo. Si se les permite convertirse en los principales usuarios de la plataforma, el mal dinero inevitablemente expulsará al buen dinero, y en última instancia, la calidad de los datos no podrá ser garantizada y no se podrán atraer compradores. En la actualidad, hemos visto que proyectos como Sahara y Sapien han enfatizado la calidad de los datos y se esfuerzan por establecer una relación de cooperación a largo plazo y saludable con la mano de obra en la plataforma.
Además, la falta de transparencia es otro problema de los proyectos en cadena actuales. De hecho, el triángulo imposible de la blockchain ha obligado a muchos proyectos a tomar el camino de "la centralización impulsa la descentralización" en la fase de inicio. Pero ahora, cada vez más proyectos en cadena dan la impresión de "viejos proyectos Web2 con apariencia de Web3" - hay muy pocos datos públicos que se pueden rastrear en la cadena, e incluso la hoja de ruta es difícil de ver en cuanto a la determinación a largo plazo de apertura y transparencia. Esto es sin duda tóxico para el desarrollo saludable a largo plazo de Web3 DataFi, y también esperamos que más proyectos mantengan siempre sus intenciones originales y aceleren el ritmo de apertura y transparencia.
Finalmente, el camino hacia la adopción masiva de DataFi también debe dividirse en dos partes: una es atraer a suficientes participantes de toC para unirse a la red, formando una nueva fuerza para la ingeniería de recolección/generación de datos y consumidores de la economía de IA, formando un ciclo ecológico cerrado; la otra es obtener el reconocimiento de las actuales empresas de toB. Después de todo, a corto plazo, ellos son la principal fuente de grandes pedidos de datos con sus profundos bolsillos. En este sentido, también hemos visto que Sahara AI, Vana, etc. han hecho buenos progresos.
Conclusión
Para ser más fatalista, DataFi se trata de utilizar la inteligencia humana para cultivar la inteligencia de las máquinas a largo plazo, mientras se utilizan contratos inteligentes como un contrato para garantizar que el trabajo de la inteligencia humana sea rentable y, en última instancia, disfrute de la retroalimentación de la inteligencia de las máquinas.
Si estás ansioso por la incertidumbre de la era de la IA, y si aún tienes ideales de blockchain en medio de los altibajos del mundo de las criptomonedas, entonces seguir los pasos de un grupo de gigantes del capital y unirte a DataFi es una buena elección para ir con la tendencia.