IA y Cadena de bloques: de la exploración tecnológica a la reestructuración de la cadena industrial

La fusión de la IA y la tecnología de la cadena de bloques: de la infraestructura a la aplicación

La inteligencia artificial ( AI ) ha avanzado rápidamente en los últimos años, siendo vista como un motor clave de la nueva revolución industrial. La aparición de modelos de lenguaje grande ha mejorado significativamente la eficiencia laboral en diversas industrias, y Boston Consulting estima que GPT ha aportado aproximadamente un 20% de mejora en la eficiencia laboral general de Estados Unidos. Al mismo tiempo, la capacidad de generalización de los grandes modelos se considera un nuevo paradigma de diseño de software; en comparación con el código preciso tradicional, el diseño de software actual utiliza más un marco de grandes modelos generalizados para apoyar una gama más amplia de entradas y salidas de modalidades. La tecnología de aprendizaje profundo ha traído una nueva ola de prosperidad a la industria de la IA, y esta ola también se ha extendido a la industria de las criptomonedas.

Este artículo explorará en detalle el desarrollo de la industria de la IA, la clasificación de tecnologías y el impacto del aprendizaje profundo en la industria. Analizaremos en profundidad la cadena de valor del aprendizaje profundo, incluyendo GPU, computación en la nube, fuentes de datos, dispositivos de borde, etc., y organizaremos su estado de desarrollo y tendencias. Luego, exploraremos esencialmente la relación entre las criptomonedas y la industria de la IA, y organizaremos el panorama de la cadena de valor de la IA relacionada con las criptomonedas.

Nuevas tecnologías丨AI x Crypto: de cero a la cima

La evolución de la industria de la IA

La industria de la IA comenzó en la década de 1950. Para lograr la visión de la inteligencia artificial, el mundo académico y la industria han desarrollado diversas corrientes en diferentes contextos históricos. La tecnología moderna de inteligencia artificial utiliza principalmente el método de "aprendizaje automático", cuya idea central es permitir que las máquinas, impulsadas por datos, iteran continuamente en las tareas para mejorar el rendimiento del sistema. Los pasos principales incluyen introducir datos en el algoritmo, entrenar el modelo, probar e implementar, y finalmente lograr la predicción automatizada.

Actualmente, el aprendizaje automático se divide en tres grandes corrientes: el conexionismo, el simbolismo y el conductismo, que imitan respectivamente el sistema nervioso humano, el pensamiento y el comportamiento. Entre ellos, el conexionismo, representado por las redes neuronales, ocupa una posición dominante y también se conoce como aprendizaje profundo. La arquitectura de la red neuronal incluye una capa de entrada, una capa de salida y múltiples capas ocultas. A medida que aumenta el número de capas y el número de neuronas ( parámetros ), se pueden ajustar tareas generales más complejas. Ajustando continuamente los parámetros mediante la entrada de datos, se alcanza finalmente el estado óptimo, de ahí proviene el término "profundo".

Nuevo conocimiento丨AI x Crypto: De cero a la cima

La tecnología de aprendizaje profundo ha pasado por múltiples evoluciones, desde las primeras redes neuronales, pasando por redes neuronales de retroalimentación, RNN, CNN, GAN, hasta llegar a los modernos modelos grandes como los que utilizan la tecnología Transformer, como GPT. Transformer, al agregar convertidores, puede codificar datos multimodales ( como audio, video, imágenes, etc. ) en representaciones numéricas correspondientes, logrando así el ajuste de cualquier tipo de datos.

El desarrollo de la IA ha pasado por tres olas tecnológicas:

  1. Década de 1960: La primera ola fue provocada por la tecnología del simbolismo, resolviendo el problema del procesamiento de lenguaje natural y la interacción hombre-máquina. Al mismo tiempo, nacieron los sistemas expertos.

  2. 1997: IBM Deep Blue venció al campeón de ajedrez, marcando el segundo auge de la tecnología de IA.

  3. Desde 2006 hasta ahora: los tres gigantes del aprendizaje profundo propusieron el concepto de aprendizaje profundo, los algoritmos evolucionaron gradualmente, formando la tercera ola tecnológica, que también es la época dorada del conexionismo.

En los últimos años, han surgido varios eventos emblemáticos en el campo de la IA, incluyendo:

  • 2014: Goodfellow propuso la red antagonista generativa GAN(
  • 2015: Se funda OpenAI
  • 2016: AlphaGo derrotó a Lee Sedol
  • 2017: Google publica el artículo del algoritmo Transformer
  • 2018: OpenAI lanza GPT
  • 2020: OpenAI lanzó GPT-3
  • 2023: Se lanzó ChatGPT basado en GPT-4 y se popularizó rápidamente

![Nuevo conocimiento丨AI x Crypto: de cero a la cima])https://img-cdn.gateio.im/webp-social/moments-0c9bdea33a39a2c07d1f06760ed7e804.webp(

Cadena de industria de aprendizaje profundo

Los modelos de lenguaje de gran tamaño actuales utilizan principalmente métodos de aprendizaje profundo basados en redes neuronales. Los grandes modelos representados por GPT han desencadenado una nueva ola de entusiasmo por la IA, y la demanda del mercado de datos y poder de cálculo ha crecido significativamente. Nos centraremos en explorar la composición de la cadena industrial de los algoritmos de aprendizaje profundo, así como la situación actual, las relaciones de oferta y demanda y las tendencias de desarrollo futuro en la parte superior e inferior de la cadena.

Los modelos de lenguaje LLMs basados en la tecnología Transformer ) se entrenan principalmente en tres pasos:

  1. Preentrenamiento: Entrada de pares de datos masivos para buscar los mejores parámetros de las neuronas. Esta fase consume la mayor cantidad de potencia de cálculo y requiere iterar repetidamente y probar varios parámetros.

  2. Ajuste fino: utilizar una pequeña cantidad de datos de alta calidad para entrenar, mejorando la calidad de salida del modelo.

  3. Aprendizaje reforzado: establecer un modelo de recompensas para clasificar los resultados de salida, utilizado para la iteración automática de los parámetros del gran modelo. A veces también se requiere la participación humana para juzgar.

El rendimiento del modelo está determinado principalmente por la cantidad de parámetros, la cantidad y calidad de los datos y la potencia de cálculo. Cuantos más parámetros, mayor es el límite de la capacidad de generalización del modelo. Según la regla empírica, entrenar un gran modelo preentrenado requiere aproximadamente 6np Flops de capacidad de cálculo, donde n es la cantidad de tokens y p es la cantidad de parámetros.

El entrenamiento temprano de IA utilizaba principalmente CPU para proporcionar potencia de cálculo, y luego se fue trasladando gradualmente a GPU, como los chips A100 y H100 de NVIDIA. Las GPU realizan cálculos de punto flotante a través del módulo Tensor Core, y los datos de Flops en precisión FP16/FP32 son un indicador importante del rendimiento del chip.

Tomando como ejemplo GPT-3, tiene 175 mil millones de parámetros y 180 mil millones de Tokens de datos de entrenamiento. Una preentrenamiento requiere aproximadamente 3.15*10^22 Flops, incluso utilizando los chips GPU más avanzados, se necesitan cientos de días. A medida que se amplía la escala del modelo, la demanda de potencia de cálculo crece de manera exponencial.

Durante el proceso de entrenamiento del modelo, el almacenamiento de datos también enfrenta desafíos. Debido a la limitada memoria de la GPU, es necesario transferir datos con frecuencia entre el disco duro y la memoria, y el ancho de banda del chip se convierte en un factor clave. En el entrenamiento paralelo con múltiples GPU, la tasa de transferencia de datos entre chips también es muy importante. Por lo tanto, la capacidad de cálculo del chip no es el único cuello de botella, el ancho de banda de la memoria a menudo es más crítico.

La cadena de la industria de aprendizaje profundo incluye principalmente los siguientes eslabones:

  1. Proveedores de hardware GPU: NVIDIA tiene una posición de monopolio en el mercado de chips de IA de alta gama. Empresas como Google e Intel también están desarrollando sus propios chips de IA.

  2. Proveedores de servicios en la nube: se dividen principalmente en tres categorías: proveedores de nube tradicionales ( como AWS, Google Cloud ), proveedores de servicios en la nube de AI vertical ( como CoreWeave ), y proveedores de inferencia como servicio ( como Together.ai ).

  3. Proveedores de fuentes de datos de entrenamiento: proporcionan enormes, de alta calidad y específicos datos para modelos grandes y modelos de nicho.

  4. Proveedor de base de datos: principalmente bases de datos vectoriales, utilizadas para el almacenamiento y procesamiento eficiente de datos no estructurados.

  5. Dispositivos de borde: incluyen sistemas de suministro de energía y refrigeración para apoyar el funcionamiento de clústeres de cálculo a gran escala.

  6. Aplicación: diversos aplicaciones de IA desarrolladas sobre grandes modelos, como sistemas de conversación, herramientas de creación, etc.

Nuevos conocimientos丨AI x Crypto: de cero a la cima

La relación entre las criptomonedas y la IA

La tecnología de la cadena de bloques se basa en la descentralización y la desconfianza. Bitcoin creó un sistema de transferencia de valor sin confianza, y Ethereum llevó más lejos la implementación de una plataforma de contratos inteligentes descentralizada y sin confianza. En esencia, una red de bloques es una red de valor, donde cada transacción se basa en la conversión del valor de los tokens subyacentes.

En Internet tradicional, el valor de las empresas se refleja principalmente a través del flujo de caja y la relación precio-beneficio. Sin embargo, en el ecosistema de la Cadena de bloques, el token nativo ( como ETH) lleva el valor multidimensional de la red, no solo puede obtener ingresos por staking, sino que también puede servir como medio de intercambio de valor, medio de almacenamiento y producto de consumo en actividades de la red. La economía de tokens define el valor relativo de los activos de liquidación del ecosistema; aunque es difícil fijar un precio para cada dimensión de forma independiente, el precio del token refleja de manera integral el valor multidimensional.

El atractivo de los tokens radica en la capacidad de otorgar valor a cualquier función o idea. La economía de tokens redefine y redescubre la forma en que se percibe el valor, lo cual es crucial para diversas industrias, incluida la IA. En la industria de la IA, la emisión de tokens puede reconfigurar el valor en cada eslabón de la cadena de la industria, incentivando a más participantes a profundizar en segmentos específicos. Los tokens no solo generan flujo de caja, sino que también pueden aumentar el valor de la infraestructura a través de efectos de sinergia, formando el paradigma de "protocolo grueso, aplicación delgada".

Las características de inmutabilidad y confianza implícita de la tecnología de Cadena de bloques también aportan un significado práctico a la industria de la IA. Puede hacer posible algunas aplicaciones que requieren confianza, como asegurar que los modelos no filtren la privacidad al usar datos de usuarios. Cuando hay escasez de suministro de GPU, se puede distribuir la potencia de cálculo a través de la red de Cadena de bloques; cuando las GPU se actualizan, los dispositivos antiguos inactivos también pueden seguir contribuyendo valor. Estas son ventajas únicas de la red de valor global.

Nuevos conocimientos丨IA x Cripto: de cero a la cima

Visión general del proyecto de la cadena industrial de IA en la industria de las criptomonedas

  1. Lado de suministro de GPU:

Los principales proyectos incluyen Render, Golem, entre otros. Render, como un proyecto de infraestructura descentralizada más maduro, se dirige principalmente a tareas no relacionadas con grandes modelos, como la renderización de video. Con el aumento de la demanda de IA y la iteración de GPUs, la necesidad de compartir la potencia de cálculo de GPUs podría aumentar, proporcionando oportunidades de descubrimiento de valor para GPUs inactivas.

  1. Ancho de banda de hardware:

Proyectos típicos como Meson Network, que tiene como objetivo establecer una red de compartición de ancho de banda global. Sin embargo, el ancho de banda compartido puede ser una necesidad falsa, ya que para los clústeres de computación de alto rendimiento, la latencia del almacenamiento de datos local es mucho menor que la del almacenamiento distribuido.

  1. Datos:

EpiK Protocol, Synesis One, Masa y otros proyectos ofrecen servicios de datos de entrenamiento de IA. Entre ellos, Masa se basa en la tecnología de prueba de cero conocimiento y admite la recopilación de datos privados. La ventaja de este tipo de proyectos radica en que pueden lograr una amplia recopilación de datos y a través de tokens incentivar a los usuarios a contribuir con datos.

  1. ZKML( aprendizaje automático de conocimiento cero ):

Utilizar la tecnología de prueba de conocimiento cero para lograr cálculos y entrenamientos privados. Los principales proyectos incluyen Modulus Labs, Giza, entre otros. Algunos proyectos ZK de uso general como Axiom y Risc Zero también merecen atención.

  1. Aplicaciones de IA:

Principalmente combina la capacidad de IA con aplicaciones tradicionales de Cadena de bloques, como AI Agent. Fetch.AI es un proyecto representativo que ayuda a los usuarios a tomar decisiones complejas en la cadena a través de agentes inteligentes.

  1. Cadena de bloques de IA:

Como Tensor, Allora, Hypertensor, etc., redes adaptativas construidas específicamente para modelos o agentes de IA. Este tipo de proyectos generalmente emplea mecanismos similares al aprendizaje por refuerzo, mejorando los parámetros del modelo a través de evaluadores en la cadena de bloques.

Nuevos conocimientos丨AI x Crypto: De cero a la cima

Resumen

A pesar de que el desarrollo actual de la IA se centra principalmente en la tecnología de aprendizaje profundo, todavía hay otras rutas potenciales de tecnología de IA que merecen atención. Aunque el aprendizaje profundo puede no lograr una inteligencia artificial general, ya se ha aplicado ampliamente en campos como los sistemas de recomendación, teniendo un valor práctico.

La tecnología de la Cadena de bloques y la economía de tokens han traído nuevas definiciones de valor y mecanismos de descubrimiento a la industria de la IA. Pueden remodelar el valor de cada eslabón de la cadena industrial de la IA, incentivar a más participantes y lograr una alta eficiencia en la asignación de recursos a través de una red de valor global.

Sin embargo, la red GPU descentralizada todavía tiene desventajas en términos de ancho de banda y herramientas para desarrolladores, y actualmente es más adecuada para el entrenamiento de modelos pequeños que no son urgentes. Para grandes empresas y tareas críticas, las plataformas de servicios en la nube tradicionales todavía tienen ventajas.

En general, la combinación de AI y Cadena de bloques tiene utilidad práctica y potencial a largo plazo. La economía de tokens puede remodelar y descubrir un valor más amplio, mientras que el libro mayor descentralizado puede resolver problemas de confianza, facilitando el flujo de valor y el descubrimiento de valor residual a nivel global. Con el desarrollo de la tecnología y la mejora del ecosistema, se espera que la fusión de AI y Cadena de bloques traiga más innovaciones y oportunidades.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
ContractSurrendervip
· hace9h
mundo Cripto contratos inteligentes una cuchilla🔪
Ver originalesResponder0
UncleWhalevip
· hace9h
Boston realmente se atreve a presumir, solo hay que hacer una tabla para saber el 20%.
Ver originalesResponder0
Whale_Whisperervip
· hace10h
cuando gpt salga, estará condenado
Ver originalesResponder0
GateUser-40edb63bvip
· hace10h
Acumulando GPU locamente...
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)