Desmontando marcos de IA: De agentes inteligentes a exploración de descentralización

Intermedio1/16/2025, 6:03:33 AM
Este artículo profundiza en las tendencias de desarrollo y la lógica de inversión en el campo de los agentes de IA, con un enfoque particular en el análisis detallado de proyectos basados en marcos de trabajo. Presenta los conceptos básicos y las funcionalidades de los marcos de IA, y demuestra su rendimiento y potencial en diferentes escenarios de aplicación a través de estudios de casos específicos como Eliza, G.A.M.E, Rig y ZerePy. Además, desde perspectivas técnicas, de mercado e inversión, el artículo compara las similitudes entre los agentes de IA y el ecosistema BTC, explorando la importancia de llevar agentes de IA a la cadena de bloques y las posibles innovaciones que esto puede traer en el futuro.

Introducción

En artículos anteriores, hemos discutido con frecuencia nuestras opiniones sobre el estado actual de los Memes de IA y el desarrollo futuro de los Agentes de IA. Sin embargo, el rápido desarrollo narrativo y la evolución de la pista de Agentes de IA aún han sido algo abrumadores. En los breves dos meses desde el lanzamiento de 'Truth Terminal' y el inicio del Agente de Verano, la narrativa de la integración de la IA y la criptografía ha evolucionado casi semanalmente. Recientemente, la atención del mercado ha comenzado a centrarse en los proyectos de 'marco de trabajo', que están impulsados ​​principalmente por narrativas tecnológicas. Este subcampo de nicho ya ha producido varios proyectos unicornio con una capitalización de mercado de más de mil millones de dólares en las últimas semanas. Estos proyectos también han llevado a un nuevo paradigma para la emisión de activos, donde los proyectos emiten tokens basados ​​en sus repositorios de código de GitHub, y los Agentes construidos en estos marcos también pueden emitir tokens. En el núcleo de esta estructura, tenemos marcos, con Agentes como la capa superior. Se asemeja a una plataforma de emisión de activos, pero en realidad es un modelo infraestructural único que surge en la era de la IA. ¿Cómo debemos ver esta nueva tendencia? Este artículo comenzará con una introducción a los marcos y ofrecerá una interpretación de lo que significan los marcos de IA para Crypto, combinando estas ideas con nuestras propias reflexiones.

I. ¿Qué es un marco de trabajo?

Por definición, un marco de inteligencia artificial es una herramienta o plataforma de desarrollo subyacente que integra un conjunto de módulos, bibliotecas y herramientas preconstruidas para simplificar el proceso de construcción de modelos de inteligencia artificial complejos. Estos marcos también suelen incluir funciones para manejar datos, entrenar modelos y realizar predicciones. En términos simples, puedes pensar en un marco como un sistema operativo para la era de la inteligencia artificial, similar a los sistemas operativos de escritorio como Windows o Linux, o los sistemas operativos móviles como iOS y Android. Cada marco tiene sus propias ventajas y desventajas, lo que permite a los desarrolladores elegir según sus necesidades específicas.

Aunque el término "marco de IA" todavía es un concepto relativamente nuevo en el campo de la criptografía, su desarrollo se remonta a casi 14 años, comenzando con Theano en 2010. En la comunidad tradicional de IA, tanto la academia como la industria ya han desarrollado marcos muy maduros para elegir, como TensorFlow de Google, PyTorch de Meta, PaddlePaddle de Baidu y MagicAnimate de ByteDance, cada uno de los cuales tiene sus ventajas en diferentes escenarios.

Los proyectos de marco de inteligencia artificial que actualmente están surgiendo en Crypto se basan en la demanda de un gran número de Agentes que surgen del auge de la IA, y estos se han ramificado aún más en otras pistas en Crypto, formando eventualmente diferentes marcos de IA para subcampos específicos. Vamos a explorar algunos de los marcos principales actuales en la industria para ilustrar mejor este punto.

1.1 Eliza

Primero, consideremos a Eliza, un marco creado por ai16z. Es un marco de simulación multiagente diseñado para crear, implementar y gestionar agentes de IA autónomos. Desarrollado utilizando TypeScript como lenguaje de programación, su ventaja radica en una mejor compatibilidad y una integración de API más sencilla. Según la documentación oficial, Eliza está diseñada principalmente para redes sociales, ofreciendo soporte para integraciones multiplataforma. El marco proporciona una integración completa de Discord, con soporte para canales de voz, cuentas automatizadas para X/Twitter, integración de Telegram y acceso directo a la API. En cuanto al procesamiento de contenido multimedia, admite la lectura y el análisis de documentos PDF, la extracción y resumen de enlaces, la transcripción de audio, el manejo de contenido de video, análisis de imágenes y resúmenes de conversaciones.

Los casos de uso admitidos actualmente por Eliza incluyen las siguientes cuatro categorías:

  1. Aplicaciones de asistente de IA: agentes de soporte al cliente, administradores de la comunidad, asistentes personales.
  2. Roles en redes sociales: creadores de contenido automatizados, bots interactivos, representantes de marca.
  3. Trabajadores del conocimiento: asistentes de investigación, analistas de contenido, procesadores de documentos.
  4. Roles interactivos: personajes de rol, tutores educativos, bots de entretenimiento.

Los modelos actualmente soportados por Eliza son:

  1. Modelos de inferencia local de código abierto: como Llama3, Qwen1.5, BERT.
  2. Inferencia en la nube a través de la API de OpenAI.
  3. Configuración predeterminada como Nous Hermes Llama 3.1B.
  4. Integración con Claude para consultas complejas.

1.2 G.A.M.E

G.A.M.E (Framework de Entidades Multimodales Autónomas Generativas) es un marco de IA multimodal para la generación y gestión automática, lanzado por Virtual. Está diseñado principalmente para el diseño de NPC inteligentes en juegos. Un aspecto único de este marco es que permite a los usuarios de bajo código o sin código participar en el diseño de Agentes simplemente modificando parámetros a través de su interfaz de prueba.

En cuanto a la arquitectura del proyecto, G.A.M.E se construye sobre un diseño modular, donde varios subsistemas trabajan juntos en colaboración. La arquitectura detallada es la siguiente:

  1. Interfaz de Promoción de Agentes: La interfaz para que los desarrolladores interactúen con el marco de IA. A través de esta interfaz, los desarrolladores pueden iniciar una sesión y especificar IDs de sesión, IDs de agente, IDs de usuario y otros parámetros.
  2. Subsistema de percepción: Responsable de recibir información de entrada, sintetizarla y enviarla al motor de planificación estratégica. También maneja las respuestas del módulo de procesamiento de diálogo.
  3. Motor de Planificación Estratégica: El núcleo de todo el marco, dividido en un planificador de alto nivel y una política de bajo nivel. El planificador de alto nivel es responsable de formular objetivos y planes a largo plazo, mientras que la política de bajo nivel traduce estos planes en acciones específicas.
  4. Contexto mundial: Contiene información ambiental, estado mundial y datos del estado del juego, ayudando a los agentes a comprender su contexto actual.
  5. Módulo de Procesamiento de Diálogo: Maneja mensajes y respuestas, generando diálogo o reacciones como salida.
  6. Operador de billetera en cadena: Probablemente relacionado con aplicaciones de tecnología blockchain, aunque las funciones específicas no están claras.
  7. Módulo de aprendizaje: Aprende de los comentarios y actualiza la base de conocimientos del agente.
  8. Memoria de trabajo: Almacena acciones recientes, resultados y planes actuales, entre otra información a corto plazo.
  9. Procesador de memoria a largo plazo: extrae y clasifica información importante sobre el agente y su memoria de trabajo en función de factores como importancia, recencia y relevancia.
  10. Repositorio del Agente: Almacena las metas, reflexiones, experiencias y características del agente.
  11. Planificador de Acciones: Genera planes de acción específicos basados en estrategias de bajo nivel.
  12. Plan Executor: Ejecuta los planes de acción generados por el planificador de acciones.

Flujo de trabajo: Los desarrolladores inician un Agente a través de la Interfaz de Solicitud de Agente, donde el Subsistema de Percepción recibe la entrada y la envía al Motor de Planificación Estratégica. El motor, con la ayuda del sistema de memoria, el contexto mundial y el repositorio de Agentes, formula y ejecuta un plan de acción. El Módulo de Aprendizaje monitorea las acciones del Agente y ajusta su comportamiento en consecuencia.

Escenarios de aplicación: Desde la arquitectura técnica general, este marco se centra en la toma de decisiones, retroalimentación, percepción y personalidad de los Agentes en entornos virtuales. Además de los videojuegos, este marco también es aplicable al Metaverso. La lista a continuación de Virtual muestra que muchos proyectos ya han adoptado este marco para su construcción.

1.3 Rig

Rig es una herramienta de código abierto escrita en Rust, diseñada específicamente para simplificar el desarrollo de aplicaciones de modelos de lenguaje grandes (LLM). Proporciona una interfaz unificada que permite a los desarrolladores interactuar fácilmente con varios proveedores de servicios de LLM (como OpenAI y Anthropic) y diversas bases de datos vectoriales (como MongoDB y Neo4j)

Características clave:

  • Interfaz unificada: independientemente del proveedor de LLM o el almacenamiento de vectores utilizado, Rig ofrece un método de acceso constante, lo que reduce en gran medida la complejidad del trabajo de integración.
  • Arquitectura Modular: El marco utiliza un diseño modular, que incluye componentes clave como "Capa de Abstracción del Proveedor," "Interfaz de Almacenamiento de Vectores," y "Sistema de Agente Inteligente," asegurando la flexibilidad y escalabilidad del sistema.
  • Type Safety: Aprovechando las características de Rust, Rig logra operaciones de incrustación seguras en cuanto a tipos, garantizando la calidad del código y la seguridad en tiempo de ejecución.
  • Alto rendimiento: el sistema admite programación asíncrona, optimizando las capacidades de procesamiento de concurrencia. Las funciones de registro y monitoreo incorporadas ayudan con el mantenimiento y la solución de problemas.

Flujo de trabajo: Cuando un usuario ingresa al sistema Rig, la solicitud primero pasa por la “Capa de Abstracción del Proveedor”, que estandariza las diferencias entre varios proveedores y garantiza un manejo de errores consistente. En la capa central, los agentes inteligentes pueden llamar a diferentes herramientas o consultar el almacenamiento vectorial para recuperar la información necesaria. Finalmente, mecanismos avanzados como la Generación con Recuperación Aumentada (RAG) combinan la recuperación de documentos y la comprensión contextual para generar respuestas precisas y significativas antes de devolverlas al usuario.

Casos de uso: Rig es adecuado para construir sistemas que requieren respuestas rápidas y precisas, crear herramientas eficientes de búsqueda de documentos, desarrollar chatbots o asistentes virtuales conscientes del contexto, e incluso apoyar la creación de contenido mediante la generación automática de texto u otras formas de contenido basadas en patrones de datos existentes.

1.4 ZerePy

ZerePy es un marco de código abierto basado en Python diseñado para simplificar la implementación y gestión de agentes de IA en la plataforma X (anteriormente Twitter). Evolucionó a partir del proyecto Zerebro y heredó sus funcionalidades principales, pero fue diseñado de manera más modular y escalable. El objetivo es permitir a los desarrolladores crear fácilmente agentes de IA personalizados e implementar diversas tareas de automatización y creación de contenidos en X.

ZerePy proporciona una interfaz de línea de comandos (CLI), lo que facilita a los usuarios administrar y controlar los agentes de IA que implementan. Su arquitectura central es modular, lo que permite a los desarrolladores integrar de manera flexible diferentes módulos funcionales, como:

  • Integración LLM: ZerePy admite modelos de lenguaje grandes (LLMs) de OpenAI y Anthropic, lo que permite a los desarrolladores seleccionar el modelo que mejor se adapte a su aplicación. Esto permite a los agentes generar contenido textual de alta calidad.
  • Integración de la plataforma X: El marco se integra directamente con la API de X, lo que permite a los agentes realizar tareas como publicar, responder, dar me gusta y retuitear.
  • Sistema de Conexión Modular: Este sistema permite a los desarrolladores añadir fácilmente soporte para otras plataformas sociales o servicios, extendiendo la funcionalidad del marco.
  • Sistema de Memoria (Planes Futuros): Aunque no está completamente implementado en la versión actual, el objetivo de diseño de ZerePy incluye la integración de un sistema de memoria que permitiría a los agentes recordar interacciones anteriores e información contextual para generar contenido más coherente y personalizado.

Si bien tanto ZerePy como el proyecto Eliza de a16z tienen como objetivo construir y gestionar agentes de inteligencia artificial, difieren en arquitectura y enfoque. Eliza está más orientada hacia simulaciones multiagente y una investigación de IA más amplia, mientras que ZerePy se centra en simplificar la implementación de agentes de inteligencia artificial en plataformas sociales específicas (X), lo que lo hace más orientado a la aplicación.

II. Una réplica del ecosistema de BTC

En cuanto a la trayectoria de desarrollo, los agentes de IA comparten muchas similitudes con el ecosistema de BTC desde finales de 2023 hasta principios de 2024. La trayectoria de desarrollo del ecosistema de BTC se puede resumir simplemente como: competencia multi-protocolo BRC20-Atomical/Rune y otros — BTC L2 — BTCFi centrado en Babilonia. Si bien los agentes de IA se han desarrollado más rápidamente sobre la base de pilas tecnológicas de IA tradicionales maduras, su trayectoria general de desarrollo refleja el ecosistema de BTC en varios aspectos. Lo resumiría de la siguiente manera: GOAT/ACT — Agentes de tipo social — Competencia de marco de agentes de IA analíticos. Desde una perspectiva de tendencia, es probable que los proyectos de infraestructura centrados en la descentralización y la seguridad en torno a los agentes también avancen en esta ola de marcos, convirtiéndose en el próximo tema dominante.

Entonces, ¿seguirá este camino, como el ecosistema BTC, llevando a la homogeneización y la burbujización? No creo. En primer lugar, la narrativa de los agentes de IA no se trata de recrear la historia de las cadenas de contratos inteligentes. En segundo lugar, ya sea que estos proyectos de marcos de IA existentes sean técnicamente sólidos o aún estén atascados en la etapa de presentación o simplemente Ctrl+C y Ctrl+V, al menos proporcionan un nuevo enfoque de desarrollo de infraestructura. Muchos artículos han comparado los marcos de IA con plataformas de emisión de activos, y los agentes con activos. Sin embargo, en comparación con los Memecoin Launchpads y los protocolos de inscripción, personalmente creo que los marcos de IA se asemejan a las futuras cadenas públicas, mientras que los agentes se asemejan a las futuras DApps.

En el espacio criptográfico actual, tenemos miles de cadenas públicas y decenas de miles de DApps. En el reino de las cadenas de propósito general, tenemos BTC, Ethereum y varias cadenas heterogéneas, mientras que las formas de cadenas de aplicación son más diversas, como cadenas de juegos, cadenas de almacenamiento y cadenas Dex. Las cadenas públicas y los marcos de AI son muy similares en naturaleza, y los DApps pueden corresponder bien a los agentes.

En la era de las criptomonedas en la IA, es muy probable que el espacio evolucione en esta dirección, y que los debates futuros pasen de la EVM frente a las cadenas heterogéneas a los debates marco. El problema actual tiene que ver más con la descentralización, o cómo "encadenarla". Creo que los futuros proyectos de infraestructura de IA se desarrollarán en torno a esta base. Otro punto importante es: ¿Qué importancia tiene hacer esto en la cadena de bloques?

III. El Significado de On-Chain

Independientemente de con qué blockchain se combine, finalmente se enfrenta a una pregunta crítica: ¿Es significativo? En el artículo del año pasado, critiqué a GameFi por sus prioridades desplazadas, donde el desarrollo de infraestructura estaba demasiado avanzado, y en artículos anteriores sobre IA, expresé escepticismo sobre la practicidad actual de combinar IA con Crypto. Después de todo, la fuerza impulsora narrativa para proyectos tradicionales se ha debilitado cada vez más. Los pocos proyectos tradicionales que tuvieron buen rendimiento el año pasado en términos de precio de token fueron generalmente aquellos que pudieron igualar o superar la fuerza del precio.

¿Qué puede hacer la inteligencia artificial por las criptomonedas? Anteriormente, pensaba en casos de uso como agentes de IA realizando tareas en nombre de los usuarios, Metaverso y agentes como empleados, ideas relativamente mundanas pero con ciertas exigencias. Sin embargo, estas exigencias no requieren estar completamente en la cadena, y desde una perspectiva de lógica empresarial, no pueden formar un bucle cerrado. El navegador de agentes mencionado en el último artículo, que implementa intenciones, podría generar demandas de etiquetado de datos y de potencia de cómputo de inferencia, pero estos dos elementos aún no están estrechamente integrados y, en términos de potencia de cómputo, la informática centralizada todavía tiene la ventaja.

Al revisitar el éxito de DeFi, la razón por la que DeFi logró abrirse paso en las finanzas tradicionales es porque proporciona una mayor accesibilidad, una mejor eficiencia, costos más bajos y seguridad sin confianza. Si consideramos este marco, creo que puede haber varias razones por las que la "cadenaización" de agentes podría tener sentido:

  1. Reducción de costos: ¿Puede la cadena de agentes reducir los costos de uso, logrando así una mayor accesibilidad y más opciones para los usuarios? Con el tiempo, esto podría permitir a los usuarios comunes participar en lo que tradicionalmente ha sido el dominio exclusivo de los "alquileres" de IA de los gigantes tecnológicos de la Web2.
  2. Seguridad: Según la definición más simple, un agente es una IA que puede interactuar con el mundo virtual o real. Si un agente puede intervenir en el mundo real o incluso en mi billetera virtual, entonces las soluciones de seguridad basadas en blockchain podrían convertirse en una necesidad.
  3. Juego financiero específico de blockchain: ¿Pueden los agentes crear un conjunto único de mecanismos financieros en la blockchain? Por ejemplo, en el AMM (Creador de Mercado Automatizado), los proveedores de liquidez (LPs) permiten a los usuarios comunes participar en la creación de mercado automatizada. De manera similar, si los agentes requieren poder de cómputo o etiquetado de datos, los usuarios podrían invertir en estos protocolos en forma de USDT, basándose en su confianza en el sistema. O bien, los agentes en diferentes escenarios de aplicación podrían formar nuevas estructuras financieras.
  4. Interoperabilidad DeFi: Si bien DeFi actualmente carece de una interoperabilidad perfecta, los agentes podrían abordar este problema al habilitar procesos de razonamiento transparentes y rastreables, llenando los vacíos.

IV. ¿Creatividad?

Los proyectos de marco en el futuro también proporcionarán oportunidades empresariales similares a la Tienda GPT. Si bien lanzar un agente a través de un marco aún es complejo para los usuarios comunes, creo que simplificar el proceso de construcción del agente y proporcionar combinaciones de funciones más complejas dará a dichos marcos una ventaja competitiva en el futuro. Esto podría conducir a la creación de una economía creativa Web3 que es mucho más interesante que la Tienda GPT.

Actualmente, la tienda GPT todavía está más orientada hacia usos prácticos tradicionales, con la mayoría de las aplicaciones populares creadas por empresas tradicionales Web2. Además, los ingresos generados están en gran medida monopolizados por los creadores. Según la explicación oficial de OpenAI, la estrategia es simplemente proporcionar apoyo financiero a desarrolladores destacados en los Estados Unidos, ofreciendo subsidios hasta cierta cantidad.

Desde una perspectiva de demanda, Web3 todavía tiene muchos vacíos que llenar, y desde el punto de vista del sistema económico, puede hacer que las políticas injustas de los gigantes de Web2 sean más equitativas. Además, podemos introducir naturalmente economías comunitarias para mejorar aún más a los agentes. La economía creativa en torno a los agentes presentará a las personas ordinarias una oportunidad de participar. En el futuro, los memes de IA serán mucho más inteligentes e interesantes que los agentes emitidos por GOAT o Clanker.

Sobre YBB

YBB es un fondo web3 que se dedica a identificar proyectos que definen Web3 con la visión de crear un mejor hábitat en línea para todos los residentes de Internet. Fundada por un grupo de creyentes en la cadena de bloques que han participado activamente en esta industria desde 2013, YBB siempre está dispuesta a ayudar a los proyectos en etapas iniciales a evolucionar de 0 a 1. Valoramos la innovación, la pasión autodirigida y los productos orientados al usuario, al tiempo que reconocemos el potencial de las criptomonedas y las aplicaciones de la cadena de bloques.

Sitio web | Twi: @YBBCapital

Descargo de responsabilidad:

  1. Este artículo es una reimpresión de [YBB Capital]. Todos los derechos de autor pertenecen al autor original [Investigador de YBB Capital Zeke]. Si hay objeciones a esta reimpresión, por favor contactar a la Gate Learnequipo y ellos lo resolverán rápidamente.
  2. Descargo de responsabilidad por responsabilidad: Las opiniones y puntos de vista expresados en este artículo son únicamente los del autor y no constituyen asesoramiento de inversión.
  3. El equipo de Learn gate tradujo el artículo a otros idiomas. Está prohibido copiar, distribuir o plagiar los artículos traducidos a menos que se mencione.

Desmontando marcos de IA: De agentes inteligentes a exploración de descentralización

Intermedio1/16/2025, 6:03:33 AM
Este artículo profundiza en las tendencias de desarrollo y la lógica de inversión en el campo de los agentes de IA, con un enfoque particular en el análisis detallado de proyectos basados en marcos de trabajo. Presenta los conceptos básicos y las funcionalidades de los marcos de IA, y demuestra su rendimiento y potencial en diferentes escenarios de aplicación a través de estudios de casos específicos como Eliza, G.A.M.E, Rig y ZerePy. Además, desde perspectivas técnicas, de mercado e inversión, el artículo compara las similitudes entre los agentes de IA y el ecosistema BTC, explorando la importancia de llevar agentes de IA a la cadena de bloques y las posibles innovaciones que esto puede traer en el futuro.

Introducción

En artículos anteriores, hemos discutido con frecuencia nuestras opiniones sobre el estado actual de los Memes de IA y el desarrollo futuro de los Agentes de IA. Sin embargo, el rápido desarrollo narrativo y la evolución de la pista de Agentes de IA aún han sido algo abrumadores. En los breves dos meses desde el lanzamiento de 'Truth Terminal' y el inicio del Agente de Verano, la narrativa de la integración de la IA y la criptografía ha evolucionado casi semanalmente. Recientemente, la atención del mercado ha comenzado a centrarse en los proyectos de 'marco de trabajo', que están impulsados ​​principalmente por narrativas tecnológicas. Este subcampo de nicho ya ha producido varios proyectos unicornio con una capitalización de mercado de más de mil millones de dólares en las últimas semanas. Estos proyectos también han llevado a un nuevo paradigma para la emisión de activos, donde los proyectos emiten tokens basados ​​en sus repositorios de código de GitHub, y los Agentes construidos en estos marcos también pueden emitir tokens. En el núcleo de esta estructura, tenemos marcos, con Agentes como la capa superior. Se asemeja a una plataforma de emisión de activos, pero en realidad es un modelo infraestructural único que surge en la era de la IA. ¿Cómo debemos ver esta nueva tendencia? Este artículo comenzará con una introducción a los marcos y ofrecerá una interpretación de lo que significan los marcos de IA para Crypto, combinando estas ideas con nuestras propias reflexiones.

I. ¿Qué es un marco de trabajo?

Por definición, un marco de inteligencia artificial es una herramienta o plataforma de desarrollo subyacente que integra un conjunto de módulos, bibliotecas y herramientas preconstruidas para simplificar el proceso de construcción de modelos de inteligencia artificial complejos. Estos marcos también suelen incluir funciones para manejar datos, entrenar modelos y realizar predicciones. En términos simples, puedes pensar en un marco como un sistema operativo para la era de la inteligencia artificial, similar a los sistemas operativos de escritorio como Windows o Linux, o los sistemas operativos móviles como iOS y Android. Cada marco tiene sus propias ventajas y desventajas, lo que permite a los desarrolladores elegir según sus necesidades específicas.

Aunque el término "marco de IA" todavía es un concepto relativamente nuevo en el campo de la criptografía, su desarrollo se remonta a casi 14 años, comenzando con Theano en 2010. En la comunidad tradicional de IA, tanto la academia como la industria ya han desarrollado marcos muy maduros para elegir, como TensorFlow de Google, PyTorch de Meta, PaddlePaddle de Baidu y MagicAnimate de ByteDance, cada uno de los cuales tiene sus ventajas en diferentes escenarios.

Los proyectos de marco de inteligencia artificial que actualmente están surgiendo en Crypto se basan en la demanda de un gran número de Agentes que surgen del auge de la IA, y estos se han ramificado aún más en otras pistas en Crypto, formando eventualmente diferentes marcos de IA para subcampos específicos. Vamos a explorar algunos de los marcos principales actuales en la industria para ilustrar mejor este punto.

1.1 Eliza

Primero, consideremos a Eliza, un marco creado por ai16z. Es un marco de simulación multiagente diseñado para crear, implementar y gestionar agentes de IA autónomos. Desarrollado utilizando TypeScript como lenguaje de programación, su ventaja radica en una mejor compatibilidad y una integración de API más sencilla. Según la documentación oficial, Eliza está diseñada principalmente para redes sociales, ofreciendo soporte para integraciones multiplataforma. El marco proporciona una integración completa de Discord, con soporte para canales de voz, cuentas automatizadas para X/Twitter, integración de Telegram y acceso directo a la API. En cuanto al procesamiento de contenido multimedia, admite la lectura y el análisis de documentos PDF, la extracción y resumen de enlaces, la transcripción de audio, el manejo de contenido de video, análisis de imágenes y resúmenes de conversaciones.

Los casos de uso admitidos actualmente por Eliza incluyen las siguientes cuatro categorías:

  1. Aplicaciones de asistente de IA: agentes de soporte al cliente, administradores de la comunidad, asistentes personales.
  2. Roles en redes sociales: creadores de contenido automatizados, bots interactivos, representantes de marca.
  3. Trabajadores del conocimiento: asistentes de investigación, analistas de contenido, procesadores de documentos.
  4. Roles interactivos: personajes de rol, tutores educativos, bots de entretenimiento.

Los modelos actualmente soportados por Eliza son:

  1. Modelos de inferencia local de código abierto: como Llama3, Qwen1.5, BERT.
  2. Inferencia en la nube a través de la API de OpenAI.
  3. Configuración predeterminada como Nous Hermes Llama 3.1B.
  4. Integración con Claude para consultas complejas.

1.2 G.A.M.E

G.A.M.E (Framework de Entidades Multimodales Autónomas Generativas) es un marco de IA multimodal para la generación y gestión automática, lanzado por Virtual. Está diseñado principalmente para el diseño de NPC inteligentes en juegos. Un aspecto único de este marco es que permite a los usuarios de bajo código o sin código participar en el diseño de Agentes simplemente modificando parámetros a través de su interfaz de prueba.

En cuanto a la arquitectura del proyecto, G.A.M.E se construye sobre un diseño modular, donde varios subsistemas trabajan juntos en colaboración. La arquitectura detallada es la siguiente:

  1. Interfaz de Promoción de Agentes: La interfaz para que los desarrolladores interactúen con el marco de IA. A través de esta interfaz, los desarrolladores pueden iniciar una sesión y especificar IDs de sesión, IDs de agente, IDs de usuario y otros parámetros.
  2. Subsistema de percepción: Responsable de recibir información de entrada, sintetizarla y enviarla al motor de planificación estratégica. También maneja las respuestas del módulo de procesamiento de diálogo.
  3. Motor de Planificación Estratégica: El núcleo de todo el marco, dividido en un planificador de alto nivel y una política de bajo nivel. El planificador de alto nivel es responsable de formular objetivos y planes a largo plazo, mientras que la política de bajo nivel traduce estos planes en acciones específicas.
  4. Contexto mundial: Contiene información ambiental, estado mundial y datos del estado del juego, ayudando a los agentes a comprender su contexto actual.
  5. Módulo de Procesamiento de Diálogo: Maneja mensajes y respuestas, generando diálogo o reacciones como salida.
  6. Operador de billetera en cadena: Probablemente relacionado con aplicaciones de tecnología blockchain, aunque las funciones específicas no están claras.
  7. Módulo de aprendizaje: Aprende de los comentarios y actualiza la base de conocimientos del agente.
  8. Memoria de trabajo: Almacena acciones recientes, resultados y planes actuales, entre otra información a corto plazo.
  9. Procesador de memoria a largo plazo: extrae y clasifica información importante sobre el agente y su memoria de trabajo en función de factores como importancia, recencia y relevancia.
  10. Repositorio del Agente: Almacena las metas, reflexiones, experiencias y características del agente.
  11. Planificador de Acciones: Genera planes de acción específicos basados en estrategias de bajo nivel.
  12. Plan Executor: Ejecuta los planes de acción generados por el planificador de acciones.

Flujo de trabajo: Los desarrolladores inician un Agente a través de la Interfaz de Solicitud de Agente, donde el Subsistema de Percepción recibe la entrada y la envía al Motor de Planificación Estratégica. El motor, con la ayuda del sistema de memoria, el contexto mundial y el repositorio de Agentes, formula y ejecuta un plan de acción. El Módulo de Aprendizaje monitorea las acciones del Agente y ajusta su comportamiento en consecuencia.

Escenarios de aplicación: Desde la arquitectura técnica general, este marco se centra en la toma de decisiones, retroalimentación, percepción y personalidad de los Agentes en entornos virtuales. Además de los videojuegos, este marco también es aplicable al Metaverso. La lista a continuación de Virtual muestra que muchos proyectos ya han adoptado este marco para su construcción.

1.3 Rig

Rig es una herramienta de código abierto escrita en Rust, diseñada específicamente para simplificar el desarrollo de aplicaciones de modelos de lenguaje grandes (LLM). Proporciona una interfaz unificada que permite a los desarrolladores interactuar fácilmente con varios proveedores de servicios de LLM (como OpenAI y Anthropic) y diversas bases de datos vectoriales (como MongoDB y Neo4j)

Características clave:

  • Interfaz unificada: independientemente del proveedor de LLM o el almacenamiento de vectores utilizado, Rig ofrece un método de acceso constante, lo que reduce en gran medida la complejidad del trabajo de integración.
  • Arquitectura Modular: El marco utiliza un diseño modular, que incluye componentes clave como "Capa de Abstracción del Proveedor," "Interfaz de Almacenamiento de Vectores," y "Sistema de Agente Inteligente," asegurando la flexibilidad y escalabilidad del sistema.
  • Type Safety: Aprovechando las características de Rust, Rig logra operaciones de incrustación seguras en cuanto a tipos, garantizando la calidad del código y la seguridad en tiempo de ejecución.
  • Alto rendimiento: el sistema admite programación asíncrona, optimizando las capacidades de procesamiento de concurrencia. Las funciones de registro y monitoreo incorporadas ayudan con el mantenimiento y la solución de problemas.

Flujo de trabajo: Cuando un usuario ingresa al sistema Rig, la solicitud primero pasa por la “Capa de Abstracción del Proveedor”, que estandariza las diferencias entre varios proveedores y garantiza un manejo de errores consistente. En la capa central, los agentes inteligentes pueden llamar a diferentes herramientas o consultar el almacenamiento vectorial para recuperar la información necesaria. Finalmente, mecanismos avanzados como la Generación con Recuperación Aumentada (RAG) combinan la recuperación de documentos y la comprensión contextual para generar respuestas precisas y significativas antes de devolverlas al usuario.

Casos de uso: Rig es adecuado para construir sistemas que requieren respuestas rápidas y precisas, crear herramientas eficientes de búsqueda de documentos, desarrollar chatbots o asistentes virtuales conscientes del contexto, e incluso apoyar la creación de contenido mediante la generación automática de texto u otras formas de contenido basadas en patrones de datos existentes.

1.4 ZerePy

ZerePy es un marco de código abierto basado en Python diseñado para simplificar la implementación y gestión de agentes de IA en la plataforma X (anteriormente Twitter). Evolucionó a partir del proyecto Zerebro y heredó sus funcionalidades principales, pero fue diseñado de manera más modular y escalable. El objetivo es permitir a los desarrolladores crear fácilmente agentes de IA personalizados e implementar diversas tareas de automatización y creación de contenidos en X.

ZerePy proporciona una interfaz de línea de comandos (CLI), lo que facilita a los usuarios administrar y controlar los agentes de IA que implementan. Su arquitectura central es modular, lo que permite a los desarrolladores integrar de manera flexible diferentes módulos funcionales, como:

  • Integración LLM: ZerePy admite modelos de lenguaje grandes (LLMs) de OpenAI y Anthropic, lo que permite a los desarrolladores seleccionar el modelo que mejor se adapte a su aplicación. Esto permite a los agentes generar contenido textual de alta calidad.
  • Integración de la plataforma X: El marco se integra directamente con la API de X, lo que permite a los agentes realizar tareas como publicar, responder, dar me gusta y retuitear.
  • Sistema de Conexión Modular: Este sistema permite a los desarrolladores añadir fácilmente soporte para otras plataformas sociales o servicios, extendiendo la funcionalidad del marco.
  • Sistema de Memoria (Planes Futuros): Aunque no está completamente implementado en la versión actual, el objetivo de diseño de ZerePy incluye la integración de un sistema de memoria que permitiría a los agentes recordar interacciones anteriores e información contextual para generar contenido más coherente y personalizado.

Si bien tanto ZerePy como el proyecto Eliza de a16z tienen como objetivo construir y gestionar agentes de inteligencia artificial, difieren en arquitectura y enfoque. Eliza está más orientada hacia simulaciones multiagente y una investigación de IA más amplia, mientras que ZerePy se centra en simplificar la implementación de agentes de inteligencia artificial en plataformas sociales específicas (X), lo que lo hace más orientado a la aplicación.

II. Una réplica del ecosistema de BTC

En cuanto a la trayectoria de desarrollo, los agentes de IA comparten muchas similitudes con el ecosistema de BTC desde finales de 2023 hasta principios de 2024. La trayectoria de desarrollo del ecosistema de BTC se puede resumir simplemente como: competencia multi-protocolo BRC20-Atomical/Rune y otros — BTC L2 — BTCFi centrado en Babilonia. Si bien los agentes de IA se han desarrollado más rápidamente sobre la base de pilas tecnológicas de IA tradicionales maduras, su trayectoria general de desarrollo refleja el ecosistema de BTC en varios aspectos. Lo resumiría de la siguiente manera: GOAT/ACT — Agentes de tipo social — Competencia de marco de agentes de IA analíticos. Desde una perspectiva de tendencia, es probable que los proyectos de infraestructura centrados en la descentralización y la seguridad en torno a los agentes también avancen en esta ola de marcos, convirtiéndose en el próximo tema dominante.

Entonces, ¿seguirá este camino, como el ecosistema BTC, llevando a la homogeneización y la burbujización? No creo. En primer lugar, la narrativa de los agentes de IA no se trata de recrear la historia de las cadenas de contratos inteligentes. En segundo lugar, ya sea que estos proyectos de marcos de IA existentes sean técnicamente sólidos o aún estén atascados en la etapa de presentación o simplemente Ctrl+C y Ctrl+V, al menos proporcionan un nuevo enfoque de desarrollo de infraestructura. Muchos artículos han comparado los marcos de IA con plataformas de emisión de activos, y los agentes con activos. Sin embargo, en comparación con los Memecoin Launchpads y los protocolos de inscripción, personalmente creo que los marcos de IA se asemejan a las futuras cadenas públicas, mientras que los agentes se asemejan a las futuras DApps.

En el espacio criptográfico actual, tenemos miles de cadenas públicas y decenas de miles de DApps. En el reino de las cadenas de propósito general, tenemos BTC, Ethereum y varias cadenas heterogéneas, mientras que las formas de cadenas de aplicación son más diversas, como cadenas de juegos, cadenas de almacenamiento y cadenas Dex. Las cadenas públicas y los marcos de AI son muy similares en naturaleza, y los DApps pueden corresponder bien a los agentes.

En la era de las criptomonedas en la IA, es muy probable que el espacio evolucione en esta dirección, y que los debates futuros pasen de la EVM frente a las cadenas heterogéneas a los debates marco. El problema actual tiene que ver más con la descentralización, o cómo "encadenarla". Creo que los futuros proyectos de infraestructura de IA se desarrollarán en torno a esta base. Otro punto importante es: ¿Qué importancia tiene hacer esto en la cadena de bloques?

III. El Significado de On-Chain

Independientemente de con qué blockchain se combine, finalmente se enfrenta a una pregunta crítica: ¿Es significativo? En el artículo del año pasado, critiqué a GameFi por sus prioridades desplazadas, donde el desarrollo de infraestructura estaba demasiado avanzado, y en artículos anteriores sobre IA, expresé escepticismo sobre la practicidad actual de combinar IA con Crypto. Después de todo, la fuerza impulsora narrativa para proyectos tradicionales se ha debilitado cada vez más. Los pocos proyectos tradicionales que tuvieron buen rendimiento el año pasado en términos de precio de token fueron generalmente aquellos que pudieron igualar o superar la fuerza del precio.

¿Qué puede hacer la inteligencia artificial por las criptomonedas? Anteriormente, pensaba en casos de uso como agentes de IA realizando tareas en nombre de los usuarios, Metaverso y agentes como empleados, ideas relativamente mundanas pero con ciertas exigencias. Sin embargo, estas exigencias no requieren estar completamente en la cadena, y desde una perspectiva de lógica empresarial, no pueden formar un bucle cerrado. El navegador de agentes mencionado en el último artículo, que implementa intenciones, podría generar demandas de etiquetado de datos y de potencia de cómputo de inferencia, pero estos dos elementos aún no están estrechamente integrados y, en términos de potencia de cómputo, la informática centralizada todavía tiene la ventaja.

Al revisitar el éxito de DeFi, la razón por la que DeFi logró abrirse paso en las finanzas tradicionales es porque proporciona una mayor accesibilidad, una mejor eficiencia, costos más bajos y seguridad sin confianza. Si consideramos este marco, creo que puede haber varias razones por las que la "cadenaización" de agentes podría tener sentido:

  1. Reducción de costos: ¿Puede la cadena de agentes reducir los costos de uso, logrando así una mayor accesibilidad y más opciones para los usuarios? Con el tiempo, esto podría permitir a los usuarios comunes participar en lo que tradicionalmente ha sido el dominio exclusivo de los "alquileres" de IA de los gigantes tecnológicos de la Web2.
  2. Seguridad: Según la definición más simple, un agente es una IA que puede interactuar con el mundo virtual o real. Si un agente puede intervenir en el mundo real o incluso en mi billetera virtual, entonces las soluciones de seguridad basadas en blockchain podrían convertirse en una necesidad.
  3. Juego financiero específico de blockchain: ¿Pueden los agentes crear un conjunto único de mecanismos financieros en la blockchain? Por ejemplo, en el AMM (Creador de Mercado Automatizado), los proveedores de liquidez (LPs) permiten a los usuarios comunes participar en la creación de mercado automatizada. De manera similar, si los agentes requieren poder de cómputo o etiquetado de datos, los usuarios podrían invertir en estos protocolos en forma de USDT, basándose en su confianza en el sistema. O bien, los agentes en diferentes escenarios de aplicación podrían formar nuevas estructuras financieras.
  4. Interoperabilidad DeFi: Si bien DeFi actualmente carece de una interoperabilidad perfecta, los agentes podrían abordar este problema al habilitar procesos de razonamiento transparentes y rastreables, llenando los vacíos.

IV. ¿Creatividad?

Los proyectos de marco en el futuro también proporcionarán oportunidades empresariales similares a la Tienda GPT. Si bien lanzar un agente a través de un marco aún es complejo para los usuarios comunes, creo que simplificar el proceso de construcción del agente y proporcionar combinaciones de funciones más complejas dará a dichos marcos una ventaja competitiva en el futuro. Esto podría conducir a la creación de una economía creativa Web3 que es mucho más interesante que la Tienda GPT.

Actualmente, la tienda GPT todavía está más orientada hacia usos prácticos tradicionales, con la mayoría de las aplicaciones populares creadas por empresas tradicionales Web2. Además, los ingresos generados están en gran medida monopolizados por los creadores. Según la explicación oficial de OpenAI, la estrategia es simplemente proporcionar apoyo financiero a desarrolladores destacados en los Estados Unidos, ofreciendo subsidios hasta cierta cantidad.

Desde una perspectiva de demanda, Web3 todavía tiene muchos vacíos que llenar, y desde el punto de vista del sistema económico, puede hacer que las políticas injustas de los gigantes de Web2 sean más equitativas. Además, podemos introducir naturalmente economías comunitarias para mejorar aún más a los agentes. La economía creativa en torno a los agentes presentará a las personas ordinarias una oportunidad de participar. En el futuro, los memes de IA serán mucho más inteligentes e interesantes que los agentes emitidos por GOAT o Clanker.

Sobre YBB

YBB es un fondo web3 que se dedica a identificar proyectos que definen Web3 con la visión de crear un mejor hábitat en línea para todos los residentes de Internet. Fundada por un grupo de creyentes en la cadena de bloques que han participado activamente en esta industria desde 2013, YBB siempre está dispuesta a ayudar a los proyectos en etapas iniciales a evolucionar de 0 a 1. Valoramos la innovación, la pasión autodirigida y los productos orientados al usuario, al tiempo que reconocemos el potencial de las criptomonedas y las aplicaciones de la cadena de bloques.

Sitio web | Twi: @YBBCapital

Descargo de responsabilidad:

  1. Este artículo es una reimpresión de [YBB Capital]. Todos los derechos de autor pertenecen al autor original [Investigador de YBB Capital Zeke]. Si hay objeciones a esta reimpresión, por favor contactar a la Gate Learnequipo y ellos lo resolverán rápidamente.
  2. Descargo de responsabilidad por responsabilidad: Las opiniones y puntos de vista expresados en este artículo son únicamente los del autor y no constituyen asesoramiento de inversión.
  3. El equipo de Learn gate tradujo el artículo a otros idiomas. Está prohibido copiar, distribuir o plagiar los artículos traducidos a menos que se mencione.
Comece agora
Registe-se e ganhe um cupão de
100 USD
!