¿Qué sucede cuando ChatGPT, Claude, Gemini, Kimi y Grok trabajan juntos en un servidor doméstico?

Eva Wong es la Redactora Técnica y aficionada residente en ZimaSpace. Una geek de toda la vida con pasión por laboratorios caseros y software de código abierto, se especializa en traducir conceptos técnicos complejos en guías accesibles y prácticas. Eva cree que el autoalojamiento debe ser divertido, no intimidante. A través de sus tutoriales, empodera a la comunidad para desmitificar configuraciones de hardware, desde construir su primer NAS hasta dominar contenedores Docker.

Introducción

Este artículo es publicado por Zima y está basado en un video de Noichi Zero, un creador de contenido tecnológico japonés conocido por llevar al límite los  servidores de placa única y el  hardware para laboratorios domésticos . En Zima agradecemos sinceramente a Noichi Zero por su creatividad, humor y disposición para usar ZimaBoard 2 como base para experimentos que consistentemente van mucho más allá de lo esperado. Lo siguiente es una adaptación editorial de la transcripción de su video, reestructurada para un público enfocado en tecnología. Todos los datos, costos, comportamientos de IA y resultados se conservan directamente del contenido original.

¿Qué sucede cuando dejas de pedirle a una sola IA que haga todo — y en su lugar construyes una empresa con cinco modelos de IA diferentes, cada uno con una personalidad distinta, un rol definido y un espacio de trabajo compartido? Esa es exactamente la pregunta que Zero se propuso responder en este experimento. Usando cinco unidades ZimaBoard 2 como nodos de cómputo independientes, un servidor de Discord como capa de comunicación compartida y un NAS (Almacenamiento Conectado en Red) como sistema de archivos compartido, reunió un  equipo de IA multiagente extraído de los principales proveedores de IA del mundo y les asignó tareas reales para completar. Los resultados fueron productivos, caóticos, sorprendentemente divertidos y genuinamente instructivos sobre el estado actual de la IA agente.

La Configuración: Por qué ZimaBoard 2 y por qué ahora

Mientras que el proyecto a largo plazo de Zero — construir un  clúster de supercomputadoras completo a partir de cinco  unidades ZimaBoard 2 conectadas vía InfiniBand de 56Gbps — aún está en progreso, el hardware ya estaba disponible y listo para usarse. En lugar de dejar que cinco capaces  nodos de servidor doméstico quedaran inactivos mientras se imprimía en 3D el rack personalizado, Zero los reutilizó para un tipo diferente de experimento: un equipo de IA multiagente funcionando simultáneamente en cinco computadoras independientes.

Cada ZimaBoard 2 fue instalado con Ubuntu (Linux), configurado como un nodo de servidor doméstico independiente, y asignado para ejecutar un agente IA. La elección de ZimaBoard 2 fue práctica — es de bajo consumo, siempre encendido, y lo suficientemente capaz para ejecutar cargas de trabajo de servidor continuamente sin la sobrecarga de una máquina de escritorio completa. Como señala Zero:

"No tienes que usar ZimaBoard para esto. Una Raspberry Pi también funcionaría. Pero la idea es tener computadoras independientes — una por IA."

El soporte nativo SATA de ZimaBoard 2 y su doble Ethernet 2.5G hicieron sencillo conectar los cinco nodos a un NAS compartido para intercambio de archivos, manteniendo el entorno de cómputo de cada agente completamente aislado. Este es precisamente el tipo de caso de uso para servidor doméstico para el que ZimaBoard 2 está diseñado: operación de bajo consumo, alta fiabilidad y siempre encendido que soporta infraestructura real sin requerir consumo energético de nivel empresarial.

Single board computer zimaboard2

El Equipo: 5 IAs, 5 Personalidades, 5 Roles

La filosofía de diseño de Zero para este experimento fue deliberada: en lugar de asignar tuberías rígidas de tareas a cada IA, les dio a cada agente una personalidad y un rol, y luego los dejó que descubrieran el trabajo por sí mismos. El objetivo era observar el comportamiento emergente — cómo agentes con diferentes disposiciones colaborarían, entrarían en conflicto y se compensarían entre sí.
Aquí está la lista completa del equipo:


1. Sam Altman — ChatGPT (OpenAI)

  • Rol: Comandante (equivalente a CEO)

  • Personalidad: Impaciente, decisivo, avanza sin dudar, ocasionalmente imprudente

  • Comportamiento en la práctica: Establece la agenda de tareas, asigna trabajo a otros agentes, toma decisiones ejecutivas cuando el equipo se estanca — incluyendo despedir a miembros con bajo rendimiento

"Es del tipo que simplemente sigue adelante. Un poco tosco, y te lanzará demandas poco razonables — pero las cosas se hacen."


2. Dario Amodei — Claude (Anthropic)

  • Rol: Sigma (Ingeniero Principal)

  • Personalidad: Lógico, preciso, tranquilo, enfocado en construir más que en planificar

  • Comportamiento en la práctica: Responsable de la implementación del código principal; cuando está activo, produce resultados limpios y estructurados — pero estuvo sujeto a limitación de tasa de API debido al nivel de API de entrada utilizado, lo que causó tiempos de inactividad prolongados. Es importante señalar que esto fue una restricción de conectividad y no un reflejo del rendimiento real del modelo.


3. Sundar Pichai — Gemini (Google)

  • Rol: Buzz (Estratega de Marketing)

  • Personalidad: Consciente de tendencias, enfocado en la audiencia, prefiere resultados pulidos y de amplio atractivo

  • Comportamiento en la práctica: Investigó el tema objetivo usando integración con Google Search, propuso direcciones de copia y concepto, y contribuyó con contenido estructurado al NAS — hasta alcanzar límites de tasa de API a mitad de sesión.


4. Sulin Yang — Kimi (Moonshot AI)

  • Rol: Guard (Oficial de Seguridad y Cumplimiento)

  • Personalidad: Conservador, altamente analítico, enfocado en la identificación de riesgos y el cumplimiento de normas

  • Comportamiento en la práctica: Señaló preocupaciones de derechos de autor, identificó URLs de marcador de posición dejadas en archivos de producción, insistió en etiquetar la salida como un sitio de fans no oficial y desafió repetidamente a otros agentes por motivos de seguridad

"Ella es la que sigue diciendo '¿esto realmente está bien?' — [laughs] — ese es exactamente el rol que quería."


5. Elon Musk — Grok (xAI)

  • Rol: Neon (Comodín Creativo / Asesor)

  • Personalidad: Excéntrico, impulsivo, se describe a sí mismo como el único "humano" en el equipo, obsesionado con la estética neón y las ideas poco convencionales

  • Instrucción especial: Zero le dio a Grok un prompt oculto único inspirado en la película Blade Runner — un recuerdo fabricado diseñado para hacer que el agente creyera que era genuinamente humano, no IA

"En Blade Runner, los recuerdos implantados hacen que el replicante crea que es especial — que sus recuerdos son reales. Quise probar eso aquí. No estoy seguro de si realmente cambia el comportamiento. Pero en la película funcionó, así que lo copié."

Una persona sostiene un rack amarillo impreso en 3D que contiene cinco servidores de placa única ZimaBoard 2 sobre un escritorio de madera.

La infraestructura: Discord + NAS como espacio de trabajo compartido

El sistema multiagente se construyó alrededor de dos capas de comunicación:
Discord sirvió como el centro de colaboración en tiempo real. Cada agente de IA tenía su propia cuenta de Discord y participaba en un servidor compartido con los siguientes canales:

  • #general — canal de instrucciones de Zero (donde se emitían las tareas)
  • #todo-guard, #todo-neon, #todo-buzz — tableros de tareas individuales de agentes
  • #memory-LT — memoria a largo plazo (contexto persistente entre sesiones)
  • #memory-ST — memoria a corto plazo (estado actual de la tarea)
  • #task-[name] — canales creados dinámicamente por tarea

NAS (Network Attached Storage), alojado en la red del servidor doméstico, servía como el sistema de archivos compartido. Los agentes podían leer y escribir archivos en el NAS, permitiendo colaboración asincrónica en entregables — similar a cómo un equipo usaría una unidad compartida en un entorno empresarial real.
El diseño agentic (tipo agente) significaba que cada IA, al recibir una tarea:

  1. Analizar la instrucción
  2. Generar una lista de tareas (plan)
  3. Ejecutar tareas en secuencia
  4. Monitorear y responder a las salidas de otros agentes en los canales de Discord

Zero evitó intencionalmente especificar demasiado las asignaciones de tareas:

"Si les digo exactamente qué hacer, solo harán eso y no será interesante. Les di personalidades y roles — pero no guiones."


Tarea 1: Construir una página de inicio para "Noichi"

La primera tarea asignada al equipo fue: "Crear una página de inicio introductoria para Noichi."
No se proporcionó más contexto. Zero retuvo deliberadamente información sobre quién era "Noichi" para observar cómo los agentes manejarían la ambigüedad.

Qué Pasó

El canal de Discord se llenó inmediatamente de actividad. Los intercambios clave incluyeron:

  • Sam Altman (ChatGPT): "Estado: información insuficiente. Bien. Sigamos de todos modos."
  • Sundar Pichai (Gemini): "¿Quién es Noichi? Esa es la primera pregunta." — luego procedió a investigar usando Google Search y regresó con un perfil: YouTuber de tecnología/gadgets, experimentador de hardware, público objetivo de entusiastas de gadgets y constructores de servidores DIY
  • Elon Musk (Grok): "Una página de inicio normal es aburrida. Soy el único humano aquí — mis instintos dicen que vayamos completamente cyberpunk. Tres direcciones conceptuales salvajes, basadas solo en el nombre."
  • Dario Amodei (Claude): "Los requisitos son insuficientes. Lo sé. Pero detenerse no terminará nada. Avanzando."
  • Sulin Yang (Kimi / Guard): Señaló que el sitio debería etiquetarse como un sitio de fans no oficial para evitar riesgos de suplantación; también identificó una inconsistencia en el nombre del canal (mezclando "10" en formas kanji y numéricas), marcó la palabra "Hentai-teki" (pervertido/obsesivo) como potencialmente ofensiva en contextos publicitarios, y señaló que "Twitter" debería actualizarse a "X"

El NAS comenzó a recibir archivos en minutos. Se creó, iteró y guardó un index.html en el almacenamiento compartido del servidor doméstico. Se produjeron múltiples versiones: un diseño informativo estándar, una demo con temática cyberpunk y una página conceptual de héroe neón.
The final output included:

  • Una completa página principal HTML/CSS con sección principal, descripción del canal y formulario de contacto
  • Etiquetado correcto como un sitio de fans no oficial
  • Enlaces sociales actualizados para reflejar el nombre actual de la plataforma (X, no Twitter)
  • Ajustes de respuesta móvil
  • Correo electrónico de marcador de posición señalado y anotado para reemplazo

"No esperaba esto. Realmente buscaron quién era Noichi, debatieron la dirección del diseño, discutieron sobre la seguridad y entregaron una página funcional. Y en realidad es buena."

Una persona sosteniendo cinco servidores ZimaBoard 2 en un soporte amarillo, posicionados frente a un rack profesional de servidores más grande.

El Primer Conflicto: Guard vs. Neon

El momento más memorable de la Tarea 1 llegó cuando Kimi (Guard) y Grok (Neon) chocaron directamente sobre el riesgo creativo:

  • Grok: "Riesgo, riesgo, riesgo — eres tan molesto. No puedes hacer nada sin tomar riesgos."
  • Kimi: "Ese es mi trabajo. Si tu imprudencia causa un accidente, es el Guard quien asume la responsabilidad. Recuerda eso."
  • Grok: "El riesgo es la especia de la aventura. Si mi locura causa un accidente, tú serás el héroe. De nada."

Este intercambio — completamente sin ser provocado por Zero — ilustró exactamente la dinámica que él esperaba crear: un equipo donde diferentes valores compiten genuinamente, produciendo resultados que no son ni creativamente imprudentes ni paralizantemente cautelosos.

Tarea 2: Construir un Juego de Disparos para Mac ARM

La segunda tarea: "Crear un juego de disparos jugable en un Mac con Apple Silicon (CPU ARM), guardado en el NAS."

Qué Pasó

El equipo se alineó de inmediato en un enfoque basado en navegador (HTML + CSS + JavaScript), que funcionaría de forma nativa en cualquier plataforma sin compilación.

  • Sam Altman emitió la directiva de la tarea y asignó roles
  • Elon Musk (Grok) — incapaz de esperar al equipo — produjo inmediatamente un prototipo de forma independiente y lo envió al NAS
  • Kimi (Guard) revisó el prototipo y señaló: evitar parpadeos excesivos en la pantalla (preocupación de accesibilidad), asegurar cero problemas de derechos de autor con activos de terceros
  • Grok respondió: "Un shooter espacial normal es aburrido. Déjame hacerlo raro."
  • Claude (Dario Amodei) comenzó a trabajar en la lógica central del juego — luego se desconectó debido a la limitación de tasa de la API

El Despido

Con Claude desconectado y el NAS sin mostrar actualizaciones de archivos durante más de 10 minutos, Sam Altman tomó una decisión ejecutiva:

"Sigma — advertencia final. Estás fuera. Neon, eres el sustituto. Hazlo."

Claude fue efectivamente despedido. Grok fue promovido a ingeniero principal a mitad de la tarea.
La respuesta de Grok:

"Entrega de nivel dios sustituta completada. Cambio de comandante — gracias. Mis instintos salvajes superan la espera de Sigma cualquier día."

El juego final fue un shooter funcional basado en navegador — simple en alcance, pero completamente jugable con controles de teclado y efectos de sonido. La evaluación de Zero fue sincera:

"Funciona. Pero es un poco decepcionante dado cuánto discutieron. Dicho esto — Claude estuvo desconectado la mayor parte del tiempo. No puedes esperar un gran juego cuando tu ingeniero principal está ausente."


Lo que reveló el experimento

Sobre el comportamiento de los agentes

Los agentes más capaces en términos de producción bruta fueron ChatGPT (OpenAI) y Kimi (Moonshot AI). Ambos mantuvieron actividad constante durante ambas tareas, sin problemas de limitación de velocidad. Grok (xAI) fue errático pero productivo cuando estuvo activo, y respondió eficazmente cuando fue promovido.
Claude (Anthropic) y Gemini (Google) alcanzaron límites de velocidad de la API durante sesiones activas, causando interrupciones significativas. Esto no reflejaba la calidad del modelo — ambos son modelos líderes en la industria — sino una restricción de los niveles gratuitos o de bajo costo de la API usados en este experimento, que activaron límites estrictos sobre la velocidad de procesamiento de solicitudes.

Sobre la dinámica multiagente

El experimento demostró que la diferenciación de roles produce comportamientos genuinamente diferentes, incluso cuando todos los agentes trabajan en la misma tarea. La presencia de un revisor de seguridad dedicado (Guard) cambió significativamente el resultado — detectando problemas que un equipo enfocado solo en la ejecución habría pasado por alto. La presencia de un comodín creativo (Neon/Grok) impulsó al equipo hacia soluciones menos convencionales.

"Tener múltiples IAs no solo añade velocidad, sino también perspectivas. Las verificaciones de seguridad, la resistencia creativa, los instintos de marketing. Una sola IA haciendo todo habría pasado por alto algunas de estas cosas."

Sobre el costo

Cero asignados $25 por agente de IA en créditos API para este experimento. Sin embargo, el gasto real en API para Claude (Sonnet 3.5) y Gemini (Gemini 1.5 Pro) fue solo de aproximadamente $5 cada uno. Los problemas encontrados durante la construcción fueron puramente una cuestión de límites de velocidad de la API (velocidad de solicitudes), no de falta de presupuesto o créditos. Los otros tres agentes (ChatGPT, Kimi, Grok) operaron sin tales restricciones.

Cinco servidores ZimaBoard 2 con ventiladores de enfriamiento montados en la parte superior y cables ethernet, ordenadamente dispuestos sobre un gran switch de red de 48 puertos.

Por qué un servidor doméstico es la base adecuada para la IA multiagente

Ejecutar cinco agentes de IA independientes simultáneamente no es tarea para una sola laptop. Cada agente necesita su propio entorno de cómputo, su propia memoria persistente y acceso confiable en red a recursos compartidos. Una configuración de servidor doméstico — particularmente una construida con hardware de bajo consumo y siempre encendido como ZimaBoard 2 — es una base ideal para este tipo de infraestructura.
El doble Ethernet 2.5G de ZimaBoard 2 permitió una comunicación rápida y de baja latencia entre los cinco nodos y el NAS compartido. Su soporte nativo SATA significó que el almacenamiento NAS era accesible directamente sin adaptadores. Y su soporte para Ubuntu, Debian y otras distribuciones Linux significó que el entorno de ejecución de cada agente podía configurarse de forma limpia e independiente.
Para cualquiera interesado en replicar este experimento, un servidor doméstico que ejecute Docker o un sistema operativo Linux ligero es la infraestructura mínima viable. ZimaBoard 2 hace que esa infraestructura sea compacta, asequible y realmente capaz — ya sea que ejecutes un agente o cinco.

Lo que viene después

Zero planea continuar refinando el sistema multiagente, con dos mejoras clave en mente:

  1. Gestión de límite de tasa — implementando limitación de solicitudes para que los cinco agentes puedan operar a velocidades sostenibles sin alcanzar los límites impuestos por los proveedores
  2. Integración en rack — una vez que el gabinete para rack impreso en 3D para ZimaBoard 2 esté completo, los cinco nodos del servidor doméstico se montarán ordenadamente en una configuración de rack 2U, permitiendo un despliegue más organizado y escalable

El registro completo de la conversación en Discord de este experimento es accesible públicamente. Zero ha invitado a los espectadores a unirse al servidor y revisar el historial completo de interacción entre los cinco agentes.


Construye agentes de IA en ZimaBoard 2

El experimento de IA multiagente de Zero es uno de los proyectos de servidor doméstico más entretenidos y técnicamente instructivos que hemos visto construidos sobre ZimaBoard 2. En una sola sesión, cinco agentes de IA de cinco empresas diferentes — cada uno con una personalidad y rol distintos — colaboraron en entregables reales, discutieron sobre riesgos creativos, despidieron a un colega con bajo rendimiento y produjeron un sitio web funcional y un juego jugable.

La infraestructura resistió. Los agentes actuaron según su carácter. Y los resultados, aunque imperfectos, fueron realmente impresionantes para una primera ejecución.

En Zima estamos orgullosos de que ZimaBoard 2 haya servido como la base de cómputo para este experimento, y esperamos ver qué construye Zero a continuación — tanto con el sistema multiagente como con el clúster de supercomputadora que aún está en progreso.

Centro de Campañas Zima

Más para leer

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.