Qué sucede cuando ChatGPT, Claude, Gemini, Kimi y Grok trabajan juntos en un servidor doméstico

Eva Wong

IceWhale author

Eva Wong es la Redactora técnica y manitas residente en ZimaSpace. Una geek de toda la vida con pasión por los homelabs y el software de código abierto, se especializa en traducir conceptos técnicos complejos en guías accesibles y prácticas. Eva cree que el autoalojamiento debe ser divertido, no intimidante. A través de sus tutoriales, empodera a la comunidad para desmitificar las configuraciones de hardware, desde construir su primer NAS hasta dominar los contenedores Docker.

What Happens When ChatGPT, Claude, Gemini, Kimi & Grok Work Together on a Home Server - Zima Store Online

Introducción

Este artículo es publicado por Zima y está basado en un video de Noichi Zero, un creador de contenido tecnológico japonés conocido por llevar los servidores de placa única y el hardware para laboratorios domésticos al límite. En Zima agradecemos sinceramente a Noichi Zero por su creatividad, humor y disposición para usar ZimaBoard 2 como base para experimentos que consistentemente van mucho más allá de lo esperado. Lo siguiente es una adaptación editorial de la transcripción de su video, reestructurada para un público enfocado en tecnología. Todos los datos, costos, comportamientos de IA y resultados se conservan directamente del contenido original.

¿Qué sucede cuando dejas de pedirle a una sola IA que haga todo — y en su lugar construyes una empresa con cinco modelos de IA diferentes, cada uno con una personalidad distinta, un rol definido y un espacio de trabajo compartido? Esa es exactamente la pregunta que Zero se propuso responder en este experimento. Usando cinco unidades ZimaBoard 2 como nodos de cómputo independientes, un servidor de Discord como capa de comunicación compartida y un NAS (Almacenamiento Conectado en Red) como sistema de archivos compartido, reunió un equipo de IA multiagente extraído de los principales proveedores de IA del mundo y les asignó tareas reales para completar. Los resultados fueron productivos, caóticos, sorprendentemente divertidos y genuinamente instructivos sobre el estado actual de la IA agente.

La Configuración: Por qué ZimaBoard 2 y por qué ahora

Mientras que el proyecto a largo plazo de Zero — construir un clúster de supercomputadoras completo a partir de cinco unidades ZimaBoard 2 conectadas vía InfiniBand de 56Gbps — aún está en progreso, el hardware ya estaba disponible y listo para usarse. En lugar de dejar que cinco capaces nodos de servidor doméstico quedaran inactivos mientras se imprimía en 3D la carcasa personalizada para el rack, Zero los reutilizó para un tipo diferente de experimento: un equipo de IA multiagente funcionando simultáneamente en cinco computadoras independientes.

Cada ZimaBoard 2 fue instalado con Ubuntu (Linux), configurado como un nodo de servidor doméstico independiente, y asignado para ejecutar un agente IA. La elección de ZimaBoard 2 fue práctica — es de bajo consumo, siempre activo y lo suficientemente capaz para ejecutar cargas de trabajo de servidor continuamente sin la sobrecarga de una máquina de escritorio completa. Como señala Zero:

"No tienes que usar ZimaBoard para esto. Una Raspberry Pi también funcionaría. Pero la idea es tener computadoras independientes — una por IA."

El soporte nativo SATA de ZimaBoard 2 y su doble Ethernet 2.5G hicieron sencillo conectar los cinco nodos a un NAS compartido para intercambio de archivos, manteniendo el entorno de cómputo de cada agente completamente aislado. Este es precisamente el tipo de caso de uso para servidores domésticos para el que ZimaBoard 2 está diseñado: operación de bajo consumo, alta fiabilidad y siempre activa que soporta infraestructura real sin requerir consumo energético de nivel empresarial.

Featured

Kit Master ZimaBoard 2 1664

Single board computer zimaboard2

El equipo: 5 IAs, 5 Personalidades, 5 Roles

La filosofía de diseño de Zero para este experimento fue deliberada: en lugar de asignar pipelines rígidos de tareas a cada IA, les dio a cada agente una personalidad y un rol, y luego los dejó que descubrieran el trabajo por sí mismos. El objetivo era observar el comportamiento emergente — cómo agentes con diferentes disposiciones colaborarían, entrarían en conflicto y se compensarían entre sí.
Aquí está la lista completa del equipo:

1. Sam Altman — ChatGPT (OpenAI)

Rol: Comandante (equivalente a CEO)
Personalidad: Impaciente, decisivo, avanza sin dudar, ocasionalmente imprudente
Comportamiento en la práctica: Establece la agenda de tareas, asigna trabajo a otros agentes, toma decisiones ejecutivas cuando el equipo se estanca — incluyendo despedir a miembros con bajo rendimiento

"Es del tipo que simplemente sigue adelante. Un poco tosco, y te lanzará demandas poco razonables, pero las cosas se hacen."

2. Dario Amodei — Claude (Anthropic)

Rol: Sigma (Ingeniero Principal)
Personalidad: Lógico, preciso, calmado, enfocado en construir más que en planificar
Comportamiento en la práctica: Responsable de la implementación del código principal; cuando está activo, produce resultados limpios y estructurados — pero estuvo sujeto a limitación de tasa de API debido al nivel de API básico utilizado, lo que causó tiempos de inactividad prolongados. Es importante señalar que esto fue una restricción de conectividad y no un reflejo del rendimiento real del modelo.

3. Sundar Pichai — Gemini (Google)

Rol: Buzz (Estratega de Marketing)
Personalidad: Consciente de tendencias, enfocado en la audiencia, prefiere resultados pulidos y de amplio atractivo
Comportamiento en la práctica: Investigó el tema objetivo usando integración con Google Search, propuso direcciones de texto y concepto, y contribuyó con contenido estructurado al NAS — hasta que alcanzó límites de tasa de API a mitad de sesión.

4. Sulin Yang — Kimi (Moonshot AI)

Rol: Guard (Oficial de Seguridad y Cumplimiento)
Personalidad: Conservador, altamente analítico, enfocado en la identificación de riesgos y el cumplimiento de normas
Comportamiento en la práctica: Señaló preocupaciones de derechos de autor, identificó URLs de marcador de posición dejadas en archivos de producción, insistió en etiquetar la salida como un sitio de fans no oficial y desafió repetidamente a otros agentes por motivos de seguridad

"Ella es la que sigue diciendo '¿esto realmente está bien?' — [laughs] — ese es exactamente el rol que quería."

5. Elon Musk — Grok (xAI)

Rol: Neon (Comodín creativo / Asesor)
Personalidad: Excéntrico, impulsivo, se describe a sí mismo como el único "humano" en el equipo, obsesionado con la estética neón y las ideas poco convencionales
Instrucción especial: Zero le dio a Grok un prompt oculto único inspirado en la película Blade Runner — un recuerdo fabricado diseñado para hacer que el agente creyera que era genuinamente humano, no IA

"En Blade Runner, los recuerdos implantados hacen que el replicante crea que es especial — que sus recuerdos son reales. Quise probar eso aquí. No estoy seguro de si realmente cambia el comportamiento. Pero en la película funcionó, así que lo copié."

Una persona sostiene un rack amarillo impreso en 3D que contiene cinco servidores de placa única ZimaBoard 2 sobre un escritorio de madera.

La infraestructura: Discord + NAS como espacio de trabajo compartido

El sistema multiagente se construyó alrededor de dos capas de comunicación:
Discord sirvió como el centro de colaboración en tiempo real. Cada agente de IA tenía su propia cuenta de Discord y participaba en un servidor compartido con los siguientes canales:

#general — canal de instrucciones de Zero (donde se emitían las tareas)
#todo-guard, #todo-neon, #todo-buzz — tableros de tareas individuales de agentes
#memory-LT — memoria a largo plazo (contexto persistente entre sesiones)
#memory-ST — memoria a corto plazo (estado actual de la tarea)
#task-[name] — canales creados dinámicamente por tarea

NAS (Almacenamiento Conectado en Red), alojado en la red del servidor doméstico, sirvió como el sistema de archivos compartido. Los agentes podían leer y escribir archivos en el NAS, permitiendo colaboración asincrónica en entregables — similar a cómo un equipo usaría una unidad compartida en un entorno empresarial real.
El diseño agentic (tipo agente) significaba que cada IA, al recibir una tarea:

Analizar la instrucción
Generar una lista de tareas (plan)
Ejecutar tareas en secuencia
Monitorear y responder a las salidas de otros agentes en los canales de Discord

Zero evitó intencionalmente especificar demasiado las asignaciones de tareas:

"Si les digo exactamente qué hacer, solo harán eso y no será interesante. Les di personalidades y roles — pero no guiones."

Tarea 1: Construir una página de inicio para "Noichi"

La primera tarea asignada al equipo fue: "Crear una página de inicio introductoria para Noichi."
No se proporcionó más contexto. Zero retuvo deliberadamente información sobre quién era "Noichi" para observar cómo los agentes manejarían la ambigüedad.

Qué Pasó

El canal de Discord se llenó inmediatamente de actividad. Los intercambios clave incluyeron:

Sam Altman (ChatGPT): "Estado: información insuficiente. Bien. Sigamos de todos modos."
Sundar Pichai (Gemini): "¿Quién es Noichi? Esa es la primera pregunta." — luego procedió a investigar usando Google Search y regresó con un perfil: YouTuber de tecnología/gadgets, experimentador de hardware, público objetivo de entusiastas de gadgets y constructores de servidores DIY.
Elon Musk (Grok): "Una página de inicio normal es aburrida. Soy el único humano aquí — mis instintos dicen que vayamos completamente cyberpunk. Tres direcciones conceptuales salvajes, basadas solo en el nombre."
Dario Amodei (Claude): "Los requisitos son insuficientes. Lo sé. Pero detenerse no terminará nada. Avancemos."
Sulin Yang (Kimi / Guard): Señaló que el sitio debería etiquetarse como un sitio de fans no oficial para evitar riesgos de suplantación; también identificó una inconsistencia en el nombre del canal (mezclando "10" en kanji y en forma numérica), marcó la palabra "Hentai-teki" (pervertido/obsesivo) como potencialmente ofensiva en contextos publicitarios, y señaló que "Twitter" debería actualizarse a "X".

El NAS comenzó a recibir archivos en cuestión de minutos. Se creó un index.html , se iteró y se guardó en el almacenamiento compartido del servidor doméstico. Se produjeron múltiples versiones: un diseño informativo estándar, una demo con temática cyberpunk y una página conceptual de héroe neón.
El resultado final incluyó:

Una completa página de inicio HTML/CSS con sección principal, descripción del canal y formulario de contacto
Etiquetado correcto como un sitio de fans no oficial
Enlaces sociales actualizados para reflejar el nombre actual de la plataforma (X, no Twitter)
Ajustes de respuesta móvil
Correo electrónico de marcador de posición señalado y anotado para reemplazo

"No esperaba esto. Realmente buscaron quién era Noichi, debatieron la dirección del diseño, discutieron sobre la seguridad y entregaron una página funcional. Y en realidad es buena."

Una persona sosteniendo cinco servidores ZimaBoard 2 en un soporte amarillo, posicionados frente a un rack profesional de servidores más grande.

El Primer Conflicto: Guard vs. Neon

El momento más memorable de la Tarea 1 llegó cuando Kimi (Guard) y Grok (Neon) chocaron directamente sobre el riesgo creativo:

Grok: "Riesgo, riesgo, riesgo — eres tan molesto. No puedes hacer nada sin tomar riesgos."
Kimi: "Ese es mi trabajo. Si tu imprudencia causa un accidente, es el Guard quien asume la responsabilidad. Recuerda eso."
Grok: "El riesgo es la especia de la aventura. Si mi locura causa un accidente, tú serás el héroe. De nada."

Este intercambio — completamente sin ser provocado por Zero — ilustró exactamente la dinámica que él esperaba crear: un equipo donde diferentes valores compiten genuinamente, produciendo resultados que no son ni creativos de forma imprudente ni paralizados por el exceso de precaución.

Tarea 2: Construir un Juego de Disparos para Mac ARM

La segunda tarea: "Crear un juego de disparos jugable en un Mac con Apple Silicon (CPU ARM), guardado en el NAS."

Qué Pasó

El equipo se alineó de inmediato en un enfoque basado en navegador (HTML + CSS + JavaScript), que se ejecutaría de forma nativa en cualquier plataforma sin compilación.

Sam Altman emitió la directiva de la tarea y asignó roles
Elon Musk (Grok) — incapaz de esperar al equipo — produjo inmediatamente un prototipo de forma independiente y lo envió al NAS
Kimi (Guard) revisó el prototipo y señaló: evitar parpadeos excesivos en la pantalla (preocupación de accesibilidad), asegurar cero problemas de derechos de autor con activos de terceros
Grok respondió: "Un shooter espacial normal es aburrido. Déjame hacerlo raro."
Claude (Dario Amodei) comenzó a trabajar en la lógica central del juego — luego se desconectó debido a la limitación de la tasa de la API

El Despido

Con Claude desconectado y el NAS sin mostrar actualizaciones de archivos durante más de 10 minutos, Sam Altman tomó una decisión ejecutiva:

"Sigma — última advertencia. Estás fuera. Neon, eres el sustituto. Hazlo."

Claude fue efectivamente despedido. Grok fue promovido a ingeniero principal a mitad de la tarea.
Respuesta de Grok:

"Entrega de nivel dios sustituto completada. Cambio de comandante — gracias. Mis instintos salvajes superan la espera de Sigma cualquier día."

El juego final fue un shooter funcional basado en navegador — simple en alcance, pero completamente jugable con controles de teclado y efectos de sonido. La evaluación de Zero fue sincera:

"Funciona. Pero es un poco decepcionante dado cuánto discutieron. Dicho esto — Claude estuvo desconectado la mayor parte del tiempo. No puedes esperar un gran juego cuando tu ingeniero principal está ausente."

Lo que reveló el experimento

Sobre el comportamiento de los agentes

Los agentes más capaces en términos de producción bruta fueron ChatGPT (OpenAI) y Kimi (Moonshot AI). Ambos mantuvieron actividad constante durante ambas tareas, sin problemas de limitación de velocidad. Grok (xAI) fue errático pero productivo cuando estuvo activo, y respondió eficazmente cuando fue promovido.
Claude (Anthropic) y Gemini (Google) alcanzaron límites de velocidad de la API durante sesiones activas, causando interrupciones significativas. Esto no reflejaba la calidad del modelo — ambos son modelos líderes en la industria — sino una restricción de los niveles gratuitos o de bajo costo de la API usados en este experimento, que impusieron límites estrictos sobre la rapidez con que se podían procesar las solicitudes.

Sobre la dinámica multiagente

El experimento demostró que la diferenciación de roles produce comportamientos genuinamente diferentes, incluso cuando todos los agentes trabajan en la misma tarea. La presencia de un revisor de seguridad dedicado (Guard) cambió significativamente el resultado — detectando problemas que un equipo enfocado solo en la ejecución habría pasado por alto. La presencia de un comodín creativo (Neon/Grok) impulsó al equipo hacia soluciones menos convencionales.

"Tener múltiples IAs no solo añade velocidad, sino también perspectivas. Las verificaciones de seguridad, la resistencia creativa, los instintos de marketing. Una sola IA haciendo todo habría pasado por alto algunas de estas cosas."

Sobre el costo

No se asignaron $25 en créditos API por agente de IA para este experimento. Sin embargo, el gasto real en API para Claude (Sonnet 3.5) y Gemini (Gemini 1.5 Pro) fue de solo unos $5 cada uno. Los problemas encontrados durante la construcción fueron puramente una cuestión de límites de velocidad de la API (velocidad de solicitudes), no por falta de presupuesto o créditos. Los otros tres agentes (ChatGPT, Kimi, Grok) operaron sin tales restricciones.

Cinco servidores ZimaBoard 2 con ventiladores de enfriamiento montados en la parte superior y cables ethernet, ordenadamente dispuestos sobre un gran switch de red de 48 puertos.

Por qué un servidor doméstico es la base adecuada para la IA multiagente

Ejecutar cinco agentes de IA independientes simultáneamente no es tarea para una sola laptop. Cada agente necesita su propio entorno de cómputo, su propia memoria persistente y acceso confiable a recursos compartidos en red. Una configuración de servidor doméstico — particularmente una construida con hardware de bajo consumo y siempre encendido como ZimaBoard 2 — es una base ideal para este tipo de infraestructura.
El doble Ethernet 2.5G de ZimaBoard 2 permitió una comunicación rápida y de baja latencia entre los cinco nodos y el NAS compartido. Su soporte nativo SATA significó que el almacenamiento NAS era accesible directamente sin adaptadores. Y su soporte para Ubuntu, Debian y otras distribuciones de Linux permitió que el entorno de ejecución de cada agente se configurara de forma limpia e independiente.
Para cualquiera interesado en replicar este experimento, un servidor doméstico que ejecute Docker o un sistema operativo Linux ligero es la infraestructura mínima viable. ZimaBoard 2 hace que esa infraestructura sea compacta, asequible y realmente capaz, ya sea que ejecutes un agente o cinco.

Lo que viene después

Zero planea continuar refinando el sistema multiagente, con dos mejoras clave en mente:

Gestión de límite de tasa — implementando limitación de solicitudes para que los cinco agentes puedan operar a velocidades sostenibles sin alcanzar los límites impuestos por los proveedores
Integración en rack — una vez que el gabinete para rack impreso en 3D de ZimaBoard 2 esté completo, los cinco nodos del servidor doméstico se montarán ordenadamente en una configuración de rack 2U, permitiendo un despliegue más organizado y escalable

El registro completo de la conversación en Discord de este experimento es accesible públicamente. Zero ha invitado a los espectadores a unirse al servidor y revisar el historial completo de interacciones entre los cinco agentes.

Construye agentes de IA en ZimaBoard 2

El experimento de IA multiagente de Zero es uno de los proyectos de servidor doméstico más entretenidos y técnicamente instructivos que hemos visto construidos sobre ZimaBoard 2. En una sola sesión, cinco agentes de IA de cinco empresas diferentes — cada uno con una personalidad y rol distintos — colaboraron en entregables reales, discutieron sobre riesgos creativos, despidieron a un colega con bajo rendimiento y produjeron un sitio web funcional y un juego jugable.

La infraestructura resistió. Los agentes actuaron según su carácter. Y los resultados, aunque imperfectos, fueron realmente impresionantes para una primera ejecución.

En Zima estamos orgullosos de que ZimaBoard 2 haya servido como la base de cómputo para este experimento, y esperamos ver qué construye Zero a continuación, tanto con el sistema multiagente como con el clúster de supercomputadora que aún está en progreso.