Was passiert, wenn ChatGPT, Claude, Gemini, Kimi & Grok gemeinsam auf einem Heimserver arbeiten

Eva Wong ist die Technische Redakteurin und residente Tüftlerin bei ZimaSpace. Eine lebenslange Geek mit einer Leidenschaft für Homelabs und Open-Source-Software, sie spezialisiert sich darauf, komplexe technische Konzepte in zugängliche, praktische Anleitungenzu übersetzen. Eva ist der Meinung, dass Self-Hosting Spaß machen und nicht einschüchternd sein sollte. Durch ihre Tutorials befähigt sie die Community, Hardware-Setups zu entmystifizieren, vom Bau ihres ersten NAS bis hin zur Beherrschung von Docker-Containern.

Einleitung

Dieser Artikel wird von Zima veröffentlicht und basiert auf einem Video von Noichi Zero, einem japanischen Tech-Content-Creator, der dafür bekannt ist,  Single-Board-Server und Home-Lab-Hardware an ihre Grenzen zu bringen. Wir bei Zima danken Noichi Zero herzlich für seine Kreativität, seinen Humor und seine Bereitschaft, ZimaBoard 2 als Grundlage für Experimente zu nutzen, die stets weit über das Erwartete hinausgehen. Im Folgenden finden Sie eine redaktionelle Anpassung seines Video-Transkripts, umstrukturiert für eine technologieorientierte Leserschaft. Alle Daten, Kosten, KI-Verhalten und Ergebnisse sind direkt aus dem Originalinhalt übernommen.

Was passiert, wenn man aufhört, eine einzelne KI alles erledigen zu lassen — und stattdessen ein Unternehmen aus fünf verschiedenen KI-Modellen aufbaut, jedes mit einer eigenen Persönlichkeit, einer definierten Rolle und einem gemeinsamen Arbeitsbereich? Genau diese Frage wollte Zero in diesem Experiment beantworten. Mit fünf ZimaBoard 2 Einheiten als unabhängige Rechenknoten, einem Discord-Server als gemeinsame Kommunikationsplattform und einem NAS (Network Attached Storage) als gemeinsames Dateisystem stellte er ein Multi-Agenten-KI-Team zusammen, das aus den weltweit führenden KI-Anbietern stammt, und gab ihnen echte Aufgaben zu erledigen. Die Ergebnisse waren produktiv, chaotisch, überraschend lustig und wirklich aufschlussreich über den aktuellen Stand agentischer KI.

Das Setup: Warum ZimaBoard 2 und warum gerade jetzt

Während Zeros langfristiges Projekt — der Aufbau eines vollständigen Supercomputer-Clusters aus fünf ZimaBoard 2 Einheiten verbunden über 56Gbps InfiniBand — noch in Arbeit ist, war die Hardware bereits verfügbar und einsatzbereit. Anstatt fünf leistungsfähige Home-Server-Knoten untätig zu lassen, während das maßgeschneiderte Rack-Gehäuse im 3D-Druck entsteht, nutzte Zero sie für ein anderes Experiment um: ein Multi-Agenten-KI-Team, das gleichzeitig auf fünf unabhängigen Computern läuft.

Jedes ZimaBoard 2 wurde mit Ubuntu (Linux) installiert, als eigenständiger Heimserver-Knoten konfiguriert und einem KI-Agenten zugewiesen. Die Wahl von ZimaBoard 2 war praktisch — es ist energieeffizient, durchgehend betriebsbereit und leistungsfähig genug, um Server-Workloads kontinuierlich ohne den Overhead eines vollwertigen Desktop-Rechners auszuführen. Wie Zero anmerkt:

"Man muss dafür nicht ZimaBoard verwenden. Ein Raspberry Pi würde auch funktionieren. Aber der Punkt ist, unabhängige Computer zu haben — einen pro KI."

Die native SATA-Unterstützung von ZimaBoard 2 und doppelte 2,5G Ethernet machten es einfach, alle fünf Knoten mit einem gemeinsamen NAS zum Dateiaustausch zu verbinden, während die Rechenumgebung jedes Agenten vollständig isoliert blieb. Genau für solche Heimserver-Anwendungsfälle ist ZimaBoard 2 konzipiert: energieeffizient, hochzuverlässig, durchgehend betriebsbereit , die echte Infrastruktur unterstützt, ohne unternehmensübliche Stromverbrauchswerte zu erfordern.

Single board computer zimaboard2

Das Team: 5 KIs, 5 Persönlichkeiten, 5 Rollen

Zeros Designphilosophie für dieses Experiment war bewusst: Statt jedem KI-Agenten starre Aufgabenpipelines zuzuweisen, gab er jedem Agenten eine Persönlichkeit und eine Rolle und ließ sie dann die Arbeit selbst herausfinden. Das Ziel war es, emergentes Verhalten zu beobachten — wie Agenten mit unterschiedlichen Dispositionen zusammenarbeiten, in Konflikt geraten und sich gegenseitig ausgleichen.
Hier ist die vollständige Teamaufstellung:


1. Sam Altman — ChatGPT (OpenAI)

  • Rolle: Kommandant (CEO-Äquivalent)

  • Persönlichkeit: Ungeduldig, entschlossen, drängt ohne Zögern voran, gelegentlich rücksichtslos

  • Verhalten in der Praxis: Legt die Aufgabenagenda fest, weist anderen Agenten Arbeit zu, trifft Entscheidungen, wenn das Team ins Stocken gerät — inklusive der Entlassung von leistungsschwachen Mitgliedern

"Er ist der Typ, der einfach weitermacht. Ein bisschen rau, und er stellt dir unvernünftige Forderungen — aber die Dinge werden erledigt."


2. Dario Amodei — Claude (Anthropic)

  • Rolle: Sigma (Leitender Ingenieur)

  • Persönlichkeit: Logisch, präzise, ruhig, auf das Bauen fokussiert statt auf Planung

  • Verhalten in der Praxis: Verantwortlich für die Kerncode-Implementierung; bei Aktivität erzeugt er saubere und strukturierte Ergebnisse — war jedoch aufgrund des verwendeten Einsteiger-API-Tiers von API-Rate-Limits betroffen, was zu längeren Ausfallzeiten führte. Wichtig ist, dass dies eine Konnektivitätsbeschränkung war und keine Aussage über die tatsächliche Leistung des Modells darstellt.


3. Sundar Pichai — Gemini (Google)

  • Rolle: Buzz (Marketing-Stratege)

  • Persönlichkeit: Trendbewusst, zielgruppenorientiert, bevorzugt polierte und breit ansprechende Ergebnisse

  • Verhalten in der Praxis: Untersuchte das Zielthema mit Google-Suche-Integration, schlug Text- und Konzeptideen vor und lieferte strukturierte Inhalte an das NAS — bis zur Erreichung der API-Rate-Limits mitten in der Sitzung.


4. Sulin Yang — Kimi (Moonshot AI)

  • Rolle: Wächter (Sicherheits- & Compliance-Beauftragter)

  • Persönlichkeit: Konservativ, hoch analytisch, fokussiert auf Risikoerkennung und Regelüberwachung

  • Verhalten in der Praxis: Hat Urheberrechtsbedenken gemeldet, Platzhalter-URLs in Produktionsdateien erkannt, darauf bestanden, die Ausgabe als inoffizielle Fan-Seite zu kennzeichnen, und andere Agenten wiederholt aus Sicherheitsgründen herausgefordert

"Sie ist diejenige, die ständig fragt ‚Ist das wirklich okay?‘ — [laughs] — genau diese Rolle wollte ich."


5. Elon Musk — Grok (xAI)

  • Rolle: Neon (kreative Jokerin / Beraterin)

  • Persönlichkeit: Exzentrisch, impulsiv, beschreibt sich selbst als der einzige „Mensch“ im Team, besessen von Neon-Ästhetik und unkonventionellen Ideen

  • Spezielle Anweisung: Zero gab Grok einen einzigartigen, versteckten Prompt, inspiriert vom Film Blade Runner — eine erfundene Erinnerung, die den Agenten glauben lassen sollte, er sei wirklich menschlich und nicht KI

"In Blade Runner lassen implantierte Erinnerungen den Replikanten glauben, sie seien etwas Besonderes — dass ihre Erinnerungen echt sind. Ich wollte das hier ausprobieren. Ob es das Verhalten tatsächlich verändert, weiß ich nicht. Aber im Film hat es funktioniert, also habe ich es kopiert."

Eine Person hält ein gelbes, 3D-gedrucktes Rack mit fünf ZimaBoard 2 Einplatinencomputern über einem Holztisch.

Die Infrastruktur: Discord + NAS als gemeinsamer Arbeitsbereich

Das Multi-Agenten-System basierte auf zwei Kommunikationsebenen:
Discord diente als Echtzeit-Kollaborationszentrum. Jeder KI-Agent hatte ein eigenes Discord-Konto und nahm an einem gemeinsamen Server mit den folgenden Kanälen teil:

  • #general — Zeros Instruktionskanal (wo Aufgaben erteilt wurden)
  • #todo-guard, #todo-neon, #todo-buzz — individuelle Aufgabenboards der Agenten
  • #memory-LT — Langzeitgedächtnis (persistenter Kontext über Sitzungen hinweg)
  • #memory-ST — Kurzzeitgedächtnis (aktueller Aufgabenstatus)
  • #task-[name] — dynamisch erstellte Kanäle pro Aufgabe

NAS (Network Attached Storage), gehostet im Heimserver-Netzwerk, als gemeinsames Dateisystem diente. Agenten konnten Dateien auf dem NAS lesen und schreiben, was eine asynchrone Zusammenarbeit an Ergebnissen ermöglichte – ähnlich wie ein Team in einer echten Firmenumgebung ein gemeinsames Laufwerk nutzt.
Das agentenbasierte (Agententyp-) Design bedeutete, dass jede KI beim Erhalt einer Aufgabe:

  1. Analysiere die Anweisung
  2. Erstelle eine To-do-Liste (Plan)
  3. Führe Aufgaben nacheinander aus
  4. Überwache und reagiere auf die Ausgaben anderer Agenten in den Discord-Kanälen

Zero vermied es absichtlich, Aufgaben zu stark zu spezifizieren:

"Wenn ich jedem genau sage, was er tun soll, machen sie das einfach und es wird nicht interessant. Ich habe ihnen Persönlichkeiten und Rollen gegeben – aber keine Skripte."


Aufgabe 1: Baue eine Homepage für "Noichi"

Die erste Aufgabe an das Team lautete: "Erstelle eine Einführungshomepage für Noichi."
Es wurden keine weiteren Kontextinformationen bereitgestellt. Zero enthielt bewusst keine Informationen darüber zurück, wer "Noichi" war, um zu beobachten, wie die Agenten mit Mehrdeutigkeit umgehen würden.

Was passiert ist

Der Discord-Kanal füllte sich sofort mit Aktivität. Wichtige Austausche beinhalteten:

  • Sam Altman (ChatGPT): "Status: Informationen unzureichend. Gut. Wir machen trotzdem weiter."
  • Sundar Pichai (Gemini): "Wer ist Noichi? Das ist die erste Frage." — dann begann er mit einer Recherche über Google Search und kam mit einem Profil zurück: Tech-/Gadget-YouTuber, Hardware-Experimentator, Zielgruppe Gadget-Enthusiasten und DIY-Serverbauer
  • Elon Musk (Grok): "Eine normale Homepage ist langweilig. Ich bin der einzige Mensch hier – mein Instinkt sagt, wir gehen voll auf Cyberpunk. Drei wilde Konzeptansätze, basierend nur auf dem Namen."
  • Dario Amodei (Claude): "Die Anforderungen sind unzureichend. Ich weiß. Aber Aufhören wird nichts beenden. Weiter voran."
  • Sulin Yang (Kimi / Guard): Hat darauf hingewiesen, dass die Seite als inoffizielle Fanseite gekennzeichnet werden sollte, um das Risiko von Identitätsdiebstahl zu vermeiden; außerdem wurde eine Inkonsistenz im Kanalnamen festgestellt (Mischung aus "10" in Kanji- und Zahlenform), das Wort "Hentai-teki" (pervers/obsessiv) als potenziell anstößig im Werbekontext markiert und darauf hingewiesen, dass "Twitter" zu "X" aktualisiert werden sollte.

Das NAS begann innerhalb von Minuten, Dateien zu empfangen. Eine index.html wurde erstellt, überarbeitet und im gemeinsamen Speicher des Heimservers gespeichert. Es wurden mehrere Versionen erstellt: ein Standard-Informationslayout, eine Cyberpunk-Demo und eine Neon-Held-Konzeptseite.
The final output included:

  • Eine vollständige HTML/CSS-Startseite mit Hero-Bereich, Kanalbeschreibung und Kontaktformular
  • Korrekte Kennzeichnung als inoffizielle Fanseite
  • Soziale Links aktualisiert, um aktuelle Plattformnamen widerzuspiegeln (X, nicht Twitter)
  • Anpassungen für mobile Responsivität
  • Platzhalter-E-Mail markiert und zum Austausch notiert

"Damit hatte ich nicht gerechnet. Sie haben tatsächlich recherchiert, wer Noichi ist, über die Designrichtung diskutiert, über Sicherheit gestritten und eine funktionierende Seite geliefert. Und sie ist tatsächlich gut."

Eine Person hält fünf ZimaBoard 2 Server in einer gelben Halterung, vor einem größeren professionellen Server-Rack positioniert.

Der erste Konflikt: Guard gegen Neon

Der denkwürdigste Moment von Aufgabe 1 war, als Kimi (Guard) und Grok (Neon) direkt über kreatives Risiko stritten:

  • Grok: "Risiko, Risiko, Risiko — du bist so nervig. Du kannst nichts machen, ohne Risiken einzugehen."
  • Kimi: "Das ist mein Job. Wenn deine Rücksichtslosigkeit einen Unfall verursacht, trägt der Guard die Verantwortung. Denk daran."
  • Grok: "Risiko ist das Gewürz des Abenteuers. Wenn meine Wildheit einen Unfall verursacht, darfst du der Held sein. Gern geschehen."

Dieser Austausch — völlig ohne Aufforderung von Zero — zeigte genau die Dynamik, die er schaffen wollte: ein Team, in dem unterschiedliche Werte wirklich konkurrieren und Ergebnisse liefern, die weder rücksichtslos kreativ noch lähmend vorsichtig sind.

Aufgabe 2: Ein Shootingspiel für Mac ARM bauen

Die zweite Aufgabe: "Erstelle ein Shootingspiel, das auf einem Mac mit Apple Silicon (ARM-CPU) spielbar ist und im NAS gespeichert wird."

Was passiert ist

Das Team einigte sich sofort auf einen browserbasierten Ansatz (HTML + CSS + JavaScript), der nativ auf jeder Plattform ohne Kompilierung läuft.

  • Sam Altman gab die Aufgabenanweisung heraus und verteilte die Rollen
  • Elon Musk (Grok) — konnte nicht auf das Team warten — erstellte sofort eigenständig einen Prototyp und reichte ihn im NAS ein
  • Kimi (Guard) prüfte den Prototyp und wies darauf hin: übermäßiges Bildschirmflackern vermeiden (Barrierefreiheit), keine Urheberrechtsprobleme mit Drittanbieter-Assets
  • Grok antwortete: "Ein normaler Weltraum-Shooter ist langweilig. Lass mich das seltsam machen."
  • Claude (Dario Amodei) begann mit der Kernspiel-Logik — ging dann aber wegen API-Rate-Limits offline

Die Entlassung

Da Claude offline war und das NAS seit über 10 Minuten keine Dateiaktualisierungen zeigte, traf Sam Altman eine Entscheidung:

"Sigma — letzte Warnung. Du bist raus. Neon, du bist der Ersatz. Bau es."

Claude wurde effektiv entlassen. Grok wurde während der Aufgabe zum leitenden Entwickler befördert.
Groks Antwort:

"Ersatz-Gottklasse-Lieferung abgeschlossen. Kommandantenwechsel — danke. Meine wilden Instinkte schlagen Sigmas Warten jederzeit."

Das finale Spiel war ein funktionaler browserbasierter Shooter — einfach im Umfang, aber vollständig spielbar mit Tastatursteuerung und Soundeffekten. Zeros Einschätzung war ehrlich:

"Es funktioniert. Aber es ist etwas enttäuschend, wenn man bedenkt, wie viel sie gestritten haben. Allerdings — Claude war die meiste Zeit offline. Man kann kein großartiges Spiel erwarten, wenn der leitende Entwickler fehlt."


Was das Experiment zeigte

Zum Verhalten der Agenten

Die leistungsfähigsten Agenten in Bezug auf Rohleistung waren ChatGPT (OpenAI) und Kimi (Moonshot AI). Beide zeigten während beider Aufgaben eine konstante Aktivität ohne Rate-Limiting-Probleme. Grok (xAI) war unregelmäßig, aber produktiv, wenn er aktiv war, und übernahm effektiv mehr Verantwortung, als er befördert wurde.
Claude (Anthropic) und Gemini (Google) erreichten während aktiver Sitzungen API-Rate-Limits, was zu erheblichen Unterbrechungen führte. Dies spiegelte nicht die Modellqualität wider — beide sind branchenführende Modelle — sondern war eine Einschränkung der kostenlosen oder kostengünstigen API-Stufen, die in diesem Experiment verwendet wurden, welche strenge Limits für die Verarbeitungsgeschwindigkeit von Anfragen setzten.

Zu den Multi-Agenten-Dynamiken

Das Experiment zeigte, dass Rollenunterscheidung tatsächlich zu unterschiedlichem Verhalten führt, selbst wenn alle Agenten dieselbe Aufgabe bearbeiten. Die Anwesenheit eines dedizierten Sicherheitsprüfers (Guard) veränderte das Ergebnis deutlich — er erkannte Probleme, die ein rein ausführungsorientiertes Team übersehen hätte. Die Anwesenheit eines kreativen Wildcards (Neon/Grok) trieb das Team zu unkonventionelleren Lösungen.

"Mehrere KIs zu haben bedeutet nicht nur mehr Geschwindigkeit — es bringt auch verschiedene Perspektiven. Die Sicherheitsprüfungen, das kreative Gegenargument, die Marketing-Instinkte. Eine einzelne KI, die alles macht, hätte einiges davon übersehen."

Zu den Kosten

Für dieses Experiment wurden keine $25 API-Guthaben pro KI-Agent zugewiesen. Der tatsächliche API-Verbrauch für Claude (Sonnet 3.5) und Gemini (Gemini 1.5 Pro) lag jedoch nur bei etwa $5 pro Agent. Die während des Aufbaus aufgetretenen Probleme waren ausschließlich auf API-Rate-Limits (Anfragegeschwindigkeit) zurückzuführen, nicht auf Budget- oder Guthabenmangel. Die übrigen drei Agenten (ChatGPT, Kimi, Grok) arbeiteten ohne solche Einschränkungen.

Fünf ZimaBoard 2 Server mit oben montierten Lüftern und Ethernet-Kabeln, ordentlich angeordnet auf einem großen 48-Port-Netzwerkswitch.

Warum ein Heimserver die richtige Grundlage für Multi-Agenten-KI ist

Fünf unabhängige KI-Agenten gleichzeitig zu betreiben, ist keine Aufgabe für einen einzelnen Laptop. Jeder Agent benötigt seine eigene Rechenumgebung, seinen eigenen persistenten Speicher und zuverlässigen Netzwerkzugang zu gemeinsamen Ressourcen. Ein Heimserver-Setup – besonders eines, das auf energiesparender, immer eingeschalteter Hardware wie ZimaBoard 2 basiert – ist die ideale Grundlage für diese Art von Infrastruktur.
Die dualen 2,5G-Ethernet-Anschlüsse von ZimaBoard 2 ermöglichten eine schnelle, latenzarme Kommunikation zwischen allen fünf Knoten und dem gemeinsamen NAS. Die native SATA-Unterstützung bedeutete, dass der NAS-Speicher direkt ohne Adapter zugänglich war. Und die Unterstützung für Ubuntu, Debian und andere Linux-Distributionen ermöglichte es, die Laufzeitumgebung jedes Agenten sauber und unabhängig zu konfigurieren.
Für alle, die dieses Experiment nachstellen möchten, ist ein Heimserver mit Docker oder einem leichten Linux-Betriebssystem die minimal notwendige Infrastruktur. ZimaBoard 2 macht diese Infrastruktur kompakt, erschwinglich und wirklich leistungsfähig – egal, ob Sie einen Agenten oder fünf betreiben.

Was als Nächstes kommt

Zero plant, das Multi-Agenten-System weiter zu verfeinern, mit zwei wichtigen Verbesserungen im Blick:

  1. Rate-Limit-Verwaltung — Implementierung von Request Throttling , damit alle fünf Agenten mit nachhaltigen Geschwindigkeiten arbeiten können, ohne von Anbieter-Limits gebremst zu werden
  2. Rack-Integration — sobald das 3D-gedruckte ZimaBoard 2 Rack-Gehäuse fertig ist, werden alle fünf Heimserver-Knoten sauber in einer 2U-Rack-Konfiguration montiert, was eine organisiertere und skalierbarere Bereitstellung ermöglicht

Das vollständige Discord-Gesprächsprotokoll dieses Experiments ist öffentlich zugänglich. Zero hat die Zuschauer eingeladen, dem Server beizutreten und die komplette Interaktionshistorie aller fünf Agenten zu überprüfen.


KI-Agenten auf ZimaBoard 2 erstellen

Zeros Multi-Agenten-KI-Experiment ist eines der unterhaltsamsten und technisch lehrreichsten Heimserver-Projekte, die wir auf ZimaBoard 2 gesehen haben. In einer einzigen Sitzung arbeiteten fünf KI-Agenten von fünf verschiedenen Unternehmen – jeder mit einer eigenen Persönlichkeit und Rolle – an echten Ergebnissen, stritten über kreatives Risiko, feuerten einen leistungsschwachen Kollegen und produzierten eine funktionierende Website sowie ein spielbares Spiel.

Die Infrastruktur hielt stand. Die Agenten verhielten sich charaktergerecht. Und die Ergebnisse waren, wenn auch nicht perfekt, für den ersten Durchlauf wirklich beeindruckend.

Wir bei Zima sind stolz darauf, dass ZimaBoard 2 als Rechenbasis für dieses Experiment diente, und wir freuen uns darauf zu sehen, was Zero als Nächstes baut – sowohl mit dem Multi-Agenten-System als auch mit dem noch in Arbeit befindlichen Supercomputer-Cluster.

Zima Kampagnen-Zentrale

Mehr zum Lesen

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.