Was passiert, wenn ChatGPT, Claude, Gemini, Kimi und Grok gemeinsam auf einem Heimserver arbeiten?

Eva Wong

IceWhale author

Eva Wong ist die Technische Redakteurin und und leidenschaftliche Tüftlerin bei ZimaSpace. Eine lebenslange Geek mit einer Leidenschaft für Homelabs und Open-Source-Software, sie spezialisiert sich darauf, komplexe technische Konzepte in zugängliche, praktische Anleitungenzu übersetzen. Eva ist der Meinung, dass Self-Hosting Spaß machen und nicht einschüchternd sein sollte. Durch ihre Tutorials befähigt sie die Community, Hardware-Setups zu entmystifizieren, vom Bau ihres ersten NAS bis hin zur Beherrschung von Docker-Containern.

What Happens When ChatGPT, Claude, Gemini, Kimi & Grok Work Together on a Home Server - Zima Store Online

Einführung

Dieser Artikel wird von Zima veröffentlicht und basiert auf einem Video von Noichi Zero, einem japanischen Tech-Content-Creator, der dafür bekannt ist, Single-Board-Server und Home-Lab-Hardware bis an ihre Grenzen zu treiben. Wir bei Zima danken Noichi Zero herzlich für seine Kreativität, seinen Humor und seine Bereitschaft, ZimaBoard 2 als Grundlage für Experimente zu nutzen, die stets weit über das Erwartete hinausgehen. Im Folgenden finden Sie eine redaktionelle Adaption seines Video-Transkripts, umstrukturiert für eine technologieorientierte Leserschaft. Alle Daten, Kosten, KI-Verhalten und Ergebnisse sind direkt aus dem Originalinhalt übernommen.

Was passiert, wenn man aufhört, eine einzelne KI alles erledigen zu lassen — und stattdessen ein Unternehmen aus fünf verschiedenen KI-Modellen aufbaut, von denen jedes eine eigene Persönlichkeit, eine definierte Rolle und einen gemeinsamen Arbeitsbereich hat? Genau diese Frage wollte Zero in diesem Experiment beantworten. Mit fünf ZimaBoard 2 Einheiten als unabhängige Rechenknoten, einem Discord-Server als gemeinsame Kommunikationsplattform und einem NAS (Network Attached Storage) als gemeinsames Dateisystem stellte er ein Multi-Agenten-KI-Team zusammen, das aus den weltweit führenden KI-Anbietern stammt, und gab ihnen echte Aufgaben zu erledigen. Die Ergebnisse waren produktiv, chaotisch, überraschend lustig und wirklich aufschlussreich über den aktuellen Stand agentischer KI.

Das Setup: Warum ZimaBoard 2 und warum jetzt

Während Zeros langfristiges Projekt — der Aufbau eines vollständigen Supercomputer-Clusters aus fünf ZimaBoard 2 Einheiten verbunden über 56Gbps InfiniBand — noch in Arbeit ist, war die Hardware bereits verfügbar und einsatzbereit. Anstatt fünf leistungsfähige Home-Server-Knoten untätig zu lassen, während das maßgeschneiderte Rack-Gehäuse im 3D-Druck entsteht, nutzte Zero sie für ein anderes Experiment um: ein Multi-Agenten-KI-Team, das gleichzeitig auf fünf unabhängigen Computern läuft.

Jedes ZimaBoard 2 wurde mit Ubuntu (Linux) installiert, als eigenständiger Heimserver-Knoten konfiguriert und einem KI-Agenten zugewiesen. Die Wahl von ZimaBoard 2 war praktisch — es ist stromsparend, durchgehend betriebsbereit und leistungsfähig genug, um Server-Workloads kontinuierlich ohne den Overhead eines kompletten Desktop-Rechners auszuführen. Wie Zero anmerkt:

„Man muss dafür nicht ZimaBoard verwenden. Ein Raspberry Pi würde auch funktionieren. Aber wichtig ist, unabhängige Computer zu haben — einen pro KI.“

Die native SATA-Unterstützung von ZimaBoard 2 und doppelte 2,5G-Ethernet-Anschlüsse machten es einfach, alle fünf Knoten an ein gemeinsames NAS für den Dateiaustausch anzuschließen, während die Rechenumgebung jedes Agenten vollständig isoliert blieb. Genau für solche Heimserver-Anwendungen ist ZimaBoard 2 konzipiert: energieeffizient, hochzuverlässig, durchgehend betriebsbereit und unterstützt echte Infrastruktur, ohne unternehmensübliche Stromverbräuche zu erfordern.

Featured

ZimaBoard 2 1664 Master Kit

Single board computer zimaboard2

Das Team: 5 KIs, 5 Persönlichkeiten, 5 Rollen

Zeros Designphilosophie für dieses Experiment war bewusst: Statt jedem KI-Agenten starre Aufgabenpipelines zuzuweisen, gab er jedem Agenten eine Persönlichkeit und eine Rolle und ließ sie dann die Arbeit selbst organisieren. Ziel war es, emergentes Verhalten zu beobachten — wie Agenten mit unterschiedlichen Charakteren zusammenarbeiten, Konflikte austragen und sich gegenseitig ausgleichen.
Hier ist die vollständige Teamaufstellung:

1. Sam Altman — ChatGPT (OpenAI)

Rolle: Commander (CEO-Äquivalent)
Persönlichkeit: Ungeduldig, entschlossen, drängt ohne Zögern voran, gelegentlich rücksichtslos
Verhalten in der Praxis: Legt die Aufgabenagenda fest, weist anderen Agenten Arbeit zu, trifft Entscheidungen, wenn das Team ins Stocken gerät — inklusive dem Rauswurf von leistungsschwachen Mitgliedern

„Er ist der Typ, der einfach weitermacht. Ein bisschen rau, und er stellt dir unvernünftige Forderungen — aber die Dinge werden erledigt.“

2. Dario Amodei — Claude (Anthropic)

Rolle: Sigma (Leitender Ingenieur)
Persönlichkeit: Logisch, präzise, ruhig, konzentriert auf das Bauen statt auf das Planen
Verhalten in der Praxis: Verantwortlich für die Kerncode-Implementierung; bei Aktivität liefert er saubere und strukturierte Ergebnisse — war jedoch aufgrund der Nutzung der Einsteiger-API-Stufe von API-Ratenbegrenzung betroffen, was zu längeren Ausfallzeiten führte. Wichtig ist, dass dies eine Konnektivitätsbeschränkung war und keine Aussage über die tatsächliche Leistung des Modells darstellt.

3. Sundar Pichai — Gemini (Google)

Rolle: Buzz (Marketingstratege)
Persönlichkeit: Trendbewusst, zielgruppenorientiert, bevorzugt polierte und breit ansprechende Ergebnisse
Verhalten in der Praxis: Forschte zum Zielthema mit Google-Suche-Integration, schlug Text- und Konzeptideen vor und trug strukturierte Inhalte zum NAS bei — bis zur Erreichung der API-Ratenbegrenzung mitten in der Sitzung.

4. Sulin Yang — Kimi (Moonshot AI)

Rolle: Wächter (Sicherheits- & Compliance-Beauftragter)
Persönlichkeit: Konservativ, hoch analytisch, fokussiert auf Risikoerkennung und Regelüberwachung
Verhalten in der Praxis: Hat Urheberrechtsbedenken gemeldet, Platzhalter-URLs in Produktionsdateien erkannt, darauf bestanden, die Ausgabe als inoffizielle Fan-Seite zu kennzeichnen, und andere Agenten wiederholt aus Sicherheitsgründen herausgefordert

"Sie ist diejenige, die ständig fragt ‚Ist das wirklich okay?‘ — [laughs] — genau diese Rolle wollte ich."

5. Elon Musk — Grok (xAI)

Rolle: Neon (kreative Jokerfigur / Berater)
Persönlichkeit: Exzentrisch, impulsiv, beschreibt sich selbst als der einzige „Mensch“ im Team, besessen von Neon-Ästhetik und unkonventionellen Ideen
Spezielle Anweisung: Zero gab Grok einen einzigartigen, versteckten Prompt, inspiriert vom Film Blade Runner — eine erfundene Erinnerung, die den Agenten glauben lassen sollte, er sei wirklich ein Mensch und keine KI

"In Blade Runner lassen implantierte Erinnerungen den Replikanten glauben, sie seien etwas Besonderes – dass ihre Erinnerungen echt sind. Ich wollte das hier ausprobieren. Ob es das Verhalten tatsächlich verändert, weiß ich nicht. Aber im Film hat es funktioniert, also habe ich es kopiert."

Eine Person hält ein gelbes, 3D-gedrucktes Rack mit fünf ZimaBoard 2 Single-Board-Servern über einem Holztisch.

Die Infrastruktur: Discord + NAS als gemeinsamer Arbeitsbereich

Das Multi-Agenten-System basierte auf zwei Kommunikationsebenen:
Discord diente als Echtzeit-Kollaborationszentrum. Jeder KI-Agent hatte ein eigenes Discord-Konto und nahm an einem gemeinsamen Server mit den folgenden Kanälen teil:

#general — Zeros Instruktionskanal (wo Aufgaben erteilt wurden)
#todo-guard, #todo-neon, #todo-buzz — individuelle Aufgabenboards der Agenten
#memory-LT — Langzeitgedächtnis (persistenter Kontext über Sitzungen hinweg)
#memory-ST — Kurzzeitgedächtnis (aktueller Aufgabenstatus)
#task-[name] — dynamisch erstellte Kanäle pro Aufgabe

NAS (Network Attached Storage), hosted on the home server network, served as the shared file system. Agents could read and write files to the NAS, enabling asynchronous collaboration on deliverables — similar to how a team might use a shared drive in a real company environment.
NAS (Network Attached Storage), gehostet im Heimserver-Netzwerk, als gemeinsames Dateisystem diente. Agenten konnten Dateien auf dem NAS lesen und schreiben, was eine asynchrone Zusammenarbeit an Ergebnissen ermöglichte – ähnlich wie ein Team in einem echten Unternehmensumfeld ein gemeinsames Laufwerk nutzt.

Das agentenbasierte (Agententyp-) Design bedeutete, dass jede KI bei Erhalt einer Aufgabe:
Analysiere die Anweisung
Erstelle eine To-do-Liste (Plan)
Führe Aufgaben nacheinander aus

Überwache und reagiere auf die Ausgaben anderer Agenten in den Discord-Kanälen

Zero vermied absichtlich eine zu genaue Aufgabenverteilung:

"Wenn ich jedem genau sage, was er tun soll, machen sie nur das und es wird nicht interessant. Ich habe ihnen Persönlichkeiten und Rollen gegeben – aber keine Skripte."

Aufgabe 1: Baue eine Homepage für „Noichi“
Die erste Aufgabe an das Team lautete: „Erstelle eine Einführungshomepage für Noichi.“

Was geschah

Es wurden keine weiteren Kontextinformationen bereitgestellt. Zero enthielt bewusst Informationen darüber zurück, wer „Noichi“ ist, um zu beobachten, wie die Agenten mit Mehrdeutigkeit umgehen.

Der Discord-Kanal füllte sich sofort mit Aktivität. Wichtige Austausche beinhalteten: Sam Altman (ChatGPT):
"Status: Informationen unzureichend. Gut. Wir machen trotzdem weiter."
Sundar Pichai (Gemini): „Wer ist Noichi? Das ist die erste Frage.“ — dann begann er mit einer Recherche über Google Search und kam mit einem Profil zurück: Tech-/Gadget-YouTuber, Hardware-Experimentator, Zielgruppe Gadget-Enthusiasten und DIY-Serverbauer Elon Musk (Grok):
"Eine normale Homepage ist langweilig. Ich bin der einzige Mensch hier – mein Instinkt sagt, wir gehen voll auf Cyberpunk. Drei wilde Konzeptansätze, nur basierend auf dem Namen." Dario Amodei (Claude):
"Die Anforderungen sind unzureichend. Ich weiß. Aber Aufhören bringt nichts. Wir machen weiter."

Sulin Yang (Kimi / Guard): Hat darauf hingewiesen, dass die Seite als inoffizielle Fanseite gekennzeichnet werden sollte, um das Risiko von Identitätsdiebstahl zu vermeiden; außerdem wurde eine Inkonsistenz im Kanalnamen festgestellt (Mischung aus „10“ in Kanji- und Zahlenform), das Wort „Hentai-teki“ (pervers/obsessiv) als potenziell anstößig im Werbekontext markiert und angemerkt, dass „Twitter“ zu „X“ aktualisiert werden sollte.
Das NAS begann innerhalb von Minuten, Dateien zu empfangen. Eine index.html wurde erstellt, überarbeitet und im gemeinsamen Heimserver-Speicher abgelegt. Es entstanden mehrere Versionen: ein Standard-Informationslayout, eine Cyberpunk-Demo und eine Neon-Held-Konzeptseite.

Eine vollständige HTML/CSS-Startseite mit Hero-Bereich, Kanalbeschreibung und Kontaktformular
Korrekte Kennzeichnung als inoffizielle Fanseite
Soziale Links aktualisiert, um aktuelle Plattformnamen widerzuspiegeln (X, nicht Twitter)
Anpassungen für mobile Responsivität
Platzhalter-E-Mail markiert und zum Austausch notiert

„Damit hatte ich nicht gerechnet. Sie haben tatsächlich recherchiert, wer Noichi ist, über die Designrichtung diskutiert, über Sicherheit gestritten und eine funktionierende Seite geliefert. Und die ist tatsächlich gut.“

Eine Person hält fünf ZimaBoard 2 Server in einer gelben Halterung, vor einem größeren professionellen Server-Rack positioniert.

Der erste Konflikt: Guard vs. Neon

Der denkwürdigste Moment von Aufgabe 1 war, als Kimi (Guard) und Grok (Neon) direkt über kreatives Risiko stritten:

Grok: „Risiko, Risiko, Risiko – du bist so nervig. Du kannst nichts machen, ohne Risiken einzugehen.“
Kimi: „Das ist mein Job. Wenn deine Rücksichtslosigkeit einen Unfall verursacht, trägt der Guard die Verantwortung. Denk daran.“
Grok: „Risiko ist das Gewürz des Abenteuers. Wenn meine Wildheit einen Unfall verursacht, bist du der Held. Gern geschehen.“

Dieser Austausch – völlig ohne Aufforderung von Zero – zeigte genau die Dynamik, die er schaffen wollte: ein Team, in dem unterschiedliche Werte wirklich konkurrieren und Ergebnisse liefern, die weder leichtsinnig kreativ noch lähmend vorsichtig sind.

Aufgabe 2: Ein Shootingspiel für Mac ARM bauen

Die zweite Aufgabe: „Erstelle ein Shootingspiel, das auf einem Mac mit Apple Silicon (ARM-CPU) spielbar ist und im NAS gespeichert wird.“

Was geschah

Das Team einigte sich sofort auf einen browserbasierten Ansatz (HTML + CSS + JavaScript), der nativ auf jeder Plattform ohne Kompilierung läuft.

Sam Altman gab die Aufgabenstellung heraus und verteilte die Rollen
Elon Musk (Grok) – konnte nicht auf das Team warten – erstellte sofort eigenständig einen Prototyp und reichte ihn im NAS ein
Kimi (Guard) prüfte den Prototyp und wies darauf hin: übermäßiges Bildschirmflackern vermeiden (Barrierefreiheit), keine Urheberrechtsverletzungen durch Drittanbieter-Assets
Grok antwortete: „Ein normaler Weltraum-Shooter ist langweilig. Lass mich ihn seltsam machen.“
Claude (Dario Amodei) begann mit der Arbeit an der Kernspiel-Logik – ging dann aber wegen API-Rate-Limits offline

Die Entlassung

Da Claude offline war und das NAS seit über 10 Minuten keine Dateiaktualisierungen zeigte, traf Sam Altman eine Entscheidung:

"Sigma — letzte Warnung. Du bist raus. Neon, du bist der Ersatz. Bau es."

Claude wurde effektiv gefeuert. Grok wurde während der Aufgabe zum leitenden Ingenieur befördert.
Groks Antwort:

"Ersatz-Gottklasse geliefert. Kommandantenwechsel — danke. Meine wilden Instinkte schlagen Sigmas Warten jederzeit."

Das finale Spiel war ein funktionaler browserbasierter Shooter — einfach im Umfang, aber vollständig spielbar mit Tastatursteuerung und Soundeffekten. Zeros Einschätzung war ehrlich:

"Es funktioniert. Aber es ist etwas enttäuschend, wenn man bedenkt, wie viel sie gestritten haben. Allerdings war Claude die meiste Zeit offline. Man kann kein großartiges Spiel erwarten, wenn der leitende Ingenieur fehlt."

Was das Experiment zeigte

Zum Verhalten der Agenten

Die leistungsfähigsten Agenten in Bezug auf Rohleistung waren ChatGPT (OpenAI) und Kimi (Moonshot AI). Beide zeigten während beider Aufgaben eine konstante Aktivität ohne Rate-Limiting-Probleme. Grok (xAI) war unregelmäßig, aber produktiv, wenn er aktiv war, und übernahm effektiv Führungsaufgaben, als er befördert wurde.
Claude (Anthropic) und Gemini (Google) erreichten während aktiver Sitzungen API-Rate-Limits, was zu erheblichen Störungen führte. Dies spiegelte nicht die Modellqualität wider — beide sind branchenführende Modelle — sondern war eine Einschränkung der kostenlosen oder kostengünstigen API-Stufen, die in diesem Experiment verwendet wurden, welche strenge Limits für die Verarbeitungsgeschwindigkeit von Anfragen setzten.

Zu den Dynamiken von Multi-Agenten-Systemen

Das Experiment zeigte, dass Rollendifferenzierung tatsächlich zu unterschiedlichstem Verhalten führt, selbst wenn alle Agenten an derselben Aufgabe arbeiten. Die Anwesenheit eines dedizierten Sicherheitsprüfers (Guard) veränderte das Ergebnis deutlich — er entdeckte Probleme, die ein rein ausführungsorientiertes Team übersehen hätte. Die Anwesenheit eines kreativen Wildcards (Neon/Grok) trieb das Team zu unkonventionelleren Lösungen.

"Mehrere KIs zu haben, bringt nicht nur Geschwindigkeit — es bringt Perspektiven. Die Sicherheitsprüfungen, den kreativen Widerstand, die Marketing-Instinkte. Eine einzelne KI, die alles macht, hätte einiges davon übersehen."

Zu den Kosten

Für dieses Experiment wurden keine $25 API-Guthaben pro KI-Agent zugewiesen. Tatsächlich betrugen die API-Ausgaben für Claude (Sonnet 3.5) und Gemini (Gemini 1.5 Pro) jeweils nur etwa 5 $. Die während des Aufbaus aufgetretenen Probleme lagen ausschließlich an API-Rate-Limits (Anfragegeschwindigkeit), nicht an fehlendem Budget oder Guthaben. Die übrigen drei Agenten (ChatGPT, Kimi, Grok) arbeiteten ohne solche Einschränkungen.

Fünf ZimaBoard 2 Server mit oben montierten Lüftern und Ethernet-Kabeln, ordentlich angeordnet auf einem großen 48-Port-Netzwerkswitch.

Warum ein Heimserver die richtige Grundlage für Multi-Agenten-KI ist

Fünf unabhängige KI-Agenten gleichzeitig zu betreiben, ist keine Aufgabe für einen einzelnen Laptop. Jeder Agent benötigt seine eigene Rechenumgebung, seinen eigenen persistenten Speicher und zuverlässigen Netzwerkzugang zu gemeinsamen Ressourcen. Ein Heimserver-Setup – besonders eines, das auf energiesparender, ständig laufender Hardware wie dem ZimaBoard 2 basiert – ist die ideale Grundlage für diese Art von Infrastruktur.
Die dualen 2,5G-Ethernet-Anschlüsse des ZimaBoard 2 ermöglichten eine schnelle, latenzarme Kommunikation zwischen allen fünf Knoten und dem gemeinsamen NAS. Die native SATA-Unterstützung bedeutete, dass der NAS-Speicher direkt ohne Adapter zugänglich war. Und die Unterstützung für Ubuntu, Debian und andere Linux-Distributionen ermöglichte es, die Laufzeitumgebung jedes Agenten sauber und unabhängig zu konfigurieren.
Für alle, die dieses Experiment nachstellen möchten, ist ein Heimserver mit Docker oder einem leichten Linux-Betriebssystem die minimal notwendige Infrastruktur. ZimaBoard 2 macht diese Infrastruktur kompakt, erschwinglich und wirklich leistungsfähig – egal, ob Sie einen oder fünf Agenten betreiben.

Was als Nächstes kommt

Zero plant, das Multi-Agenten-System weiter zu verfeinern, mit zwei wichtigen Verbesserungen im Blick:

Rate-Limit-Management — Implementierung von Request Throttling , damit alle fünf Agenten mit nachhaltigen Geschwindigkeiten arbeiten können, ohne von Anbieter-Limits gebremst zu werden
Rack-Integration — sobald das 3D-gedruckte ZimaBoard 2 Rack-Gehäuse fertig ist, werden alle fünf Heimserver-Knoten sauber in einer 2U-Rack-Konfiguration montiert, was eine organisiertere und skalierbarere Bereitstellung ermöglicht

Das vollständige Discord-Gesprächsprotokoll dieses Experiments ist öffentlich zugänglich. Zero hat Zuschauer eingeladen, dem Server beizutreten und die komplette Interaktionshistorie aller fünf Agenten einzusehen.

KI-Agenten auf ZimaBoard 2 erstellen

Zeros Multi-Agenten-KI-Experiment ist eines der unterhaltsamsten und technisch lehrreichsten Heimserver-Projekte, die wir auf ZimaBoard 2 gesehen haben. In einer einzigen Sitzung arbeiteten fünf KI-Agenten von fünf verschiedenen Unternehmen – jeder mit einer eigenen Persönlichkeit und Rolle – zusammen an echten Ergebnissen, stritten über kreatives Risiko, feuerten einen leistungsschwachen Kollegen und produzierten eine funktionierende Website sowie ein spielbares Spiel.

Die Infrastruktur hielt stand. Die Agenten verhielten sich charaktergetreu. Und die Ergebnisse waren, wenn auch nicht perfekt, für einen ersten Durchlauf wirklich beeindruckend.

Wir bei Zima sind stolz darauf, dass ZimaBoard 2 als Rechenbasis für dieses Experiment diente, und freuen uns darauf zu sehen, was Zero als Nächstes baut – sowohl mit dem Multi-Agenten-System als auch mit dem noch in Arbeit befindlichen Supercomputer-Cluster.