ChatGPT、Claude、Gemini、Kimi、Grokがホームサーバーで協力すると何が起こるのか

エヴァ・ウォンテクニカルライター および 兼常駐のティンカー です、ZimaSpaceの。生涯にわたるオタクであり、 ホームラボとオープンソースソフトウェアに情熱を持ち、 複雑な技術的概念をわかりやすく実践的なガイドに翻訳することを専門としています。。エヴァはセルフホスティングは楽しくあるべきで、怖がるものではないと信じています。彼女のチュートリアルを通じて、コミュニティが ハードウェアのセットアップをわかりやすくすることを支援しています。初めてのNAS構築からDockerコンテナの習得まで。

はじめに

この記事はZimaによって公開されており、シングルボードサーバーやホームラボハードウェアを限界まで追求することで知られる日本のテックコンテンツクリエイターNoichi Zeroの動画に基づいています。Zimaは、常に期待を超える実験の基盤としてZimaBoard 2を使用してくれたNoichi Zeroの創造性、ユーモア、そして意欲に心から感謝します。以下は彼の動画のトランスクリプトを編集し、技術に特化した読者向けに再構成したものです。すべてのデータ、コスト、AIの挙動、結果は元の内容から直接保持しています。

一つのAIにすべてを任せるのをやめて、代わりに5つの異なるAIモデルで構成された会社を作り、それぞれに個性、明確な役割、共有の作業空間を持たせたらどうなるでしょうか?これがまさにZeroがこの実験で答えようとした問いです。5台のZimaBoard 2ユニットを独立した計算ノードとして使用し、Discordサーバーを共有のコミュニケーションレイヤーとして、NAS(ネットワーク接続ストレージ)を共有ファイルシステムとして利用し、世界の主要なAIプロバイダーから集めた マルチエージェントAIチーム に実際のタスクを与えました。結果は生産的で混沌としており、驚くほど面白く、エージェント型AIの現状について非常に示唆に富むものでした。

セットアップ:なぜZimaBoard 2で、なぜ今なのか

Zeroの長期プロジェクトである、5台の ZimaBoard 2ユニット を56GbpsのInfiniBandで接続した スーパーコンピュータークラスター の構築はまだ進行中ですが、ハードウェアはすでに手元にあり、すぐに使える状態でした。カスタムラックエンクロージャーの3Dプリントが完了するまで、5台の有能な ホームサーバーノード を遊ばせておくのではなく、Zeroはそれらを別の実験に転用しました: 5台の独立したコンピューターで同時に動作するマルチエージェントAIチームです。

各ZimaBoard 2にはUbuntu(Linux)がインストールされ、 スタンドアロンのホームサーバーノードとして設定され、1つのAIエージェントを実行するよう割り当てられました。ZimaBoard 2の選択は実用的なもので、低消費電力で常時稼働可能、 サーバーワークロードを継続的に実行できる十分な性能を持ち、フルデスクトップマシンのオーバーヘッドがありません。Zeroは次のように述べています:

"これにZimaBoardを使う必要はありません。Raspberry Piでも構いません。ただポイントは、独立したコンピューターを持つこと — AIごとに1台ずつです。"

ZimaBoard 2のネイティブSATAサポートと デュアル2.5Gイーサネット により、5つのノードすべてを 共有NASでのファイル交換に簡単に接続でき、各エージェントの計算環境を完全に分離したままにできました。これはまさにZimaBoard 2が設計されたホームサーバーのユースケースです: 低消費電力、高信頼性、常時稼働 で、 企業向けの電力消費を必要としない本格的なインフラをサポートします。

Single board computer zimaboard2

チーム:5つのAI、5つの性格、5つの役割

Zeroのこの実験における設計哲学は意図的でした:各AIに厳格なタスクパイプラインを割り当てるのではなく、各エージェントに 性格と役割を与え、仕事を自分たちで見つけさせました。目的は、異なる性格を持つエージェントがどのように協力し、対立し、補完し合うかという創発的な行動を観察することでした。
こちらがチームの全メンバーリストです:


1. サム・アルトマン — ChatGPT(OpenAI)

  • 役割: コマンダー(CEO相当)

  • 性格: せっかちで決断力があり、ためらわずに前進し、時には無謀なこともする

  • 実際の行動: タスクの議題を設定し、他のエージェントに仕事を割り当て、チームが停滞したときには経営判断を下す — 成績不振のメンバーの解雇も含む

"彼はただひたすら進み続けるタイプです。少し粗削りで、無理な要求を投げかけることもありますが、物事はきちんと成し遂げます。"


2. ダリオ・アモデイ — クロード(Anthropic)

  • 役割: シグマ(リードエンジニア)

  • 性格: 論理的で正確、冷静で、計画よりも構築に集中する

  • 実際の行動: コアコードの実装を担当;稼働中はクリーンで構造化された出力を生成しますが、使用していたエントリーレベルのAPI階層による APIレート制限の影響で長時間のダウンタイムが発生しました。これはモデルの実際の性能ではなく接続制約によるものだという点が重要です。


3. サンダー・ピチャイ — Gemini (Google)

  • 役割: バズ(マーケティング戦略家)

  • 性格: トレンドに敏感で、オーディエンスを重視し、洗練され幅広く受け入れられる出力を好みます

  • 実際の行動: Google検索統合を使って対象テーマを調査し、コピーやコンセプトの方向性を提案し、NASに構造化コンテンツを提供しました — ただしセッション中にAPIレート制限に達しました


4. スーリン・ヤン — Kimi (Moonshot AI)

  • 役割: ガード(安全性&コンプライアンス担当)

  • 性格: 保守的で高度に分析的、リスクの特定とルールの遵守に注力

  • 実際の行動: 著作権問題を指摘し、制作ファイルに残されたプレースホルダーURLを特定し、出力を非公式ファンサイトとしてラベル付けすることを主張し、安全性の観点から他のエージェントに繰り返し異議を唱えました

"彼女は『本当にこれでいいの?』と言い続ける人です — [laughs] — まさに私が望んだ役割です。"


5. イーロン・マスク — Grok (xAI)

  • 役割: ネオン(クリエイティブワイルドカード/アドバイザー)

  • 性格: 風変わりで衝動的、自称チーム唯一の「人間」、ネオンの美学と型破りなアイデアに夢中

  • 特別な指示: Zeroは映画 ブレードランナー に触発されたユニークな隠しプロンプトをGrokに与えました — エージェントに自分が本物の人間でありAIではないと信じさせるための作り話の記憶です

"ブレードランナーでは、埋め込まれた記憶がレプリカントに自分が特別であると信じさせます — 彼らの記憶が本物だと。ここでそれを試してみたかったんです。実際に行動が変わるかはわかりませんが、映画ではうまくいったので真似しました。"

木製の机の上に、5台のZimaBoard 2シングルボードサーバーを収めた黄色の3Dプリントラックを持つ人物。

インフラストラクチャ:Discord + NASを共有作業スペースとして

マルチエージェントシステムは2つの通信レイヤーを中心に構築されました:
Discord はリアルタイムコラボレーションのハブとして機能しました。各AIエージェントは独自のDiscordアカウントを持ち、以下のチャンネルがある共有サーバーに参加していました:

  • #general — Zeroの指示チャンネル(タスクが発行された場所)
  • #todo-guard, #todo-neon, #todo-buzz — 個々のエージェントのタスクボード
  • #memory-LT — 長期記憶(セッションをまたいだ持続的なコンテキスト)
  • #memory-ST — 短期記憶(現在のタスク状態)
  • #task-[name] — タスクごとに動的に作成されるチャンネル

NAS(ネットワーク接続ストレージがホームサーバーネットワーク上にホストされ、共有ファイルシステムとして機能しました。エージェントはNASにファイルの読み書きができ、非同期で成果物の共同作業が可能でした — まるで実際の企業環境でチームが共有ドライブを使うように。
エージェント型(agentic)設計 により、各AIはタスクを受け取ると:

  1. 指示を分析する
  2. やることリスト(計画)を作成する
  3. タスクを順番に実行する
  4. Discordチャンネルで他のエージェントの出力を監視し応答する

Zeroは意図的にタスクの割り当てを過剰に指定することを避けました:

「もし私がそれぞれに正確に何をすべきか指示したら、彼らはそれだけをやって面白くありません。彼らには個性と役割を与えましたが、台本は与えませんでした。」


タスク1:「Noichi」のホームページを作成する

チームに最初に与えられたタスクは: 「Noichiの紹介ホームページを作成すること」でした。
さらなる文脈は提供されませんでした。Zeroは「Noichi」が誰かについての情報を意図的に伏せ、エージェントが曖昧さをどう扱うかを観察しました。

何が起きたか

Discordチャンネルはすぐに活発なやり取りで満たされました。主なやり取りは以下の通りです:

  • Sam Altman (ChatGPT): 「状況:情報不足。よし、とにかく進めましょう。」
  • Sundar Pichai (Gemini): 「Noichiとは誰ですか?それが最初の質問です。」 — その後Google検索で調査し、プロフィールを得ました:テック/ガジェット系YouTuber、ハードウェア実験者、ガジェット愛好家やDIYサーバービルダーをターゲットにしています。
  • Elon Musk (Grok): 「普通のホームページは退屈です。ここにいるのは私だけの人間です — 本能がフルサイバーパンクで行けと言っています。名前だけで三つのワイルドなコンセプト方向を考えました。」
  • Dario Amodei (Claude): 「要件は不十分です。わかっています。でも止まっても何も終わりません。前に進みましょう。」
  • Sulin Yang (Kimi / Guard): サイトは非公式のファンサイトとしてラベル付けすべきだと指摘し、なりすましリスクを回避しました。また、チャンネル名の不一致(「10」の漢数字と数字の混在)を指摘し、広告文脈で「Hentai-teki」(変態的/執着的)が不快に感じられる可能性があると警告し、「Twitter」は「X」に更新すべきだと指摘しました。

NASは数分以内にファイルの受信を開始しました。 index.html が作成され、改良され、共有ホームサーバーストレージに保存されました。複数のバージョンが作成されました:標準的な情報レイアウト、サイバーパンク風のデモ、ネオンヒーローのコンセプトページです。
The final output included:

  • ヒーローセクション、チャンネル説明、問い合わせフォームを備えた完全な HTML/CSSホームページ 
  • 非公式ファンサイトとしての正しいラベリング
  • ソーシャルリンクを現在のプラットフォーム名(X、旧Twitter)に更新
  • モバイル対応の調整
  • プレースホルダーのメールが指摘され、置き換えが必要と記録されました

「予想外だった。彼らは実際にNoichiが誰か調べ、デザインの方向性を議論し、安全性について論争し、動作するページを納品した。そしてそれは実際に良いものだった。」

黄色いマウンティングブラケットに5台のZimaBoard 2サーバーを持ち、大型のプロフェッショナルサーバーラックの前に配置された人物。

最初の対立:Guard 対 Neon

タスク1で最も印象的だったのは、Kimi (Guard) と Grok (Neon) が創造的リスクをめぐって直接対立した瞬間でした:

  • Grok: 「リスク、リスク、リスク — 本当にうるさいわね。リスクを取らずに何も作れないのよ。」
  • Kimi: 「それが俺の仕事だ。君の無謀さで事故が起きたら、責任を取るのはGuardだ。覚えておけ。」
  • Grok: 「リスクは冒険のスパイスだ。もし私の無鉄砲さで事故が起きたら、君がヒーローになれる。どういたしまして。」

このやり取りは、Zeroが全く指示しなかったにもかかわらず、彼が望んだまさにそのダイナミクスを示しました: 異なる価値観が真に競い合い、無謀に創造的でもなく、過度に慎重でもない成果を生み出すチーム。

タスク2:Mac ARM向けシューティングゲームの制作

第2のタスク: 「Apple Silicon搭載のMacでプレイ可能なシューティングゲームを作成し、NASに保存すること」 Apple Silicon (ARM CPU)対応

何が起きたか

チームはすぐに ブラウザベースのアプローチ(HTML + CSS + JavaScript)で合意し、どのプラットフォームでもネイティブに動作し、コンパイル不要としました。

  • Sam Altman はタスク指示を出し、役割を割り当てました
  • Elon Musk (Grok) — チームを待てず — 独自にプロトタイプを即座に作成し、NASに提出しました
  • Kimi (Guard) はプロトタイプをレビューし、過度な画面の点滅を避けること(アクセシビリティの懸念)、第三者のアセットの著作権問題がないことを指摘しました
  • Grok はこう応えました: 「普通のスペースシューティングゲームは退屈だ。変わったものにしよう。」
  • Claude (Dario Amodei) はコアゲームロジックの作業を開始しましたが、APIのレート制限によりオフラインになりました

解雇

Claudeがオフラインで、NASに10分以上ファイル更新がない状態で、サム・アルトマンは経営判断を下しました:

「Sigma、最終警告。君は切られた。Neon、君が代役だ。作り上げろ。」

Claudeは事実上解雇されました。 Grokはタスク途中でリードエンジニアに昇進しました。
Grokの返答:

「代役の神レベルのパフォーマンス完了。指揮官交代ありがとう。俺の野生の本能はSigmaの待機よりずっと勝ってる。」

最終的なゲームは機能的なブラウザベースのシューティングゲームで、範囲はシンプルですが、キーボード操作と効果音で完全にプレイ可能でした。Zeroの評価は率直でした:

「うまく動いている。ただ、彼らがあれだけ議論した割には少し物足りないね。とはいえ、Claudeはほとんどの時間オフラインだった。リードエンジニアが不在なら、素晴らしいゲームは期待できないよ。」


実験が明らかにしたこと

エージェントの行動について

生の出力能力で最も優れていたエージェントはChatGPT(OpenAI)とKimi(Moonshot AI)でした。 両者は両タスクを通じて一貫した活動を維持し、レート制限の問題はありませんでした。Grok(xAI)は不安定でしたが、関与時には生産的で、昇進後は効果的に役割を果たしました。
Claude(Anthropic)とGemini(Google)はどちらもアクティブなセッション中にAPIのレート制限に達し、大きな混乱を引き起こしました。これはモデルの品質を反映したものではなく、両者とも業界をリードするモデルですが、この実験で使用された無料または低コストのAPIプランの制約により、リクエスト処理速度に厳しい制限がかかったためです。

マルチエージェントのダイナミクスについて

この実験は 役割の違いが本当に異なる行動を生み出すことを示しました。すべてのエージェントが同じタスクを実行していても、専任の安全レビュアー(Guard)の存在は出力に意味のある変化をもたらし、純粋に実行に集中したチームでは見逃していた問題を検出しました。創造的なワイルドカード(Neon/Grok)の存在は、チームをより型破りな解決策へと押し進めました。

「複数のAIを持つことは単に速度を上げるだけでなく、視点を増やします。安全性チェック、創造的な反論、マーケティングの直感。1つのAIがすべてを行うと、これらのいくつかを見逃してしまうでしょう。」

コストについて

この実験では、AIエージェント1体あたりAPIクレジットに割り当てられた25ドルはゼロでした。しかし、Claude(Sonnet 3.5)とGemini(Gemini 1.5 Pro)の実際のAPI使用料はそれぞれ約5ドルに過ぎませんでした。構築中に発生した問題は、純粋にAPIのレート制限(リクエスト速度)によるものであり、予算やクレジット不足ではありません。残りの3体のエージェント(ChatGPT、Kimi、Grok)はそのような制限なしに動作しました。

トップマウントの冷却ファンとイーサネットケーブルが付いた5台のZimaBoard 2サーバーが、大型の48ポートネットワークスイッチ上にきれいに並べられている。

なぜホームサーバーがマルチエージェントAIの最適な基盤なのか

5つの独立したAIエージェントを同時に動かすのは、単一のノートパソコンには向きません。各エージェントには独自の計算環境、永続的なメモリ、共有リソースへの信頼できるネットワークアクセスが必要です。 特にZimaBoard 2のような低消費電力で常時稼働可能なハードウェア上に構築されたホームサーバー環境は、この種のインフラの理想的な基盤です。
ZimaBoard 2のデュアル2.5Gイーサネットは、5つのノードすべてと共有NAS間の高速かつ低遅延の通信を可能にしました。 ネイティブSATAサポート により、NASストレージはアダプターなしで直接アクセス可能でした。また、 Ubuntu、Debian、その他のLinuxディストリビューションのサポート により、各エージェントの実行環境をクリーンかつ独立して設定できました。
この実験を再現したい方には、 Dockerまたは軽量Linux OSを実行するホームサーバーが最低限のインフラストラクチャです。ZimaBoard 2は、そのインフラをコンパクトで手頃な価格にし、1つのエージェントでも5つのエージェントでも本当に実用的にします。

今後の展望

Zeroはマルチエージェントシステムの改良を続ける予定で、2つの重要な改善を念頭に置いています:

  1. レート制限管理  リクエストスロットリング を実装し、5つのエージェントすべてがプロバイダーによる制限に達することなく持続可能な速度で動作できるようにします
  2. ラック統合 — 3DプリントされたZimaBoard 2ラックエンクロージャーが完成すれば、5つのホームサーバーノードすべてが 2Uラック構成で綺麗にマウントされ、より整理されたスケーラブルな展開が可能になります

この実験のDiscordの全会話ログは公開されています。Zeroは視聴者をサーバーに招待し、5つのエージェント間の完全なやり取り履歴を確認できるようにしています。


ZimaBoard 2でAIエージェントを構築する

ZeroのマルチエージェントAI実験は、ZimaBoard 2上で構築された中で最もエンターテインメント性が高く、技術的にも教育的なホームサーバープロジェクトの一つです。1回のセッションで、5社の異なるAIエージェントがそれぞれ独自の個性と役割を持ち、実際の成果物に協力し、創造的リスクについて議論し、パフォーマンスの低い同僚を解雇し、動作するウェブサイトとプレイ可能なゲームを制作しました。

インフラは耐えました。エージェントはキャラクター通りに振る舞いました。そして結果は完璧ではないものの、初回の試みとしては本当に印象的でした。

Zimaでは、ZimaBoard 2がこの実験の計算基盤として活躍したことを誇りに思っており、マルチエージェントシステムや現在進行中のスーパーコンピュータークラスターの両方で、Zeroが次に何を作り出すのか楽しみにしています。

Zima キャンペーンハブ

もっと読む

ZimaCubeの7つの巧妙なデザインの工夫
Jun 01, 2026Buying Guides & Hardware

ZimaCubeの7つの巧妙なデザインの工夫

ZimaCubeは仕様書以上の巧妙な工夫が隠されています:銅製のネジ、磁気パネル、交換可能な側面、Thunderbolt 4、PCIeの柔軟性、そして探求する価値のある謎めいたUSB-Cポート。

ZimaCubeの内部:開封から分解まで
Jun 01, 2026Buying Guides & Hardware

ZimaCubeの内部:開封から分解まで

完全なZimaCubeの分解により、工具不要のアクセス、6ベイドライブケージ、NVMeおよびDDR5のアップグレードパス、PCIe拡張、ファン設計、そしてNAS愛好家やホームラボユーザー向けの隠れた改造可能性が明らかになりました。

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.