ChatGPT、Claude、Gemini、Kimi、Grokがホームサーバーで協力するとどうなるか

エヴァ・ウォン

IceWhale author

エヴァ・ウォン は テクニカルライター であり ZimaSpaceの常駐ティンカーでもあります。 生涯のオタクであり、 ホームラボとオープンソースソフトウェアに情熱を持っています。彼女は複雑な技術的概念をわかりやすく、 実践的なガイドに翻訳することを専門としています。エヴァはセルフホスティングは楽しくあるべきで、怖がるものではないと信じています。彼女のチュートリアルを通じて、コミュニティが ハードウェアのセットアップを解明する手助けをしています。初めてのNAS構築からDockerコンテナの習得まで。

What Happens When ChatGPT, Claude, Gemini, Kimi & Grok Work Together on a Home Server - Zima Store Online

はじめに

この記事はZimaによって公開されており、日本のテックコンテンツクリエイターNoichi Zeroのビデオを基にしています。彼は シングルボードサーバー や ホームラボハードウェア の限界に挑戦することで知られています。ZimaはNoichi Zeroの創造性、ユーモア、そしてZimaBoard 2を基盤にした実験を常に期待以上の成果に導く意欲に心から感謝しています。以下は彼のビデオのトランスクリプトを技術志向の読者向けに編集・再構成したものです。すべてのデータ、コスト、AIの挙動、結果は元の内容から直接保持しています。

すべてを一つのAIに任せるのをやめ、代わりにそれぞれ異なる個性と明確な役割を持ち、共有の作業空間を持つ5つの異なるAIモデルで会社を作ったらどうなるでしょうか？これがまさにZeroがこの実験で答えようとした問いです。5台のZimaBoard 2ユニットを独立した計算ノードとして使用し、Discordサーバーを共有のコミュニケーションレイヤーとして、NAS（ネットワーク接続ストレージ）を共有ファイルシステムとして活用し、世界有数のAIプロバイダーから集めた マルチエージェントAIチーム に実際のタスクを与えました。結果は生産的で混沌としており、驚くほど面白く、エージェント型AIの現状について非常に示唆に富むものでした。

セットアップ：なぜZimaBoard 2を選び、なぜ今なのか

Zeroの長期プロジェクトである、5台のZimaBoard 2ユニットを56GbpsのInfiniBandで接続した完全なスーパーコンピュータークラスターの構築はまだ進行中ですが、ハードウェアはすでに手元にあり、すぐに稼働可能な状態でした。カスタムラックエンクロージャーが3Dプリントされる間、5台の有能なホームサーバーノードを遊ばせておくのではなく、Zeroはそれらを別の実験に転用しました： 5台の独立したコンピューターで同時に動作するマルチエージェントAIチームです。

各ZimaBoard 2にはUbuntu（Linux）がインストールされ、 スタンドアロンのホームサーバーノードとして設定され、1体のAIエージェントを動かす役割が割り当てられました。ZimaBoard 2を選んだのは実用的な理由からで、低消費電力で常時稼働可能、かつサーバーワークロードを継続的に実行できる十分な性能を持ち、フルデスクトップ機のオーバーヘッドが不要だからです。Zeroはこう述べています：

「これにZimaBoardを使う必要はありません。Raspberry Piでも構いません。ただ重要なのは、独立したコンピューターを持つこと — AIごとに1台ずつです。」

ZimaBoard 2のネイティブSATAサポートと デュアル2.5Gイーサネット により、5つのノードすべてを 共有NASでファイル交換できる一方で、各エージェントの計算環境は完全に分離されました。これはまさにZimaBoard 2が設計されたホームサーバーのユースケースです： 低消費電力、高信頼性、常時稼働 で、企業向けの電力消費を必要としない本格的なインフラを支えます。

Featured

ZimaBoard 2 1664 マスターキット

Single board computer zimaboard2

チーム：5体のAI、5つの性格、5つの役割

Zeroのこの実験における設計哲学は意図的でした。各AIに厳格なタスクパイプラインを割り当てるのではなく、各エージェントに 性格と役割を与え、それぞれが自分で仕事を見つけ出すようにしました。目的は、異なる性格を持つエージェントがどのように協力し、対立し、補完し合うかという創発的な行動を観察することでした。
こちらがチームの全メンバーリストです：

1. サム・アルトマン — ChatGPT（OpenAI）

役割： コマンダー（CEO相当）
性格： せっかちで決断力があり、ためらわずに前進し、時には無謀なこともする
実際の行動： タスクの議題を設定し、他のエージェントに仕事を割り当て、チームが停滞した際には経営判断を下す — パフォーマンスの低いメンバーの解雇も含む

「彼はただひたすら前進し続けるタイプ。少し粗削りで、無理な要求を突きつけることもあるが、物事は必ず成し遂げる。」

2. ダリオ・アモデイ — クロード（Anthropic）

役割： Sigma（リードエンジニア）
性格： 論理的で正確、冷静で、計画よりも構築に集中するタイプ
実際の行動： コアコードの実装を担当。稼働中はクリーンで構造化された出力を生成しますが、使用していたエントリーレベルのAPI階層による APIレート制限の影響で長時間のダウンタイムが発生しました。これはモデルの性能ではなく接続制約によるものです。

3. Sundar Pichai — Gemini (Google)

役割： Buzz（マーケティングストラテジスト）
性格： トレンドに敏感で、オーディエンスを重視し、洗練され幅広く受け入れられる出力を好む
実際の行動： Google検索連携を使って対象テーマを調査し、コピーやコンセプトの方向性を提案し、NASに構造化コンテンツを提供しました――ただしセッション中にAPIのレート制限に達しました。

4. Sulin Yang — Kimi (Moonshot AI)

役割： Guard（安全・コンプライアンス担当）
性格： 保守的で高度に分析的、リスクの特定とルールの遵守に注力
実際の行動： 著作権問題を指摘し、制作ファイルに残されたプレースホルダーURLを特定し、出力を非公式ファンサイトとしてラベル付けすることを主張し、安全性の観点から他のエージェントに繰り返し異議を唱えた。

「彼女は『本当にこれでいいの？』と言い続ける人だ――[laughs]――まさに私が望んだ役割だ。」

5. イーロン・マスク — Grok (xAI)

役割： Neon（クリエイティブワイルドカード／アドバイザー）
性格： 風変わりで衝動的、自称チーム唯一の「人間」、ネオンの美学と型破りなアイデアに夢中
特別な指示： Zeroは映画 ブレードランナー に触発されたユニークな隠しプロンプトをGrokに与えました――エージェントに自分が本物の人間でありAIではないと信じ込ませるための作り話の記憶です。

「ブレードランナーでは、埋め込まれた記憶がレプリカントに自分が特別であると信じさせる――彼らの記憶が本物だと。ここでそれを試してみたかった。実際に行動が変わるかはわからないけど、映画ではうまくいったから真似したんだ。」

木製の机の上に5台のZimaBoard 2シングルボードサーバーを収めた黄色の3Dプリントラックを持つ人物。

インフラストラクチャ：Discord + NASを共有作業スペースとして使用

マルチエージェントシステムは2つの通信レイヤーを中心に構築されました：
Discord はリアルタイムコラボレーションのハブとして機能しました。各AIエージェントは独自のDiscordアカウントを持ち、以下のチャンネルがある共有サーバーに参加していました：

#general — Zeroの指示チャンネル（タスクが発行された場所）
#todo-guard, #todo-neon, #todo-buzz — 個別エージェントのタスクボード
#memory-LT — 長期記憶（セッションをまたいだ持続的なコンテキスト）
#memory-ST — 短期記憶（現在のタスク状態）
#task-[name] — タスクごとに動的に作成されるチャンネル

NAS（ネットワーク接続ストレージ）はホームサーバーネットワーク上にホストされ、共有ファイルシステムとして機能しました。エージェントはNASにファイルの読み書きができ、非同期で成果物を共同作業できました — まるで実際の企業環境でチームが共有ドライブを使うように。
エージェント型（agentic）設計 は、各AIがタスクを受け取ると：

指示を分析する
やることリスト（計画）を作成する
タスクを順番に実行する
Discordチャンネルで他のエージェントの出力を監視し応答する

ゼロは意図的にタスク割り当てを過剰に指定しなかった：

「一つ一つに正確に何をすべきか指示したら、彼らはそれだけをやって面白くない。性格と役割は与えたが、台本は与えなかった。」

タスク1：「ノイチ」のホームページを作成する

チームに最初に与えられたタスクは： 「ノイチの紹介ホームページを作成せよ。」
さらなる文脈は提供されなかった。ゼロは「ノイチ」が誰かの情報を意図的に伏せ、エージェントが曖昧さにどう対処するかを観察した。

何が起きたか

Discordチャンネルはすぐに活気づいた。主なやり取りは以下の通り：

サム・アルトマン（ChatGPT）： 「状況：情報不足。よし、とにかく進もう。」
スンダー・ピチャイ（ジェミニ）： 「ノイチって誰？それが最初の質問だ。」 — その後Google検索で調査し、プロフィールを得た：テック／ガジェット系YouTuber、ハードウェア実験者、ガジェット愛好家やDIYサーバービルダーを対象とした人物。
イーロン・マスク（グロック）： 「普通のホームページは退屈だ。ここにいるのは俺だけだ — 本能がフルサイバーパンクで行けと言っている。名前だけで三つのワイルドなコンセプト方向を考えた。」
ダリオ・アモデイ（クロード）： 「要件は不十分だ。わかっている。でも止まっても何も終わらない。前に進もう。」
楊素琳（キミ / ガード）： サイトは非公式ファンサイトとしてラベル付けすべきと指摘し、なりすましリスクを回避；またチャンネル名の不一致（「10」を漢数字と算用数字で混在）を指摘し、広告文脈で「変態的」という言葉が不快に感じられる可能性を警告、さらに「Twitter」は「X」に更新すべきと指摘しました。

NASは数分以内にファイルの受信を開始しました。 index.html が作成され、何度も修正されて共有ホームサーバーストレージに保存されました。複数のバージョンが作成されました：標準的な情報レイアウト、サイバーパンク風のデモ、ネオンヒーローコンセプトページです。
最終出力には以下が含まれていました：

ヒーローセクション、チャンネル説明、問い合わせフォームを備えた完全な HTML/CSSホームページ
非公式ファンサイトとしての正しい表記
ソーシャルリンクを現在のプラットフォーム名（X、旧Twitter）に更新
モバイル対応の調整
プレースホルダーのメールアドレスが指摘され、差し替えが必要と記録されました

「予想外だった。彼らは実際にノイチが誰か調べ、デザインの方向性を議論し、安全性について論争し、動作するページを納品した。そしてそれが実に良い出来だった。」

黄色いマウンティングブラケットに5台のZimaBoard 2サーバーを持ち、大型のプロフェッショナルサーバーラックの前に配置された人物。

最初の対立：ガード対ネオン

タスク1で最も印象的だったのは、キミ（ガード）とグロック（ネオン）が創造的リスクをめぐって直接対立した瞬間でした：

グロック： 「リスク、リスク、リスク—本当にうるさいわね。リスクを取らずに何も作れないのよ。」
キミ： 「それが俺の仕事だ。君の無謀で事故が起きたら、責任を取るのはガードだ。覚えておけ。」
グロック： 「リスクは冒険のスパイスだ。俺の無鉄砲で事故が起きたら、君がヒーローになれる。どういたしまして。」

このやり取りは、ゼロからの指示なしに起こり、彼が望んだまさにそのダイナミクスを示しました： 異なる価値観が真に競い合い、無謀な創造性でも慎重すぎる停滞でもない成果を生み出すチーム。

タスク2：Mac ARM向けシューティングゲームの制作

第2のタスク： 「Macの Apple Silicon (ARM CPU)でプレイ可能なシューティングゲームを作り、NASに保存する」

何が起きたか

チームは即座に ブラウザベースのアプローチ（HTML + CSS + JavaScript）で合意し、どのプラットフォームでもネイティブに動作しコンパイル不要としました。

サム・アルトマン はタスク指示を出し、役割を割り当てました
イーロン・マスク（グロック） はチームを待てず、独自にプロトタイプを即座に制作しNASに提出しました
キミ（ガード） はプロトタイプをレビューし、過度な画面点滅を避けること（アクセシビリティの懸念）、第三者の著作権資産を一切使用しないことを指摘しました
グロック はこう応えました： 「普通のスペースシューティングゲームは退屈だ。変わったものにしよう。」
クロード（ダリオ・アモデイ） はコアゲームロジックの開発を始めましたが、APIのレート制限によりオフラインになりました

解雇

クロードがオフラインで、NASに10分以上ファイル更新がない状態が続いたため、サム・アルトマンは経営判断を下しました：

"Sigma、最終警告。君は切られた。Neon、君が代役だ。作り上げろ。"

Claudeは事実上解雇されました。 Grokはタスクの途中でリードエンジニアに昇進しました。
Grokの返答：

"代役の神レベルの仕事完了。指揮官交代、ありがとう。私の野生の本能はSigmaの待機よりずっと勝っている。"

最終的なゲームはブラウザベースのシューターで、範囲はシンプルですが、キーボード操作と効果音で完全にプレイ可能でした。Zeroの評価は率直でした：

"うまく動いています。ただ、彼らがあれだけ議論した割には少し物足りない感じです。とはいえ、Claudeはほとんどの時間オフラインでした。リードエンジニアが不在なら、素晴らしいゲームは期待できません。"

実験が明らかにしたこと

エージェントの行動について

生の出力能力で最も優れていたエージェントはChatGPT（OpenAI）とKimi（Moonshot AI）でした。 両者は2つのタスクを通じて一貫した活動を維持し、レート制限の問題はありませんでした。Grok（xAI）は不安定でしたが、関与時には生産的で、昇進後は効果的に役割を果たしました。
Claude（Anthropic）とGemini（Google）は、アクティブなセッション中にAPIのレート制限に達し、大きな混乱を引き起こしました。これはモデルの品質を反映したものではなく、両者とも業界をリードするモデルですが、今回の実験で使用した無料または低コストのAPIプランの制約により、リクエスト処理速度に厳しい制限がかかったためです。

マルチエージェントのダイナミクスについて

この実験は、 役割分担が本当に異なる行動を生み出すことを示しました。すべてのエージェントが同じタスクに取り組んでいても、専任の安全レビュアー（Guard）の存在は出力に意味のある変化をもたらし、純粋に実行に集中したチームでは見逃していた問題を検出しました。創造的なワイルドカード（Neon/Grok）の存在は、チームをより型破りな解決策へと押し進めました。

"複数のAIがいることで単に速度が増すだけでなく、視点が増えます。安全チェック、創造的な反論、マーケティングの直感。すべてを1つのAIに任せていたら、これらのいくつかは見逃していたでしょう。"

コストについて

この実験では、AIエージェント1体あたりAPIクレジットとして25ドルの割り当てはゼロでした。しかし、Claude（Sonnet 3.5）とGemini（Gemini 1.5 Pro）の実際のAPI使用料はそれぞれ約5ドルに過ぎませんでした。構築中に発生した問題は、純粋にAPIのレート制限（リクエスト速度）によるものであり、予算やクレジット不足ではありません。残りの3体のエージェント（ChatGPT、Kimi、Grok）はそのような制限なしに動作しました。

トップに冷却ファンとイーサネットケーブルが取り付けられた5台のZimaBoard 2サーバーが、大型の48ポートネットワークスイッチ上にきれいに並べられている。

なぜホームサーバーがマルチエージェントAIの基盤に最適なのか

5体の独立したAIエージェントを同時に動かすのは単一のノートパソコンには向きません。各エージェントには独自の計算環境、永続的なメモリ、共有リソースへの信頼できるネットワークアクセスが必要です。 特にZimaBoard 2のような低消費電力で常時稼働可能なハードウェア上に構築されたホームサーバー環境は、この種のインフラの理想的な基盤です。
ZimaBoard 2のデュアル2.5Gイーサネットは、5つのノードすべてと共有NAS間の高速かつ低遅延の通信を可能にしました。 ネイティブSATAサポート により、NASストレージはアダプターなしで直接アクセス可能でした。また、 Ubuntu、Debian、その他のLinuxディストリビューション をサポートしているため、各エージェントの実行環境をきれいかつ独立して構成できました。
この実験を再現したい方には、 Dockerまたは軽量Linux OSを実行するホームサーバーが最低限必要なインフラです。ZimaBoard 2はそのインフラをコンパクトで手頃な価格かつ本当に高性能にします—1体のエージェントでも5体でも同様です。

次に来るもの

Zeroはマルチエージェントシステムの改良を続ける予定で、2つの重要な改善点を念頭に置いています：

レート制限管理 — リクエストスロットリングを実装し、5体のエージェントすべてがプロバイダーによる制限に達することなく持続可能な速度で動作できるようにします
ラック統合 — 3DプリントされたZimaBoard 2ラックエンクロージャーが完成すれば、5つのホームサーバーノードすべてが 2Uラック構成できれいにマウントされ、より整理されたスケーラブルな展開が可能になります

この実験のDiscordの全会話ログは公開されています。Zeroは視聴者をサーバーに招待し、5体のエージェント間の完全なやり取りの履歴を確認できるようにしています。

ZimaBoard 2でAIエージェントを構築する

ZeroのマルチエージェントAI実験は、ZimaBoard 2上で構築された中で最もエンターテインメント性が高く技術的にも示唆に富んだホームサーバープロジェクトの一つです。1回のセッションで、5社の異なる個性と役割を持つ5体のAIエージェントが協力して実際の成果物を作り、創造的リスクについて議論し、パフォーマンスの低い同僚を解雇し、動作するウェブサイトとプレイ可能なゲームを制作しました。

インフラは耐え抜きました。エージェントはキャラクター通りに振る舞いました。そして結果は完璧ではないものの、初回の試みとしては本当に印象的でした。

Zimaでは、ZimaBoard 2がこの実験の計算基盤として活躍したことを誇りに思っており、マルチエージェントシステムや現在進行中のスーパーコンピュータークラスターでZeroが次に何を作り出すのか楽しみにしています。