IA locale sur le ZimaCube 2 — Extension PCIe, Ollama et pérennisation de votre homelab

Eva Wong est la rédactrice technique et bricoleuse résidente chez ZimaSpace. Geek passionnée depuis toujours, elle s'intéresse aux homelabs et aux logiciels open source, et elle est spécialisée dans la traduction de concepts techniques complexes en guides pratiques et accessibles. Eva croit que l'auto-hébergement doit être amusant, pas intimidant. À travers ses tutoriels, elle donne à la communauté les moyens de démystifier les configurations matérielles, depuis la construction de leur premier NAS jusqu'à la maîtrise des conteneurs Docker.

💡 Focus communauté : Michael Luckenbill, programme pionnier ZimaCube 2

Quand j'ai ouvert le ZimaCube 2 pour la première fois, je ne regardais pas seulement ce qu'il pouvait faire aujourd'hui. Je regardais ce qu'il pourrait devenir demain.

À l'intérieur, en plus du matériel attendu, j'ai trouvé quelque chose qui m'a vraiment enthousiasmé : un disque NVMe Kingston de 256 Go pour le système d'exploitation — et un emplacement NVMe supplémentaire inutilisé sur la carte mère. Associé à l'emplacement d'extension PCIe à l'arrière, ce n'était pas qu'un NAS. C'était une plateforme conçue pour évoluer.

Vue du panneau avant du ZimaCube 2 : 6 baies de disques SATA, ports USB-A et USB-C avant, emplacement M.2 NVMe intégré

Au-delà du stockage : une plateforme conçue pour l'expansion

Le ZimaCube 2 est livré prêt à l'emploi, mais la vraie histoire est ce que vous pouvez ajouter plus tard :

Intégré

  • 6 × baies SATA
  • 4 × emplacements M.2 NVMe
  • 8 Go DDR5 SODIMM
  • Double Ethernet 2,5 Gb
  • Châssis métallique avec refroidissement actif

Extensible

  • Emplacement NVMe supplémentaire sur la carte mère
  • Emplacement d'extension PCIe (GPU/IA/Stockage/Réseau)
  • RAM DDR5 SODIMM évolutive
  • Composants standards remplaçables

C'est l'une des plus grandes forces du système : il évolue avec vos besoins en infrastructure. Vous n'avez pas à tout acheter d'un coup. Vous commencez avec ce dont vous avez besoin et vous étendez quand vous êtes prêt.

IA locale : pourquoi c'est important pour les homelabs

Un de mes objectifs à long terme est d'exécuter davantage de charges de travail IA localement. Pas parce que l'IA cloud est mauvaise — mais parce que l'IA locale offre quelque chose de différent :

  • Confidentialité — Vos données ne quittent jamais votre réseau
  • Prévisibilité des coûts — Pas de tarification par token, pas de factures d'API en fin de mois
  • Liberté d'expérimentation — Tester des modèles, casser des choses, recommencer — sans se soucier des coûts cloud
  • Fonctionnement hors ligne — Une IA qui fonctionne même lorsque votre connexion internet ne fonctionne pas
  • Apprentissage — Comprendre comment les modèles fonctionnent réellement en les exécutant vous-même

Le ZimaCube 2 me fournit une plateforme où je peux expérimenter tout cela — Ollama pour les LLM locaux, les workflows de développement assistés par IA, les pipelines d'analyse d'images, les charges de travail d'inférence et les outils d'IA auto-hébergés — sans dépendre entièrement de l'infrastructure cloud.

Ce que vous pouvez exécuter aujourd'hui (sans GPU)

Même avant d'ajouter un GPU dédié, le ZimaCube 2 offre déjà une base solide pour l'expérimentation en IA :

🤖 Ollama + modèles plus petits — Le système de base peut exécuter confortablement des modèles quantifiés de 7B à 8B paramètres. Pensez aux modèles Llama 3, Mistral et de classe Phi pour le chat, l'assistance au code et l'analyse de texte.
💻 Développement assisté par IA — Combinez Ollama avec des outils comme Continue.dev ou Cody, et vous avez un assistant de codage IA local qui fonctionne entièrement hors ligne. Pas de clés API, pas de limites d'utilisation, pas de soucis de confidentialité.
📄 Analyse de documents & RAG — Avec les pools de stockage ZFS, vous pouvez construire des pipelines RAG (Retrieval Augmented Generation) locaux — alimentez vos documents, notes et ensembles de données dans une base de données vectorielle locale et interrogez-les avec un LLM fonctionnant sur la même machine.
🎁 Automatisation & Scripting — Les LLM locaux excellent dans les tâches structurées — classification, résumé, extraction. Intégrez Ollama à vos flux de travail Docker existants et automatisez les pipelines de traitement de texte qui nécessitaient auparavant des API cloud.
Disposition interne du matériel ZimaCube 2, dissipateur passif CPU, slot d'extension PCIe et emplacements NVMe intégrés

La voie de mise à niveau GPU

Le slot d'extension PCIe est là où les choses deviennent intéressantes à long terme. Ajouter un GPU — même modeste — transforme le ZimaCube 2 en un véritable serveur IA local :

  • Modèles plus grands — Exécutez des modèles de 13B à 34B paramètres avec déchargement GPU
  • Inférence plus rapide — Accélération de 10 à 50× sur la génération de tokens
  • Transcodage média — Transcodage Plex/Jellyfin accéléré par matériel
  • Génération d'images — Stable Diffusion et modèles similaires
  • Service multi-modèles — Exécutez différents modèles pour différentes tâches simultanément
🔌 Le slot prend en charge les cartes PCIe standard — pas de formats propriétaires, pas de verrouillage fournisseur. Vous choisissez le GPU qui correspond à vos besoins et à votre budget.

Pourquoi cette architecture est importante

Les homelabs modernes se chevauchent de plus en plus avec les charges de travail d'IA, l'inférence locale, le transcodage média, l'orchestration de conteneurs et l'informatique en périphérie.

Le ZimaCube 2 semble conçu avec cet avenir en tête. Ce n’est pas un appareil scellé qui vous oblige à en acheter un nouveau quand vos besoins changent. C’est une plateforme qui dit « voici ce dont vous avez besoin maintenant, voici la place pour ce que vous voudrez plus tard. »

Pour moi, c’est la différence entre un gadget et une infrastructure.

Vérification thermique : peut-il gérer une carte GPU ?

Une question naturelle : un système compact et silencieux peut-il vraiment gérer thermiquement une carte GPU ?

La réponse dépend du GPU, mais les bases sont solides :

  • Le châssis en métal fait office de dissipateur thermique
  • La conception du flux d’air est intentionnelle (pas une réflexion après coup)
  • La disposition interne des composants laisse de la place pour les besoins en flux d’air d’une carte PCIe

Le système gère déjà des charges continues Docker, ZFS et réseau tout en restant frais au toucher. La conception thermique offre une marge.

Questions fréquemment posées

Q1 : Le ZimaCube 2 peut-il faire tourner Ollama ?

Oui. La configuration de base peut faire tourner confortablement des modèles quantifiés de 7B à 8B paramètres (Llama 3, Mistral, Phi) pour le chat, l’assistance au code et l’analyse de texte. Avec un GPU ajouté via PCIe, vous pouvez exécuter des modèles plus grands avec une inférence beaucoup plus rapide.

Q2 : Le ZimaCube 2 possède-t-il un emplacement PCIe pour une carte GPU ?

Oui. Le ZimaCube 2 inclut un emplacement d’extension PCIe qui supporte les GPU standards, les accélérateurs IA, les cartes de stockage supplémentaires et les cartes réseau. Pas de formats propriétaires ni de verrouillage fournisseur.

Q3 : Que puis-je faire avec l’IA locale sur un NAS ?

L’IA locale sur un NAS permet des assistants de chat privés, du codage assisté par IA (avec des outils comme Continue.dev), l’analyse de documents avec des pipelines RAG, le traitement et la classification automatisés de textes, l’analyse d’images, et des expérimentations sans coûts d’API cloud.

Q4 : Combien d’emplacements NVMe le ZimaCube 2 possède-t-il ?

Le système dispose de 4 emplacements M.2 NVMe ainsi qu’un emplacement NVMe supplémentaire sur la carte mère (initialement utilisé pour le disque système), qui peut servir pour des disques système en miroir, un stockage Docker dédié ou des couches de cache.

Q5 : Puis-je augmenter la RAM plus tard ?

Oui. Le ZimaCube 2 utilise de la RAM DDR5 SODIMM standard, remplaçable par l'utilisateur. La configuration de base de 8 Go gère bien les charges de travail en conteneurs, et vous pouvez l'upgrader selon vos besoins.

Q6 : Le ZimaCube 2 est-il capable de gérer thermiquement une carte GPU ?

Oui. Le châssis en métal, la conception intentionnelle du flux d'air et la disposition interne des composants favorisent le refroidissement des cartes PCIe. Le système gère des charges de travail continues tout en restant frais, et la conception thermique offre une marge pour l'expansion.

Centre de campagne Zima

À lire aussi

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.