Can the ZimaCube 2 run Ollama?

Yes. The stock configuration can run quantized 7B–8B parameter models (Llama 3, Mistral, Phi) comfortably for chat, code assistance, and text analysis. With a GPU added via PCIe, you can run larger models with significantly faster inference.

Does the ZimaCube 2 have a PCIe slot for a GPU?

Yes. The ZimaCube 2 includes a PCIe expansion slot that supports standard GPUs, AI accelerators, additional storage cards, and networking cards. No proprietary form factors or vendor lock-in.

What can I do with local AI on a NAS?

Local AI on a NAS enables private chat assistants, AI-assisted coding (with tools like Continue.dev), document analysis with RAG pipelines, automated text processing and classification, image analysis, and experimentation without cloud API costs.

How many NVMe slots does the ZimaCube 2 have?

The system has 4× M.2 NVMe slots plus an additional NVMe slot on the motherboard (originally holding the OS drive), which can be used for mirrored OS drives, dedicated Docker storage, or caching layers.

Can I upgrade the RAM later?

Yes. The ZimaCube 2 uses standard SODIMM DDR5 RAM, which is user-replaceable. The stock 8GB configuration handles container workloads well, and you can upgrade when your needs grow.

Is the ZimaCube 2 thermally capable of handling a GPU?

Yes. The metal chassis, intentional airflow design, and internal component layout support PCIe card airflow. The system handles continuous workloads while staying cool, and the thermal design has headroom for expansion.

IA locale sur le ZimaCube 2 — Extension PCIe, Ollama et pérennisation de votre homelab

Eva Wong

IceWhale author

Eva Wong est la rédactrice technique et bricoleuse résidente chez ZimaSpace. Geek depuis toujours, passionnée par les homelabs et les logiciels open source, elle se spécialise dans la traduction de concepts techniques complexes en guides accessibles et pratiques. Eva croit que l’auto-hébergement doit être amusant, pas intimidant. À travers ses tutoriels, elle donne à la communauté les moyens de démystifier les configurations matérielles, depuis la construction de leur premier NAS jusqu’à la maîtrise des conteneurs Docker.

Local AI on the ZimaCube 2 — PCIe Expansion, Ollama, and Future-Proofing Your Homelab - Zima Store Online

💡 Focus communauté : Michael Luckenbill, programme pionnier ZimaCube 2

Quand j'ai ouvert le ZimaCube 2 pour la première fois, je ne regardais pas seulement ce qu'il pouvait faire aujourd'hui. Je regardais ce qu'il pourrait devenir demain.

À l'intérieur, en plus du matériel attendu, j'ai trouvé quelque chose qui m'a vraiment enthousiasmé : un disque NVMe Kingston de 256 Go pour le système d'exploitation — et un emplacement NVMe supplémentaire inutilisé sur la carte mère. Associé à l'emplacement d'extension PCIe à l'arrière, ce n'était pas qu'un NAS. C'était une plateforme conçue pour évoluer.

Vue du panneau avant du ZimaCube 2 : 6 baies de disques SATA, ports USB-A et USB-C avant, emplacement M.2 NVMe intégré

Au-delà du stockage : une plateforme conçue pour l'expansion

Le ZimaCube 2 est livré prêt à l'emploi, mais la vraie histoire est ce que vous pouvez ajouter plus tard :

Intégré

6 × baies SATA
4 × emplacements M.2 NVMe
8 Go DDR5 SODIMM
Double Ethernet 2,5 Gb
Châssis métallique avec refroidissement actif

Extensible

Emplacement NVMe supplémentaire sur la carte mère
Emplacement d'extension PCIe (GPU/IA/Stockage/Réseau)
RAM DDR5 SODIMM évolutive
Composants standards remplaçables

C'est l'une des plus grandes forces du système : il évolue avec vos besoins en infrastructure. Vous n'avez pas à tout acheter d'un coup. Vous commencez avec ce dont vous avez besoin et vous étendez quand vous êtes prêt.

IA locale : pourquoi c'est important pour les homelabs

Un de mes objectifs à long terme est d'exécuter davantage de charges de travail IA localement. Pas parce que l'IA cloud est mauvaise — mais parce que l'IA locale offre quelque chose de différent :

Confidentialité — Vos données ne quittent jamais votre réseau
Prévisibilité des coûts — Pas de tarification par token, pas de factures d'API en fin de mois
Liberté d'expérimentation — Tester des modèles, casser des choses, recommencer — sans se soucier des coûts cloud
Fonctionnement hors ligne — Une IA qui fonctionne même lorsque votre connexion internet ne fonctionne pas
Apprentissage — Comprendre comment les modèles fonctionnent réellement en les exécutant vous-même

Le ZimaCube 2 me fournit une plateforme où je peux expérimenter tout cela — Ollama pour les LLM locaux, les workflows de développement assistés par IA, les pipelines d'analyse d'images, les charges de travail d'inférence et les outils d'IA auto-hébergés — sans dépendre entièrement de l'infrastructure cloud.

Featured

ZimaCube 2 NAS personnel Cloud à domicile

ZimaCube2

Ce que vous pouvez exécuter aujourd'hui (sans GPU)

Même avant d'ajouter un GPU dédié, le ZimaCube 2 offre déjà une base solide pour l'expérimentation en IA :

🤖 Ollama + modèles plus petits — Le système de base peut exécuter confortablement des modèles quantifiés de 7B à 8B paramètres. Pensez aux modèles Llama 3, Mistral et de classe Phi pour le chat, l'assistance au code et l'analyse de texte.

💻 Développement assisté par IA — Combinez Ollama avec des outils comme Continue.dev ou Cody, et vous avez un assistant de codage IA local qui fonctionne entièrement hors ligne. Pas de clés API, pas de limites d'utilisation, pas de soucis de confidentialité.

📄 Analyse de documents & RAG — Avec les pools de stockage ZFS, vous pouvez construire des pipelines RAG (Retrieval Augmented Generation) locaux — alimentez vos documents, notes et ensembles de données dans une base de données vectorielle locale et interrogez-les avec un LLM fonctionnant sur la même machine.

🎁 Automatisation & Scripting — Les LLM locaux excellent dans les tâches structurées — classification, résumé, extraction. Intégrez Ollama à vos flux de travail Docker existants et automatisez les pipelines de traitement de texte qui nécessitaient auparavant des API cloud.

Disposition interne du matériel ZimaCube 2, dissipateur passif CPU, slot d'extension PCIe et emplacements NVMe intégrés

La voie de mise à niveau GPU

Le slot d'extension PCIe est là où les choses deviennent intéressantes à long terme. Ajouter un GPU — même modeste — transforme le ZimaCube 2 en un véritable serveur IA local :

Modèles plus grands — Exécutez des modèles de 13B à 34B paramètres avec déchargement GPU
Inférence plus rapide — Accélération de 10 à 50× sur la génération de tokens
Transcodage média — Transcodage Plex/Jellyfin accéléré par matériel
Génération d'images — Stable Diffusion et modèles similaires
Service multi-modèles — Exécutez différents modèles pour différentes tâches simultanément

🔌 Le slot prend en charge les cartes PCIe standard — pas de formats propriétaires, pas de verrouillage fournisseur. Vous choisissez le GPU qui correspond à vos besoins et à votre budget.

Pourquoi cette architecture est importante

Les homelabs modernes se chevauchent de plus en plus avec les charges de travail d'IA, l'inférence locale, le transcodage média, l'orchestration de conteneurs et l'informatique en périphérie.

Le ZimaCube 2 semble conçu avec cet avenir en tête. Ce n’est pas un appareil scellé qui vous oblige à en acheter un nouveau quand vos besoins changent. C’est une plateforme qui dit « voici ce dont vous avez besoin maintenant, voici la place pour ce que vous voudrez plus tard. »

Pour moi, c’est la différence entre un gadget et une infrastructure.

Vérification thermique : peut-il gérer une carte GPU ?

Une question naturelle : un système compact et silencieux peut-il vraiment gérer thermiquement une carte GPU ?

La réponse dépend du GPU, mais les bases sont solides :

Le châssis en métal fait office de dissipateur thermique
La conception du flux d’air est intentionnelle (pas une réflexion après coup)
La disposition interne des composants laisse de la place pour les besoins en flux d’air d’une carte PCIe

Le système gère déjà des charges continues Docker, ZFS et réseau tout en restant frais au toucher. La conception thermique offre une marge.

Questions fréquemment posées

Q1 : Le ZimaCube 2 peut-il faire tourner Ollama ?

Oui. La configuration de base peut faire tourner confortablement des modèles quantifiés de 7B à 8B paramètres (Llama 3, Mistral, Phi) pour le chat, l’assistance au code et l’analyse de texte. Avec un GPU ajouté via PCIe, vous pouvez exécuter des modèles plus grands avec une inférence beaucoup plus rapide.

Q2 : Le ZimaCube 2 possède-t-il un emplacement PCIe pour une carte GPU ?

Oui. Le ZimaCube 2 inclut un emplacement d’extension PCIe qui supporte les GPU standards, les accélérateurs IA, les cartes de stockage supplémentaires et les cartes réseau. Pas de formats propriétaires ni de verrouillage fournisseur.

Q3 : Que puis-je faire avec l’IA locale sur un NAS ?

L’IA locale sur un NAS permet des assistants de chat privés, du codage assisté par IA (avec des outils comme Continue.dev), l’analyse de documents avec des pipelines RAG, le traitement et la classification automatisés de textes, l’analyse d’images, et des expérimentations sans coûts d’API cloud.

Q4 : Combien d’emplacements NVMe le ZimaCube 2 possède-t-il ?

Le système dispose de 4 emplacements M.2 NVMe ainsi qu’un emplacement NVMe supplémentaire sur la carte mère (initialement utilisé pour le disque système), qui peut servir pour des disques système en miroir, un stockage Docker dédié ou des couches de cache.

Q5 : Puis-je augmenter la RAM plus tard ?

Oui. Le ZimaCube 2 utilise de la RAM DDR5 SODIMM standard, remplaçable par l'utilisateur. La configuration de base de 8 Go gère bien les charges de travail en conteneurs, et vous pouvez l'upgrader selon vos besoins.

Q6 : Le ZimaCube 2 est-il capable de gérer thermiquement une carte GPU ?

Oui. Le châssis en métal, la conception intentionnelle du flux d'air et la disposition interne des composants favorisent le refroidissement des cartes PCIe. Le système gère des charges de travail continues tout en restant frais, et la conception thermique offre une marge pour l'expansion.