Kan ZimaBoard 2 een lokale AI-assistent draaien?

Eva Wong is de Technisch Schrijver en vaste knutselaar bij ZimaSpace. Een levenslange geek met een passie voor homelabs en open-source software, ze is gespecialiseerd in het vertalen van complexe technische concepten naar toegankelijke, praktische handleidingen. Eva gelooft dat zelf-hosting leuk moet zijn, niet intimiderend. Met haar tutorials geeft ze de community de kracht om hardware-setup te ontrafelen, van het bouwen van hun eerste NAS tot het beheersen van Docker-containers.

Introductie

Bij ZimaSpace verkennen we continu hoe compacte hardware persoonlijke computing kan herdefiniëren. In dit artikel analyseren we een praktische test door de maker achter het Core Works Lab YouTube-kanaal, die onderzocht of een ventilatorloze single-board server een volledig lokale AI-spraakassistent kan draaien.

We willen Core Works Lab bedanken voor de gedetailleerde walkthrough en praktijktests. Dit artikel zet hun video-inzichten om in een gestructureerd, geschreven formaat om meer gebruikers te helpen begrijpen wat mogelijk is met ZimaBoard 2 als Home Server—van AI-workloads tot homelab-opstellingen.

ZimaBoard 2 testen als lokale AI-machine

Het geteste apparaat is de ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), een compacte en energiezuinige Home Server ontworpen voor flexibiliteit. Het ondersteunt native SATA- en PCIe-uitbreiding, waardoor gebruikers SSD's, GPU's en netwerkkaarten kunnen aansluiten zonder extra adapters.

Het doel van de maker was duidelijk:
Kan een ventilatorloze Home Server betrouwbaar een lokale AI-spraakassistent draaien?

Initiële installatie en hardwareconfiguratie

Het systeem werd uitgebreid met:

Het bord start op in een webgebaseerd dashboard, waar applicaties zoals Docker-containers en tools zoals N8N kunnen worden geïnstalleerd.

Belangrijke observatie:
Het installatieproces is eenvoudig, waardoor ZimaBoard 2 toegankelijk is, zelfs voor gebruikers die hun eerste Home Server bouwen.

Echter, werden enkele kleine hardwareproblemen opgemerkt:

  • Beugelschroeven waren niet getapt
  • Sommige schroeven waren te lang voor bepaalde configuraties

De AI-assistent (CAL) draaien

De assistent (CAL) werd ingezet via Docker met een CPU-only configuratie.

Initiële opstelling omvatte:

  • Spraak-naar-tekst: Groq Whisper (cloud)
  • LLM: Groq (cloud-inferentie)
  • Tekst-naar-spraak: Piper (lokaal CPU)

Resultaat:
De hybride opstelling werkte soepel en reageerde snel, wat een sterke basislijn opleverde.

Een belangrijke functie die werd gedemonstreerd was korte-termijngeheugen, waarbij de assistent gegevens zoals trackingnummers of vluchtgegevens opsloeg en terughaalde.

Voorbeeld:

  • Opgeslagen: Vluchtnummer AF1
  • Automatisch opgehaald voor tool-gebaseerde zoekopdrachten

Dit toont aan hoe persistente geheugensystemen AI-assistenten op een Home Server kunnen verbeteren.

Lokale LLM-test met Ollama

De volgende fase testte volledig lokale modellen met Ollama.

Ministral 3B (3 miljard parameters)

  • Promptverwerking: ~268 tokens/sec
  • Generatiesnelheid: ~7 tokens/sec

Belangrijkste bevinding:
Het riep succesvol tools aan zonder fijnafstelling, wat indrukwekkend is.

Echter:

  • Reactietijd bereikte tot 6 minuten per interactie

Dit maakt het onpraktisch voor realtime spraakassistenten.

Close-up van handen die een compacte witte ZIMA persoonlijke server uit de kartonnen verpakking tillen op een houten tafel

Functie Gemma (270M Parameters)

  • Veel sneller (~43 tokens/sec)
  • Kon tool-aanroepen niet correct uitvoeren

Inzicht:
Kleinere modellen zijn sneller maar vereisen fijnafstelling om gestructureerde taken zoals tool-aanroepen aan te kunnen.

Een GPU toevoegen: prestatieverbeteringen

Een GT 1030 (2GB VRAM) werd toegevoegd via PCIe.

Resultaten:

  • Prompt-evaluatiesnelheid bijna verdubbeld
  • Modelverdeling: 34% GPU / 66% CPU
  • De snelheid van token generatie bleef vergelijkbaar

Belangrijke conclusie:
Bandbreedte—niet rekenkracht—is de bottleneck voor token generatie.

Bij het testen van een kleiner model volledig geladen in de GPU:

  • Prompt-evaluatie bereikte 1100 tokens/sec

Dit bevestigt:

Volledige GPU-belasting verbetert de latentie dramatisch voor een Home Server AI-opstelling

Beperkingen in de praktijk

Ondanks veelbelovende resultaten kwamen er verschillende beperkingen naar voren:

  • CPU-only opstellingen zijn te traag voor grote modellen
  • Kleine modellen missen betrouwbaarheid zonder training
  • GPU-prestaties hangen sterk af van VRAM en stroomvoorziening

De maker merkte op dat een 5GB GPU (bijv. Quadro P2200) een 3B-model volledig kon belasten en de prestaties aanzienlijk verbeterde.

Belangrijkste conclusies

  • ZimaBoard 2 kan AI-taken effectief uitvoeren als Home Server
  • Hybride (cloud + lokaal) opstellingen bieden vandaag de beste balans
  • Lokale LLM's zijn haalbaar maar vereisen optimalisatie
  • GPU-upgrades ontgrendelen aanzienlijke prestatieverbeteringen
  • Tool-aanroepcapaciteit hangt meer af van modelontwerp dan van grootte

Waarom ZimaBoard 2 eruit springt

ZimaBoard 2 combineert:

  • Laag energieverbruik (24/7 werking)
  • Stil, ventilatorloos ontwerp
  • Native SATA & PCIe-uitbreiding
  • Dubbele 2,5G Ethernet

Dit maakt het ideaal voor:

  • Plex-mediaservers
  • Docker-labs
  • AI-containers
  • Persoonlijke NAS-systemen

Zoals veel gebruikers het beschrijven:
“Een mini-server die eruitziet als een speelgoedje maar draait als een beest.”

Slotgedachten

Dit experiment toont aan dat het bouwen van een AI-capabele Home Server niet langer onbereikbaar is. Hoewel volledig lokale spraakassistenten nog prestatie-uitdagingen kennen, Biedt ZimaBoard 2 een flexibele en krachtige basis voor experimenten.

Voor ontwikkelaars, knutselaars en homelab-liefhebbers opent het de deur naar:

En misschien wel het belangrijkste—het maakt het proces leuk, aanpasbaar en toegankelijk.

Zima Campagne Hub

Meer om te lezen

Bouw je eigen cloud met ZimaCube 2
May 23, 2026Homelab Projects

Bouw je eigen cloud met ZimaCube 2

Leer hoe ZimaCube 2 en tools zoals Nextcloud, Alpha AI en Resilio Sync je in staat stellen om conventionele cloudopslag te vervangen door een...

Hoe ZimaCube 2 een NAS verandert in een AI-beest
May 22, 2026Home Server Projects

Hoe ZimaCube 2 een NAS verandert in een AI-beest

ZimaCube 2 is een modulaire persoonlijke cloud-NAS die opslag met hoge capaciteit, PCIe-uitbreiding, Zima OS en externe toegang combineert in een flexibele thuisserver voor...

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.