ZimaBoard 2 può eseguire un assistente AI locale?

Eva Wong è la Technical Writer e smanettatrice residente di ZimaSpace. Una geek da sempre con una passione per homelab e software open source, si specializza nel tradurre concetti tecnici complessi in guide pratiche e accessibili .Eva crede che l'auto-hosting debba essere divertente, non intimidatorio. Attraverso i suoi tutorial, dà potere alla community di demistificare le configurazioni hardware, dalla costruzione del primo NAS al dominio dei container Docker.

Introduzione

Da ZimaSpace, esploriamo continuamente come l'hardware compatto possa ridefinire il personal computing. In questo articolo, analizziamo un esperimento pratico del creatore dietro il canale YouTube Core Works Lab, che ha testato se un server single-board senza ventola può eseguire un assistente vocale AI completamente locale.

Ringraziamo Core Works Lab per la dettagliata guida e i test sul campo. Questo articolo trasforma i loro approfondimenti video in un formato scritto strutturato per aiutare più utenti a capire cosa è possibile con ZimaBoard 2 come Home Server—dai carichi di lavoro AI alle configurazioni homelab.

Test di ZimaBoard 2 come macchina AI locale

Il dispositivo testato è il ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Home Server compatto e a basso consumo progettato per la flessibilità. Supporta espansione nativa SATA e PCIe, permettendo agli utenti di collegare SSD, GPU e schede di rete senza adattatori aggiuntivi.

L'obiettivo del creatore era chiaro:
Un Home Server senza ventola può eseguire affidabilmente un assistente vocale AI locale?

Configurazione iniziale e configurazione hardware

Il sistema è stato ampliato usando:

La scheda si avvia in una dashboard web, dove possono essere installate applicazioni come container Docker e strumenti come N8N.

Osservazione chiave:
Il processo di configurazione è semplice, rendendo ZimaBoard 2 accessibile anche per utenti che costruiscono il loro primo Home Server.

Tuttavia, sono stati notati alcuni piccoli problemi hardware:

  • Le viti della staffa di montaggio non erano filettate
  • Alcune viti erano troppo lunghe per alcune configurazioni

Esecuzione dell'Assistente AI (CAL)

L'assistente (CAL) è stato distribuito tramite Docker usando configurazione solo CPU.

La configurazione iniziale includeva:

  • Voce in testo: Groq Whisper (cloud)
  • LLM: Groq (inferenzia cloud)
  • Testo in voce: Piper (CPU locale)

Risultato:
La configurazione ibrida ha funzionato senza intoppi e ha risposto rapidamente, stabilendo una solida base.

Una caratteristica chiave dimostrata è stata la memoria a breve termine, dove l'assistente ha memorizzato e richiamato dati come numeri di tracciamento o dettagli di volo.

Esempio:

  • Memorizzato: Numero volo AF1
  • Recuperato automaticamente per query basate su strumenti

Questo mostra come i sistemi di memoria persistente possono migliorare gli assistenti AI su un Home Server.

Test di LLM locale con Ollama

La fase successiva ha testato modelli completamente locali usando Ollama.

Ministral 3B (3 miliardi di parametri)

  • Elaborazione prompt: ~268 token/sec
  • Velocità di generazione: ~7 token/sec

Scoperta chiave:
Ha chiamato con successo gli strumenti senza fine-tuning, il che è impressionante.

Tuttavia:

  • Il tempo di risposta ha raggiunto fino a 6 minuti per interazione

Questo lo rende poco pratico per assistenti vocali in tempo reale.

Vista ravvicinata di mani che sollevano un compatto server personale bianco ZIMA dalla sua confezione di cartone su un tavolo di legno

Funzione Gemma (270M Parametri)

  • Molto più veloce (~43 token/sec)
  • Non è riuscito a eseguire correttamente le chiamate agli strumenti

Approfondimento:
I modelli più piccoli sono più veloci ma richiedono fine-tuning per gestire compiti strutturati come la chiamata di strumenti.

Aggiunta di una GPU: guadagni di prestazioni

È stata aggiunta una GT 1030 (2GB VRAM) tramite PCIe.

Risultati:

  • La velocità di valutazione del prompt è quasi raddoppiata
  • Divisione modello: 34% GPU / 66% CPU
  • La velocità di generazione dei token è rimasta simile

Importante da ricordare:
La larghezza di banda — non il calcolo — è il collo di bottiglia per la generazione di token.

Durante il test di un modello più piccolo completamente caricato in GPU:

  • La valutazione del prompt ha raggiunto 1100 token/sec

Questo conferma:

Il caricamento completo della GPU migliora drasticamente la latenza per una configurazione AI su Home Server

Limitazioni nel mondo reale

Nonostante i risultati promettenti, sono emerse diverse limitazioni:

  • Le configurazioni solo CPU sono troppo lente per modelli grandi
  • I modelli piccoli mancano di affidabilità senza addestramento
  • Le prestazioni GPU dipendono molto dalla VRAM e dall’alimentazione

Il creatore ha notato che una GPU da 5GB (es. Quadro P2200) poteva caricare completamente un modello 3B e migliorare significativamente le prestazioni.

Punti chiave

  • ZimaBoard 2 può eseguire carichi di lavoro AI efficacemente come Home Server
  • Le configurazioni ibride (cloud + locale) offrono oggi il miglior equilibrio
  • I LLM locali sono fattibili ma richiedono ottimizzazione
  • Gli upgrade GPU sbloccano guadagni di prestazioni significativi
  • La capacità di chiamare strumenti dipende più dal design del modello che dalla dimensione

Perché ZimaBoard 2 si distingue

ZimaBoard 2 combina:

  • Basso consumo energetico (funzionamento 24/7)
  • Design silenzioso e senza ventole
  • Espansione nativa SATA & PCIe
  • Doppia Ethernet 2.5G

Questo lo rende ideale per:

  • Server multimediali Plex
  • Laboratori Docker
  • Container AI
  • Sistemi NAS personali

Come molti utenti lo descrivono:
“Un mini server che sembra un giocattolo ma funziona come una bestia.”

Considerazioni finali

Questo esperimento dimostra che costruire un Home Server capace di AI non è più fuori portata. Sebbene gli assistenti vocali completamente locali affrontino ancora sfide di prestazioni, ZimaBoard 2 offre una base flessibile e potente per la sperimentazione.

Per sviluppatori, smanettoni e appassionati di homelab, apre la porta a:

E forse, cosa più importante, rende il processo divertente, modificabile e accessibile.

Centro Campagna Zima

Altro da leggere

Costruisci il tuo cloud con ZimaCube 2
May 23, 2026Homelab Projects

Costruisci il tuo cloud con ZimaCube 2

Scopri come ZimaCube 2 e strumenti come Nextcloud, Alpha AI e Resilio Sync ti permettono di sostituire l'archiviazione cloud convenzionale con un'infrastruttura potente e...

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.