Introduzione
Da ZimaSpace, esploriamo continuamente come l'hardware compatto possa ridefinire il personal computing. In questo articolo, analizziamo un esperimento pratico del creatore dietro il canale YouTube Core Works Lab, che ha testato se un server single-board senza ventola può eseguire un assistente vocale AI completamente locale.
Ringraziamo Core Works Lab per la dettagliata guida e i test sul campo. Questo articolo trasforma i loro approfondimenti video in un formato scritto strutturato per aiutare più utenti a capire cosa è possibile con ZimaBoard 2 come Home Server—dai carichi di lavoro AI alle configurazioni homelab.
Test di ZimaBoard 2 come macchina AI locale
Il dispositivo testato è il ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Home Server compatto e a basso consumo progettato per la flessibilità. Supporta espansione nativa SATA e PCIe, permettendo agli utenti di collegare SSD, GPU e schede di rete senza adattatori aggiuntivi.
L'obiettivo del creatore era chiaro:
Un Home Server senza ventola può eseguire affidabilmente un assistente vocale AI locale?
Configurazione iniziale e configurazione hardware
Il sistema è stato ampliato usando:
- SSD NVMe tramite adattatore PCIe
- Rack doppio per unità da 2,5"
- GPU opzionale (GT 1030)
- ZimaOS preinstallato
La scheda si avvia in una dashboard web, dove possono essere installate applicazioni come container Docker e strumenti come N8N.
Osservazione chiave:
Il processo di configurazione è semplice, rendendo ZimaBoard 2 accessibile anche per utenti che costruiscono il loro primo Home Server.
Tuttavia, sono stati notati alcuni piccoli problemi hardware:
- Le viti della staffa di montaggio non erano filettate
- Alcune viti erano troppo lunghe per alcune configurazioni
Esecuzione dell'Assistente AI (CAL)
L'assistente (CAL) è stato distribuito tramite Docker usando configurazione solo CPU.
La configurazione iniziale includeva:
- Voce in testo: Groq Whisper (cloud)
- LLM: Groq (inferenzia cloud)
- Testo in voce: Piper (CPU locale)
Risultato:
La configurazione ibrida ha funzionato senza intoppi e ha risposto rapidamente, stabilendo una solida base.
Una caratteristica chiave dimostrata è stata la memoria a breve termine, dove l'assistente ha memorizzato e richiamato dati come numeri di tracciamento o dettagli di volo.
Esempio:
- Memorizzato: Numero volo AF1
- Recuperato automaticamente per query basate su strumenti
Questo mostra come i sistemi di memoria persistente possono migliorare gli assistenti AI su un Home Server.
Test di LLM locale con Ollama
La fase successiva ha testato modelli completamente locali usando Ollama.
Ministral 3B (3 miliardi di parametri)
- Elaborazione prompt: ~268 token/sec
- Velocità di generazione: ~7 token/sec
Scoperta chiave:
Ha chiamato con successo gli strumenti senza fine-tuning, il che è impressionante.
Tuttavia:
- Il tempo di risposta ha raggiunto fino a 6 minuti per interazione
Questo lo rende poco pratico per assistenti vocali in tempo reale.

Funzione Gemma (270M Parametri)
- Molto più veloce (~43 token/sec)
- Non è riuscito a eseguire correttamente le chiamate agli strumenti
Approfondimento:
I modelli più piccoli sono più veloci ma richiedono fine-tuning per gestire compiti strutturati come la chiamata di strumenti.
Aggiunta di una GPU: guadagni di prestazioni
È stata aggiunta una GT 1030 (2GB VRAM) tramite PCIe.
Risultati:
- La velocità di valutazione del prompt è quasi raddoppiata
- Divisione modello: 34% GPU / 66% CPU
- La velocità di generazione dei token è rimasta simile
Importante da ricordare:
La larghezza di banda — non il calcolo — è il collo di bottiglia per la generazione di token.
Durante il test di un modello più piccolo completamente caricato in GPU:
- La valutazione del prompt ha raggiunto 1100 token/sec
Questo conferma:
Il caricamento completo della GPU migliora drasticamente la latenza per una configurazione AI su Home Server
Limitazioni nel mondo reale
Nonostante i risultati promettenti, sono emerse diverse limitazioni:
- Le configurazioni solo CPU sono troppo lente per modelli grandi
- I modelli piccoli mancano di affidabilità senza addestramento
- Le prestazioni GPU dipendono molto dalla VRAM e dall’alimentazione
Il creatore ha notato che una GPU da 5GB (es. Quadro P2200) poteva caricare completamente un modello 3B e migliorare significativamente le prestazioni.
Punti chiave
- ZimaBoard 2 può eseguire carichi di lavoro AI efficacemente come Home Server
- Le configurazioni ibride (cloud + locale) offrono oggi il miglior equilibrio
- I LLM locali sono fattibili ma richiedono ottimizzazione
- Gli upgrade GPU sbloccano guadagni di prestazioni significativi
- La capacità di chiamare strumenti dipende più dal design del modello che dalla dimensione
Perché ZimaBoard 2 si distingue
ZimaBoard 2 combina:
- Basso consumo energetico (funzionamento 24/7)
- Design silenzioso e senza ventole
- Espansione nativa SATA & PCIe
- Doppia Ethernet 2.5G
Questo lo rende ideale per:
- Server multimediali Plex
- Laboratori Docker
- Container AI
- Sistemi NAS personali
Come molti utenti lo descrivono:
“Un mini server che sembra un giocattolo ma funziona come una bestia.”
Considerazioni finali
Questo esperimento dimostra che costruire un Home Server capace di AI non è più fuori portata. Sebbene gli assistenti vocali completamente locali affrontino ancora sfide di prestazioni, ZimaBoard 2 offre una base flessibile e potente per la sperimentazione.
Per sviluppatori, smanettoni e appassionati di homelab, apre la porta a:
- Pipeline AI locali
- Configurazioni di edge computing
- Ambienti server completamente personalizzati
E forse, cosa più importante, rende il processo divertente, modificabile e accessibile.
Centro Campagna Zima
Altro da leggere

Cosa sorprendente può davvero fare l'AI NAS di ZimaCube 2
Scopri come ZimaCube 2 si evolve in un NAS AI che combina un enorme spazio di archiviazione con l'intelligenza artificiale locale, utilizzando la ricerca...

Costruisci il tuo cloud con ZimaCube 2
Scopri come ZimaCube 2 e strumenti come Nextcloud, Alpha AI e Resilio Sync ti permettono di sostituire l'archiviazione cloud convenzionale con un'infrastruttura potente e...

Come ZimaCube 2 Trasforma un NAS in una Bestia AI
ZimaCube 2 è un NAS cloud personale modulare che combina un'ampia capacità di archiviazione, espansione PCIe, Zima OS e accesso remoto in un server...

