ZimaBoard 2 può eseguire un assistente AI locale?

Eva Wong

IceWhale author

Eva Wong è la Technical Writer e smanettatrice residente di ZimaSpace. Una geek da sempre con una passione per homelab e software open-source, si specializza nel tradurre concetti tecnici complessi in guide accessibili e pratiche. Eva crede che l'auto-ospitare debba essere divertente, non intimidatorio. Attraverso i suoi tutorial, dà potere alla comunità di demistificare le configurazioni hardware, dalla costruzione del loro primo NAS al dominio dei container Docker.

Can ZimaBoard 2 Run a Local AI Assistant? - Zima Store Online

Introduzione

Da ZimaSpace esploriamo continuamente come l’hardware compatto possa ridefinire il computing personale. In questo articolo analizziamo un esperimento pratico del creatore del canale YouTube Core Works Lab, che ha testato se un server single-board senza ventola può eseguire un assistente vocale AI completamente locale.

Ringraziamo Core Works Lab per la dettagliata guida e i test reali. Questo articolo trasforma i loro approfondimenti video in un formato scritto strutturato per aiutare più utenti a capire cosa è possibile con ZimaBoard 2 come Home Server—dai carichi AI alle configurazioni homelab.

Test di ZimaBoard 2 come macchina AI locale

Il dispositivo testato è il ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Home Server compatto e a basso consumo progettato per la flessibilità. Supporta espansione nativa SATA e PCIe, permettendo agli utenti di collegare SSD, GPU e schede di rete senza adattatori aggiuntivi.

L’obiettivo del creatore era chiaro:
Un Home Server senza ventola può eseguire affidabilmente un assistente vocale AI locale?

Configurazione iniziale e hardware

Il sistema è stato ampliato usando:

SSD NVMe tramite adattatore PCIe
Rack doppio per unità 2,5"
GPU opzionale (GT 1030)
ZimaOS preinstallato

La scheda si avvia in una dashboard web, dove possono essere installate applicazioni come container Docker e strumenti come N8N.

Osservazione chiave:
Il processo di configurazione è semplice, rendendo ZimaBoard 2 accessibile anche agli utenti che costruiscono il loro primo Home Server.

Tuttavia, sono stati notati alcuni piccoli problemi hardware:

Le viti della staffa di montaggio non erano filettate
Alcune viti erano troppo lunghe per alcune configurazioni

Esecuzione dell’Assistente AI (CAL)

L’assistente (CAL) è stato distribuito tramite Docker usando configurazione solo CPU.

La configurazione iniziale includeva:

Voce in testo: Groq Whisper (cloud)
LLM: Groq (inferenzia cloud)
Testo in voce: Piper (CPU locale)

Risultato:
La configurazione ibrida ha funzionato senza intoppi e ha risposto rapidamente, stabilendo una solida base.

Una caratteristica chiave dimostrata è stata la memoria a breve termine, dove l’assistente ha memorizzato e richiamato dati come numeri di tracciamento o dettagli di volo.

Esempio:

Memorizzato: Numero volo AF1
Recuperato automaticamente per query basate su strumenti

Questo dimostra come i sistemi di memoria persistente possano migliorare gli assistenti AI su un Home Server.

Test di LLM locali con Ollama

La fase successiva ha testato modelli completamente locali usando Ollama.

Ministral 3B (3 miliardi di parametri)

Elaborazione prompt: ~268 token/sec
Velocità di generazione: ~7 token/sec

Risultato chiave:
Ha chiamato con successo gli strumenti senza fine-tuning, il che è impressionante.

Tuttavia:

Il tempo di risposta ha raggiunto fino a 6 minuti per interazione

Questo lo rende poco pratico per assistenti vocali in tempo reale.

Vista ravvicinata di mani che sollevano un compatto server personale bianco ZIMA dalla sua confezione di cartone su un tavolo di legno

Funzione Gemma (270M Parametri)

Molto più veloce (~43 token/sec)
Non è riuscito a eseguire correttamente le chiamate agli strumenti

Osservazione:
I modelli più piccoli sono più veloci ma richiedono fine-tuning per gestire compiti strutturati come la chiamata di strumenti.

Aggiunta di una GPU: guadagni di prestazioni

È stata aggiunta una GT 1030 (2GB VRAM) tramite PCIe.

Risultati:

La velocità di valutazione del prompt è quasi raddoppiata
Divisione modello: 34% GPU / 66% CPU
La velocità di generazione dei token è rimasta simile

Importante da ricordare:
La larghezza di banda—non il calcolo—è il collo di bottiglia per la generazione di token.

Durante il test di un modello più piccolo completamente caricato in GPU:

La valutazione del prompt ha raggiunto 1100 token/sec

Questo conferma:

Il caricamento completo della GPU migliora drasticamente la latenza per una configurazione AI su Home Server

Limitazioni nel mondo reale

Nonostante i risultati promettenti, sono emerse diverse limitazioni:

Le configurazioni solo CPU sono troppo lente per modelli grandi
I modelli piccoli mancano di affidabilità senza addestramento
Le prestazioni GPU dipendono molto dalla VRAM e dall’alimentazione

Il creatore ha notato che una GPU da 5GB (es. Quadro P2200) poteva caricare completamente un modello 3B e migliorare significativamente le prestazioni.

Punti chiave

ZimaBoard 2 può eseguire carichi di lavoro AI efficacemente come Home Server
Le configurazioni ibride (cloud + locale) offrono oggi il miglior equilibrio
I LLM locali sono fattibili ma richiedono ottimizzazione
Gli upgrade GPU sbloccano guadagni di prestazioni significativi
La capacità di chiamare strumenti dipende più dal design del modello che dalla dimensione

Featured

ZimaBoard 2 - Server domestico a scheda singola ad alte prestazioni

Single board computer zimaboard2

Perché ZimaBoard 2 si distingue

ZimaBoard 2 combina:

Basso consumo energetico (funzionamento 24/7)
Design silenzioso e senza ventole
Espansione nativa SATA e PCIe
Doppia Ethernet 2.5G

Questo lo rende ideale per:

Server multimediali Plex
Laboratori Docker
Container AI
Sistemi NAS personali

Come lo descrivono molti utenti:
“Un mini server che sembra un giocattolo ma funziona come una bestia.”

Considerazioni finali

Questo esperimento dimostra che costruire un Home Server capace di AI non è più fuori portata. Sebbene gli assistenti vocali completamente locali affrontino ancora sfide di prestazioni, ZimaBoard 2 offre una base flessibile e potente per la sperimentazione.

Per sviluppatori, smanettoni e appassionati di homelab, apre la porta a: