Wprowadzenie
W ZimaSpace nieustannie badamy, jak kompaktowy sprzęt może redefiniować osobiste komputery. W tym artykule analizujemy praktyczny eksperyment twórcy kanału Core Works Lab na YouTube, który testował, czy bezwentylatorowy serwer jednopłytkowy może uruchomić w pełni lokalnego asystenta głosowego AI.
Chcielibyśmy podziękować Core Works Lab za szczegółowy przewodnik i testy w rzeczywistych warunkach. Ten artykuł przekształca ich wideo w uporządkowany, pisemny format, aby pomóc większej liczbie użytkowników zrozumieć, co jest możliwe z ZimaBoard 2 jako serwerem domowym — od obciążeń AI po konfiguracje homelab.
Testowanie ZimaBoard 2 jako lokalnej maszyny AI
Testowane urządzenie to ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), kompaktowy i energooszczędny serwer domowy zaprojektowany z myślą o elastyczności. Obsługuje natywne rozszerzenia SATA i PCIe, pozwalając użytkownikom podłączać dyski SSD, karty GPU i sieciowe bez dodatkowych adapterów.
Cel twórcy był jasny:
Czy bezwentylatorowy serwer domowy może niezawodnie uruchomić lokalnego asystenta głosowego AI?
Początkowa konfiguracja i ustawienia sprzętowe
System został rozbudowany za pomocą:
- Dysk NVMe SSD przez adapter PCIe
- Podwójna zatoka na dyski 2,5"
- Opcjonalna karta GPU (GT 1030)
- Zainstalowany fabrycznie ZimaOS
Płyta uruchamia się do panelu webowego, gdzie można instalować aplikacje takie jak kontenery Docker i narzędzia typu N8N.
Kluczowa obserwacja:
Proces konfiguracji jest prosty, co sprawia, że ZimaBoard 2 jest dostępny nawet dla użytkowników budujących swój pierwszy serwer domowy.
Jednakże, zauważono drobne problemy sprzętowe:
- Śruby do uchwytu montażowego nie były gwintowane
- Niektóre śruby były za długie dla niektórych konfiguracji
Uruchamianie asystenta AI (CAL)
Asystent (CAL) został wdrożony przez Docker z konfiguracją tylko CPU.
Początkowa konfiguracja obejmowała:
- Mowa na tekst: Groq Whisper (chmura)
- LLM: Groq (inference w chmurze)
- Tekst na mowę: Piper (lokalny CPU)
Wynik:
Konfiguracja hybrydowa działała płynnie i szybko reagowała, ustanawiając solidną bazę.
Kluczową cechą, którą zademonstrowano, była pamięć krótkotrwała, gdzie asystent zapisywał i przypominał sobie dane takie jak numery śledzenia czy szczegóły lotu.
Przykład:
- Zapisane: Numer lotu AF1
- Pobrane automatycznie dla zapytań opartych na narzędziach
To pokazuje, jak systemy pamięci trwałej mogą usprawnić asystentów AI na serwerze domowym.
Testowanie lokalnych LLM z Ollama
Następna faza testowała w pełni lokalne modele za pomocą Ollama.
Ministral 3B (3 miliardy parametrów)
- Przetwarzanie promptu: ~268 tokenów/sek
- Prędkość generowania: ~7 tokenów/sek
Kluczowe ustalenie:
Udało się wywołać narzędzia bez dostrajania, co jest imponujące.
Jednak:
- Czas odpowiedzi sięgał do 6 minut na interakcję
To czyni go niepraktycznym dla asystentów głosowych w czasie rzeczywistym.

Funkcja Gemma (270M parametrów)
- Znacznie szybsze (~43 tokeny/sekundę)
- Nie udało się poprawnie wykonać wywołań narzędzi
Wgląd:
Mniejsze modele są szybsze, ale wymagają dostrajania do obsługi zadań strukturalnych, takich jak wywoływanie narzędzi.
Dodanie GPU: wzrost wydajności
Dodano GT 1030 (2GB VRAM) przez PCIe.
Wyniki:
- Prędkość oceny promptu prawie się podwoiła
- Podział modelu: 34% GPU / 66% CPU
- Prędkość generowania tokenów pozostała podobna
Ważny wniosek:
Wąskim gardłem dla generowania tokenów jest przepustowość, a nie moc obliczeniowa.
Podczas testowania mniejszego modelu w pełni załadowanego do GPU:
- Ocena promptu osiągnęła 1100 tokenów/sekundę
To potwierdza:
Pełne obciążenie GPU znacznie poprawia opóźnienia w konfiguracji AI na domowym serwerze
Ograniczenia w rzeczywistych warunkach
Pomimo obiecujących wyników pojawiło się kilka ograniczeń:
- Konfiguracje tylko z CPU są zbyt wolne dla dużych modeli
- Małe modele są niewiarygodne bez treningu
- Wydajność GPU w dużej mierze zależy od VRAM i zasilania
Twórca zauważył, że 5GB GPU (np. Quadro P2200) może w pełni obciążyć model 3B i znacznie poprawić wydajność.
Kluczowe wnioski
- ZimaBoard 2 może skutecznie uruchamiać zadania AI jako domowy serwer
- Hybrydowe konfiguracje (chmura + lokalne) oferują dziś najlepszą równowagę
- Lokalne LLM są wykonalne, ale wymagają optymalizacji
- Ulepszenia GPU odblokowują znaczące wzrosty wydajności
- Możliwość wywoływania narzędzi zależy bardziej od projektu modelu niż od rozmiaru
Dlaczego ZimaBoard 2 się wyróżnia
ZimaBoard 2 łączy w sobie:
- Niskie zużycie energii (praca 24/7)
- Cicha, bezwentylatorowa konstrukcja
- Natywne rozszerzenia SATA i PCIe
- Podwójny Ethernet 2,5G
To czyni go idealnym do:
- Serwery multimedialne Plex
- Laboratoria Docker
- Kontenery AI
- Osobiste systemy NAS
Jak wielu użytkowników go opisuje:
„Mini serwer, który wygląda jak zabawka, ale działa jak bestia.”
Ostateczne przemyślenia
Ten eksperyment pokazuje, że budowa domowego serwera zdolnego do AI nie jest już poza zasięgiem. Chociaż w pełni lokalni asystenci głosowi nadal mają wyzwania wydajnościowe, ZimaBoard 2 zapewnia elastyczną i potężną podstawę do eksperymentów.
Dla programistów, majsterkowiczów i entuzjastów homelabów otwiera to drzwi do:
- Lokalne pipeline'y AI
- Konfiguracje edge computing
- W pełni spersonalizowane środowiska serwerowe
I co być może najważniejsze — proces ten jest zabawny, modyfikowalny i dostępny.
Centrum Kampanii Zima
Więcej do przeczytania

Zaskakujące możliwości AI NAS ZimaCube 2
Zobacz, jak ZimaCube 2 przekształca się w AI NAS, łącząc ogromną przestrzeń dyskową z lokalną sztuczną inteligencją, wykorzystując wyszukiwanie wektorowe do automatycznego tagowania zdjęć,...

Zbuduj własną chmurę z ZimaCube 2
Dowiedz się, jak ZimaCube 2 oraz narzędzia takie jak Nextcloud, Alpha AI i Resilio Sync pozwalają zastąpić tradycyjną chmurę potężną, prywatną infrastrukturą self-hosted do...

Jak ZimaCube 2 zamienia NAS w potwora AI
ZimaCube 2 to modułowy osobisty chmurowy NAS, który łączy dużą pojemność pamięci, rozszerzenia PCIe, Zima OS oraz zdalny dostęp w elastyczny serwer domowy do...

