Czy ZimaBoard 2 może obsługiwać lokalnego asystenta AI?

Eva Wong

IceWhale author

Eva Wong jest Technicznym pisarzem i stałym majsterkowiczem w ZimaSpace. Całe życie geek z pasją do homelabów i oprogramowania open-source, specjalizuje się w tłumaczeniu skomplikowanych koncepcji technicznych na przystępne, praktyczne przewodniki. Eva wierzy, że samodzielne hostowanie powinno być zabawą, a nie czymś onieśmielającym. Poprzez swoje samouczki umożliwia społeczności rozwiewanie tajemnic konfiguracji sprzętu, od budowy pierwszego NAS po opanowanie kontenerów Docker.

Can ZimaBoard 2 Run a Local AI Assistant? - Zima Store Online

Wprowadzenie

W ZimaSpace nieustannie badamy, jak kompaktowy sprzęt może redefiniować osobiste komputery. W tym artykule analizujemy praktyczny eksperyment twórcy kanału Core Works Lab na YouTube, który testował, czy bezwentylatorowy serwer jednopłytkowy może uruchomić w pełni lokalnego asystenta głosowego AI.

Chcielibyśmy podziękować Core Works Lab za szczegółowy przewodnik i testy w praktyce. Ten artykuł przekształca ich wideo w uporządkowany, pisemny format, aby pomóc większej liczbie użytkowników zrozumieć, co jest możliwe z ZimaBoard 2 jako serwerem domowym — od obciążeń AI po konfiguracje homelab.

Testowanie ZimaBoard 2 jako lokalnej maszyny AI

Testowane urządzenie to ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), kompaktowy i energooszczędny serwer domowy zaprojektowany z myślą o elastyczności. Obsługuje natywne rozszerzenia SATA i PCIe, pozwalając użytkownikom podłączać dyski SSD, karty GPU i sieciowe bez dodatkowych adapterów.

Cel twórcy był jasny:
Czy bezwentylatorowy serwer domowy może niezawodnie uruchomić lokalnego asystenta głosowego AI?

Początkowa konfiguracja i ustawienia sprzętowe

System został rozbudowany za pomocą:

NVMe SSD przez adapter PCIe
Podwójna zatoka na dyski 2,5"
Opcjonalna karta GPU (GT 1030)
Zainstalowany fabrycznie ZimaOS

Płyta uruchamia się do panelu webowego, gdzie można instalować aplikacje takie jak kontenery Docker i narzędzia typu N8N.

Kluczowa obserwacja:
Proces konfiguracji jest prosty, co sprawia, że ZimaBoard 2 jest dostępny nawet dla użytkowników budujących swój pierwszy serwer domowy.

Jednakże, zauważono drobne problemy sprzętowe:

Śruby do uchwytu montażowego nie były gwintowane
Niektóre śruby były za długie dla niektórych konfiguracji

Uruchamianie asystenta AI (CAL)

Asystent (CAL) został wdrożony przez Dockera w konfiguracji tylko CPU.

Początkowa konfiguracja obejmowała:

Mowa na tekst: Groq Whisper (chmura)
LLM: Groq (chmura)
Tekst na mowę: Piper (lokalny CPU)

Wynik:
Konfiguracja hybrydowa działała płynnie i szybko reagowała, ustanawiając solidną bazę.

Kluczową cechą było pamięć krótkotrwała, gdzie asystent zapisywał i przypominał sobie dane takie jak numery śledzenia czy szczegóły lotu.

Przykład:

Zapisane: Numer lotu AF1
Automatycznie pobierane dla zapytań opartych na narzędziach

To pokazuje, jak systemy pamięci trwałej mogą usprawnić asystentów AI na serwerze domowym.

Testowanie lokalnych LLM z Ollama

Następna faza testowała w pełni lokalne modele za pomocą Ollama.

Ministral 3B (3 miliardy parametrów)

Przetwarzanie promptu: ~268 tokenów/sek
Prędkość generowania: ~7 tokenów/sek

Kluczowe ustalenie:
Udało się wywołać narzędzia bez dostrajania, co jest imponujące.

Jednak:

Czas odpowiedzi sięgał do 6 minut na interakcję

To czyni go niepraktycznym dla asystentów głosowych w czasie rzeczywistym.

Zbliżenie na ręce wyjmujące kompaktowy biały osobisty serwer ZIMA z kartonowego opakowania na drewnianym stole

Funkcja Gemma (270M parametrów)

Znacznie szybsze (~43 tokeny/sekundę)
Nie udało się poprawnie wykonać wywołań narzędzi

Spostrzeżenie:
Mniejsze modele są szybsze, ale wymagają dostrajania, aby radzić sobie z zadaniami strukturalnymi, takimi jak wywoływanie narzędzi.

Dodanie GPU: wzrosty wydajności

Dodano GT 1030 (2GB VRAM) przez PCIe.

Wyniki:

Prędkość oceny promptu prawie się podwoiła
Podział modelu: 34% GPU / 66% CPU
Prędkość generowania tokenów pozostała podobna

Ważny wniosek:
Wąskim gardłem generowania tokenów jest przepustowość, a nie moc obliczeniowa.

Podczas testowania mniejszego modelu w pełni załadowanego do GPU:

Ocena promptu osiągnęła 1100 tokenów/sekundę

To potwierdza:

Pełne obciążenie GPU znacznie poprawia opóźnienia w konfiguracji AI na domowym serwerze

Ograniczenia w rzeczywistych zastosowaniach

Pomimo obiecujących wyników pojawiło się kilka ograniczeń:

Konfiguracje tylko z CPU są zbyt wolne dla dużych modeli
Małe modele są niestabilne bez treningu
Wydajność GPU w dużej mierze zależy od VRAM i zasilania

Twórca zauważył, że 5GB GPU (np. Quadro P2200) może w pełni obciążyć model 3B i znacznie poprawić wydajność.

Kluczowe wnioski

ZimaBoard 2 może skutecznie uruchamiać zadania AI jako domowy serwer
Hybrydowe konfiguracje (chmura + lokalne) oferują dziś najlepszą równowagę
Lokalne LLM są wykonalne, ale wymagają optymalizacji
Ulepszenia GPU przynoszą znaczące wzrosty wydajności
Możliwość wywoływania narzędzi zależy bardziej od projektu modelu niż od rozmiaru

Featured

ZimaBoard 2 - Wysokowydajny jednopłytkowy serwer domowy

Single board computer zimaboard2

Dlaczego ZimaBoard 2 się wyróżnia

ZimaBoard 2 łączy w sobie:

Niskie zużycie energii (praca 24/7)
Cicha, bezwentylatorowa konstrukcja
Natywna rozbudowa SATA i PCIe
Podwójny Ethernet 2,5G

To czyni go idealnym do:

Serwery multimedialne Plex
Laboratoria Docker
Kontenery AI
Osobiste systemy NAS

Jak wielu użytkowników go opisuje:
„Mini serwer, który wygląda jak zabawka, ale działa jak bestia.”

Ostateczne przemyślenia

Ten eksperyment pokazuje, że budowa domowego serwera zdolnego do AI nie jest już poza zasięgiem. Choć w pełni lokalni asystenci głosowi nadal mają wyzwania wydajnościowe, ZimaBoard 2 zapewnia elastyczną i potężną podstawę do eksperymentów.

Dla programistów, majsterkowiczów i entuzjastów homelabów otwiera drzwi do: