Kann ZimaBoard 2 einen lokalen KI-Assistenten ausführen?

Eva Wong ist die Technische Redakteurin und residente Tüftlerin bei ZimaSpace. Eine lebenslange Geek mit einer Leidenschaft für Homelabs und Open-Source-Software, sie spezialisiert sich darauf, komplexe technische Konzepte in zugängliche, praktische Anleitungenzu übersetzen. Eva ist der Meinung, dass Self-Hosting Spaß machen und nicht einschüchternd sein sollte. Durch ihre Tutorials befähigt sie die Community, Hardware-Setups zu entmystifizieren, vom Bau ihres ersten NAS bis hin zur Beherrschung von Docker-Containern.

Einführung

Bei ZimaSpace erforschen wir kontinuierlich, wie kompakte Hardware das persönliche Computing neu definieren kann. In diesem Artikel analysieren wir ein praktisches Experiment des Erstellers hinter dem YouTube-Kanal Core Works Lab, der getestet hat, ob ein lüfterloser Einplatinenserver einen vollständig lokalen KI-Sprachassistenten betreiben kann.

Wir danken Core Works Lab für die detaillierte Anleitung und den Praxistest. Dieser Artikel verwandelt ihre Videoeinblicke in ein strukturiertes, schriftliches Format, um mehr Nutzern zu zeigen, was mit ZimaBoard 2 als Heimserver möglich ist – von KI-Workloads bis zu Homelab-Setups.

Test von ZimaBoard 2 als lokale KI-Maschine

Das getestete Gerät ist das ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), ein kompakter und energiesparender Heimserver, der auf Flexibilität ausgelegt ist. Es unterstützt native SATA- und PCIe-Erweiterungen, sodass Nutzer SSDs, GPUs und Netzwerkkarten ohne zusätzliche Adapter anschließen können.

Das Ziel des Erstellers war klar:
Kann ein lüfterloser Heimserver einen lokalen KI-Sprachassistenten zuverlässig betreiben?

Erstkonfiguration und Hardware-Setup

Das System wurde erweitert mit:

Das Board startet in ein webbasiertes Dashboard, in dem Anwendungen wie Docker-Container und Tools wie N8N installiert werden können.

Wichtige Beobachtung:
Der Einrichtungsprozess ist unkompliziert, wodurch ZimaBoard 2 auch für Nutzer zugänglich ist, die ihren ersten Heimserver bauen.

Allerdings wurden einige kleinere Hardwareprobleme festgestellt:

  • Montagehalterungsschrauben waren nicht gewindegängig
  • Einige Schrauben waren für bestimmte Konfigurationen zu lang

Den KI-Assistenten (CAL) ausführen

Der Assistent (CAL) wurde über Docker mit CPU-only-Konfiguration bereitgestellt.

Die Anfangskonfiguration umfasste:

  • Sprache-zu-Text: Groq Whisper (Cloud)
  • LLM: Groq (Cloud-Inferenz)
  • Text-zu-Sprache: Piper (lokale CPU)

Ergebnis:
Das hybride Setup funktionierte reibungslos und reagierte schnell, was eine solide Basis schuf.

Ein wichtiges Merkmal war Kurzzeitspeicher, bei dem der Assistent Daten wie Sendungsverfolgungsnummern oder Flugdaten speicherte und abrief.

Beispiel:

  • Gespeichert: Flugnummer AF1
  • Automatisch für werkzeugbasierte Anfragen abgerufen

Dies zeigt, wie persistente Speichersysteme KI-Assistenten auf einem Heimserver verbessern können.

Lokaler LLM-Test mit Ollama

Die nächste Phase testete vollständig lokale Modelle mit Ollama.

Ministral 3B (3 Milliarden Parameter)

  • Prompt-Verarbeitung: ~268 Tokens/Sekunde
  • Generierungsgeschwindigkeit: ~7 Tokens/Sekunde

Wichtiges Ergebnis:
Es rief Werkzeuge erfolgreich ohne Feinabstimmung auf, was beeindruckend ist.

Allerdings:

  • Antwortzeit erreichte bis zu 6 Minuten pro Interaktion

Das macht es für Echtzeit-Sprachassistenten unpraktisch.

Nahaufnahme von Händen, die einen kompakten weißen ZIMA-Persönlichen Server aus seiner Kartonverpackung auf einem Holztisch heben

Funktion Gemma (270M Parameter)

  • Viel schneller (~43 Tokens/Sekunde)
  • Tool-Aufrufe wurden nicht korrekt ausgeführt

Erkenntnis:
Kleinere Modelle sind schneller, benötigen aber Feinabstimmung, um strukturierte Aufgaben wie Tool-Aufrufe zu bewältigen.

GPU hinzufügen: Leistungssteigerungen

Eine GT 1030 (2GB VRAM) wurde über PCIe hinzugefügt.

Ergebnisse:

  • Prompt-Auswertungsgeschwindigkeit fast verdoppelt
  • Modellaufteilung: 34 % GPU / 66 % CPU
  • Die Geschwindigkeit der Token-Generierung blieb ähnlich

Wichtige Erkenntnis:
Bandbreite – nicht Rechenleistung – ist der Engpass bei der Token-Generierung.

Beim Testen eines kleineren Modells, das vollständig in die GPU geladen wurde:

  • Prompt-Auswertung erreichte 1100 Tokens/Sekunde

Das bestätigt:

Volle GPU-Auslastung verbessert die Latenz bei einem Heimserver-KI-Setup dramatisch

Einschränkungen in der Praxis

Trotz vielversprechender Ergebnisse traten mehrere Einschränkungen auf:

  • CPU-only Setups sind für große Modelle zu langsam
  • Kleine Modelle sind ohne Training nicht zuverlässig
  • GPU-Leistung hängt stark von VRAM und Stromversorgung ab

Der Ersteller stellte fest, dass eine 5GB GPU (z. B. Quadro P2200) ein 3B-Modell vollständig auslasten und die Leistung deutlich verbessern kann.

Wichtigste Erkenntnisse

  • ZimaBoard 2 kann KI-Arbeitslasten effektiv als Heimserver ausführen
  • Hybride (Cloud + lokal) Setups bieten heute die beste Balance
  • Lokale LLMs sind machbar, erfordern aber Optimierung
  • GPU-Upgrades ermöglichen erhebliche Leistungssteigerungen
  • Tool-Aufruf-Fähigkeit hängt mehr vom Modell-Design als von der Größe ab

Warum ZimaBoard 2 herausragt

ZimaBoard 2 vereint:

  • Niedriger Stromverbrauch (24/7 Betrieb)
  • Leises, lüfterloses Design
  • Native SATA- & PCIe-Erweiterung
  • Duales 2,5G Ethernet

Das macht es ideal für:

  • Plex-Medienserver
  • Docker-Labore
  • KI-Container
  • Persönliche NAS-Systeme

Wie viele Nutzer es beschreiben:
„Ein Mini-Server, der wie ein Spielzeug aussieht, aber wie ein Biest läuft.“

Abschließende Gedanken

Dieses Experiment zeigt, dass der Aufbau eines KI-fähigen Heimservers nicht mehr unerreichbar ist. Während vollständig lokale Sprachassistenten noch Leistungsprobleme haben, bietet ZimaBoard 2 eine flexible und leistungsstarke Grundlage für Experimente.

Für Entwickler, Tüftler und Homelab-Enthusiasten öffnet es die Tür zu:

Und vielleicht am wichtigsten – es macht den Prozess spaßig, hackbar und zugänglich.

Zima Kampagnen-Zentrale

Mehr zum Lesen

Baue deine eigene Cloud mit ZimaCube 2
May 23, 2026Homelab Projects

Baue deine eigene Cloud mit ZimaCube 2

Erfahren Sie, wie ZimaCube 2 und Tools wie Nextcloud, Alpha AI und Resilio Sync herkömmlichen Cloud-Speicher durch eine leistungsstarke, private und selbstgehostete Infrastruktur für...

Wie ZimaCube 2 ein NAS in eine KI-Maschine verwandelt
May 22, 2026Home Server Projects

Wie ZimaCube 2 ein NAS in eine KI-Maschine verwandelt

ZimaCube 2 ist ein modularer persönlicher Cloud-NAS, der hochkapazitiven Speicher, PCIe-Erweiterung, Zima OS und Fernzugriff in einem flexiblen Heimserver für Medien, Self-Hosting und KI-fähige...

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.