Einführung
Bei ZimaSpace erforschen wir kontinuierlich, wie kompakte Hardware das persönliche Computing neu definieren kann. In diesem Artikel analysieren wir ein praktisches Experiment des Erstellers hinter dem YouTube-Kanal Core Works Lab, der getestet hat, ob ein lüfterloser Einplatinenserver einen vollständig lokalen KI-Sprachassistenten betreiben kann.
Wir danken Core Works Lab für die detaillierte Anleitung und den Praxistest. Dieser Artikel verwandelt ihre Videoeinblicke in ein strukturiertes, schriftliches Format, um mehr Nutzern zu zeigen, was mit ZimaBoard 2 als Heimserver möglich ist – von KI-Workloads bis zu Homelab-Setups.
Test von ZimaBoard 2 als lokale KI-Maschine
Das getestete Gerät ist das ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), ein kompakter und energiesparender Heimserver, der auf Flexibilität ausgelegt ist. Es unterstützt native SATA- und PCIe-Erweiterungen, sodass Nutzer SSDs, GPUs und Netzwerkkarten ohne zusätzliche Adapter anschließen können.
Das Ziel des Erstellers war klar:
Kann ein lüfterloser Heimserver einen lokalen KI-Sprachassistenten zuverlässig betreiben?
Erstkonfiguration und Hardware-Setup
Das System wurde erweitert mit:
- NVMe SSD über PCIe-Adapter
- Doppelter 2,5"-Laufwerksschacht
- Optionale GPU (GT 1030)
- ZimaOS vorinstalliert
Das Board startet in ein webbasiertes Dashboard, in dem Anwendungen wie Docker-Container und Tools wie N8N installiert werden können.
Wichtige Beobachtung:
Der Einrichtungsprozess ist unkompliziert, wodurch ZimaBoard 2 auch für Nutzer zugänglich ist, die ihren ersten Heimserver bauen.
Allerdings wurden einige kleinere Hardwareprobleme festgestellt:
- Montagehalterungsschrauben waren nicht gewindegängig
- Einige Schrauben waren für bestimmte Konfigurationen zu lang
Den KI-Assistenten (CAL) ausführen
Der Assistent (CAL) wurde über Docker mit CPU-only-Konfiguration bereitgestellt.
Die Anfangskonfiguration umfasste:
- Sprache-zu-Text: Groq Whisper (Cloud)
- LLM: Groq (Cloud-Inferenz)
- Text-zu-Sprache: Piper (lokale CPU)
Ergebnis:
Das hybride Setup funktionierte reibungslos und reagierte schnell, was eine solide Basis schuf.
Ein wichtiges Merkmal war Kurzzeitspeicher, bei dem der Assistent Daten wie Sendungsverfolgungsnummern oder Flugdaten speicherte und abrief.
Beispiel:
- Gespeichert: Flugnummer AF1
- Automatisch für werkzeugbasierte Anfragen abgerufen
Dies zeigt, wie persistente Speichersysteme KI-Assistenten auf einem Heimserver verbessern können.
Lokaler LLM-Test mit Ollama
Die nächste Phase testete vollständig lokale Modelle mit Ollama.
Ministral 3B (3 Milliarden Parameter)
- Prompt-Verarbeitung: ~268 Tokens/Sekunde
- Generierungsgeschwindigkeit: ~7 Tokens/Sekunde
Wichtiges Ergebnis:
Es rief Werkzeuge erfolgreich ohne Feinabstimmung auf, was beeindruckend ist.
Allerdings:
- Antwortzeit erreichte bis zu 6 Minuten pro Interaktion
Das macht es für Echtzeit-Sprachassistenten unpraktisch.

Funktion Gemma (270M Parameter)
- Viel schneller (~43 Tokens/Sekunde)
- Tool-Aufrufe wurden nicht korrekt ausgeführt
Erkenntnis:
Kleinere Modelle sind schneller, benötigen aber Feinabstimmung, um strukturierte Aufgaben wie Tool-Aufrufe zu bewältigen.
GPU hinzufügen: Leistungssteigerungen
Eine GT 1030 (2GB VRAM) wurde über PCIe hinzugefügt.
Ergebnisse:
- Prompt-Auswertungsgeschwindigkeit fast verdoppelt
- Modellaufteilung: 34 % GPU / 66 % CPU
- Die Geschwindigkeit der Token-Generierung blieb ähnlich
Wichtige Erkenntnis:
Bandbreite – nicht Rechenleistung – ist der Engpass bei der Token-Generierung.
Beim Testen eines kleineren Modells, das vollständig in die GPU geladen wurde:
- Prompt-Auswertung erreichte 1100 Tokens/Sekunde
Das bestätigt:
Volle GPU-Auslastung verbessert die Latenz bei einem Heimserver-KI-Setup dramatisch
Einschränkungen in der Praxis
Trotz vielversprechender Ergebnisse traten mehrere Einschränkungen auf:
- CPU-only Setups sind für große Modelle zu langsam
- Kleine Modelle sind ohne Training nicht zuverlässig
- GPU-Leistung hängt stark von VRAM und Stromversorgung ab
Der Ersteller stellte fest, dass eine 5GB GPU (z. B. Quadro P2200) ein 3B-Modell vollständig auslasten und die Leistung deutlich verbessern kann.
Wichtigste Erkenntnisse
- ZimaBoard 2 kann KI-Arbeitslasten effektiv als Heimserver ausführen
- Hybride (Cloud + lokal) Setups bieten heute die beste Balance
- Lokale LLMs sind machbar, erfordern aber Optimierung
- GPU-Upgrades ermöglichen erhebliche Leistungssteigerungen
- Tool-Aufruf-Fähigkeit hängt mehr vom Modell-Design als von der Größe ab
Warum ZimaBoard 2 herausragt
ZimaBoard 2 vereint:
- Niedriger Stromverbrauch (24/7 Betrieb)
- Leises, lüfterloses Design
- Native SATA- & PCIe-Erweiterung
- Duales 2,5G Ethernet
Das macht es ideal für:
- Plex-Medienserver
- Docker-Labore
- KI-Container
- Persönliche NAS-Systeme
Wie viele Nutzer es beschreiben:
„Ein Mini-Server, der wie ein Spielzeug aussieht, aber wie ein Biest läuft.“
Abschließende Gedanken
Dieses Experiment zeigt, dass der Aufbau eines KI-fähigen Heimservers nicht mehr unerreichbar ist. Während vollständig lokale Sprachassistenten noch Leistungsprobleme haben, bietet ZimaBoard 2 eine flexible und leistungsstarke Grundlage für Experimente.
Für Entwickler, Tüftler und Homelab-Enthusiasten öffnet es die Tür zu:
- Lokale KI-Pipelines
- Edge-Computing-Setups
- Vollständig angepasste Serverumgebungen
Und vielleicht am wichtigsten – es macht den Prozess spaßig, hackbar und zugänglich.
Zima Kampagnen-Zentrale
Mehr zum Lesen

Überraschende Dinge, die das AI-NAS des ZimaCube 2 wirklich kann
Sehen Sie, wie sich ZimaCube 2 zu einem AI-NAS entwickelt, das massiven Speicher mit lokaler KI kombiniert, Vektorsuche verwendet, um Fotos automatisch zu taggen,...

Baue deine eigene Cloud mit ZimaCube 2
Erfahren Sie, wie ZimaCube 2 und Tools wie Nextcloud, Alpha AI und Resilio Sync herkömmlichen Cloud-Speicher durch eine leistungsstarke, private und selbstgehostete Infrastruktur für...

Wie ZimaCube 2 ein NAS in eine KI-Maschine verwandelt
ZimaCube 2 ist ein modularer persönlicher Cloud-NAS, der hochkapazitiven Speicher, PCIe-Erweiterung, Zima OS und Fernzugriff in einem flexiblen Heimserver für Medien, Self-Hosting und KI-fähige...

