Introducción
En ZimaSpace, exploramos continuamente cómo el hardware compacto puede redefinir la computación personal. En este artículo, desglosamos un experimento práctico del creador detrás del canal de YouTube Core Works Lab, quien probó si un servidor de placa única sin ventilador puede ejecutar un asistente de voz de IA totalmente local.
Queremos agradecer a Core Works Lab por la explicación detallada y las pruebas en el mundo real. Este artículo transforma sus ideas en video en un formato escrito estructurado para ayudar a más usuarios a entender lo que es posible con ZimaBoard 2 como Servidor Doméstico, desde cargas de trabajo de IA hasta configuraciones de homelab.
Probando ZimaBoard 2 como máquina de IA local
El dispositivo probado es el ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Servidor Doméstico compacto y de bajo consumo diseñado para flexibilidad. Soporta expansión nativa SATA y PCIe, permitiendo a los usuarios conectar SSDs, GPUs y tarjetas de red sin adaptadores adicionales.
El objetivo del creador era claro:
¿Puede un Servidor Doméstico sin ventilador ejecutar un asistente de voz de IA local de forma confiable?
Configuración inicial y configuración de hardware
El sistema se amplió usando:
- SSD NVMe vía adaptador PCIe
- Bandeja para dos discos de 2.5"
- GPU opcional (GT 1030)
- ZimaOS preinstalado
La placa arranca en un panel web, donde se pueden instalar aplicaciones como contenedores Docker y herramientas como N8N.
Observación clave:
El proceso de configuración es sencillo, haciendo ZimaBoard 2 accesible incluso para usuarios que construyen su primer Servidor Doméstico.
Sin embargo, se notaron algunos problemas menores de hardware:
- Los tornillos del soporte de montaje no tenían rosca
- Algunos tornillos eran demasiado largos para ciertas configuraciones
Ejecutando el Asistente de IA (CAL)
El asistente (CAL) se desplegó vía Docker usando configuración solo CPU.
La configuración inicial incluyó:
- Voz a texto: Groq Whisper (nube)
- LLM: Groq (inferencia en la nube)
- Texto a voz: Piper (CPU local)
Resultado:
La configuración híbrida funcionó sin problemas y respondió rápidamente, estableciendo una base sólida.
Una característica clave demostrada fue la memoria a corto plazo, donde el asistente almacenó y recordó datos como números de seguimiento o detalles de vuelos.
Ejemplo:
- Almacenado: Número de vuelo AF1
- Recuperado automáticamente para consultas basadas en herramientas
Esto muestra cómo los sistemas de memoria persistente pueden mejorar los asistentes de IA en un Servidor Doméstico.
Pruebas de LLM local con Ollama
La siguiente fase probó modelos totalmente locales usando Ollama.
Ministral 3B (3 mil millones de parámetros)
- Procesamiento de indicaciones: ~268 tokens/seg
- Velocidad de generación: ~7 tokens/seg
Conclusión clave:
Logró llamar herramientas sin ajustes finos, lo cual es impresionante.
Sin embargo:
- El tiempo de respuesta alcanzó hasta 6 minutos por interacción
Esto lo hace poco práctico para asistentes de voz en tiempo real.

Función Gemma (270M parámetros)
- Mucho más rápido (~43 tokens/seg)
- No logró ejecutar correctamente las llamadas a herramientas
Perspectiva:
Los modelos más pequeños son más rápidos pero requieren ajustes finos para manejar tareas estructuradas como llamadas a herramientas.
Añadir una GPU: Ganancias de rendimiento
Se añadió una GT 1030 (2GB VRAM) vía PCIe.
Resultados:
- La velocidad de evaluación de prompts casi se duplicó
- División del modelo: 34% GPU / 66% CPU
- La velocidad de generación de tokens se mantuvo similar
Conclusión importante:
El ancho de banda—no el cómputo—es el cuello de botella para la generación de tokens.
Al probar un modelo más pequeño completamente cargado en la GPU:
- La evaluación de prompts alcanzó 1100 tokens/seg
Esto confirma:
La carga completa de la GPU mejora drásticamente la latencia para una configuración de IA en servidor doméstico
Limitaciones en el mundo real
A pesar de los resultados prometedores, surgieron varias limitaciones:
- Las configuraciones solo con CPU son demasiado lentas para modelos grandes
- Los modelos pequeños carecen de fiabilidad sin entrenamiento
- El rendimiento de la GPU depende en gran medida de la VRAM y la fuente de alimentación
El creador señaló que una GPU de 5GB (por ejemplo, Quadro P2200) podría cargar completamente un modelo 3B y mejorar significativamente el rendimiento.
Puntos clave
- ZimaBoard 2 puede ejecutar cargas de trabajo de IA de manera efectiva como servidor doméstico
- Las configuraciones híbridas (nube + local) ofrecen el mejor equilibrio hoy en día
- Los LLM locales son viables pero requieren optimización
- Las actualizaciones de GPU desbloquean ganancias significativas de rendimiento
- La capacidad de llamar herramientas depende más del diseño del modelo que del tamaño
Por qué ZimaBoard 2 destaca
ZimaBoard 2 combina:
- Bajo consumo de energía (operación 24/7)
- Diseño silencioso y sin ventilador
- Expansión nativa SATA y PCIe
- Doble Ethernet 2.5G
Esto lo hace ideal para:
- Servidores multimedia Plex
- Laboratorios Docker
- Contenedores de IA
- Sistemas NAS personales
Como muchos usuarios lo describen:
“Un mini servidor que parece un juguete pero funciona como una bestia.”
Reflexiones finales
Este experimento demuestra que construir un servidor doméstico con capacidad de IA ya no está fuera de alcance. Aunque los asistentes de voz completamente locales aún enfrentan desafíos de rendimiento, ZimaBoard 2 ofrece una base flexible y potente para la experimentación.
Para desarrolladores, aficionados y entusiastas de homelabs, abre la puerta a:
- Canales locales de IA
- Configuraciones de computación en el borde
- Entornos de servidor totalmente personalizados
Y quizás lo más importante: hace que el proceso sea divertido, hackeable y accesible.
Centro de Campañas Zima
Más para leer

Lo sorprendente que realmente puede hacer el NAS con IA ZimaCube 2
Descubre cómo ZimaCube 2 evoluciona hacia un NAS con IA que combina un almacenamiento masivo con IA local, utilizando búsqueda vectorial para etiquetar automáticamente...

Construye Tu Propia Nube con ZimaCube 2
Aprende cómo ZimaCube 2 y herramientas como Nextcloud, Alpha AI y Resilio Sync te permiten reemplazar el almacenamiento en la nube convencional con una...

Cómo ZimaCube 2 convierte un NAS en una bestia de IA
ZimaCube 2 es un NAS en la nube personal modular que combina almacenamiento de alta capacidad, expansión PCIe, Zima OS y acceso remoto en...

