¿Puede ZimaBoard 2 Ejecutar un Asistente de IA Local?

Eva Wong es la Redactora Técnica y aficionada residente en ZimaSpace. Una geek de toda la vida con pasión por laboratorios caseros y software de código abierto, se especializa en traducir conceptos técnicos complejos en guías accesibles y prácticas. Eva cree que el autoalojamiento debe ser divertido, no intimidante. A través de sus tutoriales, empodera a la comunidad para desmitificar configuraciones de hardware, desde construir su primer NAS hasta dominar contenedores Docker.

Introducción

En ZimaSpace, exploramos continuamente cómo el hardware compacto puede redefinir la computación personal. En este artículo, desglosamos un experimento práctico del creador detrás del canal de YouTube Core Works Lab, quien probó si un servidor de placa única sin ventilador puede ejecutar un asistente de voz de IA totalmente local.

Queremos agradecer a Core Works Lab por la explicación detallada y las pruebas en el mundo real. Este artículo transforma sus ideas en video en un formato escrito estructurado para ayudar a más usuarios a entender lo que es posible con ZimaBoard 2 como Servidor Doméstico, desde cargas de trabajo de IA hasta configuraciones de homelab.

Probando ZimaBoard 2 como máquina de IA local

El dispositivo probado es el ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Servidor Doméstico compacto y de bajo consumo diseñado para flexibilidad. Soporta expansión nativa SATA y PCIe, permitiendo a los usuarios conectar SSDs, GPUs y tarjetas de red sin adaptadores adicionales.

El objetivo del creador era claro:
¿Puede un Servidor Doméstico sin ventilador ejecutar un asistente de voz de IA local de forma confiable?

Configuración inicial y configuración de hardware

El sistema se amplió usando:

La placa arranca en un panel web, donde se pueden instalar aplicaciones como contenedores Docker y herramientas como N8N.

Observación clave:
El proceso de configuración es sencillo, haciendo ZimaBoard 2 accesible incluso para usuarios que construyen su primer Servidor Doméstico.

Sin embargo, se notaron algunos problemas menores de hardware:

  • Los tornillos del soporte de montaje no tenían rosca
  • Algunos tornillos eran demasiado largos para ciertas configuraciones

Ejecutando el Asistente de IA (CAL)

El asistente (CAL) se desplegó vía Docker usando configuración solo CPU.

La configuración inicial incluyó:

  • Voz a texto: Groq Whisper (nube)
  • LLM: Groq (inferencia en la nube)
  • Texto a voz: Piper (CPU local)

Resultado:
La configuración híbrida funcionó sin problemas y respondió rápidamente, estableciendo una base sólida.

Una característica clave demostrada fue la memoria a corto plazo, donde el asistente almacenó y recordó datos como números de seguimiento o detalles de vuelos.

Ejemplo:

  • Almacenado: Número de vuelo AF1
  • Recuperado automáticamente para consultas basadas en herramientas

Esto muestra cómo los sistemas de memoria persistente pueden mejorar los asistentes de IA en un Servidor Doméstico.

Pruebas de LLM local con Ollama

La siguiente fase probó modelos totalmente locales usando Ollama.

Ministral 3B (3 mil millones de parámetros)

  • Procesamiento de indicaciones: ~268 tokens/seg
  • Velocidad de generación: ~7 tokens/seg

Conclusión clave:
Logró llamar herramientas sin ajustes finos, lo cual es impresionante.

Sin embargo:

  • El tiempo de respuesta alcanzó hasta 6 minutos por interacción

Esto lo hace poco práctico para asistentes de voz en tiempo real.

Vista cercana de manos levantando un servidor personal blanco compacto ZIMA de su embalaje de cartón sobre una mesa de madera

Función Gemma (270M parámetros)

  • Mucho más rápido (~43 tokens/seg)
  • No logró ejecutar correctamente las llamadas a herramientas

Perspectiva:
Los modelos más pequeños son más rápidos pero requieren ajustes finos para manejar tareas estructuradas como llamadas a herramientas.

Añadir una GPU: Ganancias de rendimiento

Se añadió una GT 1030 (2GB VRAM) vía PCIe.

Resultados:

  • La velocidad de evaluación de prompts casi se duplicó
  • División del modelo: 34% GPU / 66% CPU
  • La velocidad de generación de tokens se mantuvo similar

Conclusión importante:
El ancho de banda—no el cómputo—es el cuello de botella para la generación de tokens.

Al probar un modelo más pequeño completamente cargado en la GPU:

  • La evaluación de prompts alcanzó 1100 tokens/seg

Esto confirma:

La carga completa de la GPU mejora drásticamente la latencia para una configuración de IA en servidor doméstico

Limitaciones en el mundo real

A pesar de los resultados prometedores, surgieron varias limitaciones:

  • Las configuraciones solo con CPU son demasiado lentas para modelos grandes
  • Los modelos pequeños carecen de fiabilidad sin entrenamiento
  • El rendimiento de la GPU depende en gran medida de la VRAM y la fuente de alimentación

El creador señaló que una GPU de 5GB (por ejemplo, Quadro P2200) podría cargar completamente un modelo 3B y mejorar significativamente el rendimiento.

Puntos clave

  • ZimaBoard 2 puede ejecutar cargas de trabajo de IA de manera efectiva como servidor doméstico
  • Las configuraciones híbridas (nube + local) ofrecen el mejor equilibrio hoy en día
  • Los LLM locales son viables pero requieren optimización
  • Las actualizaciones de GPU desbloquean ganancias significativas de rendimiento
  • La capacidad de llamar herramientas depende más del diseño del modelo que del tamaño

Por qué ZimaBoard 2 destaca

ZimaBoard 2 combina:

  • Bajo consumo de energía (operación 24/7)
  • Diseño silencioso y sin ventilador
  • Expansión nativa SATA y PCIe
  • Doble Ethernet 2.5G

Esto lo hace ideal para:

  • Servidores multimedia Plex
  • Laboratorios Docker
  • Contenedores de IA
  • Sistemas NAS personales

Como muchos usuarios lo describen:
“Un mini servidor que parece un juguete pero funciona como una bestia.”

Reflexiones finales

Este experimento demuestra que construir un servidor doméstico con capacidad de IA ya no está fuera de alcance. Aunque los asistentes de voz completamente locales aún enfrentan desafíos de rendimiento, ZimaBoard 2 ofrece una base flexible y potente para la experimentación.

Para desarrolladores, aficionados y entusiastas de homelabs, abre la puerta a:

Y quizás lo más importante: hace que el proceso sea divertido, hackeable y accesible.

Centro de Campañas Zima

Más para leer

Construye Tu Propia Nube con ZimaCube 2
May 23, 2026Homelab Projects

Construye Tu Propia Nube con ZimaCube 2

Aprende cómo ZimaCube 2 y herramientas como Nextcloud, Alpha AI y Resilio Sync te permiten reemplazar el almacenamiento en la nube convencional con una...

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.