¿Puede ZimaBoard 2 Ejecutar un Asistente de IA Local?

Eva Wong

IceWhale author

Eva Wong es la Redactora técnica y manitas residente en ZimaSpace. Una geek de toda la vida con pasión por los homelabs y el software de código abierto, se especializa en traducir conceptos técnicos complejos en guías accesibles y prácticas. Eva cree que el autoalojamiento debe ser divertido, no intimidante. A través de sus tutoriales, empodera a la comunidad para desmitificar las configuraciones de hardware, desde construir su primer NAS hasta dominar los contenedores Docker.

Can ZimaBoard 2 Run a Local AI Assistant? - Zima Store Online

Introducción

En ZimaSpace, exploramos continuamente cómo el hardware compacto puede redefinir la computación personal. En este artículo, desglosamos un experimento práctico del creador detrás del canal de YouTube Core Works Lab, quien probó si un servidor de placa única sin ventilador puede ejecutar un asistente de voz de IA totalmente local.

Queremos agradecer a Core Works Lab por la explicación detallada y las pruebas en el mundo real. Este artículo transforma sus ideas en video en un formato escrito y estructurado para ayudar a más usuarios a entender lo que es posible con ZimaBoard 2 como Servidor Doméstico, desde cargas de trabajo de IA hasta configuraciones de homelab.

Probando ZimaBoard 2 como máquina de IA local

El dispositivo probado es el ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), un Servidor Doméstico compacto y de bajo consumo diseñado para flexibilidad. Soporta expansión nativa SATA y PCIe, permitiendo a los usuarios conectar SSDs, GPUs y tarjetas de red sin adaptadores adicionales.

El objetivo del creador fue claro:
¿Puede un Servidor Doméstico sin ventilador ejecutar un asistente de voz de IA local de forma confiable?

Configuración inicial y configuración de hardware

El sistema se amplió usando:

SSD NVMe vía adaptador PCIe
Bandeja para dos discos de 2.5"
GPU opcional (GT 1030)
ZimaOS preinstalado

La placa arranca en un panel web, donde se pueden instalar aplicaciones como contenedores Docker y herramientas como N8N.

Observación clave:
El proceso de configuración es sencillo, haciendo ZimaBoard 2 accesible incluso para usuarios que construyen su primer Servidor Doméstico.

Sin embargo, se notaron algunos problemas menores de hardware:

Los tornillos del soporte de montaje no tenían rosca
Algunos tornillos eran demasiado largos para ciertas configuraciones

Ejecutando el Asistente de IA (CAL)

El asistente (CAL) se desplegó vía Docker usando configuración solo CPU.

La configuración inicial incluyó:

Voz a texto: Groq Whisper (nube)
LLM: Groq (inferencia en la nube)
Texto a voz: Piper (CPU local)

Resultado:
La configuración híbrida funcionó sin problemas y respondió rápidamente, estableciendo una base sólida.

Una característica clave demostrada fue la memoria a corto plazo, donde el asistente almacenaba y recordaba datos como números de seguimiento o detalles de vuelos.

Ejemplo:

Almacenado: Número de vuelo AF1
Recuperado automáticamente para consultas basadas en herramientas

Esto muestra cómo los sistemas de memoria persistente pueden mejorar los asistentes de IA en un Servidor Doméstico.

Prueba de LLM local con Ollama

La siguiente fase probó modelos totalmente locales usando Ollama.

Ministral 3B (3 mil millones de parámetros)

Procesamiento de indicaciones: ~268 tokens/seg
Velocidad de generación: ~7 tokens/seg

Hallazgo clave:
Logró llamar herramientas sin ajustes finos, lo cual es impresionante.

Sin embargo:

El tiempo de respuesta alcanzó hasta 6 minutos por interacción

Esto lo hace poco práctico para asistentes de voz en tiempo real.

Vista cercana de manos levantando un servidor personal compacto blanco ZIMA de su embalaje de cartón sobre una mesa de madera

Función Gemma (270M Parámetros)

Mucho más rápido (~43 tokens/seg)
No logró ejecutar correctamente las llamadas a herramientas

Perspectiva:
Los modelos más pequeños son más rápidos pero requieren ajustes finos para manejar tareas estructuradas como llamadas a herramientas.

Añadir una GPU: Ganancias de rendimiento

Se añadió una GT 1030 (2GB VRAM) vía PCIe.

Resultados:

La velocidad de evaluación de prompts casi se duplicó
División del modelo: 34% GPU / 66% CPU
La velocidad de generación de tokens se mantuvo similar

Conclusión importante:
El ancho de banda, no el cómputo, es el cuello de botella para la generación de tokens.

Al probar un modelo más pequeño completamente cargado en la GPU:

La evaluación de prompts alcanzó 1100 tokens/seg

Esto confirma:

Cargar completamente la GPU mejora dramáticamente la latencia para una configuración de IA en Servidor Doméstico

Limitaciones en el mundo real

A pesar de los resultados prometedores, surgieron varias limitaciones:

Las configuraciones solo con CPU son demasiado lentas para modelos grandes
Los modelos pequeños carecen de fiabilidad sin entrenamiento
El rendimiento de la GPU depende mucho de la VRAM y la fuente de alimentación

El creador señaló que una GPU de 5GB (por ejemplo, Quadro P2200) podría cargar completamente un modelo 3B y mejorar significativamente el rendimiento.

Puntos clave

ZimaBoard 2 puede ejecutar cargas de trabajo de IA eficazmente como Servidor Doméstico
Las configuraciones híbridas (nube + local) ofrecen el mejor equilibrio hoy en día
Los LLM locales son viables pero requieren optimización
Las actualizaciones de GPU desbloquean ganancias significativas de rendimiento
La capacidad de llamar herramientas depende más del diseño del modelo que del tamaño

Featured

ZimaBoard 2 - Servidor doméstico de placa única de alto rendimiento

Single board computer zimaboard2

Por qué ZimaBoard 2 destaca

ZimaBoard 2 combina:

Bajo consumo de energía (funcionamiento 24/7)
Diseño silencioso y sin ventilador
Expansión nativa SATA y PCIe
Doble Ethernet 2.5G

Esto lo hace ideal para:

Servidores multimedia Plex
Laboratorios Docker
Contenedores de IA
Sistemas NAS personales

Como muchos usuarios lo describen:
“Un mini servidor que parece un juguete pero funciona como una bestia.”

Reflexiones finales

Este experimento demuestra que construir un Servidor Doméstico con capacidad de IA ya no está fuera de alcance. Aunque los asistentes de voz totalmente locales aún enfrentan desafíos de rendimiento, ZimaBoard 2 ofrece una base flexible y potente para la experimentación.

Para desarrolladores, aficionados y entusiastas de homelabs, abre la puerta a: