O ZimaBoard 2 Pode Executar um Assistente de IA Local?

Eva Wong

IceWhale author

Eva Wong é a Redatora Técnica e e entusiasta residente na ZimaSpace. Uma geek de longa data com paixão por homelabs e software de código aberto, ela é especialista em traduzir conceitos técnicos complexos em guias acessíveis e práticos . Eva acredita que o auto-hospedagem deve ser divertida, não intimidante. Através dos seus tutoriais, ela capacita a comunidade adesmistificar configurações de hardware , desde a construção do seu primeiro NAS até dominar os contêineres Docker., from building their first NAS to mastering Docker containers.

Can ZimaBoard 2 Run a Local AI Assistant? - Zima Store Online

Introdução

Na ZimaSpace, exploramos continuamente como hardware compacto pode redefinir a computação pessoal. Neste artigo, analisamos um experimento prático do criador por trás do canal Core Works Lab no YouTube, que testou se um servidor de placa única sem ventoinha pode executar um assistente de voz de IA totalmente local.

Gostaríamos de agradecer ao Core Works Lab pela explicação detalhada e testes no mundo real. Este artigo transforma as suas ideias em vídeo num formato escrito estruturado para ajudar mais utilizadores a compreender o que é possível com o ZimaBoard 2 como Servidor Doméstico — desde cargas de trabalho de IA a configurações de homelab.

Testar o ZimaBoard 2 como Máquina de IA Local

O dispositivo testado é o ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), um Servidor Doméstico compacto e de baixo consumo projetado para flexibilidade. Suporta expansão nativa SATA e PCIe, permitindo aos utilizadores ligar SSDs, GPUs e placas de rede sem adaptadores adicionais.

O objetivo do criador era claro:
Pode um Servidor Doméstico sem ventoinha executar um assistente de voz de IA local de forma fiável?

Configuração inicial e configuração de hardware

O sistema foi expandido usando:

SSD NVMe via adaptador PCIe
Suporte para dois discos de 2,5"
GPU opcional (GT 1030)
ZimaOS pré-instalado

A placa arranca num painel web, onde aplicações como contentores Docker e ferramentas como N8N podem ser instaladas.

Observação chave:
O processo de configuração é simples, tornando o ZimaBoard 2 acessível mesmo para utilizadores a construir o seu primeiro Servidor Doméstico.

No entanto, foram notados alguns pequenos problemas de hardware:

Os parafusos do suporte de montagem não eram roscados
Alguns parafusos eram demasiado longos para certas configurações

A executar o Assistente de IA (CAL)

O assistente (CAL) foi implementado via Docker usando configuração apenas com CPU.

Configuração inicial incluiu:

Fala para texto: Groq Whisper (cloud)
LLM: Groq (inferência na cloud)
Texto para fala: Piper (CPU local)

Resultado:
A configuração híbrida funcionou sem problemas e respondeu rapidamente, estabelecendo uma base sólida.

Uma funcionalidade chave demonstrada foi a memória de curto prazo, onde o assistente armazenou e recordou dados como números de rastreamento ou detalhes de voos.

Exemplo:

Armazenado: Número de voo AF1
Recuperado automaticamente para consultas baseadas em ferramentas

Isto demonstra como sistemas de memória persistente podem melhorar assistentes de IA num Servidor Doméstico.

Teste de LLM local com Ollama

A fase seguinte testou modelos totalmente locais usando Ollama.

Ministral 3B (3 mil milhões de parâmetros)

Processamento de prompt: ~268 tokens/segundo
Velocidade de geração: ~7 tokens/segundo

Conclusão principal:
Conseguiu chamar ferramentas sem ajustes finos, o que é impressionante.

No entanto:

O tempo de resposta chegou a até 6 minutos por interação

Isto torna-o impraticável para assistentes de voz em tempo real.

Vista aproximada de mãos a levantar um servidor pessoal branco compacto ZIMA da sua embalagem de cartão numa mesa de madeira

Função Gemma (270M Parâmetros)

Muito mais rápido (~43 tokens/segundo)
Falhou em executar corretamente chamadas de ferramentas

Perceção:
Modelos menores são mais rápidos mas requerem ajustes finos para lidar com tarefas estruturadas como chamadas de ferramentas.

Adicionar uma GPU: Ganhos de Desempenho

Foi adicionada uma GT 1030 (2GB VRAM) via PCIe.

Resultados:

A velocidade de avaliação de prompts quase duplicou
Divisão do modelo: 34% GPU / 66% CPU
A velocidade de geração de tokens manteve-se semelhante

Conclusão importante:
A largura de banda—não o cálculo—é o gargalo para a geração de tokens.

Ao testar um modelo menor totalmente carregado na GPU:

A avaliação de prompts atingiu 1100 tokens/segundo

Isto confirma:

Carregar totalmente a GPU melhora drasticamente a latência numa configuração de IA para Servidor Doméstico

Limitações no Mundo Real

Apesar dos resultados promissores, surgiram várias limitações:

Configurações só com CPU são demasiado lentas para modelos grandes
Modelos pequenos carecem de fiabilidade sem treino
O desempenho da GPU depende muito da VRAM e da fonte de alimentação

O criador notou que uma GPU de 5GB (ex: Quadro P2200) poderia carregar totalmente um modelo 3B e melhorar significativamente o desempenho.

Principais Conclusões

O ZimaBoard 2 pode executar cargas de trabalho de IA eficazmente como Servidor Doméstico
Configurações híbridas (nuvem + local) oferecem o melhor equilíbrio atualmente
LLMs locais são viáveis mas requerem otimização
Atualizações de GPU desbloqueiam ganhos significativos de desempenho
A capacidade de chamar ferramentas depende mais do design do modelo do que do tamanho

Featured

ZimaBoard 2 - Servidor Doméstico de Placa Única de Alto Desempenho

Single board computer zimaboard2

Por que o ZimaBoard 2 se destaca

ZimaBoard 2 combina:

Baixo consumo de energia (funcionamento 24/7)
Design silencioso e sem ventoinha
Expansão SATA e PCIe nativa
Ethernet dupla 2.5G

Isto torna-o ideal para:

Servidores de media Plex
Laboratórios Docker
Contentores de IA
Sistemas NAS pessoais

Como muitos utilizadores o descrevem:
“Um mini servidor que parece um brinquedo mas funciona como uma fera.”

Considerações Finais

Este experimento mostra que construir um Servidor Doméstico com capacidade de IA já não está fora de alcance. Embora assistentes de voz totalmente locais ainda enfrentem desafios de desempenho, o ZimaBoard 2 oferece uma base flexível e poderosa para experimentação.

Para desenvolvedores, entusiastas e amantes de homelabs, abre a porta para: