O ZimaBoard 2 Pode Executar um Assistente de IA Local?

Eva Wong é a Redatora Técnica e entusiasta residente na ZimaSpace. Uma geek de longa data com paixão por homelabs e software de código aberto, ela é especialista em traduzir conceitos técnicos complexos em guias acessíveis e práticos. Eva acredita que a auto-hospedagem deve ser divertida, não intimidante. Através dos seus tutoriais, ela capacita a comunidade a desmistificar configurações de hardware, desde construir o seu primeiro NAS até dominar os contentores Docker.

Introdução

Na ZimaSpace, exploramos continuamente como hardware compacto pode redefinir a computação pessoal. Neste artigo, analisamos um experimento prático do criador por trás do canal Core Works Lab no YouTube, que testou se um servidor de placa única sem ventoinha pode executar um assistente de voz AI totalmente local.

Gostaríamos de agradecer ao Core Works Lab pela explicação detalhada e testes no mundo real. Este artigo transforma as suas ideias em vídeo num formato escrito estruturado para ajudar mais utilizadores a compreender o que é possível com o ZimaBoard 2 como Servidor Doméstico — desde cargas de trabalho de IA a configurações de homelab.

Testar o ZimaBoard 2 como Máquina AI Local

O dispositivo testado é o ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), um Servidor Doméstico compacto e de baixo consumo desenhado para flexibilidade. Suporta expansão nativa SATA e PCIe, permitindo aos utilizadores ligar SSDs, GPUs e placas de rede sem adaptadores adicionais.

O objetivo do criador era claro:
Pode um Servidor Doméstico sem ventoinha executar um assistente de voz AI local de forma fiável?

Configuração inicial e configuração de hardware

O sistema foi expandido usando:

A placa arranca para um painel web, onde aplicações como contentores Docker e ferramentas como N8N podem ser instaladas.

Observação chave:
O processo de configuração é simples, tornando o ZimaBoard 2 acessível mesmo para utilizadores a construir o seu primeiro Servidor Doméstico.

No entanto, foram notados alguns pequenos problemas de hardware:

  • Os parafusos do suporte de montagem não eram roscados
  • Alguns parafusos eram demasiado longos para certas configurações

A executar o Assistente de IA (CAL)

O assistente (CAL) foi implementado via Docker usando configuração apenas com CPU.

Configuração inicial incluiu:

  • Fala para texto: Groq Whisper (cloud)
  • LLM: Groq (inferência na cloud)
  • Texto para fala: Piper (CPU local)

Resultado:
A configuração híbrida funcionou sem problemas e respondeu rapidamente, estabelecendo uma base sólida.

Uma funcionalidade chave demonstrada foi a memória de curto prazo, onde o assistente armazenou e recordou dados como números de rastreio ou detalhes de voo.

Exemplo:

  • Armazenado: Número de voo AF1
  • Recuperado automaticamente para consultas baseadas em ferramentas

Isto mostra como sistemas de memória persistente podem melhorar assistentes de IA num Servidor Doméstico.

Teste de LLM local com Ollama

A fase seguinte testou modelos totalmente locais usando Ollama.

Ministral 3B (3 Mil milhões de Parâmetros)

  • Processamento do prompt: ~268 tokens/seg
  • Velocidade de geração: ~7 tokens/seg

Conclusão principal:
Chamou ferramentas com sucesso sem ajuste fino, o que é impressionante.

No entanto:

  • O tempo de resposta chegou a 6 minutos por interação

Isto torna-o impraticável para assistentes de voz em tempo real.

Vista aproximada de mãos a levantar um servidor pessoal branco compacto ZIMA da sua embalagem de cartão numa mesa de madeira

Função Gemma (270M Parâmetros)

  • Muito mais rápido (~43 tokens/segundo)
  • Falhou em executar corretamente chamadas de ferramentas

Perceção:
Modelos menores são mais rápidos mas requerem ajuste fino para lidar com tarefas estruturadas como chamadas de ferramentas.

Adicionar uma GPU: Ganhos de Desempenho

Foi adicionada uma GT 1030 (2GB VRAM) via PCIe.

Resultados:

  • A velocidade de avaliação do prompt quase duplicou
  • Divisão do modelo: 34% GPU / 66% CPU
  • A velocidade de geração de tokens manteve-se semelhante

Conclusão importante:
Largura de banda—não computação—é o gargalo para a geração de tokens.

Ao testar um modelo menor totalmente carregado na GPU:

  • A avaliação do prompt atingiu 1100 tokens/segundo

Isto confirma:

Carregar totalmente a GPU melhora drasticamente a latência para uma configuração de IA em Servidor Doméstico

Limitações no Mundo Real

Apesar dos resultados promissores, surgiram várias limitações:

  • Configurações só com CPU são demasiado lentas para modelos grandes
  • Modelos pequenos carecem de fiabilidade sem treino
  • O desempenho da GPU depende muito da VRAM e da fonte de alimentação

O criador notou que uma GPU de 5GB (ex: Quadro P2200) poderia carregar completamente um modelo 3B e melhorar significativamente o desempenho.

Principais Conclusões

  • ZimaBoard 2 pode executar cargas de trabalho de IA eficazmente como Servidor Doméstico
  • Configurações híbridas (nuvem + local) oferecem o melhor equilíbrio atualmente
  • LLMs locais são viáveis mas requerem otimização
  • Atualizações de GPU desbloqueiam ganhos significativos de desempenho
  • A capacidade de chamar ferramentas depende mais do design do modelo do que do tamanho

Por que o ZimaBoard 2 se destaca

ZimaBoard 2 combina:

  • Baixo consumo de energia (operação 24/7)
  • Design silencioso e sem ventoinha
  • Expansão nativa SATA & PCIe
  • Ethernet dupla 2.5G

Isto torna-o ideal para:

  • Servidores de media Plex
  • Laboratórios Docker
  • Contentores de IA
  • Sistemas NAS pessoais

Como muitos utilizadores o descrevem:
“Um mini servidor que parece um brinquedo mas funciona como uma fera.”

Considerações Finais

Este experimento mostra que construir um Servidor Doméstico com capacidade de IA já não está fora de alcance. Embora assistentes de voz totalmente locais ainda enfrentem desafios de desempenho, ZimaBoard 2 oferece uma base flexível e poderosa para experimentação.

Para desenvolvedores, entusiastas e amantes de homelabs, abre a porta para:

E talvez o mais importante—torna o processo divertido, personalizável e acessível.

Centro de Campanha Zima

Mais para Ler

Construa a Sua Própria Nuvem com o ZimaCube 2
May 23, 2026Homelab Projects

Construa a Sua Própria Nuvem com o ZimaCube 2

Saiba como o ZimaCube 2 e ferramentas como Nextcloud, Alpha AI e Resilio Sync permitem substituir o armazenamento em nuvem convencional por uma infraestrutura...

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.