Introdução
Na ZimaSpace, exploramos continuamente como hardware compacto pode redefinir a computação pessoal. Neste artigo, analisamos um experimento prático do criador por trás do canal Core Works Lab no YouTube, que testou se um servidor de placa única sem ventoinha pode executar um assistente de voz AI totalmente local.
Gostaríamos de agradecer ao Core Works Lab pela explicação detalhada e testes no mundo real. Este artigo transforma as suas ideias em vídeo num formato escrito estruturado para ajudar mais utilizadores a compreender o que é possível com o ZimaBoard 2 como Servidor Doméstico — desde cargas de trabalho de IA a configurações de homelab.
Testar o ZimaBoard 2 como Máquina AI Local
O dispositivo testado é o ZimaBoard 2 (Intel N150, 16GB DDR5, 64GB eMMC), um Servidor Doméstico compacto e de baixo consumo desenhado para flexibilidade. Suporta expansão nativa SATA e PCIe, permitindo aos utilizadores ligar SSDs, GPUs e placas de rede sem adaptadores adicionais.
O objetivo do criador era claro:
Pode um Servidor Doméstico sem ventoinha executar um assistente de voz AI local de forma fiável?
Configuração inicial e configuração de hardware
O sistema foi expandido usando:
- SSD NVMe via adaptador PCIe
- Suporte para dois discos de 2,5"
- GPU opcional (GT 1030)
- ZimaOS pré-instalado
A placa arranca para um painel web, onde aplicações como contentores Docker e ferramentas como N8N podem ser instaladas.
Observação chave:
O processo de configuração é simples, tornando o ZimaBoard 2 acessível mesmo para utilizadores a construir o seu primeiro Servidor Doméstico.
No entanto, foram notados alguns pequenos problemas de hardware:
- Os parafusos do suporte de montagem não eram roscados
- Alguns parafusos eram demasiado longos para certas configurações
A executar o Assistente de IA (CAL)
O assistente (CAL) foi implementado via Docker usando configuração apenas com CPU.
Configuração inicial incluiu:
- Fala para texto: Groq Whisper (cloud)
- LLM: Groq (inferência na cloud)
- Texto para fala: Piper (CPU local)
Resultado:
A configuração híbrida funcionou sem problemas e respondeu rapidamente, estabelecendo uma base sólida.
Uma funcionalidade chave demonstrada foi a memória de curto prazo, onde o assistente armazenou e recordou dados como números de rastreio ou detalhes de voo.
Exemplo:
- Armazenado: Número de voo AF1
- Recuperado automaticamente para consultas baseadas em ferramentas
Isto mostra como sistemas de memória persistente podem melhorar assistentes de IA num Servidor Doméstico.
Teste de LLM local com Ollama
A fase seguinte testou modelos totalmente locais usando Ollama.
Ministral 3B (3 Mil milhões de Parâmetros)
- Processamento do prompt: ~268 tokens/seg
- Velocidade de geração: ~7 tokens/seg
Conclusão principal:
Chamou ferramentas com sucesso sem ajuste fino, o que é impressionante.
No entanto:
- O tempo de resposta chegou a 6 minutos por interação
Isto torna-o impraticável para assistentes de voz em tempo real.

Função Gemma (270M Parâmetros)
- Muito mais rápido (~43 tokens/segundo)
- Falhou em executar corretamente chamadas de ferramentas
Perceção:
Modelos menores são mais rápidos mas requerem ajuste fino para lidar com tarefas estruturadas como chamadas de ferramentas.
Adicionar uma GPU: Ganhos de Desempenho
Foi adicionada uma GT 1030 (2GB VRAM) via PCIe.
Resultados:
- A velocidade de avaliação do prompt quase duplicou
- Divisão do modelo: 34% GPU / 66% CPU
- A velocidade de geração de tokens manteve-se semelhante
Conclusão importante:
Largura de banda—não computação—é o gargalo para a geração de tokens.
Ao testar um modelo menor totalmente carregado na GPU:
- A avaliação do prompt atingiu 1100 tokens/segundo
Isto confirma:
Carregar totalmente a GPU melhora drasticamente a latência para uma configuração de IA em Servidor Doméstico
Limitações no Mundo Real
Apesar dos resultados promissores, surgiram várias limitações:
- Configurações só com CPU são demasiado lentas para modelos grandes
- Modelos pequenos carecem de fiabilidade sem treino
- O desempenho da GPU depende muito da VRAM e da fonte de alimentação
O criador notou que uma GPU de 5GB (ex: Quadro P2200) poderia carregar completamente um modelo 3B e melhorar significativamente o desempenho.
Principais Conclusões
- ZimaBoard 2 pode executar cargas de trabalho de IA eficazmente como Servidor Doméstico
- Configurações híbridas (nuvem + local) oferecem o melhor equilíbrio atualmente
- LLMs locais são viáveis mas requerem otimização
- Atualizações de GPU desbloqueiam ganhos significativos de desempenho
- A capacidade de chamar ferramentas depende mais do design do modelo do que do tamanho
Por que o ZimaBoard 2 se destaca
ZimaBoard 2 combina:
- Baixo consumo de energia (operação 24/7)
- Design silencioso e sem ventoinha
- Expansão nativa SATA & PCIe
- Ethernet dupla 2.5G
Isto torna-o ideal para:
- Servidores de media Plex
- Laboratórios Docker
- Contentores de IA
- Sistemas NAS pessoais
Como muitos utilizadores o descrevem:
“Um mini servidor que parece um brinquedo mas funciona como uma fera.”
Considerações Finais
Este experimento mostra que construir um Servidor Doméstico com capacidade de IA já não está fora de alcance. Embora assistentes de voz totalmente locais ainda enfrentem desafios de desempenho, ZimaBoard 2 oferece uma base flexível e poderosa para experimentação.
Para desenvolvedores, entusiastas e amantes de homelabs, abre a porta para:
- Pipelines locais de IA
- Configurações de computação de borda
- Ambientes de servidor totalmente personalizados
E talvez o mais importante—torna o processo divertido, personalizável e acessível.
Centro de Campanha Zima
Mais para Ler

Coisas Surpreendentes que o AI NAS do ZimaCube 2 Pode Realmente Fazer
Veja como o ZimaCube 2 evolui para um NAS com IA que combina armazenamento massivo com IA local, utilizando pesquisa vetorial para autoetiquetar fotos,...

Construa a Sua Própria Nuvem com o ZimaCube 2
Saiba como o ZimaCube 2 e ferramentas como Nextcloud, Alpha AI e Resilio Sync permitem substituir o armazenamento em nuvem convencional por uma infraestrutura...

Como o ZimaCube 2 Transforma um NAS Numa Máquina de IA
O ZimaCube 2 é um NAS pessoal modular na nuvem que combina armazenamento de alta capacidade, expansão PCIe, Zima OS e acesso remoto num...

