Skip to main content
Compartilhe:

No contexto de monitoração distribuída, proxies do Zabbix são componentes essenciais para descentralizar coleta, reduzir latência e aliviar carga do servidor central.

A partir da versão 7.x, o Zabbix introduziu um recurso estratégico para ambientes de larga escala: Proxy Groups, que combinam balanceamento de carga automático e alta disponibilidade entre múltiplas instâncias de proxy.

Em vez de vincular cada host a um único proxy fixo, os Proxy Groups permitem que o Zabbix Server decida dinamicamente qual proxy será responsável por cada host, redistribuindo-os conforme necessário para manter a continuidade de monitoramento e equilíbrio operacional.

Conceitos Fundamentais

Alta Disponibilidade (HA) de Proxies

Proxy Groups garantem que, se um proxy ficar offline, seus hosts sejam redistribuídos automaticamente para outros proxies dentro do mesmo grupo, mantendo o monitoramento ativo sem interrupção perceptível.

O Zabbix Server monitora continuamente o estado de cada proxy pertencente ao grupo.

Quando um proxy deixa de se comunicar dentro do período de failover configurado, ele é marcado como offline e o servidor inicia automaticamente o processo de redistribuição de hosts.

Esse mecanismo elimina a necessidade de scripts externos ou balanceadores adicionais para manter a continuidade da coleta.

Balanceamento de Carga Automático (Load Balancing)

Além da alta disponibilidade, Proxy Groups implementam balanceamento automático de carga entre proxies do mesmo grupo.

O algoritmo interno calcula continuamente a média de hosts atribuídos por proxy. Caso um proxy possua significativamente mais ou menos hosts que a média — definido por uma diferença superior a 10 hosts e pelo menos o dobro da média — o sistema inicia um processo de redistribuição.

Lógica de redistribuição

  1. O servidor calcula a média de hosts por proxy dentro do grupo.
  2. Proxies com excesso de hosts têm parte deles movidos para um pool temporário não atribuído.
  3. Proxies com déficit de hosts recebem hosts desse pool.
  4. A redistribuição só é aplicada se o desequilíbrio persistir por um período de carência equivalente a 10 vezes o failover delay configurado.

Esse mecanismo evita redistribuições desnecessárias causadas por instabilidades momentâneas.

zabbix proxy groups

Como o Zabbix determina o estado do Proxy Groups

Um Proxy Group é considerado online quando pelo menos o número mínimo configurado de proxies está comunicando com o Zabbix Server dentro do período de failover.

Estados possíveis do Proxy Group:

Online – O número mínimo de proxies ativos está atendido
Degrading – Próximo de perder a condição mínima de operação
Offline – Menos proxies online que o mínimo configurado
Recovering – Proxies estão se reconectando e o grupo caminha para estado online

Esses estados podem ser monitorados por itens internos como:

zabbix[proxy group,<nome>,state]
 zabbix[proxy group,discovery]

Isso permite criar triggers específicas para monitorar a saúde da própria camada distribuída.

Configurando Proxy Groups no Zabbix

Passo a passo no frontend

  1. Acesse Administration → Proxy groups.
  2. Clique em Create proxy group.
  3. Configure os seguintes parâmetros:

Name – Identificador único do grupo
Failover Period – Tempo (10 segundos a 15 minutos) para considerar um proxy offline
Minimum Number of Proxies – Quantidade mínima de proxies que devem estar online para o grupo permanecer ativo
Description – Campo opcional descritivo
Proxies – Lista de proxies que farão parte do grupo

Dica importante: o número mínimo de proxies deve ser menor que o total de proxies configurados, permitindo que o grupo continue operacional mesmo após a perda de um nó.

Atribuindo Hosts a um Proxy Groups

Para que um host participe do modelo de HA e balanceamento:

Em vez de associar o host diretamente a um proxy específico, associe-o ao Proxy Group na configuração do host.

Após essa definição, o Zabbix Server passa a calcular e distribuir automaticamente a responsabilidade de coleta entre os proxies do grupo.

Isso reduz a dependência operacional manual e simplifica a expansão horizontal.

Configurando os Agentes para trabalhar com Proxy Groups

Para que o modelo funcione corretamente, os agentes devem permitir conexão com múltiplos proxies.

Agentes Passivos

Na opção Server, liste todos os proxies do grupo separados por vírgula:

Server=proxy1,proxy2,proxy3

Soluções de TI

Agentes Ativos

Na opção ServerActive, liste todos os proxies separados por ponto e vírgula:

ServerActive=proxy1;proxy2;proxy3

Importante: versões de agentes anteriores à 7.0 não suportam corretamente esse modelo em modo ativo.

Essa configuração garante que, caso um proxy fique indisponível, o agente consiga se reconectar automaticamente a outro proxy do grupo.

Testando Load Balancing e Failover

Para validar o comportamento em laboratório ou homologação:

  1. Configure um Proxy Group com múltiplos proxies.
  2. Atribua diversos hosts ao grupo.
  3. Verifique se o grupo está online no frontend.
  4. Interrompa um dos proxies com systemctl stop zabbix-proxy.
  5. Observe a redistribuição automática de hosts após o período de failover.

Valide também o retorno do proxy e o comportamento do estado Recovering até Online.

Testes periódicos garantem previsibilidade operacional.

Limitações e observações importantes

  • Traps SNMP: Proxies dentro de um Proxy Group não suportam SNMP traps de forma integrada ao modelo de redistribuição.
  • Configurações externas: Itens que dependem de scripts externos, módulos adicionais ou ODBC devem estar idênticos em todas as instâncias de proxy do grupo. Inconsistências podem gerar falhas de coleta após redistribuição.
  • Carga adicional em ambientes VMware: Quando hosts VMware são distribuídos entre proxies, cada proxy pode armazenar dados em cache do vCenter, aumentando carga na camada VMware.
  • Distribuição em grupos muito pequenos: Se o grupo possuir menos de 10 hosts, o algoritmo pode não promover um equilíbrio perfeito entre proxies.

Boas práticas para ambientes corporativos

  • Utilize pelo menos 3 proxies por grupo para maior resiliência.
  • Utilize mass update para migrar hosts rapidamente para Proxy Groups.
  • Garanta a mesma versão de proxy e sincronização de configurações externas.
  • Teste cenários reais de failover e redistribuição antes de produção.
  • Monitore o próprio estado do grupo com triggers dedicadas.

Proxy Groups como pilar do monitoramento distribuído

Proxy Groups representam um avanço arquitetural relevante para ambientes distribuídos e de grande escala:

  • Alta disponibilidade automática
  • Balanceamento de carga inteligente
  • Eliminação de scripts auxiliares
  • Configuração centralizada

Quando bem planejado, esse modelo reduz falhas de monitoramento, melhora a latência de coleta e permite expansão escalável da malha de monitoração.

Porém, existe espaço claro para evolução.

O algoritmo atual utiliza o número de hosts como principal critério de distribuição. Na prática, isso nem sempre reflete a carga real.

Um proxy pode ter 25 hosts com poucos itens ativos, enquanto outro possui 20 hosts com centenas de itens e alto volume de valores por segundo.

O resultado é desequilíbrio operacional mesmo com “equilíbrio numérico” de hosts.

Uma abordagem baseada em métricas como valores por segundo ou número total de itens ativos por proxy seria tecnicamente mais precisa para balanceamento real de carga.

Fica a expectativa de evolução futura nesse sentido.

Quando isso acontecer, o Proxy Group deixará de ser apenas um mecanismo inteligente e passará a ser um verdadeiro orquestrador de capacidade distribuída.

Sobre a Target Solutions

A Target Solutions é especializada em AIOps, infraestrutura de TI e redes, atuando na interseção entre operação real, automação e inteligência aplicada. Com mais de 15 anos de experiência técnica, combinamos inovação em tecnologias de código aberto com inteligência artificial aplicada às operações de TI e Telecom, transformando ambientes complexos em operações mais eficientes, previsíveis e escaláveis.

Como Zabbix Certified Partner, contamos com profissionais certificados (Expert, Professional e Specialist), com ampla experiência na implantação, evolução, sustentação N2/N3 e otimização de ambientes Zabbix corporativos de grande porte. Nossa atuação abrange desde arquiteturas distribuídas com proxies regionais até ambientes com milhares de ativos monitorados, incluindo integrações com sistemas ITSM e ferramentas de observabilidade.

Ao longo de dezenas de projetos de implantação, modernização e suporte especializado em Zabbix, acumulamos não apenas domínio técnico da plataforma, mas também uma compreensão profunda dos desafios reais da gestão de incidentes: excesso de alarmes, dificuldade de priorização, análise manual e operações reativas.

É justamente nesse ponto que a proposta de valor do Argus, nossa plataforma de AIOps, se conecta de forma complementar ao Zabbix. Enquanto o Zabbix oferece monitoramento robusto e confiável, o Argus atua sobre esse universo de eventos, consolidando múltiplas fontes, correlacionando alarmes e aplicando inteligência para transformar dados em contexto, prioridade e ação.

Assim, ajudamos as organizações a evoluírem da simples monitoração para uma gestão operacional orientada à inteligência, reduzindo ruído, acelerando diagnósticos e elevando o nível de maturidade das operações de TI.

Conheça o Argus (clique aqui), solicite uma demonstração e veja como transformar ruído em inteligência operacional.

Autor deste Artigo: Luciano Souza, Consultor Associado da Target Solutions.

Entre em contato
Compartilhe: