Procuramos um Especialista em Monitoramento para integrar nossa equipe de Digital Monitoring e ser responsável por otimizar e garantir a eficiência de nossos processos de monitoramento, com foco na automação e na adoção de tecnologias avançadas. Este profissional será fundamental para assegurar a alta performance e disponibilidade dos sistemas de monitoramento e observabilidade, utilizando ferramentas como Zabbix, Prometheus e Grafana.
Responsabilidades:
- Suporte especializado e manutenção de plataformas de monitoramento como Zabbix, Prometheus, com vasta experiência na implantação e customização, além de ferramentas de visualização e análise como Grafana e Loki/Graylog/Elasticsearch.
- Diagnóstico e tratativa de problemas complexos em ambientes de monitoramento, propondo e implementando soluções duradouras.
- Otimização de atividades e processos de monitoramento, com foco em automação para aumentar a eficiência e reduzir o tempo de resposta.
- Atuar no NOC (Network Operations Center), monitorando sistemas e redes para garantir a disponibilidade e performance dos serviços.
- Colaborar com a equipe para definir estratégias de monitoramento proativas e reativas, garantindo que o ambiente esteja alinhado com as melhores práticas do setor.
- Desenvolver e manter scripts e ferramentas de automação para facilitar o processo de monitoramento e reduzir a intervenção manual.
- Configuração e ajuste de dashboards no Grafana para monitoramento em tempo real, correlacionando métricas críticas de infraestrutura e aplicações.
- Elaborar Planos e Projetos de monitoramento e observabilidade, junto as outras equipes, com o objetivo de garantir o desenho ideal e a execução contemplando as melhores soluções e arquitetura disponíveis.
- Trabalhar em estreita colaboração com outras equipes (Desenvolvimento, Infraestrutura, Segurança) para garantir a integração das soluções de monitoramento com as operações da empresa.
- Conduzir revisões periódicas de desempenho e SLA para identificar oportunidades de melhoria.
Qualificações Necessárias:
- Superior completo em Ciência da Computação, Engenharia da Computação, Sistemas de Informação ou áreas correlatas.
- Certificações: ZCE, SCP, NCM, NPM, SAM, LPIC III (301 e 302), NSE 3, NSE 4, AZ900, DP900, AI 900.
- Experiência em suporte de operações de NOC e plataformas de monitoramento.
- Forte conhecimento e experiência com Zabbix, configuração de templates, monitoramento distribuído, e criação de métricas customizadas.
- Experiência com Prometheus para monitoramento de métricas em ambientes containerizados e aplicações cloud-native.
- Familiaridade com o uso do Grafana para construção de dashboards customizados e relatórios visuais.
- Experiência em configuração e manutenção do Elasticsearch como parte de uma solução de monitoramento centralizada.
- Conhecimento em automação de processos de monitoramento (scripting e ferramentas como Ansible, Puppet ou Chef).
- Habilidade de resolver problemas complexos e gerenciar incidentes críticos de monitoramento.
- Capacidade de comunicação eficaz e colaboração entre equipes.
Diferenciais:
- Experiência com monitoramento de infraestrutura em ambientes Kubernetes e Cloud (Google Cloud, AWS, Azure).
- Familiaridade com outras ferramentas de monitoramento e observabilidade como Graylog, Kibana, ou VictoriaMetrics.
- Experiência em observabilidade e monitoramento de microserviços.
.