Desenvolvedor Kubernets

  • Não Informado
  • Remoto
  • 24/02/2026

Desenvolvedor Kubernets


Atuação remota;


Inicio Imediato;


Período 3 meses (Podendo ser renovado);


Contratação PJ;


Inglês avançado - Projeto nos EUA;


Requisitos Técnicos:


Java 17+ e Spring Boot (Web, Data, Security), Spring Cloud Kubernetes para config/secret/discovery; Kubernetes (pods, deployments, services, ingress, namespaces, quotas, affinity/tolerations), Device Plugins para GPU, e prática com NVIDIA MIG (criação/consumo de instâncias, perfis);


Observabilidade: Actuator + Micrometer (OpenMetrics), configuração de endpoints/health, integração com Prometheus/Grafana, tracing (Istio/Jaeger/Tempo);


Resiliência e integração: conectores/clients, headers de tracing e sidecar pattern conforme arquitetura de referência interna;


DevOps/CI‑CD: Git, Jenkins, pipelines, automações com Terraform/IaC e gestão por CCOE;


APIs: RESTful, JSON/Protobuf, Swagger/OpenAPI, boas práticas de versionamento e contrato.


Responsabilidades:


Projetar, desenvolver e manter microserviços Spring Boot que utilizam NVIDIA MIG via Kubernetes Device Plugin, declarando corretamente requests/limits (nvidia.com/mig-*) e garantindo isolamento, performance e custo;


Integrar configurações e segredos via Spring Cloud Kubernetes (ConfigMaps e Secrets) como fonte única de configuração operacional do serviço;


Implementar conectores para endpoints externos (REST/gRPC/Sidecar);


Expor métricas e health checks utilizando Spring Boot Actuator (Micrometer/OpenMetrics) com Prometheus e Grafana, incluindo probes de dependências (DB, broker, serviços upstream);


Aplicar práticas de resiliência (timeouts, retries, bulkheads) e observabilidade (logs estruturados, traces, métricas) desde o design;


Trabalhar com pipelines CI/CD padronizados, integrando‑se ao fluxo do CCOE e Jenkins/Terraform para promoção entre ambientes e automação de deploy/infra as code, seguindo princípio do menor privilégio;


Colaborar com times de Infra/Platform/AI na definição de perfis MIG e quotas, planejando capacidade e custo por workload;


Participar de code reviews, testes (unitários/integrados), documentação (Swagger/OpenAPI), e da evolução contínua de padrões de APIs e microsserviços;


Diferenciais:


Experiência com Istio (traffic management, mTLS), service mesh e sidecar para inferência;


Prática com OCI (Oracle Cloud), NCP/NVIDIA e arquiteturas de custo/performance para treinamento e inferência;


Conhecimento de mensageria (Kafka/RabbitMQ), caching, storage otimizado para pipelines de IA.