DevOps Engineer - SRE & Observability

Coderio
Coderio
Buenos Aires / Santiago de Chile / La Plata / Lima / Arequipa / Puno / RosarioremoteCompetitiveAdded 3 days agoPermanentRemote: Remote

Originally posted in Spanish

Original Advert

Sobre Coderio
Coderio diseña y entrega soluciones digitales escalables para empresas globales. Con una base técnica sólida y una mentalidad orientada al producto, nuestros equipos lideran proyectos de software complejos desde la arquitectura hasta la ejecución. Valoramos la autonomía, la comunicación clara y la excelencia técnica. Colaboramos estrechamente con equipos y socios internacionales, construyendo tecnología que genera impacto.
🌍 Más información: http://coderio.com
Qué buscamos
Buscamos un DevOps Engineer - SRE & Observability para garantizar la salud proactiva de nuestros sistemas. Esta posición estará enfocada en la observabilidad end-to-end y en la respuesta eficiente ante incidentes, con el objetivo de asegurar que la experiencia del usuario final no se vea afectada.

Responsabilidades:

  • Diseñar, implementar y mantener la estrategia de observabilidad
  • Medir y optimizar los SLOs, contribuyendo a la reducción del MTTR (Mean Time To Repair)
  • Liderar el análisis de incidentes y la elaboración de postmortems accionables
  • Presentar métricas de confiabilidad y desempeño a stakeholders y niveles directivos

Requisitos Técnicos:

  • 1. Stack de Observabilidad
  • Experiencia avanzada en monitoreo y métricas con Prometheus, Grafana, Datadog o New Relic
  • Gestión de logs centralizados con ELK Stack (Elasticsearch, Logstash, Kibana), Splunk o Graylog
  • Implementación de trazabilidad distribuida con OpenTelemetry, Jaeger o Honeycomb para identificar cuellos de botella en microservicios
  • 2. Ingeniería de Confiabilidad (SRE Core)
  • Capacidad para definir y configurar SLIs y SLOs alineados a las expectativas del negocio
  • Conocimiento en gestión de Error Budgets para decidir cuándo priorizar estabilidad sobre nuevas funcionalidades
  • Experiencia liderando procesos de Postmortem sin culpables y análisis de causa raíz (RCA)
  • 3. Automatización y Plataforma
  • Dominio de Infrastructure as Code con Terraform o CloudFormation para despliegues automatizados de agentes de monitoreo
  • Conocimiento sólido en Kubernetes/OpenShift con recolección de métricas a nivel de clúster (Kube-state-metrics, Node Exporter)
  • Capacidad de automatizar respuestas a alertas y runbooks mediante Python, Go o Bash
  • 4. Gestión de Alertas y Respuesta a Incidentes
  • Configuración de alertas inteligentes que reduzcan ruido y fatiga operacional con PagerDuty, Opsgenie o VictorOps
  • Dominio de técnicas de diagnóstico rápido en entornos productivos bajo presión, con foco en la reducción de MTTR

Beneficios

  • 100% remoto
  • Compromiso a largo plazo, con autonomía e impacto
  • Rol estratégico y de alta visibilidad en una cultura de ingeniería moderna
  • Equipo internacional colaborativo y liderazgo técnico sólido
  • Plan de carrera y crecimiento dentro de Coderio
¿Por qué unirte a Coderio?
En Coderio valoramos el talento sin importar la ubicación. Somos una empresa remote-first,apasionada por la tecnología, el trabajo colaborativo y la compensación justa. Ofrecemos un entorno inclusivo, desafiante y con oportunidades reales de crecimiento. Si te motiva construir soluciones con impacto, te estamos esperando.
Postula ahora.

Application managed by Coderio