Información del cargo

Site Reliability Engineer

¿Quiénes somos?

Grupo R5 es una startup de rápido crecimiento a partir de la unión de dos sectores muy dinámicos: Insurtech y Fintech. En R5 creamos productos financieros de bajo costo con la misión de mejorar la salud financiera de nuestros clientes. Nuestro SOAT digital utiliza inteligencia artificial para ofrecer el mejor descuento en el país. Nuestro crédito utiliza activos (carros, motos) como garantía para ofrecer montos mayores a tasas menores.

¿Qué buscamos?

Buscamos una persona responsable de brindar a los equipos técnicos y de producto control sobre la plataforma tecnológica de Grupo R5 para lograr alta disponibilidad, respuesta oportuna a incidentes, gestión de riesgos y evolución controlada.

Este rol implica un alto grado de interacción con el equipo de desarrollo en aras de probar e implementar las mejores soluciones sobre la infraestructura y aplicaciones de la empresa.


¿Qué ofrecemos?

En Grupo R5 creemos en el gana-gana: nuestros empleados ganan bien y nos encargamos de que tengan un desarrollo personal acelerado; nuestra empresa tiene empleados automotivados que luchan por ofrecer mejores productos que generan impacto positivo en nuestros clientes.

Nuestros colaboradores tienen la posibilidad de trabajar remotamente, pedir tardes libres, días de vacaciones adicionales. Además cuentan con presupuesto para:

  1. Salud complementaria o prepagada.
  2. Salud mental y emocional
  3. Educación
  4. Adecuación home office

Funciones especifícas

  • Conocer el negocio y las soluciones que soportan cada producto, entendiendo las dependencias entre ellas.
  • Identificar los puntos críticos de la operación.
  • Implementar estrategias de monitoreo y registro de logs de acuerdo a los principios de observabilidad.
  • Definir alertas para atención oportuna de incidentes.
  • Definición de SLAs, SLIs y SLOs.
  • Consolidar métricas históricas que permitan analizar la evolución de los servicios a través del tiempo.
  • Apoyar el diseño e implementación de pruebas de seguridad sobre los distintos ambientes.

Habilidades técnicas:

  • Conocimiento avanzado en Amazon Web Services.
  • Experiencia en servicios de AWS como EC2, ECS, RDS, CloudWatch, etc.
  • Sólido conocimiento en Docker.
  • Sólido conocimiento en procesos de CI/CD
  • Conocimiento avanzado en Infraestructura como código.
  • Nivel intermedio-avanzado en algún lenguaje de programación como Go, Python, Node.js
  • Kubernetes (opcional)

Conocimientos y experiencia:

  • Conocimiento de procesos de desarrollo ágil, incluyendo diseño, arquitectura, pruebas, despliegue continuo y operación. 
  • Conocimiento avanzado en administración de servidores Linux.
  • Conocimiento en gestión de soluciones en nube virtual.
  • Experiencia con herramientas de monitoreo como New Relic, Datadog,  Prometheus o similares.
  • Experiencia en sistemas de gestión de logs como Graylog y Elastic Stack.
  • Experiencia en construcción de Dashboards de monitoreo y alerta.
  • Conocimiento en sistemas de mensajería como RabbitMQ.
  • Conocimiento en arquitecturas de microservicios.
  • Experiencia en arquitecturas asíncronas / event driven es un plus.
  • Experiencia en soluciones serverless es un plus.
  • Conocimientos en seguridad es un plus

Formación academica: 

  • Formación en áreas de tecnología, administración de sistemas, cloud computing.

Lo que esperamos de ti
  • Buena comunicación con contrapartes técnicas y de negocio. 
  • Pensamiento crítico.
  • Aprendizaje constante.
  • Capacidad de formación de otros.
  • Autonomía
  • Alineamiento con nuestros valores
  • Humildad y sentido del humor
  • Capacidad de trabajar en un ambiente de honestidad radical.

Condiciones: 

  • 100% Remoto

Aplica a este cargo