Retail | Noticias | 08 JUL 2018

Cómo Just Eat ejecuta DevOps a escala

En el futuro, la empresa de entrega de comida a domicilio quiere que sea la inteligencia artificial la que tome el control.
justeat
Scott Carey

La empresa de distribución de alimentos Just Eat tiene una cultura de desarrollo enormemente compleja en 35 equipos de desarrollo de software en cinco emplazamientos, trabajando en conjunto para mantener 450 microservicios.

La compañía ha pasado de apoyarse en libros escritos a un equipo de ingeniería de confianza de sitios (SRE) centralizado y dedicado, reformuló sus herramientas y ahora está implementando inteligencia artificial para automatizar aún más sus procesos.

En las horas punta, Just Eat procesa 2.700 pedidos por minuto, normalmente un sábado por la noche, lo que requiere que generen más de 1.500 instancias de AWS. El equipo de ingeniería envía hasta 500 actualizaciones por semana y genera 1.5TB de registros por día.

Construyendo un equipo central de SRE
La ingeniería de confianza del sitio es de suma importancia para Just Eat, como lo es para rivales como UberEats y Deliveroo, ya que las interrupciones causan una reacción sobredimensionada por parte de clientes hambrientos.

Richard Haigh, director de tecnología de Just Eat, asegura que: "La ingeniería de confianza del sitio comienza con esta primera premisa: creemos sinceramente que los equipos de desarrollo crean el código, lo envían, lo cuidan y nosotros hacemos las comprobaciones y si el código falla y ayudan a solucionarlo".

Sin embargo, esos equipos de desarrollo no están solos, sino que cuentan con el respaldo de equipos que ejecutan lo que Haigh llama "cinco pilares" que son:

  • Proteger la disponibilidad del sitio
  • Permitir que los cambios se entreguen rápidamente, pero con calidad mediante el uso de conductos de entrega automatizados
  • Optimizar del uso de la infraestructura y los recursos, utilizando soluciones escalables en la nube y asegurando el gasto adecuado allí
  • Innovación para mantenerse a la vanguardia
  • Fomentar una cultura intachable y habilitar equipos autónomos

Todo ello comienza con un equipo central de SRE de 50 a 60 personas que dirige un centro de operaciones de servicio las 24 horas del día, los 7 días de la semana: "Su trabajo es controlar los primeros diez minutos de cualquier problema que tengamos", explica Haigh.

Este equipo también se encarga de alojar varias plataformas en la nube, automatización de la entrega (conductos de CI / CD), monitorización, registro y alerta bajo un equipo que llaman 'observabilidad' internamente, y administración de servicios por un conjunto de gerentes.

 

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios