Le principal défi à relever pour devenir une entreprise axée sur les logiciels est de trouver le meilleur équilibre entre la cadence d’innovation et la fiabilité des services : En général, plus il y a de changements, plus il y a de pannes.
Pour s’attaquer à ce problème difficile, Google utilise à la fois la cadence d’innovation et l’ingénierie de la fiabilité des sites (Site Reliability Engineering).
L’ingénierie de la fiabilité des sites (Site Reliability Engineering) est la façon dont Google met en œuvre DevOps à grande échelle, qui est désormais bien connue pour être l’un des facteurs clés de succès de Google. Nous pensons que les budgets d’erreur sont la clé pour trouver le meilleur équilibre entre la vélocité et la fiabilité, car cela se fait d’une manière collaborative basée sur les données.
Pendant longtemps, Google l’a gardé comme une « recette secrète ». Depuis qu’ils sont devenus un fournisseur de Cloud public, ils souhaitent aujourd’hui partager SRE avec les clients en espérant que ce qui fait leur succès fera aussi le leur.
En septembre dernier, SFEIR Institute vous proposait un événement dédié au SRE avec en guest : Bruno Reboul, Cloud Engineer with DevOps/Site Reliability Engineering SRE focus chez Google.