Le SRE, pour site reliability engineering, est un ensemble de principes et de pratiques qui appliquent des aspects de l’ingénierie logicielle à l’infrastructure et aux opérations informatiques pour créer des systèmes logiciels hautement fiables et évolutifs.