Нужно при этом показывать людям что оно позволит делать меньше работы
1. Если по поводу алерта ничего нельзя сделать - не надо алертить
2. Если это не срочно (ждет утра например) - не надо будить по этому поводу ночью
5. Автоматиризуй. Нет автоматизации - оно не production ready
также это относится к OPDOCS'ам - если непонятно что делать в 3 утра в субботу если сестема упала - она не Production ready
Случилось после внедрения новых процессов и решение инцидента заняло минуты