Еще проблема - много систем тесно связаны и работают параллельно
Toil - любая работа которую надо периодически делать вручную
и которая растет с количеством систем которыми ты управляешь
В начале внедрения системы нужно постараться сделать переход как можно более легким
Нужно при этом показывать людям что оно позволит делать меньше работы
1. Если по поводу алерта ничего нельзя сделать - не надо алертить
2. Если это не срочно (ждет утра например) - не надо будить по этому поводу ночью
5. Автоматиризуй. Нет автоматизации - оно не production ready
также это относится к OPDOCS'ам - если непонятно что делать в 3 утра в субботу если сестема упала - она не Production ready