NEW BOT Телеграм, страница - 5325057

I hate overtime

867 subscribers

129 photos

4 videos

54 files

961 links

Some DevOps, SRE and IT development stuff

Download Telegram

About

Blog

Apps

Platform

I hate overtime

867 subscribers

I hate overtime

Forwarded from AvitoTech

Митап с окрошкой и инцидентами

10 августа в нашем офисе пройдет четвертый митап в серии Backend United, который получил название «Окрошка».

В программе — доклады про инструменты для улучшения incident response, работу с продакшн взрывами, ценность технического долга, автоматизированный сбор сведений при значительных инцидента. А во время перерыва запланировали поедание окрошки.

Если вам всё это интересно, то регистрируйтесь на встречу на таймпаде. Подробнее о докладах можно прочитать на Хабре.

10 views08:14

I hate overtime

Митап с окрошкой и инцидентами 10 августа в нашем офисе пройдет четвертый митап в серии Backend United, который получил название «Окрошка». В программе — доклады про инструменты для улучшения incident response, работу с продакшн взрывами, ценность технического…

Почему-то потерялась ссылка на хабр Выглядит интересно, #ябсходил

Backend United 4: Окрошка. Инциденты

Привет! Мы продолжаем серию митапов Backend United. Четвёртая встреча называется «Окрошка», и посвящена она будет инцидентам. Вместе с коллегами из Tutu.Ru, Ozon...

232 views08:17

I hate overtime

В тему инцидент менеджмента. Как-то зацепились с Пашей из ОкМетра языками за anomaly detection в мониторинге. Его поинт был: anomaly detection as a service -- маркетинговый булшит и ничего более, я же апеллировал к тому, что у "конкурентов"-то(datadog, appInsides и т.п ) он цветет и пахнет и, самое главное, продается. Тут Паша высказал мысль от которой у меня чет прям очень мировозрение пошатнулось: если мы не верим, что это будет работать и приносить клиенту value, а считаем что это просто маркетинговый булшит, то делать мы это не будем.
Сцуко, а что, так можно было?! На подумать кароч)

223 views08:42

I hate overtime

Forwarded from CatOps

Большая стать от DataDog об уроках использования Kafka

В статье описывают:
- пути безболезненного изменения максимального размера сообщения
- unclean leader election: плюсы, минусы, подводные камни
- конфигурацию retention period для топиков с низкой частотой записи и на что стоит обращать внимание + настройку retention для такого типа топиков

Кроме того, DataDog заопернсорсили свой Kafka-kit - набор утилит понятно для чего. Ну и статейка про эти утилиты

#kafka

Lessons learned from running Kafka at Datadog | Datadog

Learn about several configuration-related issues we encountered while running 40+ Kafka and ZooKeeper clusters.

13 views08:53

Lessons learned from running Kafka at Datadog

kafka-kit GitHub

Introducing Kafka-Kit: Tools for Scaling Kafka

I hate overtime

Forwarded from Dmitry Sh

Перевели postmortem от Grafana Labs про их недавний фейл с Kubernetes: https://habr.com/ru/company/flant/blog/461807/

Как приоритеты pod'ов в Kubernetes стали причиной простоя в Grafana Labs

Прим. перев.: Представляем вашему вниманию технические подробности о причинах недавнего простоя в работе облачного сервиса, обслуживаемого создателями Grafana. Э...

254 views11:48

I hate overtime

Тут лухари-ретроспектива эволюции Slack'а подъехала. Со времен основания и до наших дней. Наслаждайтесь)
З.Ы. особенно круто, то что из наколеночного стартапа где никто особо не шарил они смогли вырасти и не загнуться. Под катом много инсайтов как смочь быстро и качественно

Scaling Infrastructure Engineering at Slack

Julia Grace was asked to build Slack’s first infrastructure engineering organization in August 2016. The company was two years old and they were approaching the scalability limits of the original infrastructure. Things were starting to break in strange and…

251 views15:23

I hate overtime

Forwarded from Админим с Буквой (bykva)

Задачи на собеседование

Недавно мне попалась на глаза задача на вакансию linux-администратора в одну известную компанию. Вопрос звучит следующим образом:

Вам нужно проапгрейдить ядро и операционную систему на ста одинаково настроенных серверах. Как вы будете решать эту задачу?

Вопрос никоим образом не сложный, но позволяет сразу прочувствовать знания соискателя. Прежде чем высказать свое ИМХО по этому вопросу, я запущу опрос и дам вам время чтобы вы могли составить собственное мнение.

8 views16:02

I hate overtime

Forwarded from Админим с Буквой (bykva)

А теперь немного моего ИМХО по этому поводу.
Существует несколько нюансов при выполнении этой задачи.

1) Никогда нельзя быть твердо уверенным что обновление сервера, с уставновленными из репозитория пакетами пройдет без сучка и задоринки, поэтому нельзя быть уверенным, что если мы запустим ансибл по 100 серверам у нас вообще все это выживет. Бывали случаи когда какие-то пакеты конфликтовали, и новый дистр не поднимался успешно. Ну и наконец где ваша уверенность что софт, установленный из репозитория текущего дистрибутива есть в новом??? Таким образом 2,3 варианты ответов отметаем сразу.

2) как сказано в условиях задачи "одинаково настроенные". На самом деле нет. Это в идеальном мире можно условно "расклонировать" 100 раз службу и получить одинаковый результат. По факту всегда найдется какой-то "любимый" некоторым сисадмином сервер, на который тот ходит руками. Не важно зачем - логи читать или статус софта запрашивать. А еще бывает иногда необходимость выкатить условно-релизную версию софта на сервер, чтобы убедиться, что релиз не положит весь поток продового трафика. И вот уже у нас вроде бы 100 одинаковых серверов, а вот уже и нет, даже если потом все сервера приводятся к одинаковой версии софта.

3) самое важное - это как раз необходимость изучить, какую же вообще выполняют задачу эти 100 серверов.
3.1) У нас 100 серверов-воркеров. на сервере крутится служба, которая ходит в очередь и выполняет задание. При простое одного такого воркера вообще никто не заплачет. Можно выдергивать и обновлять.
3.2) У нас кластер на 100 машин. Например куб. или эластик. Опа, а вот тут уже начинаются первые вопросы. Если мы обновим дистрибутив, сможет ли вообще наше приложение существовать в новом окружении? не посыпется по зависямостям? ничего лишнего не снесется? Все ли нужные пакеты запинены? не приведет ли новое ядро к тому что будет падать в корку приложение? Что вообще произойдет с подами куба если мы выведем ноду из обслуживания? А вдруг у нас настроено афинити и приложение жестко привязано к этой ноде и когда мы ее положим оно нигде не поднимется? С базами тоже интересно, нужно знать, достаточно ли у нас реплик, что шардинг разнесен правильно. В случае с тем же эластиком, например пишется такой плейбук, который дожидается пока не поднимется предыдущий сервер, прежде чем обновлять следующий.

Поэтому такие задачи требуют глубокого изучения, построения сценариев обновления, написания автоматизации, а возможно подъема различных стендов, на которых все это будет обкатываться. А уж какой командой мы обновлять будем сервер и ядро - это никому не интересно.. 😃

11 views16:02

I hate overtime

Подьехала тут пачка инсайтов от Нетфликса про инцидент менеджмент и как расти через инциденты. Я чет прямо орнул с working with people in this context can be the “hardest problem in tech”. Кажется, это можно смело распространить на все IT😂

How Did Things Go Right? Learning More from Incidents at Netflix: Ryan Kitchens at QCon New York

At QCon New York, Ryan Kitchens presented “How Did Things Go Right? Learning More from Incidents”. Key takeaways from the talk included: recovery is better than prevention; an incident occurs when there is a “perfect storm” of events -- there is no root cause;…

257 views11:31

I hate overtime

Ну сегодня прямо день infoQ) Тут прям картинки красивые, а ситуация страшная. Напоминает старую идею представления тредов через сети Петри. Не, может для небольших инсталяций оно и сработает, но при резервировании и постоянном падении нод вся эта штука с топологиями кмк превратится в хаос и адок

Verifying a Distributed System with Combinatorial Topology

Veronica Lopez shares her experience with containers and Kubernetes, including flexible autoscaling and refined testing & delivery experiences, that make sense within an Elixir environment.

273 viewsedited 11:48

I hate overtime

Кстати, сегодня торжественно снесли https://www.weave.works/docs/scope/latest/introducing/ т.к. воспользовались ровно один раз за пол-года(когда надо было инвесторам красивые картинки показать). Для картинок удобно, практической пользы меньше нуля(т.к. жрет больше чем пол-ядра)

www.weave.works

Weaveworks Documentation

View our up-to-date documentation for everything Weaveworks including Weave GitOps, Weave Cloud, Weave Net, Weave Scope, Weave Flux and Weave Cortex.

258 viewsedited 11:53

I hate overtime

Forwarded from Пятничный деплой

Выбираем ingress для kubernetes https://itnext.io/kubernetes-ingress-controllers-how-to-choose-the-right-one-part-1-41d3554978d2 #k8s #ingress

Kubernetes Ingress Controllers: How to choose the right one: Part 1

In this article, I will share my experience with 3 major types of Kubernetes ingress solutions. Let’s go through their pros and cons and…

10 views11:31

I hate overtime

#nodejs #async
Немножко nodejs вам в ленту!
Еще одна годная статья про то какую проблему в свое время решила нода(да и в целом V8), куча примеров и смищных картинок!

Everything you need to know about Node.js

An ultimate guide to understand Node.js

256 viewsedited 11:53

I hate overtime

Forwarded from oleg_log (Oleg Kovalov)

И даже такое есть в наших интернетах:
Paxos Jokes - Geeking out about distributed systems

Leader - I tell you Paxos joke, if you accept me as leader.
Quorum - Ok comrade.

Leader - Here is joke! (*Transmits joke*)
Quorum - Oookay...

Leader - (*Laughs* hahaha). Now you laugh!!
Quorum - Hahaha, hahaha.

http://paxosjokes.com/#!/

9 views08:29

I hate overtime

249 views08:30

I hate overtime

I hate overtime

Кстати, вот картинка смешная, а ситуация страшная. Очень часто сталкивался с удивлением в глазах у людей, когда на их утверждение "да это же блокер!" спрашиваешь "а, собственно, почему?". Дальше имеется 2 варианта развития событий: либо достается табличка/чарт с критериями приоритезации багла, с нее сдувается пыль и баг сверяется с этим делом, либо же человек заявляет что-то типа "я художник, я так вижу!"
В обоих вариантах, как не странно, есть свои плюсы! И если в первом случае они очевидны, то в кругу "художников" рекомендую делать так:
1. берете поп-корн и пиво
2. зовете другого "художника" с противоположной позицией по вопросу
3. стравливаете эту парочку между собой
4. Включаете pixies
5. Открываете поп-корн

237 views09:15

I hate overtime

Forwarded from oleg_log (Oleg Kovalov)

Автор Joy of Haskell сделал список алг. структур.

Вместо тысячи причин:
I keep forgetting what the difference is between a ring and a group, which is funny to me because I never forget the difference between a semiring and a semigroup

https://argumatronic.com/posts/2019-06-21-algebra-cheatsheet.html

CAUTION: Monoid fever is contagious.

16 views15:13

I hate overtime

confluent-designing-event-driven-systems.pdf

#kafka #eda
Тут открыл для себя книженцию. Весьма полезно если вкручиваете каффку(дада, греффневую) Прям рекомендую

292 views09:44

I hate overtime

I hate overtime

confluent-designing-event-driven-systems.pdf

А вот тут дядя заморочился и собрал список ссылок и матриалов из книжки: https://gist.github.com/giampaolotrapasso/71221f378770e21e6270ffed76b181d7

List of links from Designing Event-Driven Systems by Ben Stopford

List of links from Designing Event-Driven Systems by Ben Stopford - Designing Event-Driven Systems links.md

290 views09:46

I hate overtime

Forwarded from CatOps

Лонгрид для выходного дня о распределенном трейсинге от Cindy Sridharan.

В статье описано, какие возникают проблемы при построении трейсинга и как их можно принципиально решать.

#observability

Distributed Tracing — we’ve been doing it wrong

Distributed Tracing is often considered hard to deploy and it’s value proposition considered to be questionable at best. A variety of…

15 views10:44

Distributed Tracing — we’ve been doing it wrong

I hate overtime

Spyware на java: https://github.com/tiagorlampert/sAINT. Говорят, почти не тормозит)

GitHub - tiagorlampert/sAINT: :eye: (s)AINT is a Spyware Generator for Windows systems written in Java. [Discontinued]

:eye: (s)AINT is a Spyware Generator for Windows systems written in Java. [Discontinued] - tiagorlampert/sAINT

246 views11:04