CatOps – Telegram
CatOps
5.09K subscribers
94 photos
5 videos
19 files
2.57K links
DevOps and other issues by Yurii Rochniak (@grem1in) - SRE @ Preply && Maksym Vlasov (@MaxymVlasov) - Engineer @ Star. Opinions on our own.

We do not post ads including event announcements. Please, do not bother us with such requests!
Download Telegram
​​Managing reliability with SLOs and Error Budgets

The folks at Kudos in simple language teach us about SLOs, SLIs, and error budgets, as well as talk through their own implementation of them.

#monitoring #sre

And they have pretty useful image about SLI collection points:
Мы дожили до этого!

Встречайте краткую выжимку магистрской диссертации Docker and Kubernetes in high security environments

Вообще, интересно потому что исследуется пример не абстрактного SaaS, а подход к безопасности шведской полиции.

#kubernetes
Я чисто напомнить о событиях в Киеве.

Что: DevOps Fest 2019

Где: г. Киев, Mercure Congress Hall (ex Большевик над кинотеатром)

Когда: 6 апреля 2019 года

О чём:
- Containerization and virtualization
- DevOps tools and approaches
- Cloud and digital platforms
- CI and CD
- SecOps and TestOps
- DevOps transformation

Больше информации тут: http://devopsfest.com.ua/index.html

Цена вопроса: Сечас 120 USD
Промокод на 10%: DEVOPSFESTFORCATOPS

#event
Вылетаю на Fosdem 2019, который будет на этих выходных в Брюсселе.

Если вы тоже там, можем встретиться на кофе :)
Forwarded from DevOps Deflope News
Немножко утилит про сети.

* ksniff — kubectl плагин, который использует tcpdump и Wireshark для снятия трафика в любом поде в кластере Kubernetes.
http://amp.gs/VWbN
P.S. Напоминаю, что плагины kubectl теперь можно удобно ставить с помощью krew
http://amp.gs/VWbJ

* kubefwd — решение для форвардинга портов из Kubernetes на локальное окружение.
http://amp.gs/VWbL

* sshuttle — простая штука для создания подобия VPN через ssh соединение без админских прав.
http://amp.gs/VWb3
И kuttle — обертка для sshuttle для kubectl для пробрасывания сети из Kubernetes на локалхост.
http://amp.gs/VWb2

#tools #network
21-22 февраля пройдёт 24-часовой онлайн ивент All-day HasiTalks

Стартует в 9:00 GMT. Регистрация по ссылке выше (та же ссылка под постом)

#hashicorp
Amazon выпустили официальный пак иконок для AWS (улучшенный и обновлённый).

Но интересно то, что в конце статьи ссылки на тулзы для построения инфраструктурных схем.

Если кто собрался визуализировать свою платформу -- будет полезно.

#aws
Когда-нибудь мы напишем красивую статью в Engineering блог нашей компании, как мы боролись с перераспределением slabs в Мемкеше. Но это будет когда-нибудь, а пока почитайте, как кешируют в Reddit
Собрание тридцати лучших технических выступлений 2018 года по версии Cindy Sridharan. Со ссылками на слайды и видео + комментарии Cindy о докладе.

Вот список самих докладов:

- The Future of Microprocessors, Sophie Wilson
- The Hurricane’s Butterfly: Debugging pathologically performing systems, Bryan Cantrill
- Close Loops & Opening Minds: How to Take Control of Systems, Big & Small, Colm MacCarthaigh
- A Golden Age for Computer Architecture, David Patterson and John Hennessy
- Safe Client Behavior, Ariel Goh
- How to Serve and Protect (with Client Isolation), Frances Johnson
- Applied Performance Theory, Kavya Joshi
- Amazon Aurora: Design considerations for high throughput cloud-native relational databases, Sailesh Krishnamurthy
- Future of FoundationDB Storage Layer, Steve Atherton
- Autonomous Testing and the Future of Software Development, Will Wilson
- Everything about Distributed Systems is Terrible, Hillel Wayne
- What We Got Wrong: Lessons From The Birth Of Microservices at Google, Ben Sigelman
- Distributed Log-Processing Design Workshop, Laura Nolan, Phillip Tischler, Salim Virji
- Load Balancing at Hyper Scale, Alan Halachmi and Colm MacCarthaigh
- Isolation Without Containers, Tyler McMullen
- How C++ Debuggers Work, Simon Brand
- A Philosophy of Software Design, John Ousterhout
- Clangd: architecture of a scalable C++ language server, Ilya Biryukov
- Coroutine Representations and ABIs in LLVM, John McCall
- Developing Kotlin/Native infrastructure with LLVM/Clang, Nikolay Igotti
- Fresh Async With Kotlin, Roman Elizarov
- Kotlin Native Concurrency Model, Nikolay Igotti
- Is it time to write an Operating System in Rust, Bryan Cantrill
- What do you mean “thread-safe”?, Geoffrey Romer
- Fast Safe Mutable State, Ben Cohen
- The Dos and Donts of Error Handling, Joe Armstrong
- QUIC: Developing and Deploying a TCP Replacement for the Web, Ian Swett and Jana Iyengar
- Introducing Network.framework: A modern alternative to Sockets, Josh Graessley, Tommy Pauly, Eric Kinnear
- Kubernetes and the Path to Serverless, Kelsey Hightower
- Using Rust for Game Development, Catherine West

P.S. Не раз кидал сюда её тексты об observability
Утро начинается не с кофе (пора уже эту фразу превращать в рубрику)

В рантайме контейнеров runc, который стоит под ногами у Docker, containerd, cri-o, etc. найдена критическая уязвимость, позволяющая злоумышленнику подменять бинарник runc и таким образом получать root-доступ к хост-системе.

CVE-2019-5736

Патч уже выпущен, тестовый эксплойт будет доступен через неделю.

Это хорошее напоминание, почему неплохо гонять контейнеры на read-only ФС и использовать утилиты а-ля gVisor

P.S.: Для тех, кто не очень разбирается, что это за рантаймы контейнеров, но боится спросить; серия статей Ian Lewis, которая прекрасно раскрывает тему.

#containers #docker #security
​​Кто заведует качеством by Jennifer Riggins & Janet Gregory @ InfoQ

Тезисы:
- ответственность за качество лежит на всех членах команды
- качество не определяется только аптаймом и доступностью сервисов
- согласно David A. Garvin’s “Five Approaches to Quality" 1984-го года качество трансцидентно, основано на ценности предложения, пользователях, продукте и производстве
- Из-за предыдущего пункта качество бывает трудно измерить, поэтому единственным выходом становится общение с пользвателями
- Behavior-driven design (BDD) — это способ определить важные для пользователя компоненты ещё до написания тестов или самого кода

#quality #agile
​​Free ebook: Cloud Native DevOps with Kubernetes

Discover how to apply standard DevOps practices to Kubernetes in a cloud-native context and how to build, deploy, and scale modern applications in the cloud.

#book #kubernetes
​​At Google Cloud blog published nice article about SLI tunning

Article not small, so I made some highlits for you:
- Compare SLI with what affects users (compared SLI metrics with mentions in social networks, posts on forums, support tickets). According to the received picture - adjust SLI to make it more realistic.
- Have simple ToDo for founding first alarm/spike for incident
- If you have no alarm (so sad...) and get info from users - Google have a specific tag: "Customer found it first" when they're carrying out their postmortems.
- If your SLIs are unhappy but customers are fine - Split logs created by users and service errors, change levels of abstraction, etc.

And, of cource, nearly any SLI is better than no SLI.

#monitoring #sli
​​If you try adopt autoscaling in AWS, this post helps you get around the pitfalls. All of them is trivial, but only after they came across.

#aws