Kured (KUbernetes REboot Daemon) — утилита для управления перезагрузкой нод в кластере Kubernetes от Weaveworks.
Позволяет перезагружать при необходимости ноды по одной, сообщать об этом в Slack и проверять наличие алертов в Prometheus.
https://goo.gl/EPcp5q
Позволяет перезагружать при необходимости ноды по одной, сообщать об этом в Slack и проверять наличие алертов в Prometheus.
https://goo.gl/EPcp5q
GitHub
weaveworks/kured
Kubernetes Reboot Daemon. Contribute to weaveworks/kured development by creating an account on GitHub.
В июле 2017 мы публиковали полезную ссылку на DevopsTopologies — хорошие и плохие практики построения DevOps команд.
Мы в Express 42 сделали русскоязычную версию сайта: https://goo.gl/Tqk9s5
Мы в Express 42 сделали русскоязычную версию сайта: https://goo.gl/Tqk9s5
devopstopologies.ru
DevOps Топологии
Основная цель DevOps в любой организации - улучшить качество поставки ценности клиентам и бизнесу, а не уменьшить расходы, улучшить автоматизацию или контролировать все из системы управления конфигурацией. Следовательно, для эффективного взаимодействия разработчиков…
Joe Beda, основатель и CTO Heptio проводит регулярные онлайн трансляции на различные темы, связанные с Kubernetes под названием «TGI Kubernetes»
Плейлист с записями: https://www.youtube.com/watch?v=9YYeE-bMWv8&list=PLvmPtYZtoXOENHJiAQc6HmV2jmuexKfrJ
Плейлист с записями: https://www.youtube.com/watch?v=9YYeE-bMWv8&list=PLvmPtYZtoXOENHJiAQc6HmV2jmuexKfrJ
YouTube
TGI Kubernetes 001: A Quick Tour
Come hang out with Joe Beda as he does a bit of hands on exploration of Kubernetes and related topics. Some of this will be Joe talking about the things he k...
Начиная с версии 2.5, в Ansible будет доступен модуль для работы с Terraform.
Он позволяет управлять инфраструктурой, описанной в коде Terraform из Ansible и возвращать output переменные Terraform в Ansible.
https://goo.gl/ckqEgA
Он позволяет управлять инфраструктурой, описанной в коде Terraform из Ansible и возвращать output переменные Terraform в Ansible.
https://goo.gl/ckqEgA
Carbon — прикольная штука для красивого оформления сниппетов кода в виде картинок.
Умеет импортировать код из Gist,поддерживает различные темы оформления.
https://goo.gl/vqjfmG
GitHub: https://goo.gl/kDRCHq
Умеет импортировать код из Gist,поддерживает различные темы оформления.
https://goo.gl/vqjfmG
GitHub: https://goo.gl/kDRCHq
carbon.now.sh
Carbon is the easiest way to create and share beautiful images of your source code.
Weaveworks поделились своим опытом описания дашбордов Grafana в виде кода с помощью grafanalib.
https://goo.gl/97JgMd
P.S. Также стоит упомянуть, что в Grafana 5.0 появилась возможность задавать datasources и дашборды в виде кода
https://goo.gl/cDxqyM
https://goo.gl/97JgMd
P.S. Также стоит упомянуть, что в Grafana 5.0 появилась возможность задавать datasources и дашборды в виде кода
https://goo.gl/cDxqyM
www.weave.works
Dashboards as Code
If you use Prometheus, then you probably use Grafana. At Weave, we have Grafana dashboards for all of our microservices. When we want to understand our system, our Grafana dashboards are the first things we look at. To make the most out of...
Brendan Gregg опубликовал отличное исследование на тему падения производительности в Linux после патчей для Meltdown и Spectre.
https://goo.gl/wDYa3U
https://goo.gl/wDYa3U
Lyft рассказали в своем блоге как выглядит обеспечение безопасности продукта при высокой скорости разработки и релизов.
https://goo.gl/RkR7dF
TL;DR
* Все должно быть измеримо, в том числе проблемы безопасности
* Проверки безопасности должны быть своевременными и не тратить зря время разработчиков
* Должны быть постоянные циклы обратной связи, в том числе в отношении безопасности
И прекрасное в моем вольном переводе:
«Служба безопасности, которая шлет письма с сообщениями, что сейчас месячник информационной безопасности, поэтому не допускайте XSS уязвимостей в коде и не попадайтесь на фишинг, быстро надоедает и письма идут в корзину. Разработчикам нужно говорить про XSS когда они пишут фронтенд, а про фишинг нужно вспоминать для подозрительных писем.»
https://goo.gl/RkR7dF
TL;DR
* Все должно быть измеримо, в том числе проблемы безопасности
* Проверки безопасности должны быть своевременными и не тратить зря время разработчиков
* Должны быть постоянные циклы обратной связи, в том числе в отношении безопасности
И прекрасное в моем вольном переводе:
«Служба безопасности, которая шлет письма с сообщениями, что сейчас месячник информационной безопасности, поэтому не допускайте XSS уязвимостей в коде и не попадайтесь на фишинг, быстро надоедает и письма идут в корзину. Разработчикам нужно говорить про XSS когда они пишут фронтенд, а про фишинг нужно вспоминать для подозрительных писем.»
Lyft Engineering
Application Security in a DevOps Environment
It seems like every AppSec vendor pitch talks about how you can shift security “to the left” and they can help you transition to…
На прошлой неделе в твиттере было весьма горячее обсуждение темы on-call и должны ли разработчики в нем участвовать.
Cindy Sridharan, которая и начала эту дискуссию), написала отличный пост по результатам обсуждений.
https://goo.gl/EoXCpA
Cindy Sridharan, которая и начала эту дискуссию), написала отличный пост по результатам обсуждений.
https://goo.gl/EoXCpA
Небольшая заметка в блоге ReactiveOps на тему «Is Kubernetes Overkill?»
TL;DR нет)))
https://goo.gl/vLmfpg
TL;DR нет)))
https://goo.gl/vLmfpg
Fairwinds
Is Kubernetes Overkill?
Is Kubernetes overkill? Most companies will decide to get off Heroku. The decision: choose a simpl solution, or take a leap of faith and choose Kubernetes
Epic Games опубликовали postmortem по результатам отказа части инфраструктуры игры Fortnite на прошлой неделе.
Интересно как минимум с точки зрения расследования и оформления отказов.
https://goo.gl/5Pvbxo
Интересно как минимум с точки зрения расследования и оформления отказов.
https://goo.gl/5Pvbxo
Epic Games' Fortnite
Postmortem of Service Outage at 3.4M CCU
A technical update on our recent service issues at 3.4M CCU, including a call to action!
Стали доступны видео с конференции DevOops 2017.
Три потока интересных докладов на все выходные ヅ
Анонс: https://goo.gl/4HBQe6
Плейлист: https://goo.gl/PUdTTr
Три потока интересных докладов на все выходные ヅ
Анонс: https://goo.gl/4HBQe6
Плейлист: https://goo.gl/PUdTTr
Twitter
DevOops
Открыты доклады #devoops 2017. Админский хардкор, лайфхаки, зажигательный кейноут и четырежды @jbaruch! Смотрите и делитесь с друзьями! https://t.co/NGw54uzds2
В продолжение обсуждений on-call статья от Andrew Spyker из Netflix на тему почему он как менеджер, все равно учавствует в on-call.
https://goo.gl/cC4DW4
https://goo.gl/cC4DW4
Medium
Why, as a Netflix infrastructure manager, am I on call?
The twitter discussions on on-call last week (1, 2) motivated me to write a blog post that’s been in my Trello list for some time (actual…
Хороший цикл статей в блоге Datadog про ключевые метрики для мониторинга PostgreSQL и их получение.
Не только с помощью Datadog.
https://goo.gl/yfknPt
https://goo.gl/c53BoH
Не только с помощью Datadog.
https://goo.gl/yfknPt
https://goo.gl/c53BoH
Key metrics for PostgreSQL monitoring
Learn how to identify and track key PostgreSQL performance metrics in this monitoring guide.
Читатели подсказывают, что стоит привести ссылку что же такое on-call вообще.
Руководство от PagerDuty https://goo.gl/qa98Kj
Про инцидент менеджмент: https://goo.gl/qB7ekB
Руководство от PagerDuty https://goo.gl/qa98Kj
Про инцидент менеджмент: https://goo.gl/qB7ekB
PagerDuty Incident Response Documentation
Being On-Call - PagerDuty Incident Response Documentation
A summary of the expectations and responsibilities of being on-call at PagerDuty, along with some best practice and etiquette recommendations.
Видео доклада и репозиторий с best-practices при построении приложений, работающих в Kubernetes.
Видео: https://goo.gl/uW79Jd
Репозиторий: https://goo.gl/ZSDnHj
Видео: https://goo.gl/uW79Jd
Репозиторий: https://goo.gl/ZSDnHj
YouTube
The Elements of Kubernetes - Foundational Concepts for Apps Running on Kubernetes
The Elements of Kubernetes - Foundational Concepts for Apps Running on Kubernetes [I] - Aaron Schlesinger, Microsoft Azure
“The Elements of Style” is one of the most important and foundational guidelines on how to write well. It has effectively summarized…
“The Elements of Style” is one of the most important and foundational guidelines on how to write well. It has effectively summarized…
kaptaind — интересная штука для синхронизации ресурсов различных кластеров Kubernetes прямо в веб интерфейсе. Умеет делать снепшоты и восстанавливать их. Пока что alpha.
Есть еще CLI версия утилиты.
https://goo.gl/JW76o6
Есть еще CLI версия утилиты.
https://goo.gl/JW76o6
GitHub
kaptaind/kaptaind
Kubernetes backup & restore snapshots at your finger tips. - kaptaind/kaptaind
Весьма полезная статья про уменьшение докер образов с использованием Distroless в качестве базовых образов.
Статья: https://goo.gl/qsRCrM
GoogleCloudPlatform/distroless: https://goo.gl/WGUJNA
Статья: https://goo.gl/qsRCrM
GoogleCloudPlatform/distroless: https://goo.gl/WGUJNA
Learnk8s
3 simple tricks for smaller Docker images ⎈ Learnk8s
When it comes to building Docker containers, you should always strive for smaller images. Images that share layers and are smaller in size are quicker to transfer and deploy. But how do you keep the size under control when every RUN statement creates a new…
И немного про подписывание докер образов для повышения безопасности Kubernetes кластера.
Статья: https://goo.gl/H6Wg5K
Документация RedHat: https://goo.gl/Wtx3z2
Статья: https://goo.gl/H6Wg5K
Документация RedHat: https://goo.gl/Wtx3z2
Medium
Secure your Kubernetes production cluster
Almost an year ago Red Hat introduced something called Container Image Signing (or Simple Signing). You can read more about it in this…
И продолжая тему Kubernetes — METALLB, load-balancer для bare metal Kubernetes кластеров. Использует BGP для балансировки.
Пока что alpha).
https://goo.gl/84zhy5
GitHub https://goo.gl/HY6MJ3
Пока что alpha).
https://goo.gl/84zhy5
GitHub https://goo.gl/HY6MJ3