Please open Telegram to view this post
VIEW IN TELEGRAM
😁27
Kubernetes Node Problem Detector: как отслеживать и решать проблемы узлов в кластере
Поддержание стабильности Kubernetes-кластера — одна из ключевых задач DevOps-инженера. Чтобы вовремя обнаруживать и устранять проблемы с узлами, Google разработали Node Problem Detector (NPD). Этот инструмент интегрируется с Kubernetes и помогает автоматически выявлять неисправности узлов, такие как сбои оборудования, перегрузки или системные ошибки.
Node Problem Detector — это агент, который:
- Отслеживает проблемы на уровне операционной системы (например, ошибки ядра, падения процессов).
- Собирает метрики и логи, позволяя быстро диагностировать сбои.
- Обновляет статус узлов в Kubernetes, чтобы подсказать, какие из них нуждаются в ремонте или замене.
- Отправляет уведомления во внешние системы мониторинга, такие как Prometheus или Stackdriver.
Как настроить?
1. Установить DaemonSet: Node Problem Detector разворачивается на всех узлах кластера как DaemonSet.
2. Настроить конфигурацию: Можно задать правила для обнаружения конкретных типов проблем. Например, мониторинг системных логов для поиска определённых сообщений об ошибках.
3. Интеграция с Kubernetes: Проблемы автоматически отражаются в статусе узлов (NodeCondition), что позволяет оркестратору учитывать их при планировании подов.
4. Отправка данных в Prometheus, Grafana или другие системы для удобного отслеживания.
📌 Подробнее: https://dzone.com/articles/kubernetes-node-problem-detector-setup
MemOps🤨
Поддержание стабильности Kubernetes-кластера — одна из ключевых задач DevOps-инженера. Чтобы вовремя обнаруживать и устранять проблемы с узлами, Google разработали Node Problem Detector (NPD). Этот инструмент интегрируется с Kubernetes и помогает автоматически выявлять неисправности узлов, такие как сбои оборудования, перегрузки или системные ошибки.
Node Problem Detector — это агент, который:
- Отслеживает проблемы на уровне операционной системы (например, ошибки ядра, падения процессов).
- Собирает метрики и логи, позволяя быстро диагностировать сбои.
- Обновляет статус узлов в Kubernetes, чтобы подсказать, какие из них нуждаются в ремонте или замене.
- Отправляет уведомления во внешние системы мониторинга, такие как Prometheus или Stackdriver.
Как настроить?
1. Установить DaemonSet: Node Problem Detector разворачивается на всех узлах кластера как DaemonSet.
2. Настроить конфигурацию: Можно задать правила для обнаружения конкретных типов проблем. Например, мониторинг системных логов для поиска определённых сообщений об ошибках.
3. Интеграция с Kubernetes: Проблемы автоматически отражаются в статусе узлов (NodeCondition), что позволяет оркестратору учитывать их при планировании подов.
4. Отправка данных в Prometheus, Grafana или другие системы для удобного отслеживания.
📌 Подробнее: https://dzone.com/articles/kubernetes-node-problem-detector-setup
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
DZone
Kubernetes Add-On Setup: A Step-by-Step Guide to Node Problem Detector
Ensure Kubernetes cluster health with NPD. This guide walks you through setting up NPD to detect node issues like kernel errors and resource exhaustion.
👍3
Статья: Как мы создавали динамический Kubernetes API server для API Aggregation Layer в Cozystack
Kubernetes действительно поражает своими могучими возможностями к расширению. Вы наверняка уже знаете про operator-паттерн, а также фреймворки kubebuilder и operator-sdk с помощью которых можно его реализовать. Если вкратце, то они позволяют расширять ваш Kubernetes через определение кастом-ресурсов (CRDs) и написание дополнительного контроллера, который будет выполнять вашу бизнес-логику для реконсиляции и управления этими ресурсами. Этот подход широко изучен, а в интернете можно найти огромное количество информации о том, как написать такой оператор.
Однако это не единственный метод расширения Kubernetes API. Так, для более сложных кейсов, например реализации императивной логики, сабресурсов и формирования ответов на лету, можно рассмотреть механизм API aggregation layer, который поддерживается в Kubernetes. В рамках aggregation layer можно разработать свой собственный extension API server и бесшовно интегрировать его в общий Kubernetes API.
В этой статье мы разберем, что такое API aggregation layer, для решения каких задач его стоит использовать, когда его использовать не стоит и как мы использовали эту модель для реализации собственного extension API server в платформе Cozystack.
📌 Подробнее: https://habr.com/ru/companies/aenix/articles/832824/
MemOps🤨
Kubernetes действительно поражает своими могучими возможностями к расширению. Вы наверняка уже знаете про operator-паттерн, а также фреймворки kubebuilder и operator-sdk с помощью которых можно его реализовать. Если вкратце, то они позволяют расширять ваш Kubernetes через определение кастом-ресурсов (CRDs) и написание дополнительного контроллера, который будет выполнять вашу бизнес-логику для реконсиляции и управления этими ресурсами. Этот подход широко изучен, а в интернете можно найти огромное количество информации о том, как написать такой оператор.
Однако это не единственный метод расширения Kubernetes API. Так, для более сложных кейсов, например реализации императивной логики, сабресурсов и формирования ответов на лету, можно рассмотреть механизм API aggregation layer, который поддерживается в Kubernetes. В рамках aggregation layer можно разработать свой собственный extension API server и бесшовно интегрировать его в общий Kubernetes API.
В этой статье мы разберем, что такое API aggregation layer, для решения каких задач его стоит использовать, когда его использовать не стоит и как мы использовали эту модель для реализации собственного extension API server в платформе Cozystack.
📌 Подробнее: https://habr.com/ru/companies/aenix/articles/832824/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Kubernetes
Operator pattern
Operators are software extensions to Kubernetes that make use of custom resources to manage applications and their components. Operators follow Kubernetes principles, notably the control loop.
Motivation The operator pattern aims to capture the key aim of…
Motivation The operator pattern aims to capture the key aim of…
👍2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁37
State of DevOps 2024. Туда и обратно. Часть 2: Искусственный интеллект
Сегодня продолжаем разбирать отчёт State of DevOps 2024. В прошлой статье мы обсудили DORA-метрики, а в этой обсудим искусственный интеллект. Пока он ещё не созрел (но это не точно), чтобы самостоятельно писать на Хабр обзоры про себя и отвечать на комментарии…
Авто статьи: Сергей Задорожный, руководитель отдела платформенных решений банка «Центр-инвест».
Первая часть обзора: State of DevOps 2024. Туда и обратно: 1. DORA-метрики и элитность
📌 Подробнее: https://habr.com/ru/companies/yandex_praktikum/articles/861286/
MemOps🤨
Сегодня продолжаем разбирать отчёт State of DevOps 2024. В прошлой статье мы обсудили DORA-метрики, а в этой обсудим искусственный интеллект. Пока он ещё не созрел (но это не точно), чтобы самостоятельно писать на Хабр обзоры про себя и отвечать на комментарии…
Авто статьи: Сергей Задорожный, руководитель отдела платформенных решений банка «Центр-инвест».
Первая часть обзора: State of DevOps 2024. Туда и обратно: 1. DORA-метрики и элитность
📌 Подробнее: https://habr.com/ru/companies/yandex_praktikum/articles/861286/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰10❤7🔥6
Apache Airflow: нестандартное применение
Python разработчик в команде dBrain рассказывает, как в dBrain внедрили собственную стратегию тестирования, которая в разы сокращает количество действий работающих с платформой инженеров. Применили альтернативный вариант тестирования - с помощью сервиса Apache Airflow.
📌 Подробнее: https://habr.com/ru/companies/dbraincloud/articles/861842/
MemOps🤨
Python разработчик в команде dBrain рассказывает, как в dBrain внедрили собственную стратегию тестирования, которая в разы сокращает количество действий работающих с платформой инженеров. Применили альтернативный вариант тестирования - с помощью сервиса Apache Airflow.
📌 Подробнее: https://habr.com/ru/companies/dbraincloud/articles/861842/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Apache Airflow: нестандартное применение
Привет, Хабр! Я Маша Башан, Python разработчик в команде dBrain. Сегодня расскажу, как в dBrain мы внедрили собственную стратегию тестирования, которая в разы сокращает количество...
👍4
Кто ведёт оркестр? Kubernetes vs Docker Swarm vs Nomad
Существует несколько популярных решений для оркестрации, среди которых Kubernetes, Docker Swarm и Nomad. Каждое из этих решений имеет свои особенности, преимущества и ограничения.
▪️ Kubernetes является мощным и гибким инструментом, способным справляться с крупномасштабными задачами, но требует определённых усилий для настройки и эксплуатации.
▪️ Docker Swarm же проще в использовании и идеально подходит для проектов средней сложности, но ограничен в функционале.
▪️ Nomad, в свою очередь, представляет собой универсальное решение для оркестрации не только контейнеров, но и других типов рабочих нагрузок.
📌 Подробнее: https://hackernoon.com/container-orchestration-smackdown-kubernetes-vs-docker-swarm-vs-nomad
MemOps🤨
Существует несколько популярных решений для оркестрации, среди которых Kubernetes, Docker Swarm и Nomad. Каждое из этих решений имеет свои особенности, преимущества и ограничения.
▪️ Kubernetes является мощным и гибким инструментом, способным справляться с крупномасштабными задачами, но требует определённых усилий для настройки и эксплуатации.
▪️ Docker Swarm же проще в использовании и идеально подходит для проектов средней сложности, но ограничен в функционале.
▪️ Nomad, в свою очередь, представляет собой универсальное решение для оркестрации не только контейнеров, но и других типов рабочих нагрузок.
📌 Подробнее: https://hackernoon.com/container-orchestration-smackdown-kubernetes-vs-docker-swarm-vs-nomad
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Hackernoon
Container Orchestration Smackdown: Kubernetes vs. Docker Swarm vs. Nomad
Kubernetes vs. Docker Swarm vs. Nomad: The ultimate container orchestration smackdown! Compare and choose your ideal deployment solution.
👍6🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁37
OpenShift: улучшенный Kubernetes или переплата за техподдержку?
В статье говорится об OpenShift, который позиционируется, как "корпоративная" версия Kubernetes. Но так ли всё радужно, как рассказывают на презентациях?
📌 Подробнее: https://habr.com/ru/companies/cdnnow/articles/862380/
MemOps🤨
В статье говорится об OpenShift, который позиционируется, как "корпоративная" версия Kubernetes. Но так ли всё радужно, как рассказывают на презентациях?
📌 Подробнее: https://habr.com/ru/companies/cdnnow/articles/862380/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
OpenShift: улучшенный Kubernetes или переплата за техподдержку?
Привет, Хабр! Меня зовут Матвей Мочалов, я — компьютерный инженер и один из авторов корпоративного блога cdnnow! В прошлых постах мы разобрали особенности Docker на разных системах и его не менее...
👍3
Please open Telegram to view this post
VIEW IN TELEGRAM
😁22🔥5
Docker и микросервисы для начинающих: полный курс с практическими примерами использования Docker Compose. Продолжительность: 1:35:01
📌 Подробнее: https://www.youtube.com/watch?v=ENr2QvcHrL4
MemOps🤨
📌 Подробнее: https://www.youtube.com/watch?v=ENr2QvcHrL4
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Docker & Microservices For Beginners: Complete Course with Practical Examples Using Docker Compose
I'm working on the next YouTube course where we build an enterprise level microservices app using next.js, node.js, docker, postgresql and AWS! Join the mailing list to stay updated, get early access, and be part of our community when it's released.
🔔 Want…
🔔 Want…
👍9
Please open Telegram to view this post
VIEW IN TELEGRAM
😁26👍2
kube-startup-cpu-boost - это контроллер, который увеличивает запросы и ограничения ресурсов процессора во время запуска рабочей нагрузки Kubernetes. Как только рабочая нагрузка запущена, ресурсы возвращаются к исходным значениям.
📌 Подробнее: https://github.com/google/kube-startup-cpu-boost
MemOps🤨
📌 Подробнее: https://github.com/google/kube-startup-cpu-boost
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - google/kube-startup-cpu-boost: Kube Startup CPU Boost is a controller that increases CPU resource requests and limits…
Kube Startup CPU Boost is a controller that increases CPU resource requests and limits during Kubernetes workload startup time - google/kube-startup-cpu-boost
👍6
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19
Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик
В этой статье Станислав Савостин из СберТеха рассказывает о внутреннем сервисе мониторинга «Маяк», который основан на Prometheus, но включает много доработок и «тюнинга» под их условия и стандарты работы. Расскажет как они дорабатывали мониторинг, как реагируют на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!».
📌 Подробнее: https://habr.com/ru/companies/sberbank/articles/856074/
MemOps🤨
В этой статье Станислав Савостин из СберТеха рассказывает о внутреннем сервисе мониторинга «Маяк», который основан на Prometheus, но включает много доработок и «тюнинга» под их условия и стандарты работы. Расскажет как они дорабатывали мониторинг, как реагируют на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!».
📌 Подробнее: https://habr.com/ru/companies/sberbank/articles/856074/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик
Привет, Хабр! Меня зовут Станислав Савостин, в СберТехе я занимаюсь системой мониторинга «Маяк». Это наш внутренний сервис, который основан на Prometheus, но включает много доработок и...
🫡3👍2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9
Запуск проекта в Kubernetes за 60 минут: инструменты, GitLab, Terraform
В этой статье детально рассматривается пример CI/CD-пайплайна, который собирает разбитое на 2 микросервиса CRUD-приложение, пушится в платформенный реджистри и деплоится в Kubernetes.
Подробно рассматриваются все шаги поднятия: создание кластера и базы данных, настройка абстракций Kubernetes вроде Service, Ingress, Deployment и т. д. и установка платформенных аддонов в кластер. А также поднятие инфраструктуры стенда при помощи подхода Infrastructure-as-a-code.
📌 Подробнее: https://habr.com/ru/companies/vk/articles/782310/
MemOps🤨
В этой статье детально рассматривается пример CI/CD-пайплайна, который собирает разбитое на 2 микросервиса CRUD-приложение, пушится в платформенный реджистри и деплоится в Kubernetes.
Подробно рассматриваются все шаги поднятия: создание кластера и базы данных, настройка абстракций Kubernetes вроде Service, Ingress, Deployment и т. д. и установка платформенных аддонов в кластер. А также поднятие инфраструктуры стенда при помощи подхода Infrastructure-as-a-code.
📌 Подробнее: https://habr.com/ru/companies/vk/articles/782310/
MemOps
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Запуск проекта в Kubernetes за 60 минут: инструменты, GitLab, Terraform
Привет, Хабр! Меня зовут Илья Нырков, я архитектор в VK Cloud . В своей работе встречаюсь с желанием партнеров (это и крупный энтерпрайз, и различные стартапы) использовать Kubernetes, но их...
👍6