DevOps MemOps – Telegram
DevOps MemOps
5.45K subscribers
2.46K photos
442 videos
15 files
3.9K links
Всё о DevOps

Для связи - @raz_raz
Заказать рекламу через биржу: https://telega.in/c/devops_memops
Download Telegram
Kubernetes Node Problem Detector: как отслеживать и решать проблемы узлов в кластере

Поддержание стабильности Kubernetes-кластера — одна из ключевых задач DevOps-инженера. Чтобы вовремя обнаруживать и устранять проблемы с узлами, Google разработали Node Problem Detector (NPD). Этот инструмент интегрируется с Kubernetes и помогает автоматически выявлять неисправности узлов, такие как сбои оборудования, перегрузки или системные ошибки.

Node Problem Detector — это агент, который:
- Отслеживает проблемы на уровне операционной системы (например, ошибки ядра, падения процессов).
- Собирает метрики и логи, позволяя быстро диагностировать сбои.
- Обновляет статус узлов в Kubernetes, чтобы подсказать, какие из них нуждаются в ремонте или замене.
- Отправляет уведомления во внешние системы мониторинга, такие как Prometheus или Stackdriver.

Как настроить?
1. Установить DaemonSet: Node Problem Detector разворачивается на всех узлах кластера как DaemonSet.
2. Настроить конфигурацию: Можно задать правила для обнаружения конкретных типов проблем. Например, мониторинг системных логов для поиска определённых сообщений об ошибках.
3. Интеграция с Kubernetes: Проблемы автоматически отражаются в статусе узлов (NodeCondition), что позволяет оркестратору учитывать их при планировании подов.
4. Отправка данных в Prometheus, Grafana или другие системы для удобного отслеживания.

📌 Подробнее: https://dzone.com/articles/kubernetes-node-problem-detector-setup

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
MemOps 😃
Please open Telegram to view this post
VIEW IN TELEGRAM
💯28🔥5
Статья: Как мы создавали динамический Kubernetes API server для API Aggregation Layer в Cozystack

Kubernetes действительно поражает своими могучими возможностями к расширению. Вы наверняка уже знаете про operator-паттерн, а также фреймворки kubebuilder и operator-sdk с помощью которых можно его реализовать. Если вкратце, то они позволяют расширять ваш Kubernetes через определение кастом-ресурсов (CRDs) и написание дополнительного контроллера, который будет выполнять вашу бизнес-логику для реконсиляции и управления этими ресурсами. Этот подход широко изучен, а в интернете можно найти огромное количество информации о том, как написать такой оператор.

Однако это не единственный метод расширения Kubernetes API. Так, для более сложных кейсов, например реализации императивной логики, сабресурсов и формирования ответов на лету, можно рассмотреть механизм API aggregation layer, который поддерживается в Kubernetes. В рамках aggregation layer можно разработать свой собственный extension API server и бесшовно интегрировать его в общий Kubernetes API.

В этой статье мы разберем, что такое API aggregation layer, для решения каких задач его стоит использовать, когда его использовать не стоит и как мы использовали эту модель для реализации собственного extension API server в платформе Cozystack.

📌 Подробнее: https://habr.com/ru/companies/aenix/articles/832824/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
State of DevOps 2024. Туда и обратно. Часть 2: Искусственный интеллект

Сегодня продолжаем разбирать отчёт State of DevOps 2024. В прошлой статье мы обсудили DORA-метрики, а в этой обсудим искусственный интеллект. Пока он ещё не созрел (но это не точно), чтобы самостоятельно писать на Хабр обзоры про себя и отвечать на комментарии…

Авто статьи: Сергей Задорожный, руководитель отдела платформенных решений банка «Центр-инвест».

Первая часть обзора: State of DevOps 2024. Туда и обратно: 1. DORA-метрики и элитность

📌 Подробнее: https://habr.com/ru/companies/yandex_praktikum/articles/861286/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰107🔥6
MemOps 😃
Please open Telegram to view this post
VIEW IN TELEGRAM
😁50
Apache Airflow: нестандартное применение

Python разработчик в команде dBrain рассказывает, как в dBrain внедрили собственную стратегию тестирования, которая в разы сокращает количество действий работающих с платформой инженеров. Применили альтернативный вариант тестирования - с помощью сервиса Apache Airflow.

📌 Подробнее: https://habr.com/ru/companies/dbraincloud/articles/861842/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
MemOps 😃
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍20🤯3🎄1
Кто ведёт оркестр? Kubernetes vs Docker Swarm vs Nomad

Существует несколько популярных решений для оркестрации, среди которых Kubernetes, Docker Swarm и Nomad. Каждое из этих решений имеет свои особенности, преимущества и ограничения.

▪️ Kubernetes является мощным и гибким инструментом, способным справляться с крупномасштабными задачами, но требует определённых усилий для настройки и эксплуатации.

▪️ Docker Swarm же проще в использовании и идеально подходит для проектов средней сложности, но ограничен в функционале.

▪️ Nomad, в свою очередь, представляет собой универсальное решение для оркестрации не только контейнеров, но и других типов рабочих нагрузок.

📌 Подробнее: https://hackernoon.com/container-orchestration-smackdown-kubernetes-vs-docker-swarm-vs-nomad

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2
OpenShift: улучшенный Kubernetes или переплата за техподдержку?

В статье говорится об OpenShift, который позиционируется, как "корпоративная" версия Kubernetes. Но так ли всё радужно, как рассказывают на презентациях?

📌 Подробнее: https://habr.com/ru/companies/cdnnow/articles/862380/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Docker и микросервисы для начинающих: полный курс с практическими примерами использования Docker Compose. Продолжительность: 1:35:01

📌 Подробнее: https://www.youtube.com/watch?v=ENr2QvcHrL4

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
kube-startup-cpu-boost - это контроллер, который увеличивает запросы и ограничения ресурсов процессора во время запуска рабочей нагрузки Kubernetes. Как только рабочая нагрузка запущена, ресурсы возвращаются к исходным значениям.

📌 Подробнее: https://github.com/google/kube-startup-cpu-boost

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик

В этой статье Станислав Савостин из СберТеха рассказывает о внутреннем сервисе мониторинга «Маяк», который основан на Prometheus, но включает много доработок и «тюнинга» под их условия и стандарты работы. Расскажет как они дорабатывали мониторинг, как реагируют на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!».

📌 Подробнее: https://habr.com/ru/companies/sberbank/articles/856074/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡3👍2
Запуск проекта в Kubernetes за 60 минут: инструменты, GitLab, Terraform

В этой статье детально рассматривается пример CI/CD-пайплайна, который собирает разбитое на 2 микросервиса CRUD-приложение, пушится в платформенный реджистри и деплоится в Kubernetes.

Подробно рассматриваются все шаги поднятия: создание кластера и базы данных, настройка абстракций Kubernetes вроде Service, Ingress, Deployment и т. д. и установка платформенных аддонов в кластер. А также поднятие инфраструктуры стенда при помощи подхода Infrastructure-as-a-code.

📌 Подробнее: https://habr.com/ru/companies/vk/articles/782310/

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
MemOps 😃
Please open Telegram to view this post
VIEW IN TELEGRAM
😁30
Awesome Docker Compose examples

git clone https://github.com/Haxxnet/Compose-Examples && cd Compose-Examples
cd <интересующий контейнер>

docker compose up


В репозитории собрано много готовых YAML для запуска Docker Compose; Это манифесты как небольших self-hosted FOSS-проектов, так и больших проприетарных проектов

📌 Подробнее: https://github.com/Haxxnet/Compose-Examples

MemOps 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9