Мониторим ИТ – Telegram
Мониторим ИТ
8.07K subscribers
200 photos
2 files
1.52K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Forwarded from /usr/bin
A curated list of “Top” based monitoring tools for use in Linux and Unix terminals.

В этой статье ссылки на репозитории инструментов для мониторинга Linux.

Для мониторинга статуса процессов: htop, bpytop, btop, bashtop, atop, vtop, gtop, gotop, ytop, treetop, tiptop, pytop, mintop, ntop, below, hegemon, glances, nmon.

Для мониторинга GPU: nvtop, intel_gpu_top, radeontop, gltop.

Для мониторинга сети: iftop, sntop, jnettop, dnstop, nats-top, nettop, pingtop, iptraf-ng.

Для мониторинга дисковой подсистемы: iotop, drbdtop, nfstop, hdtop, viotop.

Для мониторинга контейнеров: ctop, ktop, kube-top.

И много других.
9 CI/CD Metrics You Should Be Monitoring

Проблема с мониторингом заключается в том, что трудно понять, что измерять. Вы можете собрать множество метрик для своего пайплайна и придумать бесконечно больше самостоятельно. Но ни у кого нет времени на пробы и ошибки. В этой статье мы рассмотрим некоторые из наиболее известных метрик конвейеров CI/CD. Читать дальше.
Implement distributed tracing with Jaeger & Opentelemetry on Kubernetes

В этой статье о том, как реализовать distributed tracing для приложения, работающего в Kubernetes, с использованием Open-Telemetry и Jaeger. Читать дальше.
Deploying Prometheus Multi-Cluster monitoring using Prometheus Agent Mode

В этом посте мы развернем Prometheus в режиме агента вместе с Prometheus Global view и проверим как они работают вместе. Для этого нам понадобится кластер Kubernetes и два отдельных пространства имен: Monitoring-Global и Monitoring. Читать дальше.
5 tips on implementing Observability

⚡️ Tip 1. Productionize your programming languages
⚡️ Tip 2. Alert on most important service metrics
⚡️ Tip 3. Add some blackbox monitoring into the mix
⚡️ Tip 4. Learn querying your metric database
⚡️ Tip 5. Invest in tracing

Читать дальше.
TCP packets traffic visualization for kubernetes by k8spacket and Grafana

Известно ли вам, что делает ваш кластер k8s, когда вы специально за этим не смотрите? Кто устанавливает с ним TCP-соединения? Кто вызывается им, например, из сторонних библиотек?

С помощью k8spacket и Grafana вы можете визуализировать TCP-трафик в кластере. Посмотрите, как приложения взаимодействуют друг с другом. Проверьте, сколько соединений установлено, сколько байтов передано и как долго эти соединения активны. Читать дальше.
В этом видео команда Zabbix рассказывает о мониторинге логов при помощи Zabbix-агента. Полезная вещь.
How to Build an End to End Open Source Observability Solution on Kubernetes

В этой статье вы узнаете, как создать готовое решение с открытым исходным кодом для получения трассировки вызовов, метрик и логов, а также корреляции между ними. Предлагаемое решение использует инструменты с открытым исходным кодом: Grafana, Prometheus, Tempo и Loki в качестве серверного стека наблюдаемости и Odigos в качестве инструмента управления наблюдаемостью. Читать дальше.
Displaying Real-Time Sensor Data in Grafana using MQTT

Начиная с Grafana 8.0 можно выполнять обновления данных в реальном времени с помощью нового потокового API. Это означает, что теперь можно создавать диаграммы, которые обновляются в режиме реального времени и по запросу.

Чтобы использовать эту функцию, можно использовать плагин MQTT, который позволяет пользователям Grafana визуализировать данные MQTT в режиме реального времени. В этой статье о том, как использовать датасорс MQTT для отображения данных датчиков в режиме реального времени. Читать дальше.
В этих двух статьях цикла автор рассказывает о своём опыте использования связки Prometheus - Thanos - Grafana / Grafana Loki.

Storing Multiple Clusters Metrics In GCS Bucket (Thanos+Prometheus) & Clusters Monitoring/Logging With Grafana →Part-1

Logging at Scale in Kubernetes by using Grafana Loki →part-2
PostgreSQL Monitoring for Application Developers: The DBA Fundamentals

В примерах этой статьи будут использован стек мониторинга на базе pgMonitor, который можно установить вместе с Postgres Operator.

Читать дальше.
ioping

Инструмент для мониторинга задержки ввода-вывода в режиме реального времени. Он показывает задержку диска так же, как ping показывает задержку сети.

Репыч на Гитхабе.
Key Kubernetes Metrics and Resources to Monitor for Peak Cluster Performance

Показатели здоровья Kubernetes делятся на две категории:

Метрики о самом кластере Kubernetes, его состоянии и узлах в кластере
Метрики развернутых приложений и подов в Kubernetes

В этой статье мы расскажем о ключевых метриках Kubernetes, которые вы можете собрать, и о том, как их интерпретировать. Читать далее.
Вакансия!

Мы компания Комс – продуктовая компания, создающая собственную систему мониторинга и эксплуатации ИТ инфраструктуры. Мы ищем в команду инженера мониторинга.

У тебя будет возможность:
• Работать над клиентскими проектами для крупнейших b2b и b2g заказчиков на российском рынке;
• Работать со сложной развитой инфраструктурой (как собственной, так и клиентской);
•Решать большие и интересные задачи.

Что предстоит делать:
• Участвовать в роли инженера мониторинга в проектной деятельности компании;
• Сопровождать существующие и внедрять новые инструменты мониторинга;
• Участвовать в разборе сложных кейсов во время аварийных ситуаций;
• Принимать участие в проработке архитектуры мониторинга;
• Заниматься построением триггеров, графиков, реализацией сложных цепочек зависимостей оповещений.

Мы ожидаем:
• Опыт работы инженером мониторинга;
• Знание Linux на уровне системного администратора;
• Хорошие знания Zabbix, в том числе умение использовать препроцессинг (XMLPath, JSONPath, регулярные выражения);
• Опыт работы с Grafana - подключение источников данных, настройка дашбордов;
• Опыт работы с Kibana - просмотр логов, настройка фильтров, дашбордов;
• Опыт написания скриптов на python/bash;
• Умение работать с API (SOAP, REST, JSON-RPC) для получения различной статистики по работе веб-приложений или устройств;
• Опыт мониторинга сетевых устройств и серверного оборудования (мониторинг через SNMP, IPMI).

Будет большим плюсом:
• Понимание принципов построения мониторинга сервисов с использованием Prometheus/ VictoriaMetrics;
• Опыт мониторинга большой разветвленной инфраструктуры;
• Опыт мониторинга высоконагруженной инфраструктуры;
• Опыт работы с Ansible.

Мы предлагаем:
• Гибкий график работы;
• Офис в центре Москвы (гибридный формат);
• Повышение квалификации за счет компании;
• Компенсация ДМС, фитнеса и дополнительного образования;
• Команда профессионалов;
• Система наставничества.

Контакты для связи: @ekaterina_arimova
How to build your monitoring dashboards?

Несколько полезных рекомендаций по дашбордостроению. Читать дальше.
VictoriaMetrics: PromQL compliance

MetricsQL — это язык запросов, основанный на PromQL. Он используется в качестве основного языка запросов в VictoriaMetrics, базе данных временных рядов для мониторинга. MetricsQL обратно совместим с PromQL. Читать далее.
Good and Bad Monitoring

Плохой и хороший мониторинг. Несколько советов по организации эффективного мониторинга. Читать дальше.
How to pick the best observability solution for your organization

Инженерам и разработчикам доступно множество решений для мониторинга, так как же выбрать наиболее подходящее? Часто бывает так, что ни самое дорогое, ни самое дешевое решение для мониторинга не является ответом, когда вы начинаете свой путь к наблюдаемости, поэтому давайте рассмотрим основные решения, которые вам необходимо принять при выборе решения для мониторинга. Читать дальше.
Kubermetrics

Kubermetrics — это инструмент с открытым исходным кодом, который обеспечивает мониторинг кластера Kubernetes, а также визуализацию данных в простом и понятном пользовательском интерфейсе. Kubermetrics объединяет Prometheus и Grafana Dashboards в одном интерфейсе.

Репыч на Гитхабе.
Мониторинг Ceph

Как не пропустить падения и взлёты в жизни кластеров ceph с помощью prometheus или victoriametrics. Теория и практика мониторинга распределенного хранилища. Читать далее.
Key Kubernetes Metrics and Resources to Monitor for Peak Cluster Performance

Метрики Kubernetes, которые наиболее полно скажут о здоровье кластера. Читать дальше.