Мониторим ИТ – Telegram
Мониторим ИТ
8.07K subscribers
200 photos
2 files
1.52K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
После известного твита Илона Маска с рекомендацией использования Signal, у них случился резкий прирост новых пользователей. На волне роста популярности в блоге Zabbix и вышла эта статья об интеграции с этим мессенджером.
Регистрируйтесь на вебинар по Grafana Tempo. Его проведёт Joe Elliot, создатель Tempo и постоянный мейнтейнер Jaeger. Вебинар состоится 4 февраля в 17:30 UTC.

Getting started setting up Tempo

⚡️ Why Tempo?

⚡️ How to discover traces without native search (Exemplars/Loki 2.0)

⚡️ Upcoming Grafana exemplar support

⚡️ Upcoming Prometheus exemplar support
А кто-то слышал про Perfromance Co-Pilot? У них и с Grafana интеграция есть.

Еще о PCP можно почитать в блоге RHEL.

👍 — слышал и использую/использовал

👎 — слышал, но не использовал

🖕 — я адепт мейнстрима
Сегодня Zabbix проводил митап, где Алексей Владышев (основатель Zabbix) рассказал о серьезных нововведениях в версии 5.4 (она, кстати, не LTS). Появляется новый синтаксис для описания триггерных выражений, вычисляемых и агрегированных проверок.

Было: {host:key.func(params)}=0

Станет: func(/host/key, params)

К слову, начиная с версии 5.4 в Zabbix больше не будет поддержки прежнего синтаксиса. И к этому нужно готовиться. Ниже несколько скриншотов из презентации для понимания.
Бенчмарк Prometheus vs VictoriaMetrics на метриках node_exporter

Недавно в VictoriaMetrics появилась возможность скрейпинга целевых объектов Prometheus. И теперь мы можем сравнивать яблоки с яблоками: сколько ресурсов используют Prometheus и VictoriaMetrics при скрейпинге большого количества node_exporter. Читать дальше.
Обнаружение утечек воды. Еще одна интеграция ZABBIX и BOLID

Читать на Хабре.
Centralized Logging for Kafka on Kubernetes With Grafana, Loki, and Promtail

In one of my another articles, I discussed how to set up strimzi (also known as Kafka on Kubernetes) on minikube. Also, we discussed how to set up Grafana and Prometheus to fetch metrics from Kafka and zookeeper instances. But wouldn't it have been more helpful and more administrator-friendly if Grafana could also be used to monitor logs of all the pods? If there are multiple zookeeper and Kafka pods, a single window would certainly be a boon for administrators and management. Читать дальше.
Auto-instrumenting a Java Spring Boot application for traces and logs using OpenTelemetry and Grafana Tempo

Auto-instrumentation is a subject I have not had much experience with. Here at Grafana Labs, we primarily develop in Go, which doesn’t afford such luxuries. However, there is an enormous amount of interest from the community in Java auto-instrumentation, so I set out to determine what was possible using the shiny new OpenTelemetry auto-instrumentation libraries. Читать дальше.
@elasticstack_ru — канал, посвящённый только Elastic Stack. Полезные статьи, видео, лайфхаки. Подписывайтесь, чтобы не пропустить.
KubeGraf — плагин для мониторинга Kubernetes в Grafana. Как создавался и почему стал востребованным

KubeGraf — это плагин для Grafana, который собирает данные с кластера Kubernetes и приложений внутри него, а затем показывает их на красивых и понятных графиках. В феврале этого года вышел релиз 1.5, и стало известно, что предыдущие версии скачали более 250 тысяч раз! Читать дальше.
Мониторим основные сервисы в AWS с Prometheus и exporter’ами для CloudWatch

Если вы используете в облачных провайдерах managed-инсталляции серверных служб вроде RDS или ElastiCache от AWS, то скорее всего уже задавались темой мониторинга инфраструктуры, а главное — оповещений по произошедшим инцидентам. При реализации возникают понятные вопросы:

Узнать какие вопросы там возникают.
Зе бест оф зе бест оф зе бест — Best AIOps Platforms Software.

На
сайте G2 совершенно буднично обнаружилась подборочка AIOps систем. А это мейнстрим, между прочим.

AIOps-систему ещё можно назвать интеллектуальной зонтичной системой мониторинга. Обычно они используются для корреляции событий из разных источников и построения прогнозной модели. Ниже подборка статей для более чёткого понимания вопроса:

Зачем нужен AIOps

AIOps-решения 2019–2020 по версии Gartner

Несколько решений AIOps по рекомендациям Gartner

AIOps от FixStream и Resolve (в подборке от G2 они есть)
А теперь сравните с подборкой APM-систем. 235 штук — не хухры-мухры.
Scaling Zabbix with containers

In
this post, a new approach with Zabbix in High Availability is explained, as well as discussed challenges when implementing Zabbix using Docker Swarm with CI / CD and such technologies as Containers, Docker Swarm, Gitlab, and CI/CD. Читать дальше.
Application performance management (APM) от Broadcom для мониторинга производительности приложений (включая мобильные)

Appdynamics, Dynatrace и New Relic достаточно известны на российском рынке. Broadcom чуть менее знаком, этакая серая лошадка, однако, имеет не уступающий всем троим функционал мониторинга приложений. А использование APM-решения от Broadcom в комплексе с другим их продуктом, зонтичной AIOps-системой DX Operations Intelligence, позволит создать единое окно мониторинга для разнокалиберного ПО и инфраструктуры. Под катом текст и скриншоты. Смотреть что там под катом.