Мониторим ИТ – Telegram
Мониторим ИТ
7.93K subscribers
199 photos
2 files
1.52K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
mcp-grafana

MCP для Grafana. Достаточно функциональное решение.

Репыч на Гитхаб
🔥12👍3
Grafana Mimir 3.0 release: performance improvements, a new query engine, and more

В 2022 году Grafana представила Grafana Mimir — многопользовательскую базу данных временных рядов (TSDB) с открытым исходным кодом, горизонтально масштабируемую и предназначенную для долгосрочного хранения метрик Prometheus и OpenTelemetry. За прошедшие годы Mimir стал популярным бэкендом для работы с метриками в сообществе разработчиков ПО с открытым исходным кодом, насчитывающим 30 разработчиков и более 4,7 тысяч звёзд на GitHub.

Разработка Mimir 3.0 заняла три года, и в этой статье в блоге Grafana рассказывают о нововведениях.
🔥9👍31👎1
9 Logging Best Practices You Should Know

Логи — это не всё, что нужно для наблюдения , но их можно преобразовать из неструктурированных строк, разбросанных по серверам, в полезные сигналы, которые помогут получить ценную информацию. Список рекомендаций из этой статьи поможет вам в этом.
🔥13👍21
What's new in ClickStack. October '25

Напомню, ClickStack — это observability-решение на базе HyperDX (интерфейс) и Clickhouse (хранилище). Каждый месяц они выпускают дайджест с обновлениями. Этот за октябрь 2025.

Уже совсем скоро нас ждет релиз облачной Yandex Observability Platform, которая решает примерно те же самые задачи. И мне было бы очень интересно узнать какое из решений более экономично по эксплуатации в плане хранения/инджеста. Это, наверное, самая большая статья расходов на обслуживание стека мониторинга после оплаты работы инженеров мониторинга по сопровождению платформы.

❗️Если на этот канал подписан кто-то из команды ClickStack, приходите в комментарии или ко мне в личку, договоримся о вебинаре для уважаемых подписчиков этого канала.

❗️Представителей Yandex Observability Platform я тоже приглашаю рассказать о продукте на нашу аудиторию.
👍8🔥6
Logging Cheat Sheet

Цель этой шпаргалки — предоставить разработчикам рекомендации по созданию механизмов ведения логов приложений, особенно касающихся логов безопасности.

Ведение лога приложений должно быть единообразным в пределах приложения, единообразным во всем портфеле приложений организации и, где это применимо, использовать отраслевые стандарты, чтобы зарегистрированные данные о событиях могли использоваться, сопоставляться, анализироваться и управляться самыми разными системами.
🔥12👍31👎1
Мониторинг Angie с Prometheus и Grafana

Контроль основных метрик веб‑сервера или балансировщика — основа надежной работы системы. Использование встроенного экспортера Prometheus и визуализация через Grafana дают принципиально другие возможности. В этой статье рассказывают как запустить полноценную систему мониторинга Angie.
🔥10👍5
Gals Software и Zabbix приглашают вас на онлайн-митап 3 декабря

На вебинаре о нововведениях 8 версии расскажет СЕО Zabbix Алексей Владышев.

Программа вебинара (все выступления будут на русском языке)

🚀 Welcome Speech & Zabbix 8.0: A New Chapter in Monitoring
Alexei Vladishev, CEO & Founder, Zabbix, Latvia

🚀 Trigger Mastery in Zabbix: Practical Tips and Deep Insights Aleksandrs Petrovs-Gavrilovs, Zabbix Trainer, Zabbix, Latvia

🚀 The Power of Zabbix Tags Anton Kasimov, Zabbix Trainer, Gals Software, Kazakhstan

🚀 Zabbix Use Cases Samir Dzavadov, Head of Partnerships, Zabbix, Latvia

Регистрация

Еще больше анонсов мероприятий и другая полезная информация в канале @zabbix_ru
🔥7👍41👎1
OpenTelemetry — не то, чем кажется…

Логи, метрики и трейсы появляются «по остаточному принципу»: что-то добавили при отладке, что-то прилетело из чужой либы, что-то настроили на проде. Итог — инженеры часами разбирают простые инциденты, а продуктовые команды теряют скорость.

В статье автор делится опытом: как они строят наблюдаемость в системах, почему OpenTelemetry — это больше чем идеология принципами которой они руководствуются.
🔥6👍52
Kite

Kite — это лёгкий дашборд для управления и мониторинга кластеров Kubernetes с интуитивно понятным интерфейсом. Он отображает метрики в реальном времени, позволяет управлять ресурсами и поддерживает работу с несколькими кластерами.

Репыч на Гитхаб

@monitorim_it
🔥8👍6🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
sqlwatch

SQLWATCH — это децентрализованное решение для мониторинга SQL Server в режиме реального или почти реального времени. Оно разработано для комплексного мониторинга прямо из коробки и может служить платформой для мониторинга ваших проектов или приложений. Оно собирает данные о производительности в локальной базе данных с возможностью централизованной отчётности для удобства.

Репыч на Гитхаб
🔥11👍3
VictoriaMetrics: взгляд вглубь

«Магия» проекта VictoriaMetrics, обеспечивающая основную функциональность и производительность, в основном происходит в бэкенд-коде Go, а именно в каталоге хранилища. В этой статье разобраны внутренности VM.
🔥4👎1
Экспертное руководство по мониторингу производительности BPF в Linux

Используя BPF, инженеры могут получить глубокий анализ своих систем без дополнительных затрат, связанных с традиционными инструментами мониторинга. Понимание того, как использовать его, — ключ к эффективной доступности и безопасности серверов Linux. Несколько примеров использования в этой статье.
🔥7👍2
7 крутых вещей, которые можно сделать дома с помощью Grafana

Мозг инженера никогда не перестаёт работать, поэтому вполне естественно, что при переходе с работы на дом работа продолжается. Неудивительно, что около десяти лет назад, когда коллега познакомил меня с Grafana, автор этой статьи почти сразу же решил использовать её для решения домашних задач. Давайте рассмотрим несколько интересных вариантов использования платформы мониторинга Grafana в домашних условиях.
👍8🔥6
grafana-kubernetes-plugin

Плагин позволяет просматривать ресурсы и журналы Kubernetes непосредственно в Grafana. Плагин также предоставляет ряд действий для взаимодействия с ресурсами, включая их редактирование, удаление и масштабирование, а ещё плагин поддерживает другие облачные инструменты, такие как Helm и Flux.

Репыч на Гитхаб

@monitorim_it
👍8🔥64
Забудьте про print(): Современное и красивое логирование в Python с помощью Loguru

Если вы пишете на Python, скорее всего, ваша карьера разработчика начиналась с одной простой, но незаменимой команды — print(). Нужно проверить значение переменной? print(my_variable). Хотите убедиться, что функция вообще вызвалась? print("Я внутри функции!"). Этот метод прост, интуитивно понятен и кажется верным другом в мире отладки.

Но дружба эта длится ровно до первого серьезного проекта. Внезапно оказывается, что ваш терминал завален десятками отладочных сообщений, и вы уже не понимаете, какое из них к чему относится. Вы начинаете писать print("--- HERE ---"), чтобы хоть как-то ориентироваться в этом хаосе. А когда приходит время выкатывать код в продакшен, вы судорожно ищете и комментируете все свои print(), надеясь не пропустить ни одного.

В этот момент опытные коллеги (или статьи в интернете) говорят вам: "Для этого есть стандартный модуль logging!". И они правы. logging — это мощный, гибкий и правильный инструмент. Но давайте будем честны, его настройка часто напоминает бюрократическую процедуру. В статье рассказано о модуле loguru — еще более эффективном инструменте для логирования.
🔥9👍4
I can’t recommend Grafana anymore

Отметьтесь в комментариях, кто, как и автор этой статьи, думает, что Grafana слишком быстро развивается, слишком быстро всё меняет и не является достаточно скучной (=неизменной). Очень интересная точка зрения, рекомендую пользователям Grafana с ней ознакомиться.

Я не слишком активный пользователь Grafana-стека. В основном пользуюсь только дашбордами. А вот те, кто использует Alloy, Mimir, Loki, OnCall, как оно вам вообще? Успеваете за изменениями?

❗️ Все желающие приглашаются в комментарии для обсуждения.
🔥93🤔3👎2
Drinking the OTel SODA: Send Observability Data Anywhere

Долгое время наблюдаемость означала организацию полного стека, который невозможно изменить: проприетарные агенты для сбора данных, проприетарный протокол для их передачи и проприетарный бэкенд для их просмотра. Наблюдаемость находилась в замкнутом пространстве.

OpenTelemetry был создан, чтобы сломать эту парадигму. Благодаря OTel Collector, выступающему в роли механизма трансляции и маршрутизации, метрики, журналы и трейсы больше не ограничены проприетарными средствами.

Наблюдаемость — это не монолит

Нет ничего плохого в проприетарном программном обеспечении; многие отличные системы имеют закрытый исходный код. Проблема в том, что данные становятся проприетарными в этих системах.

Когда сбор, передача и хранение тесно связаны с одним вендором, возможности сужаются. Нужна поддержка менее распространённого языка программирования? Вам придётся ждать агента кварталами. Хотите сменить вендора? Приготовьтесь к неделям перенастройки. Даже простые идеи, например, эксперименты со вторым параллельным бэкендом, могут стать «проектами».

OTel меняет весь подход. Сегодня вы можете единообразно инструментировать практически всё, и да, ещё никогда не было так просто менять платформу наблюдения, не трогая код приложения. Но дело не только в снижении привязки к вендору; когда вы контролируете, как перемещаются данные, вы можете отправлять их куда угодно.

Термин «наблюдаемость» создаёт впечатление, что сбор, обработка и хранение телеметрии — это один большой монолит. Это не так. Конвейер изначально компонуется, и наибольший эффект достигается в его хвосте: «бэкенде». Относитесь к этому хвосту как к развилке, а не как к тупику.

И вот тут предлагаю вам перейти к чтению оригинальной статьи, где рассказано что же такое SODA (Send Observability Data Anywhere) и как этот подход адаптировать к вашему окружению. Так как статься написана с прицелом на ClickStack, то в конце вам предлагается к нему еще раз присмотреться.
🔥72👍2
From Signals to Reliability: SLOs, Runbooks and Post-Mortems

Вы можете создать идеальную инфраструктуру наблюдения: унифицированные конвейеры OpenTelemetry, непрерывное профилирование, инструментирование каждого сервиса, сбор всех метрик, логов и трейсов и щепотка привлекательных дашбордов в Grafana.

Но это не спасет от возможных трудностей во время инцидентов. Недостающий элемент не технический, а организационный. Когда во время инцидентов срабатывают оповещения, команде необходимо мгновенно ответить на четыре вопроса: насколько это серьёзно? Какие действия следует предпринять? Кого необходимо привлечь? Когда проблема будет решена?

Без целей уровня обслуживания (SLA) критичность становится субъективной. Разные инженеры будут по-разному оценивать, приемлемо ли 5% ошибок или катастрофично. Без регламентов реагирование на инциденты превращается в импровизацию. Каждый инженер следует своей ментальной модели, что приводит к противоречивым результатам. Без структурированного анализа инцидентов команды устраняют симптомы, но упускают первопричины, постоянно сталкиваясь с одними и теми же проблемами.

В этой статье интересный разбор подхода к формированию SLA, ранбуков и пост-мортемов.
🔥75👍1
Изучаем инструменты мониторинга сети для Linux: tcpdump, wireshark и iftop

Linux предлагает много мощных инструментов, которые помогают администраторам захватывать, проверять и анализировать сетевой трафик в режиме реального времени. Три наиболее часто используемых инструмента — это tcpdump, wireshark и iftop. Подробнее в этой статье.
🔥8👍3
Галс Софтвэр приглашает на обновленный тренинг по OpenSearch 22-24 декабря

Приходите на дополнительный тренинг по OpenSearch в этом году. Мы обновили программу до версии 3.3 и добавили новые блоки:

🚀 сегментная репликация
🚀 мониторинг (Performance Analyzer)
🚀 отправка оповещений
🚀 работа с Vector
🚀 работа с Ingest pipelines

❗️ За 3 дня вы получите глубокий опыт работы с самой последней версией OpenSearch. Интенсив поможет быстро погрузиться в продукт, на растягивая знакомство на долгий срок.

Программа тренинга


Подробную информацию вы можете запросить, написав @galssoftware или через почту hello@gals.software.

Реклама. ООО «Галс Софтвэр», ИНН 5047195298, erid 2VtzquYcAp6
🔥6👍3👎1
Анализ проекта VictoriaMetrics

Мальчишки и девчонки, а также их родители, как устроена VictoriaMetrics узнать не хотите ли? В этой статье вы узнаете структуру каталогов проекта и о предназначении различных файлов. А ещё там описаны некоторые проектные решения при разработке продукта.

Эту статью можно назвать продолжением цикла. Есть еще одна похожая, которую я уже публиковал в канале. Но там рассмотрено все немного под другим углом.
🔥8👍1👎1