KazDevOps – Telegram
KazDevOps
5.38K subscribers
1.3K photos
27 videos
19 files
1.3K links
Канал о DevOps во всех проявлениях: K8s, CI/CD, AppSec, AI/ML, Cloud, Linux
Поможем с DevOps: https://core247.kz/
По рекламе @UlKonovalova
Download Telegram
🔥 Хакатон по Highload

Все началось с падения сервиса Тикетон при продаже билетов на концерт JLo этой весной. Ребята заметили в этом проблему — в IT-среде мало мест, где можно прокачать компетенции по построению высоконагруженных систем. Для этой цели команда волонтеров организует хакатон — hackload.kz.

📆 Даты проведения — 15-17 августа.

Каждый участник может попробовать свои силы в том, чтобы построить хайлоад-сервис и не допустить потерь в бизнесе. Регистрация доступна для команд из 4 человек максимум.

Докажите, что вы-то сможете построить сервис, который выдержит наплыв покупателей!

👉
Регистрируйтесь

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍9🔥43😎2
Forwarded from DigitalBusiness.kz
Кому в ИТ платят больше всего в 2025 году: исследование зарплат в Казахстане

Digital Business публикует результаты свежего исследования зарплат и бонусов на ИТ-рынке Казахстана. Консалтинговая компания People Consulting совместно с HR-сообществом провела срез по грейдам, профессиям и отраслям. Рассказываем главные инсайты отчета, чтобы понять, как меняется рынок и кому в 2025 году платят больше всех.

Читать на сайте
1😎6👍42🔥2👎1
Вакансия: Team Lead DevOps | Infrastructure

📍 из офиса в Алматы / гибрид / удалёнка с командировками
💵 $4000–6000 NET

SMALL — крупнейший ритейлер Казахстана.
Мы строим внутреннюю цифровую экосистему (ритейл, логистика, финансы, e-com). Ищем тимлида DevOps / инфраструктуры, который поможет выстроить стабильную, масштабируемую и автономную ИТ-платформу: от своего облака до культуры DevOps.


Зона ответственности:
— Руководство командой инженеров (планирование, рост, найм)
— Построение отказоустойчивой инфраструктуры (облако, сети, хранилища, backup/DR)
— Развитие DevOps-практик: CI/CD, IaC, автоматизация
— Совместная работа с dev, security и бизнесом
— Контроль SLA/SLO, построение Dev-friendly-инфраструктуры

⚡️ Технологии:
Linux (Debian, RHEL) / Windows Server
KVM, Proxmox, CEPH, Docker, Podman
Terraform, Ansible, GitLab CI, Jenkins
Zabbix, Prometheus, ELK, Grafana
VPN, pfSense, Mikrotik, NGINX, HAProxy
PostgreSQL / MySQL / MSSQL

💫 Ожидания от кандидата:
— 3+ лет в роли тимлида или ведущего DevOps/инфра-инженера
— Уверенное понимание ИТ-архитектуры, отказоустойчивости, безопасности
— Опыт внедрения DevOps-практик и построения процессов
— Сильные софт-скиллы: команда, взаимодействие, приоритизация

⭐️ Что предлагаем:
— Трансформация бизнеса с 12 000+ сотрудников
— Архитектурное влияние и современный стек
— Прозрачная продуктовая команда
— Работа в офисе Алматы (в приоритете) / гибрид / удалёнка с командировками

✉️ Отклик:
Напиши Ане в Telegram — @annantak. Пришли резюме и пару слов о себе!

#реклама
🔥75👍43😎3
🔥 Репозиторий с гайдами по стеку технологий

В репо вы найдете инструкции — от операционных систем и языков программирования до DevOps и других смежных сфер.

⚪️ Гайды сжаты и структурированы
⚪️ Актуальные библиотеки и фреймворки для работы.
⚪️ Без воды

Пользуйтесь и делитесь с коллегами 🫡

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥432
👀 Постмортем инцидента Cloudflare

14 июля Cloudflare случайно сделал изменение в настройках своей системы, из-за чего сервис 1.1.1.1 перестал работать на краевых серверах (тех, что ближе к пользователям).

Это привело к тому, что определенные пользователи не могли заходить в интернет примерно 62 минуты. Также были сбои в работе других услуг, таких как Gateway DNS. Снижение запросов заметили по всем протоколам (UDP, TCP, DNS over TLS).

Причина:

6 июня в настройках системы появилась ошибка. Тогда это не повлияло на работу, потому что изменение касалось новой, ещё не запущенной функции (DLS). Но 14 июля, когда добавили тестовый центр данных в эту систему, старая ошибка "ожила". Из-за этого маршруты были переключены только на офлайн-центр, и сервис стал недоступен по всему миру. Это не было атакой или взломом, а просто человеческой ошибкой в настройках.

Cloudflare пообещала:

1. Улучшить управление настройками, чтобы ошибки не оставались незамеченными.
2. Постепенно заменить старые системы на новые, более надёжные.
3. Добавить проверки, которые помогут избежать подобных ситуаций.

👉 Читайте подробнее
Этот случай показал, что даже маленькая ошибка в настройках может вызвать большой сбой. Cloudflare работает над тем, чтобы сделать интернет стабильнее, и этот урок поможет им лучше справляться с такими проблемами в будущем.


@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
😎433👍3🔥3
🔥 PROFIT Industry & Energy Day — 28 августа в Астане

Приглашаем на конференцию (Офлайн + Онлайн) о цифровизации промышленности и энергетики Казахстана — узнайте самое интересное и участвуйте в розыгрыше призов: Bluetooth-наушники, Умная колонка и Смартфон Samsung S24 FE.

⚪️ Какие решения используются в казахстанской промышленности?
⚪️ Как оптимизировать расходы и развивать предприятие с использованием новых технологий?
⚪️ Какие преграды стоят на пути Индустрии 4.0 в стране?

Все это обсудят на ежегодной конференции PROFIT Industry & Energy Day.

👉 Регистрируйтесь

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥3😎3
🔥 DevOps-инженер: не просто про сервера и пайплайны

Главная цель DevOps'a — создать гибкую и устойчивую систему, где каждый этап работы оптимизирован, а команды могут работать продуктивно и не перегружаться. Такой специалист отвечает за всю логистику кода и берет на себя задачи, от которых зависит устойчивость и скорость всего IT-конвейера. В его зоне ответственности:

⚪️ настройка непрерывной интеграции и доставки (CI/CD)
⚪️ автоматизация инфраструктуры, чтобы развертывание и масштабирование не занимали дни
⚪️ координация с разработчиками, тестировщиками и операторами, чтобы все части системы говорили на одном языке
⚪️ контроль за стабильной работой приложений, включая мониторинг, алертинг и устранение инцидентов
⚪️ оптимизация процессов и устранение узких мест, мешающих быстрой поставке продукта

База универсального специалиста:

⚪️Linux, Bash, Python, Dockerfile и shell-инструкции
⚪️сети
⚪️виртуализация
⚪️контейнеризация
⚪️CI/CD
⚪️облачные технологии
⚪️основы информационной безопасности

В учебном центре Core 24/7 есть курсы по всем этим дисциплинам — и даже больше. Это программы компании Слёрм, которые доступны нашим подписчикам по региональной скидке. Не упустите возможность прокачаться, пока конкуренты на рынке отдыхают 😜


@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥43👍2
🔥 10 лет развития Cloud Native Computing Foundation

CNCF была дочерней организацией Linux Foundation и задавала вектор развития — стандартизировала подходы к контейнерам, оркестрации и микросервисам. После стала выпускать собственные проекты, сегодня их 231.

К юбилею компания опубликовала отчет об их развитии. Например, там есть интересные данные о наиболее активно развивающиеся за последний год:

1. Kubernetes
2. OpenTelemetry
3. Prometheus
4. Argo
5. Backstage
6. Meshery
7. Cilium
8. Envoy
9. gRPC
10. Keycloak

В сравнении с прошлым периодом заметны кардинальные скачки по 3 проектам:

⚪️Meshery: 11-е место → 6-е
⚪️Istio: 9-е → 15-е
⚪️Prometheus: 5-е → 3-е

Другие заметные изменения в топ-100:

⚪️дебют Podman Container Tools на 18-м месте и CloudNativePG на 29-м
⚪️OpenFGA: с 34-го на 21-е
⚪️Headlamp: с 99-го на 50-е
⚪️Buildpacks: с 41-го на 60-е

Core 24/7 — официальный партнер CNCF в Казахстане.


@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍43🎉3😎3
🔥 Вакансия в CORE 24/7 для специалистов технической поддержки (L1-инженеров)

Компания Core 24/7 — лидер в сфере DevOps-аутсорсинга. Мы запускаем первую линию технической поддержки и ищем 2 начинающих специалистов.

Алматы, офис
Заработная плата: до 200 000 тг.
Можно без опыта
График: сменный (1/3, с 8:00 до 20:00)
Испытательный срок: 3 месяца


❗️ Cамый главный профит — это отличный старт карьеры бок-о-бок с командой, которая делает DevOps для госсектора, стартапов и IT-гигантов Средней Азии. Прокачаетесь на практике — и двери в DevOps станут открыты.

Задачи:

• Регистрация и обработка обращений пользователей в системе заявок
• Разрешение инцидентов и поддержка пользователей по регламентам
• Подготовка и ведение документации: инструкции для решения проблем
• Мониторинг дашбордов и управление алертами для выявления критических изменений
• Обработка запросов, эскалация критических инцидентов при необходимости
• Своевременная реакция в чатах и обратная связь клиентам в течение 15 минут

Требования:

• Базовые знания ОС Linux и администрирования IT-инфраструктуры
• Умение работать в стрессовых ситуациях и принимать решения
• Грамотная устная и письменная речь
• Готовность к сменному графику работы
• Умение быстро находить информацию для решения задач (google, stack overflow, chatgpt)
• Желание обучаться и развиваться

Приветствуется, но не обязательно:

• Техническое образование (высшее, средне-специальное или среднее).
• Опыт работы с GitLab/GitHub CI/CD
• Знания AWS, Ansible или Kubernetes
• Навыки настройки SSL и работы с сетевым оборудованием

Мы предлагаем:

• Обучение с нуля и постоянное наставничество
• Программы повышения квалификации в сфере SRE/DevOps
• Сертификацию по ключевым направлениям (Kubernetes, AWS, Red Hat и др.)
• Компенсацию за тренажерный зал
• Премии за успешную работу
• Регулярные тимбилдинги
• Возможности для профессионального и карьерного роста

Если вы хотите расти в ИТ и стать частью команды профессионалов, отправляйте свое резюме. Мы ждем вас!

Писать сюда:

👉 aissabekova@core247.io
👉 @issaika
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣87👍4🔥3👎1
🔥Поздравляем с Днём Сисадмина... и DevOps!

Каждую последнюю пятницу июля админы всего мира отмечают профессиональный праздник. Мы непосредственно связаны с ним — и мы поздравляем всех коллег!

Желаем, чтобы технологии служили вашему делу, а не трепали нервы.
Желаем, чтобы работа всегда приносила удовольствие.
Желаем, чтобы вы прокачивались, росли и пожинали плоды своего труда.

Сила — в сообществе.

Обнимаем всех!

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥286🎉6😎3
🔥 Подборка инструментов для DevOps

⚪️ Freelens

Бесплатный пользовательский проект для управления кластерами Kubernetes на macOS, Windows и Linux. Приложение упрощает сложности управления Kubernetes, предлагая интуитивно понятный и удобный интерфейс.

⚪️OpenCVE

Веб-интерфейс позволяет управлять данными о CVE из различных источников (NVD, RedHat, MITRE, Vulnrichment и т.д.). Есть возможность «подписки» на определенные CVE ради уведомлений об изменениях.

⚪️ Seccomp в Kubernetes

Ограничивает системные вызовы для повышения безопасности контейнеров. Профили (RuntimeDefault, Localhost, Unconfined) задаются через securityContext, блокируя ненужные для защиты от уязвимостей. Автор ресурса столкнулся с избыточными вызовами в авто-генерируемых профилях, создал онлайн-инструмент для анализа и сравнения профилей, упрощая их оптимизацию.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍43😎3
🔥 Летний IT-форум от Qazaq IT Community и Servercore

ИТ-инфраструктура: как оптимизировать расходы и не потерять в эффективности.

В программе:

— Кейсы от лидеров индустрии (Servercore, Core 24/7, DATA STAR)
— Практические подходы к DevOps, DevSecOps и управлению инфраструктурой
— Интерактивный нетворкинг и живое общение
— Розыгрыши, подарки и летняя атмосфера под открытым небом
— Бургер-перерыв для неформального диалога 🍔

👥 Мероприятие ориентировано на:
СТО, CEO IT-компаний, архитекторов инфраструктуры, DevOps-инженеров, IT-директоров и технологическое сообщество Казахстана.

👉 Участие по регистрации

📅 1 августа 2025
🕓 16:30 – 21:00
📍 Most It hub БЦ Fortis, улица Ходжанова, 2/2

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍32🔥2😎1
🔥 Как построить Professional Services

Процессы — сплошной хаос.
Управление построено на личных связях.
Общего хранилища информации о проектах просто нет.
Проектных артефактов тоже нет.


В такой атмосфере разработчики — чуть ли не единственные, кто знает о продуктах достаточно широко. И поэтому они превращаются в многостаночников. Знакомая ситуация? Таких компаний у нас много.

Собрали рекомендации, как вернуть разработчикам разработку:

⚪️ Оцените зрелость команды: начните с анализа знаний и компетенций.
⚪️ Разделите юниты по продуктам: фокусируйте команды на конкретных решениях, чтобы те не распылялись.
⚪️ Внедрите стандарты: создайте единые правила и шаблоны для порядка внедрения продуктов.
⚪️ Автоматизируйте процессы: используйте системы управления проектами и wiki для прозрачности.
⚪️ Проводите ретроспективы: анализируйте спринты для улучшений.
⚪️ Измеряйте метрики: отслеживайте прогресс (зрелость, сроки, эффективность).

Что еще важно:

⚪️ Привлекайте опытных людей из разработки для передачи знаний внутри команды.
⚪️ Проводите совместные встречи с проектными менеджерами и руководством, чтобы синхронизировать пайплайны.
⚪️ Внедряйте Kanban-доски с авто-обновлением статуса для эффективности.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥32😎1
🔥 Воркшоп SUSE Rancher Rodeo

📅 1 августа 2025
🕚 14:00–17:00 по времени Алматы
📍 Онлайн


Приглашаем DevOps-инженеров, платформенные команды, облачных архитекторов и всех, кто работает с Kubernetes, на бесплатный практический тренинг от SUSE.

Что вас ждёт:

— Развёртывание кластеров Kubernetes
— Надёжный деплой приложений с Application Collection
— Управление приложениями через Fleet
— Настройка Zero Trust-среды и политик безопасности с SUSE Security
— Обнаружение и устранение ошибок с помощью SUSE Observability

Спикер: Ivan Ekimov, PreSales Engineer в SUSE

❗️ Требуется базовое понимание Cloud Native и Rancher.

👉 Регистрируйтесь бесплатно

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👍32😎1
🔥 Kubernetes v1.34: что нового ждёт нас в августе 2025

Kubernetes готовит свежий релиз v1.34, который выйдет 27 августа 2025 года. Это обновление без удалений, но с кучей крутых фишек. Давайте разберём главное:

⚪️ Умное распределение ресурсов (DRA)

Подключение GPU и спецаппаратуры станет стабильным. Kubernetes распределит устройства с гибкой фильтрацией через CEL.

⚪️ Токены для загрузки образов

Kubelet использует короткоживущие токены (бета по умолчанию) для авторизации контейнеров — безопаснее секретов.

⚪️ Гибкий запуск подов

Deployments получат альфа-опцию: новые поды при старте старых (TerminationStarted) или после их завершения (TerminationComplete). Полезно при ограничениях.

⚪️ Трассировка для отладки

Kubelet и API Server станут стабильными с OpenTelemetry (трассировка CRI-вызовов), помогая найти задержки (тестировалось с v1.25).

⚪️ Умный трафик для сервисов

trafficDistribution (бета) позволит направлять трафик в ту же зону (PreferSameZone, вместо PreferClose) или узел.

⚪️ KYAML — новый формат

Безопасный YAML с комментариями и простым синтаксисом ожидается для kubectl (не гарантировано).

⚪️ Точное масштабирование

HPA (бета) даст настройку порогов масштабирования (альфа в v1.33) для точной подстройки.

👉 Читайте подробнее здесь

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥43🤡2😎2
🔥 Bottlerocket — ОС для контейнеров

Bottlerocket — это открытая Linux-ОС, созданная специально для контейнеров. Почему вообще о ней говорят, как она упрощает работу и в чем преимущества над общими ОС? Давайте разберем.

Сперва немного контекста. Почему отказываются от общих ОС (GPOS)? Они подходят для множества задач, но в больших флотах создают проблемы:

⚪️ Разные версии пакетов усложняют обновления.
⚪️ Долгая поддержка (LTS, 5-10 лет) требует дорогих патчей.
⚪️ Совместимость тормозит обновления.

Преимущества SPOS для контейнеров:

Однозадачные ОС, как Bottlerocket, заточены под конкретную цель — контейнеры:

⚪️ Используют образы, а не пакеты, что исключает несовместимости.
⚪️ Не привязаны к LTS, упрощая поддержку.
⚪️ Ограничивают доступ к библиотекам, позволяя обновлять софт без рисков.

Особенности Bottlerocket:

⚪️ Оптимизирована для Amazon ECS и EKS, доступна как AMI бесплатно.
⚪️ Нет SSH/шелла, только API для управления. Использует SELinux и криптографию.
⚪️ Поддерживает SSM и обновления через образы с откатом.

Ключевые бенефиты:

⚪️ Обновления тестируются, минимизируя сбои.
⚪️ 100 пакетов против 50 000 в GPOS, меньше уязвимостей.
⚪️ Соответствует CIS-стандартам, с отчётами через API.
⚪️ Быстрый запуск узлов благодаря встроенным контейнерам.

Кстати, в планах поддержка новых EC2 (Inf1, Trn1), FIPS 140-3, упрощённый онбординг с готовым контейнером, ускорение запуска узлов.

Пользуйтесь и делитесь с коллегами 🫡

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🤡43😎2
🎉РОЗЫГРЫШ: 5 подписок на ChatGPT Plus

Мы запускаем совместный конкурс с IT-каналами, которые мы собрали в одну удобную папку – всё самое полезное в одном месте.

🗓Старт – 2 августа
🏁Итоги – 11 августа
🎁Приз – 5 подписок на ChatGPT Plus на 1 месяц

Условия участия:

1. Подпишитесь на нашу папку ссылка
2. Нажмите на кнопку «Участвую» под этим постом
2🤡9👍8🔥8👎4🤮3
🔥 Резервные копии PostgreSQL: сравним скорость pg_dump в разных форматах

Предлагаем эксперимент: делаем резервные копии в 4 разных форматах с использованием от 1 до 7 уровней сжатия под каждый формат. Записываем результаты и сравниваем разные виды, чтобы понимать, какие способы более эффективны. Всю рутину сделали за вас и проанализировали итоги.

👉 Читайте в новой статье

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥322😎2
👀 Постмортем инцидента с перегрузкой в Yandex Go в 2024 году

Кейс хоть и прошлогодний, но далеко не устаревший.

В системе Yandex Go из 500 микросервисов произошел часовой сбой всей инфраструктуры. После обновления в сервисе заказов возникли массовые ошибки, вызванные багом с сегфолтом на таймаутах Redis. Несмотря на откат обновления, система не восстанавливалась из-за перегрузки CPU (100% у многих сервисов). Пришлось ограничить трафик до 1% пользователей, а затем постепенно наращивать нагрузку до 5%, чтобы вернуть стабильность.

Причина:

Изначально ретраи с экспоненциальным бэкоффом и джиттером решали проблему таймаутов в сервисе ценообразования. Однако во время инцидента ретраи усилили нагрузку: оркестратор генерировал 3x нагрузку, а общая нагрузка выросла до 9x. Система не могла само-восстановиться после устранения триггера (отката релиза). Ретраи задерживали восстановление, увеличивая очередь запросов.

Следствие:

Сбой привел к остановке всех сервисов на час. Перегрузка CPU и рост запросов замедлили восстановление даже после устранения бага, что выявило уязвимость системы к ретраям в условиях длительного даунтайма.

Решение:


Команда решила внедрить бюджет ретраев с лимитом 10% от успешных запросов, дополнив существующий экспоненциальный бэкофф. Это минимизирует дополнительную нагрузку при сбоях. Также рассмотрели срезание нагрузки на сервере с порогом 50% и deadline propagation для прерывания запросов,. Улучшили алерты и тесты на таймауты Redis.

Выводы:

Ретраи с экспоненциальным бэкоффом не являются универсальным решением — они лишь откладывают перегрузку, а при длительных сбоях усиливают проблему. Ключ — в адаптивном управлении ретраями (бюджет или брейкер) и контроле нагрузки.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍96🔥5🤮2
🔥 Про хакатон по Highload

На хакатон зарегистрировалось больше 30 команд, которые готовы построить тот самый отказоустойчивый сервис, чтобы выдержать нагрузку промо-акции на event большой звезды!

Но хакатон — еще и образовательный. Поэтому организаторы запустили марафон лекций про архитектуру приложений: как построить сервис, чтобы его можно было масштабировать, как устранить детские болезни в высоконагруженных сервисах?

Все это в лекциях с 4 по 13 августа. Лекции публичные (без регистрации и СМС), не только для участников хакатона.

Воркшопы проводит Дмитрий Мельник, автор канала Drim Dev и эксперт в построении высоконагруженных систем.

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥104👍4🤡1
🔥 OpenAI выпустили 2 open source модели, которые не уступают топовым o3 и o4-mini

GPT-OSS распространяется по лицензии Apache 2.0. В семействе модели на 20B и 120B параметров, при этом используется архитектура экспертов, когда запускаются только те части, которые действительно нужны для ответа на запрос.

А ещё это первый релиз в опенсорс от OpenAI за 6 лет — последний раз они выпускали мамонта GPT-2.

Попробовать можно здесь. GitHub и инструкция по установке — здесь.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍43😎2