Enabling.team Insights – Telegram
Наш эксперт, Игорь Курочкин, рассказал про современную модель DevOps на кэмпе South HUB для руководителей и CTO, который проходил осенью 2022 года и собрал более 200 участников и 29 спикеров из Tinkoff, X5, Авито, Selectel, S7, Альфа-Банк, Skillbox и др. В своем выступлении Игорь опирался на многолетний опыт помощи CTO и техническим лидерам в развитии инженерной культуры, процессов и практик в технологических компаниях, а также свой опыт работы в Microsoft и Skype, чтобы показать CTO практические способы решения проблем взаимодействия.

Подробнее

#enablingteam #insights #cto #devops #teamtopologies #southhub
Наш эксперт Андрей Александров представил кейс применения подхода Team Topologies на конференции AgileDays 2023, посвящённой современным методам управления.

Подробнее

#enablingteam #insights #agile #agiledays #teamtopologies
Наш эксперт Игорь Курочкин выступил на конференции DevOops 2023 и рассмотрел DevOps как профессиональное движение, рассказал про пройденный путь и как движение решало проблемы взаимодействия между разработкой (Dev) и эксплуатацией (Ops). Игорь проанализировал десятки публикаций, выступлений и книг, с момента появления термина в 2009 году, чтобы понять какие проблемы получилось решить DevOps движению, а какие еще предстоит.

Подробнее

#enablingteam #insights #devops #devoops #community #movement
Наш эксперт, Игорь Курочкин, открывал профессиональную конференцию DevOpsConf 2024 по интеграции процессов разработки, тестирования и эксплуатации. Конференция проходила
в Москве с 4 по 5 марта и собрала более 1800 представителей индустрии.

Игорь проанализировал десятки публикаций, выступлений и книг с момента появления термина в 2009 году, чтобы понять какие проблемы получилось решить DevOps движению, а какие еще предстоит.

Подробее

#enablingteam #insights #nextops #devops #devopsconf
Наш эксперт, Игорь Курочкин, принял участие в обсуждении книги Accelerate в подкасте Code of Leadership и поделился своим опытом проведения исследований инженерной культуры и практик. Книга Accelerate вышла в начале 2018 года в издательстве IT Revolution. Авторы книги являются основными представителями DevOps движения: Джин Ким, Джез Хамбл и Николь Форсгрен. Книга основана на результатах исследования State of DevOps с 2014 по 2017 год и помогает ответить на вопросы масштабирования и эффективности технологических компаний.

Подробнее

#enablingteam #insights #accelerate #devops #dora #books #metrics
В апреле 2024 года вышел юбилейный 30-й выпуск технологического радара от экспертов компании Thoughtworks. Мы внимательно изучили новый выпуск и подготовили краткий обзор. Напомним, что технологический радар выходит 2 раза в год на протяжении уже 15 лет, за это время в радаре упоминалось свыше 1600 практик, платформ, фреймворков и инструментов. В подготовке радара участвуют такие эксперты ThoughtWorks, как Martin Fowler, Neal Ford, James Lewis, Rebecca Parsons и другие.

Отчет начинается с 4-х актуальных проблем и вызовов в индустрии на начало 2024 года:
1. переход Open Source проектов на коммерческие лицензии;
2. развитие практик для удобной работы с Pull Requests и интеграцию в CI процесс;
3. применение AI инструментов в разработке;
4. формирование архитектурных паттернов для LLM.

На радаре в текущем выпуске упоминаются 18 практик, 25 платформ и более 60 инструментов, проектов и фреймворков. Что интересного мы отметили:
1. Развитие практики Infrastructure as code и появление новых платформ и инструментов:
- Платформы оркестрации инфраструктуры: Terragrunt, Terraspace, Terraform Cloud, Pulumi Cloud, env0, Spacelift;
- Экосистема инструментов TACOS (Terraform Automation and Collaboration Software): Atlantis, Digger, Scalr, Terramate, Terrateam;
- Стартап System Initiative для создания цифрового двойника инфраструктуры от Adam Jacob, одного из пионеров Infrastructure as code и основателя Chef;
- Язык для описания облачной инфраструктуры Winglang;
- Язык конфигураций Pkl от Apple для реализации практики Configuration as code;
- Pulumi, OpenTofu и статический анализатор кода Terrascan для Terraform;
2. Проекты и спецификации от CNCF и FinOps Foundation:
- Спецификация и проект CloudEvents для создания event-driven архитектур;
- Спецификация FOCUS для реализации практик FinOps;
- Проект Open Policy Agent для унификации управления политиками;
3. Практики и инструменты для DevSecOps:
- Практика Continuous Compliance на базе SBOM и SLSA;
- Практика Security Champions;
- Инструмент и спецификацию VISS (Vulnerability Impact Scoring System) от Zoom;
4. Сервисы для инженерной аналитики, метрик разработки и поставки LinearB и Develocity;
5. Платформы и инструменты для Observability: HyperDX, Akvorado, Chronosphere;
6. Практику поддержания актуального состояния каталога сервисов на примере Backstage;
7. Инструмент IcePanel для реализации практики Diagrams as code и командной работы с архитектурой;
8. Инструменты для Kubernetes: Kaniko, Karpenter, Rancher Desktop, actions-runner-controller, Zarf;
9. Практики и инструменты для AI такие, как RAG, Text to SQL, LLM для ChatOps и работы с Legacy кодом, PromptOps, Kubiya, Autogen, CrewAI, AutoGPT, Driver AI, bloop.

#insights #radar #techradar
🔥9
В конце октября 2024 года вышел 31-й выпуск технологического радара от компании ThoughtWorks. Мы внимательно изучили новый выпуск и подготовили краткий обзор. Напомним, что технологический радар выходит 2 раза в год на протяжении уже 15 лет, за это время на радаре появилось больше 1600 практик, платформ, фреймворков и инструментов. В подготовке радара участвуют такие эксперты, как Martin Fowler, Neal Ford, James Lewis, Rebecca Parsons и другие.

Отчет начинается с четырех инсайтов в индустрии на конец 2024 года:
1. Появление антипаттернов применения AI инструментов к процессам разработки;
2. Появление новых инструментов и рост интереса к языку Rust;
3. Распространение открытого стандарта WebAssembly (WASM);
4. Бум инструментов генеративного AI.

В новом выпуске на радаре упоминаются 23 практики, 17 платформ и более 60 инструментов, проектов и фреймворков. Что интересного мы отметили:
1. Упоминание практики Continuous Deployment. Последний раз практика появлялась на радаре в далеком 2011 году и новое упоминание связано с выходом одноименной книги Continuous Deployment от Valentina Servile (эксперта ThoughtWorks);
2. Появление нового подхода Observability 2.0 и разработка инструментов следующего поколения , подробнее в Whitepaper и выпуске подкаста Last Week in AWS с Charity Majors;
3. Развитие инструментов для локальной разработки и Dev окружений:
- Графический Git клиент GitButler, упрощающий работу с ветками;
- Консольная утилита DevBox для создания Dev окружений;
- Консольная утилита Difftastic для поиска различий в коде;
- Современный терминал Warp для macOS и Linux, написанный на Rust;
- Инструмент для MacOS для локального контроля сборок CCMenu;
4. Развитие практик, плафторм и инструментов, связанных с CI/CD:
- Практика 1% канареечного релиза;
- Continuous Delivery платформа Spinnaker;
- Платформа управления Feature флагами Unleash;
- Сервис Unblocked для поиска информации и улучшения навигации во внутренних системах и платформах;
- Проект и спецификация Score для стандартизации описания конфигураций платформ и окружений, проект активно развивается и недавно был принят в CNCF Sandbox;
- Практика Component testing и инструмент для автоматизации запуска интеграционных тестов Testcontainers;
5. Инструменты для Kubernetes:
- Консольная утилита K9s для управления кластерами;
- Дистрибутив Elastisys Compliant Kubernetes, который теперь называется Welkin;
6. Проект и фреймворк SST для развертывания приложений в облаках, более ориентированный на разработчиков;
7. Проект и спецификацию Passkeys для аутентификации от FIDO Alliance;
8. Практики и инструменты для Data Engineering и MLOps: Kedro, ReadySet, FoundationDB, ClickHouse, применение GraphQL для Data продуктов;
9. Инструменты на Rust: Mise, Iggy, Pingora, uv, Zed, Rspack, Slint;
10. Практики и инструменты для AI и LLM: RAG, Fine-tuning embedding models, Function calling, LLM as a judge, Small language models (SLMs), Synthetic data for testing and training models, Using GenAI to understand legacy codebases, AI team assistants, Dynamic few-shot prompting, LLM-powered autonomous agents, On-device LLM inference, Structured output from LLMs, FastChat, Langfuse, Qdrant, ColPali, Cursor, Instructor, LiteLLM, LLM Guardrails, Microsoft Autogen, Pingora и др.

#insights #radar #techradar
🔥92👍1
В конце октября 2024 года вышел 10-й юбилейный отчет Accelerate State of DevOps 2024 от DORA и Google Cloud. Напомним, что исследование Accelerate State of DevOps проводится ежегодно с 2014 года, за 10 лет в исследовании приняли участие свыше 39 тысяч профессионалов по всему миру, работающих в компаниях различных размеров и отраслей. Авторы отчета - команда DORA (DevOps Research and Assessment), входит в Google Cloud и состоит из исследователей, архитекторов, консультантов, технических писателей, экспертов по UX и DX. В этом году отчет получился на 120 страниц, мы внимательно изучили новый отчет и подготовили краткий обзор.

Исследование в этом году сфокусировано на таких направлениях и практиках, как применение AI, Platform Engineering, Developer Experience, Transformational leadership и их влиянии на Software delivery performance, Reliability, Product performance, Team и Organizational performance, Productivity и Well-being.

Что интересного мы отметили:
1. В исследовании приняло участие 3000 профессионалов из 3-х основных индустрий Technology (36%), Financial Services (16%) и Retail/E-commerce (9%). Большинство участников (76%) работают в компаниях размером больше 100 сотрудников, 46% в компаниях больше 1000 сотрудников. Инженеров и руководителей практически поровну, 90% FTE (Full-time employee), в среднем имеют 16 лет опыта, 5 лет на текущей роли и 3 года в текущей команде. Участники исследования из 104 стран, топ-6 стран: США, Великобритания, Канада, Германия, Япония, Индия, есть участники из Китая и России;
2. В начале отчета даны хорошие определения ключевым терминам, практикам и метрикам используемым в исследовании, чтобы синхронизировать терминологию;
3. По изменениям в ключевых метриках: в прошлом году Time to Restore Service переименовали в Failed deployment recovery time, в этом - Change failure rate переименовали в Change fail rate и экспериментируют с 5-й метрикой Rework rate, а также изменили концепцию измерения Software Delivery Performance;
4. По изменениям в профилях эффективности команд: соотношение Elite (19%) и Medium (35%) осталось практически без изменений с прошлого года, профиль High сократился на 10%, а Low вырос с 17% до 25%;
5. По изменениям ключевых метрик в профилях: Change fail rate у профилей High вырос с 10% до 20%, у Medium сократился с 15% до 10%, у Low сократился c 64% до 40%. Также у Low профилей Deployment frequency и Change lead time увеличился до 6 месяцев;
6. Приведены результаты исследования применение AI практик и инструментов и их влияние на ключевые метрики, индивидуальную продуктивность и инженерные практики. Этому направлению отведено четверть отчета, отметим хорошо составленный набор задач для которых применяют AI инструменты и анализ доверия к результатам работы AI инструментов;
7. Отдельная секция посвещена Platform Engineering, авторы ссылаются на книгу Team Topologies, опыт компаний Spotify и Netflix, дают хорошее определение: "Platform engineering is a sociotechnical discipline where engineers focus on the intersection of social interactions between different teams and the technical aspects of automation, self-service, and repeatability of processes". Исследуют влияние внутренних платформ (Internal developer platform) на индивидуальную и командную продуктивность, на ключевые метрики и результаты в разрезе 1, 2 и 5 лет использования платформ;
8. Исследование затронуло применение продуктового подхода (User-centered approach) в командах, в отчете приведены результаты влияния на Developer Experience и ключевые метрики;
9. Из Transformational Leadership охвачены такие аспекты как: Vision, Inspirational communication, Intellectual stimulation, Supportive leadership, Personal recognition и их влияние на Employee burnout, Job satisfaction, Team performance и Organizational performance.

#insights #devops #dora #report
🔥61
В начале 2024 года вышел отчет по состоянию Site Reliability Engineering в индустрии — The SRE Report 2024. Это уже 6-е издание отчета, исследования проводятся с 2018 года рабочей группой, состоящей из сотрудников Catchpoint и приглашенных экспертов. В подготовке текущего отчета участвовали: Niall Murphy (автор книг Site Reliability Engineering и The Site Reliability Workbook), Alex Hidalgo (автор книги Implementing SLO), Alex Elman (Indeed), Sarah Butt (SentinelOne), Kurt Andersen (Clari, SREcon) и др. Про компанию Catchpoint известно, что они разрабатывают SaaS платформу для Digital Experience Monitoring, аналогами которой являются платформы от Datadog, Dynatrace и New Relic. Исследование проводилось в форме опроса, в котором в этом году приняло участие 433 представителя индустрии, большинство из Америки и крупных компаний (больше 1000 сотрудников) из следующих индустрий: Technology, Financial, Healthcare, Government и Professional services.

Что интересного мы отметили в отчете:
1. В небольших компаниях (до 100 инженеров) функция SRE централизована в одной команде, поддерживающей несколько сервисов. С ростом компании происходит разделение на продуктовые и платформенные команды, что приводит к изменению топологий и структуры SRE команды;
2. Основные трудности с которыми сталкиваются SRE команды: планирование бюджета и ресурсов, приоритизация и архитектура. При этом найм, взаимодействие с командами и прозрачность работы отмечают реже;
3. С точки зрения влияния SRE на бизнес (Business Value) отмечают следующие факторы: Операционная эффективность (Operational Efficiencies), Customer Satisfaction и Customer Experience, Repair Times и реже — соблюдение SLA и Velocity;
4. Наиболее сложными аспектами решения инцидентов выделяют диагностику и поиск проблем, эскалацию и координацию между участниками, извлечение уроков и обучение на инцидентах;
5. Основное внимание уделяется решению инцидентов, оказывающим значительное влияние на пользователей, инцидентам высокого уровня (High severity) и тем, которые видны публично;
6. В качестве областей для улучшения процессов надежности выделяют: смену фокуса с исправлений на обучение на инцидентах, установление связей между инцидентами, выполнение action items после разбора инцидентов;
7. Разбор инцидентов, проведение ретроспектив и подготовка постмортемов лидируются в основном представителями SRE команд и руководителями, отдельная выделенная incident team встречается редко и в больших компаниях. При этом половина участников отмечает что уделяют недостаточное время для разбора инцидентов;
8. Вне дежурств SRE команды тратят в среднем 50% времени на инженерную работу, 25% времени на операционную работу (Toil) и 15% на прерывания;
9. Большинство компаний используют от 2 до 5 различных инструментов и систем для мониторинга и наблюдаемости. Не только из-за разного функционала и сценариев использования, но часто в следствии дублирования. Количество инструментов увеличивается с ростом компании;
10. Кроме мониторинга внутренних сервисов подчеркивается важность мониторинга внешних сервисов, таких как BGP, CDN, SASE, SaaS, внешние DNS и API;
11. Наиболее часто используемые метрики для измерений: Uptime/Availability, Performance/Response time, Latency и Error rate. Saturation упоминается гораздо реже, а SLOs разделяют на два типа: Uptime SLOs и Performance SLOs.

#insights #sre #reliability #report
🔥6👍3🙏1