Продолжаем знакомство с докладами DUMP 2025. Как и в прошлом году нас ждет сдвоенная секция Backend — впервые в секции будет воркшоп и круглый стол. О них чуть позже. А сейчас — к докладам.
1⃣ Секция Backend: «Как сделать максимально дешёвый Statefull процессинг с 1кк RPS», Максим Стаценко, руководитель службы подготовки и анализа больших данных, Яндекс
Передача информации внутри продуктовой воронки — всегда болезненная тема, особенно если длина воронки во времени растягивается на десятки дней. В Яндекс Рекламе для обучения нейронных сетей критически важна актуальная информация о том, как пользователь пришёл к покупке товара на сайте. Максим расскажет, как в компании пришли к основанной на множестве stateful процессингов шине данных, перед этим перебрав разные способы сбора. Какие оптимизации применили и с какими трудностями столкнулись на пути.
2⃣ Секция Backend: «Garbage Collection. Где мы сейчас», Михаил Поливаха, руководитель направления, Сбер
Сборка мусора — довольно сложный механизм. В большинстве managed языков runtime скрывает от нас детали дислокации памяти. С другой стороны, выбор определённого сборщика мусора может существенно улучшить производительность. Поговорим о том, какие алгоритмы сборки мусора бывают, какие бывают концептуальные трейд оффы при их использовании, и какой алгоритм вам может подойти больше всего.
3⃣ Секция Frontend: «Next. js, статика и два ЦОДа: как не оставить пользователей без скриптов и стилей», Георгий Кузьминых, разработчик, Точка
Обсудим проблему обновления статики Next. js (или любого приложения со статикой) при деплое в несколько ЦОДов (облаков). Разберём, почему стандартные решения вроде S3 и Blue-Green деплоя могут не подойти и какие сложности создают. Георгий поделится подходом к синхронизации статики, включая кастомные манифесты, скрипты очистки и возможности Next. JS и расскажет, как можно решить проблему устаревшей статики у пользователей.
4⃣ Секция Design: «Как упаковать свои результаты и себя», Митя Осадчук, директор Центра дизайн-компетенций B2C, Сбер
Чтобы о вашем проекте узнали, его недостаточно просто сделать. Его нужно упаковать и рассказать о нём. После того, как проект закончился, эта процедура кажется сложной, тяжёлой и откладывается, затем снова откладывается, ещё и ещё раз, пока проект не протухает. Поговорим о том, как быстро, на лёгких вайбах упаковать дизайн-результаты через тексто-графические артефакты. Будут байки про шоурилы, сложность написания поста и форматы коммуникации с аудиторией.
5⃣ Секция ML&DS: «Как весело и полезно потратить сгорающие токены языковых моделей», Кирилл Овчинников, руководитель направления, Сбер
Вы знали, что пакеты токенов, которые продаются у языковых моделей, имеют ограничение по времени? Кирилл поделится опытом нестандартного использования ЛЛМ в предсказании временных рядов с помощью языковых моделей и создании рекомендательных систем на базе ЛЛМ. А также расскажет о практических ограничениях, которые делают их скорее эффектными, чем эффективными в реальных задачах.
6⃣ Секция ML&DS: «Синтез визуального контента в Т-Банке: подводные камни инференса генеративных моделей», Елена Шевченко, ML TeamLead
Вы узнаете, как в Т-Банке разработали платформу для генерации визуального контента и решили ключевые проблемы инференса сложных пайплайнов из ансамблей моделей. А также почему использование статичных весов и популярные оптимизации на практике могут замедлять инференс и привести к неэффективному использованию GPU и как найти баланс между гибкостью, стабильностью и производительностью решений.
📌 Встречаемся 25 апреля на DUMP 2025, который пройдет в Екатеринбург-Экспо. Билеты на сайте еще есть, но скоро закончатся.
Передача информации внутри продуктовой воронки — всегда болезненная тема, особенно если длина воронки во времени растягивается на десятки дней. В Яндекс Рекламе для обучения нейронных сетей критически важна актуальная информация о том, как пользователь пришёл к покупке товара на сайте. Максим расскажет, как в компании пришли к основанной на множестве stateful процессингов шине данных, перед этим перебрав разные способы сбора. Какие оптимизации применили и с какими трудностями столкнулись на пути.
Сборка мусора — довольно сложный механизм. В большинстве managed языков runtime скрывает от нас детали дислокации памяти. С другой стороны, выбор определённого сборщика мусора может существенно улучшить производительность. Поговорим о том, какие алгоритмы сборки мусора бывают, какие бывают концептуальные трейд оффы при их использовании, и какой алгоритм вам может подойти больше всего.
Обсудим проблему обновления статики Next. js (или любого приложения со статикой) при деплое в несколько ЦОДов (облаков). Разберём, почему стандартные решения вроде S3 и Blue-Green деплоя могут не подойти и какие сложности создают. Георгий поделится подходом к синхронизации статики, включая кастомные манифесты, скрипты очистки и возможности Next. JS и расскажет, как можно решить проблему устаревшей статики у пользователей.
Чтобы о вашем проекте узнали, его недостаточно просто сделать. Его нужно упаковать и рассказать о нём. После того, как проект закончился, эта процедура кажется сложной, тяжёлой и откладывается, затем снова откладывается, ещё и ещё раз, пока проект не протухает. Поговорим о том, как быстро, на лёгких вайбах упаковать дизайн-результаты через тексто-графические артефакты. Будут байки про шоурилы, сложность написания поста и форматы коммуникации с аудиторией.
Вы знали, что пакеты токенов, которые продаются у языковых моделей, имеют ограничение по времени? Кирилл поделится опытом нестандартного использования ЛЛМ в предсказании временных рядов с помощью языковых моделей и создании рекомендательных систем на базе ЛЛМ. А также расскажет о практических ограничениях, которые делают их скорее эффектными, чем эффективными в реальных задачах.
Вы узнаете, как в Т-Банке разработали платформу для генерации визуального контента и решили ключевые проблемы инференса сложных пайплайнов из ансамблей моделей. А также почему использование статичных весов и популярные оптимизации на практике могут замедлять инференс и привести к неэффективному использованию GPU и как найти баланс между гибкостью, стабильностью и производительностью решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤1👍1👏1
Свободных билетов на DUMP 2025 все меньше, а крутых докладов в программе — все больше. Продолжаем знакомить вас с ними.
1️⃣ Секция Backend: «Как масштабировать реляционные базы данных в условиях взрывного роста трафика?», Григорий Богданов, Head of backend, Altenar
Григорий расскажет, какие практики помогли сохранить работоспособность проекта, который в течение года вырос с 300rps до 3000rps. Речь пойдет не столько про стандартные способы оптимизации (индексы, кеш, увеличение мощности сервера), сколько про денормализацию, прекалькуляцию и партиционирование. Где данные практики могут помочь, а где и навредить.
2️⃣ Секция Frontend: «Advanced TypeScript: тестирование сложных утилитарных типов в реальных проектах», Константин Логиновских, ведущий разработчик, Cloud.ru
Сегодня уже не найти фронтенд-разработчика, среди скиллов которого нет Typenoscript’a. Но как же разработчик решает, что TypeSrcipt освоен? Скорее всего, он запомнил примитивы, шапочно разобрался с ключевыми словами и операторами, посмотрел в сборщики, после чего пожал плечами и добавил язык себе в резюме. Константин расскажет, как он на практике понял, насколько это не так.
3️⃣ Секция Design: «Нейросети: дизайн с ИИ, а не против», Екатерина Торохова, старший графический дизайнер в отделе физических объектов и СТМ, ecom.tech
Екатерина расскажет, как в компании начали использовать нейросети в дизайне, до того, как это стало мейнстримом. Покажет реальные кейсы: что получилось, а что провалилось. И поделится советами по интеграции нейросетей в работу так, чтобы они действительно экономили время, а не создавали проблемы.
4️⃣ Секция Product: «Карта пути клиента как место встречи с продажами и маркетингом: как на каждом этапе понять, кто абьюзер», Наталия Потёмина, генеральный директор, ChessKnock
На примере кейсов поговорим о том, во сколько обходится дыра в коммуникациях, где обязательные точки синхронизации и как именно объяснять коммерсам, чего вы от них хотите, а чего делать не нужно. Узнаете, когда начинать генерить спрос на новый продукт и как проводить кастдевы, чтобы получать чистое мнение клиента без примеси фантазий сейлзов. А еще получите чек-листы по настройке коммуникаций с коммерцией и кастдеву руками внутренней и внешней команды.
5️⃣ Секция ML&DS: «LLM self-play v0: синтетические данные pretrain», Иван Басков, SberDevices
Большие языковые модели сегодня обучаются преимущественно на данных, созданных или размеченных людьми, что ограничивает их способность существенно превосходить человеческие возможности. Познакомимся с концепцией синтетических данных как первой версии self-play для языковых моделей, вдохновлённой опытом AlphaGo и подтверждённая успехом phi-4 от Microsoft Research. Доклад освещает такие конкретные техники генерации данных как instruction reversal и self-revision.
6️⃣ Секция Platform Engineering: «Распределённая инфраструктура k8s. О чём не напишут в статьях», Владислав Гладких, инженер DevOps, Точка
Многие команды разработки внедрили Kubernetes в production как облачный сервис или bare-metal реализацию. В Точке bare-metal k8s стал основой внутренней платформы для разработчиков, которая должна быть отказоустойчивой, поэтому он живёт в нескольких цодах. Владислав поделится экспертизой в расселении Kubernetes в разные цоды; расскажет, с какими проблемами столкнулись при внедрении DevOps практик, как решались вопросы межцодной коммуникации между ресурсами внутри K8s и каким образом обеспечивается доступность ресурсов при сбоях в облаке или датацентре.
📌 Встречаемся 25 апреля на DUMP 2025, который пройдет в Екатеринбург-Экспо. Большая программа докладов, воркшопы, круглые столы, нетворкинг и афтепати. Билеты на сайте
Григорий расскажет, какие практики помогли сохранить работоспособность проекта, который в течение года вырос с 300rps до 3000rps. Речь пойдет не столько про стандартные способы оптимизации (индексы, кеш, увеличение мощности сервера), сколько про денормализацию, прекалькуляцию и партиционирование. Где данные практики могут помочь, а где и навредить.
Сегодня уже не найти фронтенд-разработчика, среди скиллов которого нет Typenoscript’a. Но как же разработчик решает, что TypeSrcipt освоен? Скорее всего, он запомнил примитивы, шапочно разобрался с ключевыми словами и операторами, посмотрел в сборщики, после чего пожал плечами и добавил язык себе в резюме. Константин расскажет, как он на практике понял, насколько это не так.
Екатерина расскажет, как в компании начали использовать нейросети в дизайне, до того, как это стало мейнстримом. Покажет реальные кейсы: что получилось, а что провалилось. И поделится советами по интеграции нейросетей в работу так, чтобы они действительно экономили время, а не создавали проблемы.
На примере кейсов поговорим о том, во сколько обходится дыра в коммуникациях, где обязательные точки синхронизации и как именно объяснять коммерсам, чего вы от них хотите, а чего делать не нужно. Узнаете, когда начинать генерить спрос на новый продукт и как проводить кастдевы, чтобы получать чистое мнение клиента без примеси фантазий сейлзов. А еще получите чек-листы по настройке коммуникаций с коммерцией и кастдеву руками внутренней и внешней команды.
Большие языковые модели сегодня обучаются преимущественно на данных, созданных или размеченных людьми, что ограничивает их способность существенно превосходить человеческие возможности. Познакомимся с концепцией синтетических данных как первой версии self-play для языковых моделей, вдохновлённой опытом AlphaGo и подтверждённая успехом phi-4 от Microsoft Research. Доклад освещает такие конкретные техники генерации данных как instruction reversal и self-revision.
Многие команды разработки внедрили Kubernetes в production как облачный сервис или bare-metal реализацию. В Точке bare-metal k8s стал основой внутренней платформы для разработчиков, которая должна быть отказоустойчивой, поэтому он живёт в нескольких цодах. Владислав поделится экспертизой в расселении Kubernetes в разные цоды; расскажет, с какими проблемами столкнулись при внедрении DevOps практик, как решались вопросы межцодной коммуникации между ресурсами внутри K8s и каким образом обеспечивается доступность ресурсов при сбоях в облаке или датацентре.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥5👏2👍1
До DUMP 2025 остался один месяц! Спикеры дорабатывают презентации, а мы продолжаем рассказывать о том, что они приготовили, чтобы вы могли заранее спланировать свой маршрут по конференции. Честно — задача не из легких, потому что во всех секциях есть, что послушать.
1⃣ Секция Platform Engineering: «Metacontroller. Как превратить adhoc скрипты в полноценный gitops», Алексей Кузнецов, cloud engineer, Positive Technologies
Вы узнаете как используются gitops инструменты, вспомните, что такое операторы в k8s и что делать, если их функциональности не хватает. Алексей подробно разберет инструмент metacontroller и его применение на примере создания объектов команд разработчиков в инфраструктурных сервисах — таких как opensearch и sentry.
2⃣ Секция Backend: «Взлёт, закат и ренессанс С++», Владимир Невзоров, старший разработчик, Servicepipe
Многие знают, что С++ огромен. Не все знают, что он значительно омолодился. И не только лишь все слышали, что недавно он занял призовое место в TIOBE. Как он это сделал? Поговорим про рождение языка. Увидим, почему он чуть не канул в лету. И возродился, как птица феникс, чтобы засиять ещё ярче.
3⃣ Секция Design: «Готовим борщ без регистрации и смс: исследования от ecom.tech», Данил Чувашов, руководитель группы исследований пользовательского опыта клиентских продуктов, ecom.tech
Погрузимся в проект, который начался с идеи доставки продуктов для борща и вылился в масштабный сервис. Поговорим, как выкрутить исследования на максимум и использовать на каждом этапе разработки — от discovery до тестового запуска — чтобы подтвердить гипотезы, найти инсайты и создать продукт, который понравится пользователям.
4⃣ Секция Team: «Как научиться делегировать раз и навсегда», Илья Прахт, тренер, консультант, ментор
«Не делегируется!» — топ-1 проблема, которую прожил и прострадал каждый руководитель. Делегирование — мета-скилл, который развивается вместе с нами. И раз за разом вызывает сложности. Илья расскажет, как их побеждать, как научиться делегировать и какие инструменты в этом помогают. Без воды, с конкретикой и примерами из жизни разных руководителей. На выходе получите четкий чеклист.
5⃣ Секция Product: «Как растить лояльность пользователей через мотивационные механики и геймификацию. Успехи и лернинги Авито», Ольга Фахразиева, менеджер продукта, Авито
Узнаете, почему мотивационные программы и геймификация стали важным инструментом для повышения вовлечённости и лояльности пользователей, и как на Авито использовали опыт лидеров рынка при создании программы «Портал призов». Что при запуске программы сработало хорошо, а что не оправдало ожиданий. Рассмотрим на примере, как измерять эффективность сложных продуктов, какие метрики важно отслеживать и как избежать типичных ошибок и каннибализации.
6⃣ Секция Backend: «Подходы к обеспечению информационной безопасности на практике», Алексей Цилябин, разработчик, Лаборатория Касперского
Безопасность воспринимается всеми по-разному, но каждый человек осознаёт потенциальные проблемы, связанные с ней. Алексей расскажет про часто встречающиеся проблемы безопасности, но основной разговор пойдёт про разработку.
Поговорим про паттерны, цели и предположения безопасности, как с их помощью сделать разработку безопасных систем проще, а также рассмотрим практический пример их применения.
📌 25 апреля встречаемся в Экспо-Екатеринбург на DUMP 2025. Кстати, с 1 апреля повышение цены, и это не шутки. Так что не откладывайте покупку билетов в долгий ящик.
Вы узнаете как используются gitops инструменты, вспомните, что такое операторы в k8s и что делать, если их функциональности не хватает. Алексей подробно разберет инструмент metacontroller и его применение на примере создания объектов команд разработчиков в инфраструктурных сервисах — таких как opensearch и sentry.
Многие знают, что С++ огромен. Не все знают, что он значительно омолодился. И не только лишь все слышали, что недавно он занял призовое место в TIOBE. Как он это сделал? Поговорим про рождение языка. Увидим, почему он чуть не канул в лету. И возродился, как птица феникс, чтобы засиять ещё ярче.
Погрузимся в проект, который начался с идеи доставки продуктов для борща и вылился в масштабный сервис. Поговорим, как выкрутить исследования на максимум и использовать на каждом этапе разработки — от discovery до тестового запуска — чтобы подтвердить гипотезы, найти инсайты и создать продукт, который понравится пользователям.
«Не делегируется!» — топ-1 проблема, которую прожил и прострадал каждый руководитель. Делегирование — мета-скилл, который развивается вместе с нами. И раз за разом вызывает сложности. Илья расскажет, как их побеждать, как научиться делегировать и какие инструменты в этом помогают. Без воды, с конкретикой и примерами из жизни разных руководителей. На выходе получите четкий чеклист.
Узнаете, почему мотивационные программы и геймификация стали важным инструментом для повышения вовлечённости и лояльности пользователей, и как на Авито использовали опыт лидеров рынка при создании программы «Портал призов». Что при запуске программы сработало хорошо, а что не оправдало ожиданий. Рассмотрим на примере, как измерять эффективность сложных продуктов, какие метрики важно отслеживать и как избежать типичных ошибок и каннибализации.
Безопасность воспринимается всеми по-разному, но каждый человек осознаёт потенциальные проблемы, связанные с ней. Алексей расскажет про часто встречающиеся проблемы безопасности, но основной разговор пойдёт про разработку.
Поговорим про паттерны, цели и предположения безопасности, как с их помощью сделать разработку безопасных систем проще, а также рассмотрим практический пример их применения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤3👏2
Все меньше времени до старта DUMP 2025, все меньше билетов в продаже. А мы продолжаем рассказывать о докладах, которые вы услышите на конференции в этом году.
1⃣ Секция Backend: «Как избежать регулярной катастрофы? Учимся на чужих ошибках», Алексей Лобанов, TechLead, SberDevices
Часто регулярные выражения приводят как пример идеального write-only кода. Сложно читать, сложно изменять, но хотя бы быстро работают. Или не всегда быстро? Алексей посмотрит на регулярные выражения с точки зрения производительности, разберет понятие backtracking’а и покажет, как с ним справляются разные библиотеки. Расскажет про свой PR в Pydantic, который закрыл, возможно, и вашу уязвимость. Вы получите рекомендации для возможного обхода и гарантированного решения подобных проблем. Бенчмарки и примеры будут на Python, но основной материал релевантен без привязки к языку.
2⃣ Секция Design: «Практическое руководство по переезду на новый фронт», Анастасия Шаповалова, продуктовый дизайнер, Naumen
Анастасия поделится историей о том, как в компании перевозили продукт на новый фронт и зачем вообще всё это. Расскажет, где всё сделали правильно, а в каких моментах облажались, что с этим делали и какие уроки получили. Ну и конечно же, будут советы, как другим командам на наступить на те же грабли.
3⃣ Секция Team: «Кратное ускорение через сворминг», Илья Павличенко, консультант по организационному дизайну, Agile организации
Узнаете, как кратно (2x-6x) ускорить разработку с помощью сворминга (Swarming) — подхода, когда вся команда работает над одним элементом.
4⃣ Секция Platform Engineering: «FinOps в гибридной инфраструктуре», Татьяна Зуева, разработчик, Точка
Татьяна расскажет об опыте создания внутренней биллинговой платформы. Как «продавать» внутреннюю платформу как настоящее облако, и когда пора начинать это делать. Как считать стоимость всех вычислительных ресурсов и стоимость каждого сервиса, если вы живёте в нескольких физических ЦОДах и в нескольких приватных и публичных облаках. Кому это вообще нужно и какие «боли» может закрыть.
5⃣ Секция Science: «В дороге. Как мы искали планеты у других звёзд», Вадим Крушинский, Коуровская астрономическая обсерватория УРФУ
Нет ничего более беспомощного, безответственного и бесполезного, чем учёные, работающие на голом энтузиазме. Поэтому для поиска пока неоткрытой экзопланеты Вадим использовал ещё и две цифровые камеры, небольшой телескоп, стандартные фильтры, несколько неплохих компьютеров, три месяца коротких летних ночей, справочник по языку Си и целое множество программ для обработки данных, а также небольшую поддержку любителей астрономии. Как это было — расскажет в докладе.
6⃣ Секция TechLead: «Как компании подготовиться и пережить HighSeason, если вводных мало», Вячеслав Кудряшов, исполнительный директор, Сбер
Обеспечение работоспособности систем в периоды пиковых нагрузок – это одна из важнейших задач, которую решает сопровождение. В последние годы она значительно усложнилась. Причинами этого стали в основном непрогнозируемо меняющийся профиль нагрузки на системы (геополитическая ситуация, пандемия), а также изменение архитектуры самих систем и миграция в рамках вендорозамещения. Из доклада вы узнаете, как команда Сбера адаптировалась к новым реалиям и использует комплексный подход для подготовки к HighSeason.
Уже на следующей неделе цена на билеты поднимется. Присоединяйтесь к большой душевной конференции DUMP, которая состоится 25 апреля в Екатеринбург Экспо. До встречи!😌
Часто регулярные выражения приводят как пример идеального write-only кода. Сложно читать, сложно изменять, но хотя бы быстро работают. Или не всегда быстро? Алексей посмотрит на регулярные выражения с точки зрения производительности, разберет понятие backtracking’а и покажет, как с ним справляются разные библиотеки. Расскажет про свой PR в Pydantic, который закрыл, возможно, и вашу уязвимость. Вы получите рекомендации для возможного обхода и гарантированного решения подобных проблем. Бенчмарки и примеры будут на Python, но основной материал релевантен без привязки к языку.
Анастасия поделится историей о том, как в компании перевозили продукт на новый фронт и зачем вообще всё это. Расскажет, где всё сделали правильно, а в каких моментах облажались, что с этим делали и какие уроки получили. Ну и конечно же, будут советы, как другим командам на наступить на те же грабли.
Узнаете, как кратно (2x-6x) ускорить разработку с помощью сворминга (Swarming) — подхода, когда вся команда работает над одним элементом.
Татьяна расскажет об опыте создания внутренней биллинговой платформы. Как «продавать» внутреннюю платформу как настоящее облако, и когда пора начинать это делать. Как считать стоимость всех вычислительных ресурсов и стоимость каждого сервиса, если вы живёте в нескольких физических ЦОДах и в нескольких приватных и публичных облаках. Кому это вообще нужно и какие «боли» может закрыть.
Нет ничего более беспомощного, безответственного и бесполезного, чем учёные, работающие на голом энтузиазме. Поэтому для поиска пока неоткрытой экзопланеты Вадим использовал ещё и две цифровые камеры, небольшой телескоп, стандартные фильтры, несколько неплохих компьютеров, три месяца коротких летних ночей, справочник по языку Си и целое множество программ для обработки данных, а также небольшую поддержку любителей астрономии. Как это было — расскажет в докладе.
Обеспечение работоспособности систем в периоды пиковых нагрузок – это одна из важнейших задач, которую решает сопровождение. В последние годы она значительно усложнилась. Причинами этого стали в основном непрогнозируемо меняющийся профиль нагрузки на системы (геополитическая ситуация, пандемия), а также изменение архитектуры самих систем и миграция в рамках вендорозамещения. Из доклада вы узнаете, как команда Сбера адаптировалась к новым реалиям и использует комплексный подход для подготовки к HighSeason.
Уже на следующей неделе цена на билеты поднимется. Присоединяйтесь к большой душевной конференции DUMP, которая состоится 25 апреля в Екатеринбург Экспо. До встречи!😌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤1