В эпоху больших данных и возрастающих вычислительных нагрузок производительность Spark-приложений становится критически важной для бизнеса🔗
Data Engineer команды Голосовой Антифрод в билайн Александр Маркачев поделится опытом оптимизации Spark-кода на реальных задачах: расскажет, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов. Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения.
👉 Подробности в статье
Сохраняйте себе, чтобы прочитать, когда будет удобно🖇️
Data Engineer команды Голосовой Антифрод в билайн Александр Маркачев поделится опытом оптимизации Spark-кода на реальных задачах: расскажет, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов. Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения.
Сохраняйте себе, чтобы прочитать, когда будет удобно🖇️
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Как мигрировать с OpenShift на любой дистрибутив Kubernetes без единой правки
После ухода известных вендоров у многих возникла задача импортозамещения и миграции между платформами контейнеризации. В этой статье разберём опыт решения этой задачи и как свести к минимуму...
👍3
Какие темы вам наиболее интересны?👀
Anonymous Poll
10%
Основы аналитики данных
19%
Визуализация данных
14%
Машинное обучение
48%
Работа с большими данными
5%
Этические аспекты аналитики
5%
Напишу в комментариях свой вариант
Как Netflix угадывает ваши желания? Почему Starbucks открывает новые точки именно там, где надо, а российские IT-гиганты строят сервисы, опережая конкурентов?🤔
Всё это возможно благодаря Data-Driven подходу, который позволяет принимать решения на основе данных, а не интуиции. Но чтобы этот подход действительно работал, важно понимать, какие метрики реально важны, как не утонуть в данных и не потратить лишнего на хранение, а что делать c «грязными» данными. Об этом и многом другом на примере реальных кейсов расскажет руководитель направления в KION и член программного комитета конференции Data Internals Алексей Жиряков
👉 Читать статью здесь
Ставьте ❤️, если было полезно
Всё это возможно благодаря Data-Driven подходу, который позволяет принимать решения на основе данных, а не интуиции. Но чтобы этот подход действительно работал, важно понимать, какие метрики реально важны, как не утонуть в данных и не потратить лишнего на хранение, а что делать c «грязными» данными. Об этом и многом другом на примере реальных кейсов расскажет руководитель направления в KION и член программного комитета конференции Data Internals Алексей Жиряков
Ставьте ❤️, если было полезно
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Data-Driven: от интуиции к фактам, и при чем тут data internals?
Netflix сделал ставку на то, чтобы у каждого нового зрителя в списке просмотров было минимум три фильма или сериала «на потом». Для этого они упрощают интерфейс, мотивируют добавлять контент в очередь...
❤4👍2
Конференция, которую нельзя пропустить Data-инженерам🔥
23 сентября в Москве пройдет Data Internals X 2025 - профессиональная конференция по инженерии данных, базам данных и системам хранения и обработки данных.
Что ждет участников на площадке?
👉 Доклады, подготовленные по высоким стандартам наших привычных конференций: HighLoad++, TeamLead, DevOps Conf и других.
👉 Общение со спикерами
👉 Плодотворный нетворкинг
👉 Кофе-брейки и обеды
Ключевые темы конференции:
🟣 Разработка СУБД и инструментов работы с данными
🟣 Архитектура данных
🟣 Управление данными
🟣 Практические примеры внедрений
🟣 Машинное обучение и искусственный интеллект
🟣 И другие темы, связанные с процессами работы с данными
❗️ Сейчас у вас есть возможность купить билет по минимальной стоимости — чем ближе конференция, тем выше будет цена. Первое повышение уже с 1 июня. Вы можете забронировать билет заранее, а оплатить в течение нескольких дней.
Увидимся 23 сентября в Москве на Data Internals X 2025!
✔️ Узнать подробнее о конференции и забронировать билет можно на сайте
23 сентября в Москве пройдет Data Internals X 2025 - профессиональная конференция по инженерии данных, базам данных и системам хранения и обработки данных.
Что ждет участников на площадке?
Ключевые темы конференции:
Увидимся 23 сентября в Москве на Data Internals X 2025!
Please open Telegram to view this post
VIEW IN TELEGRAM
datainternals.ru
Профессиональная конференция по инженерии данных, базам данных и системам хранения
и обработки данных 2025
и обработки данных 2025
❤1
Data Internals pinned «Конференция, которую нельзя пропустить Data-инженерам🔥 23 сентября в Москве пройдет Data Internals X 2025 - профессиональная конференция по инженерии данных, базам данных и системам хранения и обработки данных. Что ждет участников на площадке? 👉 Доклады,…»
За счет правильных, даже необязательно новых, а просто верно выбранных архитектурных подходов можно заставить работать не один конкретный запрос, а тысячу или даже миллион.
Это становится краеугольным камнем, потому что объемы данных растут с такой скоростью, которую мы даже представить себе не могли еще пять лет назад. Так считает наш сегодняшний гость — Дмитрий Немчин, руководитель направления эксплуатации инфраструктуры данных в Т-Банке и по совместительству член программного комитета Data Internals.
О том, как решать проблемы, связанные с ростом объемов данных и необходимостью управления ресурсами, и как дата-инженеру остаться востребованным Дмитрий рассказал в этом интервью ✅
Это становится краеугольным камнем, потому что объемы данных растут с такой скоростью, которую мы даже представить себе не могли еще пять лет назад. Так считает наш сегодняшний гость — Дмитрий Немчин, руководитель направления эксплуатации инфраструктуры данных в Т-Банке и по совместительству член программного комитета Data Internals.
О том, как решать проблемы, связанные с ростом объемов данных и необходимостью управления ресурсами, и как дата-инженеру остаться востребованным Дмитрий рассказал в этом интервью ✅
Хабр
Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов
За счёт правильных, даже необязательно новых, а просто верно выбранных архитектурных подходов можно заставить работать не один конкретный запрос, а тысячу или даже миллион. Это становится...
👍3
Самые полезные материалы в одном месте
Качественная аналитика требует не только навыков, но и правильных источников знаний. Мы собрали материалы, которые станут вашим секретным инструментом — от базовых принципов до продвинутых техник. Готовы раскрыть потенциал данных? Тогда переходите по ссылкам ниже👇🏻
👉Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов
👉Data-Driven: от интуиции к фактам, и при чем тут data internals?
👉Как мигрировать с OpenShift на любой дистрибутив Kubernetes без единой правки
👉Как я оставила печати и взяла SQL: путь к Data Quality
👉Эволюция Redis в Valkey 8.0: разбираем архитектурные изменения с точки зрения производительности
👉Как мы заменили сотни Join’ов на один РТ-процессинг с 1kk RPS
Обязательно сохраняйте себе подборку и ставьте любую реакцию, если было полезно!
Качественная аналитика требует не только навыков, но и правильных источников знаний. Мы собрали материалы, которые станут вашим секретным инструментом — от базовых принципов до продвинутых техник. Готовы раскрыть потенциал данных? Тогда переходите по ссылкам ниже👇🏻
👉Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов
👉Data-Driven: от интуиции к фактам, и при чем тут data internals?
👉Как мигрировать с OpenShift на любой дистрибутив Kubernetes без единой правки
👉Как я оставила печати и взяла SQL: путь к Data Quality
👉Эволюция Redis в Valkey 8.0: разбираем архитектурные изменения с точки зрения производительности
👉Как мы заменили сотни Join’ов на один РТ-процессинг с 1kk RPS
Обязательно сохраняйте себе подборку и ставьте любую реакцию, если было полезно!
🔥3❤1
Как связаны скидки, пользовательский путь и петабайты данных в Яндекс Рекламе?
Ответ в этой статье 🔥
Автор материала Максим Стаценко работает в Яндексе в DWH поиска и рекламы. В статье он подробно рассказывает о том, как они смогли отказаться от сотен тяжёлых Joinов и Mapreduce в пользу Stateful Streaming и Key-value Storage. И делится опытом построения системы, которая обрабатывает миллион запросов в секунду, хранит всю историю событий в одном месте и позволяет быстро находить нужные данные для антифрода и аналитики (даже когда цепочка событий растягивается на 100 дней).
Ответ в этой статье 🔥
Автор материала Максим Стаценко работает в Яндексе в DWH поиска и рекламы. В статье он подробно рассказывает о том, как они смогли отказаться от сотен тяжёлых Joinов и Mapreduce в пользу Stateful Streaming и Key-value Storage. И делится опытом построения системы, которая обрабатывает миллион запросов в секунду, хранит всю историю событий в одном месте и позволяет быстро находить нужные данные для антифрода и аналитики (даже когда цепочка событий растягивается на 100 дней).
Хабр
Как мы заменили сотни Join’ов на один РТ-процессинг с 1kk RPS
Как связаны скидки, пользовательские пути и огромные массивы данных в Яндекс Рекламе? Привет, Хабр! Меня зовут Максим Стаценко, я работаю с базами данных и яростно в них копаюсь с 2010 года, а в...
❤2👍2
Кто стоит за программой Data Internals Conf X?
Конечно же, Программный комитет 👀
В ПК Data Internals Conf X мы пригласили не просто теоретиков, а практиков с «петабайтным» опытом. Именно эти люди отбирают самые лучшие доклады и готовят действительно актуальную, полезную и захватывающую программу.
Оставляйте любую реакцию, а мы расскажем про остальных членов ПК в следующих постах 🤍
Конечно же, Программный комитет 👀
В ПК Data Internals Conf X мы пригласили не просто теоретиков, а практиков с «петабайтным» опытом. Именно эти люди отбирают самые лучшие доклады и готовят действительно актуальную, полезную и захватывающую программу.
Оставляйте любую реакцию, а мы расскажем про остальных членов ПК в следующих постах 🤍
❤4👍3🔥1
Media is too big
VIEW IN TELEGRAM
Что интересного на конференции кроме докладов? 👀
Помимо насыщенной программы, Data Internals Conf X, как и все Х конференции, отличается большими возможностями для нетворкинга и особенной ламповой атмосферой.
Но лучше один раз увидеть как проходят мероприятия Онтико, чем сто раз об этом прочитать. Делимся атмосферным видео с другой X конференции — AiConf ❤️🔥
Купить билет на конференцию до повышения цен 👈
Помимо насыщенной программы, Data Internals Conf X, как и все Х конференции, отличается большими возможностями для нетворкинга и особенной ламповой атмосферой.
Но лучше один раз увидеть как проходят мероприятия Онтико, чем сто раз об этом прочитать. Делимся атмосферным видео с другой X конференции — AiConf ❤️🔥
Купить билет на конференцию до повышения цен 👈
🔥3❤1
Как настроить ClickHouse для высокопроизводительной BI отчётности? 👀
Вопрос, на который у нас уже есть ответ!
Аналитик данных Lenta Tech Михаил Кацуба поделится реальным опытом своей команды и расскажет о том, как они переводили тяжёлую отчётность с модели импорта Power BI на прямые запросы DataLens + ClickHouse.
Подробнее ознакомиться с тезисами Михаила можно здесь
Вопрос, на который у нас уже есть ответ!
Аналитик данных Lenta Tech Михаил Кацуба поделится реальным опытом своей команды и расскажет о том, как они переводили тяжёлую отчётность с модели импорта Power BI на прямые запросы DataLens + ClickHouse.
После ухода Power BI столкнулись с тем, что пока нет хороших решений, где можно просто загрузить данные в систему отчётности и отчёт будет работать на мощном облачном сервере более-менее терпимо, даже при объёме данный в миллиарды строк <...> В итоге разобрались как настраивать ClickHouse для высокопроизводительной BI отчётности и готовы поделиться опытом
Подробнее ознакомиться с тезисами Михаила можно здесь
🔥4👍3
⚡До повышения цены осталось 3 дня
Вы можете приобрести билет прямо сейчас, а можете просто зафиксировать текущую цену, если забронируете билет до 30 июня. После брони оплатить можно будет в течение нескольких дней.
Хорошая возможность для тех, кто хочет ознакомиться с полной программой Data Internals Conf X перед покупкой.
Изучить расписание и приобрести билеты можно на нашем сайте
Вы можете приобрести билет прямо сейчас, а можете просто зафиксировать текущую цену, если забронируете билет до 30 июня. После брони оплатить можно будет в течение нескольких дней.
Хорошая возможность для тех, кто хочет ознакомиться с полной программой Data Internals Conf X перед покупкой.
Изучить расписание и приобрести билеты можно на нашем сайте
👍3❤2
Как подготовить платформу данных к миграции уже сейчас?
Своим опытом решения проблем и готовым планом действий поделится Владислав Заболоцкий из Райффайзен Банк, дата-инженер в команде AI Assistants, ранее SAS разработчик и системный аналитик.
С чего начать миграцию? Как подготовить большую платформу к этому процессу? Какими способами решать проблемы сотсутствия информации о владении объектов, отключения неактуальных процессов, расхождения расчетов и т.д.?
Узнать ответы на все эти вопросы вы сможете 23 сентября на Data Internals Conf X
Полная программа конференции и расписание на нашем сайте
Своим опытом решения проблем и готовым планом действий поделится Владислав Заболоцкий из Райффайзен Банк, дата-инженер в команде AI Assistants, ранее SAS разработчик и системный аналитик.
С чего начать миграцию? Как подготовить большую платформу к этому процессу? Какими способами решать проблемы сотсутствия информации о владении объектов, отключения неактуальных процессов, расхождения расчетов и т.д.?
Узнать ответы на все эти вопросы вы сможете 23 сентября на Data Internals Conf X
Полная программа конференции и расписание на нашем сайте
🔥3❤2
Конференция, на которую нужно прийти Data Engineers🔥
А также разработчикам СУБД, архитекторам высоконагруженных систем, системным программистам и DBA с техническим уклоном
23 сентября в Москве пройдет Data Internals X 2025 — единственная в России конференция, где создатели СУБД и движков обработки данных делятся опытом работы с реальными production-системами экстремального масштаба. Вас ждёт по-настоящему "хардкорная" программа.
🎯 Глубина технических решений
Программа конференции сфокусирована на внутренних механизмах работы с данными — от разработки СУБД до оптимизации запросов и устойчивости к высоким нагрузкам. Это редкая возможность погрузиться в технические детали, которые обычно остаются за кадром.
🏭 Практический опыт масштабирования
Все доклады основаны на реальном опыте работы с петабайтными данными, высоконагруженными системами и решением production-задач в крупных компаниях (Яндекс, Сбер, VK, Т-Банк).
🔧 Импортозамещение и Open Source
Особый акцент на отечественные решения и open-source технологии, что критически важно в текущих реалиях.
🧠 Концентрированный опыт
Максимум пользы для повышения квалификации за один день: 30+ докладов, рекордная плотность экспертных знаний и нетворкинг с 300+ участниками.
❗️ Сейчас у вас есть возможность купить билет по выгодной цене. Следующее повышение стоимости билета уже 1 августа. Вы можете забронировать билет заранее, а оплатить в течение нескольких дней.
Увидимся 23 сентября в Москве на Data Internals X 2025!
А также разработчикам СУБД, архитекторам высоконагруженных систем, системным программистам и DBA с техническим уклоном
23 сентября в Москве пройдет Data Internals X 2025 — единственная в России конференция, где создатели СУБД и движков обработки данных делятся опытом работы с реальными production-системами экстремального масштаба. Вас ждёт по-настоящему "хардкорная" программа.
🎯 Глубина технических решений
Программа конференции сфокусирована на внутренних механизмах работы с данными — от разработки СУБД до оптимизации запросов и устойчивости к высоким нагрузкам. Это редкая возможность погрузиться в технические детали, которые обычно остаются за кадром.
🏭 Практический опыт масштабирования
Все доклады основаны на реальном опыте работы с петабайтными данными, высоконагруженными системами и решением production-задач в крупных компаниях (Яндекс, Сбер, VK, Т-Банк).
🔧 Импортозамещение и Open Source
Особый акцент на отечественные решения и open-source технологии, что критически важно в текущих реалиях.
🧠 Концентрированный опыт
Максимум пользы для повышения квалификации за один день: 30+ докладов, рекордная плотность экспертных знаний и нетворкинг с 300+ участниками.
Увидимся 23 сентября в Москве на Data Internals X 2025!
Please open Telegram to view this post
VIEW IN TELEGRAM
datainternals.ru
Профессиональная конференция по инженерии данных, базам данных и системам хранения
и обработки данных 2025
и обработки данных 2025
❤🔥2👍1
Кто расскажет вам о конференциях Онтико лучше и правдивее, чем коллеги по цеху?
Участник HighLoad++ Илья Левченко о пользе конференций и нетворкинга:
Участник HighLoad++ Илья Левченко о пользе конференций и нетворкинга:
Если ты хочешь быть круче остальных, если ты хочешь быть умнее остальных, если ты хочешь следить за новинками, если ты хочешь просто вливаться в IT-индустрию, ты должен, обязан знать остальных крутых спикеров и людей. Ты должен с ними общаться, забирать от них энергию. <...> участвовать в таких форматах, где участвует куча таких же специалистов, как ты, вы обмениваетесь опытом и все вместе растете
❤3👍2