Data Internals – Telegram
Data Internals
226 subscribers
78 photos
16 videos
1 file
72 links
Канал профессиональной конференции по инженерии данных, базам данных, системам хранения и обработки данных

Сайт: datainternals.ru
Чат: t.me/dataengineershub
Download Telegram
Уже завтра состоится встреча с ПК Data Internals🔥

⚫️Когда - 17 апреля
⚫️Во сколько - 18:00
⚫️Где - онлайн в Zoom
⚫️Для кого - для всех, кто хочет выступить на Data Internals X 2025

Вы узнаете, какие темы будут актуальны на конференции, что для нас важно при отборе заявок в программу и как проходит подготовка спикеров перед выступлением.

А также вы сможете задать свои вопросы комитету, в том числе по поводу ваших идей и предложений тем выступлений.

Для участия необходимо зарегистрироваться!

Ждем всех завтра, 17 апреля, в 18:00
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5👌3
У нас прошла встреча докладчиков с ПК Data Internals!

Вчера, 17 апреля, состоялась онлайн-встреча активистов программного комитета и потенциальных спикеров. Обсудили организационные моменты, помогли всем окончательно определиться с темой доклада и закрыли все сомнения.

Если у вас не получилось подключиться - ничего страшного. Прикрепляем запись, чтобы вы смогли посмотреть ее сейчас👇

Видео здесь

Также напоминаем, что у нас идет прием докладов на Data Internals X 2025! Если вам есть, чем поделиться с сообществом профессионалов, обязательно подавайте заявку👁️‍🗨️

Ждем ваших докладов и до встречи 23 сентября в Москве!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥52
В эпоху больших данных и возрастающих вычислительных нагрузок производительность Spark-приложений становится критически важной для бизнеса🔗

Data Engineer команды Голосовой Антифрод в билайн Александр Маркачев поделится опытом оптимизации Spark-кода на реальных задачах: расскажет, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов. Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения.

👉Подробности в статье

Сохраняйте себе, чтобы прочитать, когда будет удобно🖇️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Как Netflix угадывает ваши желания? Почему Starbucks открывает новые точки именно там, где надо, а российские IT-гиганты строят сервисы, опережая конкурентов?🤔

Всё это возможно благодаря Data-Driven подходу, который позволяет принимать решения на основе данных, а не интуиции. Но чтобы этот подход действительно работал, важно понимать, какие метрики реально важны, как не утонуть в данных и не потратить лишнего на хранение, а что делать c «грязными» данными. Об этом и многом другом на примере реальных кейсов расскажет руководитель направления в KION и член программного комитета конференции Data Internals Алексей Жиряков

👉Читать статью здесь

Ставьте ❤️, если было полезно
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2
Конференция, которую нельзя пропустить Data-инженерам🔥

23 сентября в Москве пройдет Data Internals X 2025 - профессиональная конференция по инженерии данных, базам данных и системам хранения и обработки данных.

Что ждет участников на площадке?
👉Доклады, подготовленные по высоким стандартам наших привычных конференций: HighLoad++, TeamLead, DevOps Conf и других.
👉Общение со спикерами
👉Плодотворный нетворкинг
👉Кофе-брейки и обеды

Ключевые темы конференции:
🟣Разработка СУБД и инструментов работы с данными
🟣Архитектура данных
🟣Управление данными
🟣Практические примеры внедрений
🟣Машинное обучение и искусственный интеллект
🟣И другие темы, связанные с процессами работы с данными

❗️Сейчас у вас есть возможность купить билет по минимальной стоимости — чем ближе конференция, тем выше будет цена. Первое повышение уже с 1 июня. Вы можете забронировать билет заранее, а оплатить в течение нескольких дней.

Увидимся 23 сентября в Москве на Data Internals X 2025!

✔️ Узнать подробнее о конференции и забронировать билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Data Internals pinned «Конференция, которую нельзя пропустить Data-инженерам🔥 23 сентября в Москве пройдет Data Internals X 2025 - профессиональная конференция по инженерии данных, базам данных и системам хранения и обработки данных. Что ждет участников на площадке? 👉Доклады,…»
За счет правильных, даже необязательно новых, а просто верно выбранных архитектурных подходов можно заставить работать не один конкретный запрос, а тысячу или даже  миллион.

Это становится краеугольным камнем, потому что объемы данных растут с такой скоростью, которую мы даже представить себе не могли еще пять лет назад. Так считает наш сегодняшний гость — Дмитрий Немчин, руководитель направления эксплуатации инфраструктуры данных в Т-Банке и по совместительству член программного комитета Data Internals.

О том, как решать проблемы, связанные с ростом объемов данных и необходимостью управления ресурсами, и как дата-инженеру остаться востребованным Дмитрий рассказал в этом интервью
👍3
Самые полезные материалы в одном месте

Качественная аналитика требует не только навыков, но и правильных источников знаний. Мы собрали материалы, которые станут вашим секретным инструментом — от базовых принципов до продвинутых техник. Готовы раскрыть потенциал данных? Тогда переходите по ссылкам ниже👇🏻

👉Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов

👉Data-Driven: от интуиции к фактам, и при чем тут data internals?

👉Как мигрировать с OpenShift на любой дистрибутив Kubernetes без единой правки

👉Как я оставила печати и взяла SQL: путь к Data Quality

👉Эволюция Redis в Valkey 8.0: разбираем архитектурные изменения с точки зрения производительности

👉Как мы заменили сотни Join’ов на один РТ-процессинг с 1kk RPS

Обязательно сохраняйте себе подборку и ставьте любую реакцию, если было полезно!
🔥31
Как связаны скидки, пользовательский путь и петабайты данных в Яндекс Рекламе?

Ответ в этой статье 🔥

Автор материала Максим Стаценко работает в Яндексе в DWH поиска и рекламы. В статье он подробно рассказывает о том, как они смогли отказаться от сотен тяжёлых Joinов и Mapreduce в пользу Stateful Streaming и Key-value Storage. И делится опытом построения системы, которая обрабатывает миллион запросов в секунду, хранит всю историю событий в одном месте и позволяет быстро находить нужные данные для антифрода и аналитики (даже когда цепочка событий растягивается на 100 дней).
2👍2
Кто стоит за программой Data Internals Conf X?

Конечно же, Программный комитет 👀

В ПК Data Internals Conf X мы пригласили не просто теоретиков, а практиков с «петабайтным» опытом. Именно эти люди отбирают самые лучшие доклады и готовят действительно актуальную, полезную и захватывающую программу.

Оставляйте любую реакцию, а мы расскажем про остальных членов ПК в следующих постах 🤍
4👍3🔥1
Media is too big
VIEW IN TELEGRAM
Что интересного на конференции кроме докладов? 👀

Помимо насыщенной программы, Data Internals Conf X, как и все Х конференции, отличается большими возможностями для нетворкинга и особенной ламповой атмосферой.

Но лучше один раз увидеть как проходят мероприятия Онтико, чем сто раз об этом прочитать. Делимся атмосферным видео с другой X конференции — AiConf ❤️‍🔥

Купить билет на конференцию до повышения цен 👈
🔥31
Как настроить ClickHouse для высокопроизводительной BI отчётности? 👀

Вопрос, на который у нас уже есть ответ!

Аналитик данных Lenta Tech Михаил Кацуба поделится реальным опытом своей команды и расскажет о том, как они переводили тяжёлую отчётность с модели импорта Power BI на прямые запросы DataLens + ClickHouse.

После ухода Power BI столкнулись с тем, что пока нет хороших решений, где можно просто загрузить данные в систему отчётности и отчёт будет работать на мощном облачном сервере более-менее терпимо, даже при объёме данный в миллиарды строк <...> В итоге разобрались как настраивать ClickHouse для высокопроизводительной BI отчётности и готовы поделиться опытом

Подробнее ознакомиться с тезисами Михаила можно здесь
🔥4👍3
До повышения цены осталось 3 дня

Вы можете приобрести билет прямо сейчас, а можете просто зафиксировать текущую цену, если забронируете билет до 30 июня. После брони оплатить можно будет в течение нескольких дней.

Хорошая возможность для тех, кто хочет ознакомиться с полной программой Data Internals Conf X перед покупкой.

Изучить расписание и приобрести билеты можно на нашем сайте
👍32
Как подготовить платформу данных к миграции уже сейчас?

Своим опытом решения проблем и готовым планом действий поделится Владислав Заболоцкий из Райффайзен Банк, дата-инженер в команде AI Assistants, ранее SAS разработчик и системный аналитик.

С чего начать миграцию? Как подготовить большую платформу к этому процессу? Какими способами решать проблемы сотсутствия информации о владении объектов, отключения неактуальных процессов, расхождения расчетов и т.д.?

Узнать ответы на все эти вопросы вы сможете 23 сентября на Data Internals Conf X

Полная программа конференции и расписание на нашем сайте
🔥32