NEW BOT Телеграм, страница

💡 7 стратегий для масштабирования базы данных

1️⃣ Индексация
Анализируйте запросы вашего приложения и создавайте подходящие индексы для ускорения работы.

2️⃣ Материализованные представления
Предварительно вычисляйте сложные запросы и сохраняйте результаты для быстрого доступа.

3️⃣ Денормализация
Сократите сложные соединения таблиц, чтобы повысить производительность запросов.

4️⃣ Вертикальное масштабирование
Увеличьте мощность сервера базы данных, добавив больше CPU, оперативной памяти или хранилища.

5️⃣ Кэширование
Сохраняйте часто используемые данные в более быстром слое хранения, чтобы снизить нагрузку на базу данных.

6️⃣ Репликация
Создавайте копии основной базы данных на других серверах для распределения нагрузки на чтение.

7️⃣ Шардинг
Разделяйте таблицы на небольшие части и распределяйте их по разным серверам. Это поможет масштабировать как чтение, так и запись.

YouTube: 7 must-know strategies to scale your database

#scaling #масштабирование_базы_данных

🤔1

1.21K views10:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Запись митапа про GreenPlum

https://www.youtube.com/live/LuZoarjNF0w

#greenplum

YouTube

Yandex Cloud Data Platform — про Greenplum® и не только

22 ноября в 16:00 (мск) провели митап, посвящённый аналитическим СУБД и работе с ними в новых условиях.

В конце мая Broadcom закрыла код Greenplum® и заархивировала проект на портале GitHub. В результате сообщество разработчиков прекратило развитие продукта.…

1.11K viewsedited 06:41

Data Engineering / Инженерия данных / Data Engineer / DWH

SQL & Hibernate (лекции JavaRush)

Неплохой набор лекций по работе с базами данных.
Что относится к Java разработке можно пролистать.

https://javarush.com/quests/QUEST_SQL_HIBERNATE_PUBLIC

JavaRush

SQL & Hibernate

Квест посвящен продвинутому изучению БД в разрезе задач разработчика. Вы узнаете о том, зачем нужны БД и какими они бывают, о проектировании БД, типах данных, ORM Hibernate (архитектура Hibernate, конфигурация, основные аннотации, получение, обновление и…

1.81K viewsedited 15:06

Data Engineering / Инженерия данных / Data Engineer / DWH

Что такое GreenPlum и как он работает?

https://youtu.be/rLG9Z_HcKPY?si=R9HAJ7kGB5xa_7VU

#greenplum

YouTube

Greenplum | Что это такое и как оно работает?

Если ждёшь ROADMAP, подписывайся на каналы:

Мой телеграмм канал: https://news.1rj.ru/str/Shust_DE
Телеграмм канал Евгения: https://news.1rj.ru/str/halltape_data

Таймкоды:
00:00:00 | Вступление
00:01:02 | Что такое GreenPlum
00:01:25 | Архитектура GreenPlum
00:08:59 | Реплиц…

1.02K views07:01

Data Engineering / Инженерия данных / Data Engineer / DWH

7 Projects to Master Data Engineering - KDnuggets
https://www.kdnuggets.com/7-projects-master-data-engineering

KDnuggets

7 Projects to Master Data Engineering - KDnuggets

Learn to build, run, and manage data engineering pipelines both locally and in the cloud using popular tools.

1.17K views11:48

Data Engineering / Инженерия данных / Data Engineer / DWH

Data Engineering Zoomcamp 2025 Cohort

_ _ _ Б Е С П Л А Т Н О _ _ _

Start: 13 January 2025
Registration link: https://airtable.com/shr6oVXeQvSI5HuWD
Materials specific to the cohort: cohorts/2025/

https://github.com/DataTalksClub/data-engineering-zoomcamp

GitHub

GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free 9-week course on building production-ready…

Data Engineering Zoomcamp is a free 9-week course on building production-ready data pipelines. The next cohort starts in January 2026. Join the course here 👇🏼 - DataTalksClub/data-engineering-zoomcamp

👍6

1.99K views10:43

Data Engineering / Инженерия данных / Data Engineer / DWH

PySpark Playground & Tutorial

https://www.sparkplayground.com/tutorials - здесь можно изучить работу со спарком (на английском)

https://www.sparkplayground.com/playground - здесь можно потренироваться онлайн

#spark #pyspark

Spark Playground

Platform to learn, practice, and solve PySpark interview questions to land your next DE role.

🔥8

2.19K viewsedited 07:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Что такое Spark и как он работает?

https://youtu.be/Gj0oSVmv7k4?si=XK0gur6IcnXSQBNd

#spark

YouTube

Apache Spark для Джуна | Что такое Spark и как он работает?

Запусти свой Spark: https://github.com/halltape/HalltapeSparkCluster
Roadmap для Data Engineer: https://github.com/halltape/HalltapeRoadmapDE

Таймкоды:
00:00:00 Начало
00:00:59 Как работает Pandas
00:01:32 Принцип работы Spark
00:02:53 Операция shuffle
00:07:30…

🔥1

1.32K views07:01

Data Engineering / Инженерия данных / Data Engineer / DWH

В видео по Spark есть ссылка на роадмап по DE с кучей полезных инструкций по инструментам.

GitHub - halltape/HalltapeRoadmapDE: Roadmap для Data Engineer.

https://github.com/halltape/HalltapeRoadmapDE

1.23K views10:15

Data Engineering / Инженерия данных / Data Engineer / DWH

В твиттере вышел Grok 2. Неплохие ответы выдает, при этом вроде нет столько воды, сколько есть у бесплатного chatgpt.

Причем даже на политические вопросы дает ответы/рассуждает.

Ну и по data engineering можно поспрашивать, может найдутся какие-нибудь инсайты)

Гоу тестить🤪

👍4

1.37K views16:32

Data Engineering / Инженерия данных / Data Engineer / DWH

Оптимизация SQL запросов на примере ClickHouse

Бесплатно

Научимся писать SQL запросы так, чтобы не убить базу данных. Изучим основные методы оптимизации SQL запросов, актуальные для любой СУБД

https://stepik.org/course/Оптимизация-SQL-запросов-на-примере-ClickHouse-215412/

#ClickHouse

Stepik: online education

Оптимизация SQL запросов на примере ClickHouse

🔥 Ваши SQL-запросы тормозят и съедают ресурсы?

На этом курсе вы научитесь писать молниеносные запросы, которые не положат базу — даже на огромных данных в ClickHouse.

Без воды: только практические приемы оптимизации, которые работают в любой СУБД. Узнаете…

❤8👎1🔥1

2.93K viewsedited 10:23

Data Engineering / Инженерия данных / Data Engineer / DWH

Awesome Data Engineering Learning Sources - Roadmap для инженеров данных

Подборка ресурсов для изучения направления Data Engineering с минимальным бюджетом (большая часть бесплатно на YT).

https://datatalks.ru/awesome-data-engineering-learning-sources/

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Awesome Data Engineering. Дорожная карта Data Engineer RoadMap

Awesome Data Engineering. Дорожная карта Data Engineer RoadMap. Дорожная карта по изучению инженерии данных. Как стать дата инженером?

🔥8👍3

1.59K viewsedited 07:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод главы "Введение в dbt" из книги Unlocking dbt

https://datatalks.ru/unlocking-dbt-data-build-tool-part-1/

#dbt

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод главы «Введение в dbt» из книги Unlocking dbt

Введение в dbt В 2006 году британский математик и предприниматель в области анализа данных Клайв Хамби ввел фразу: «Данные — это новая нефть», подчеркнув их невероятно высокую ценность. Как и нефть, данные в сыром виде полезны, но их нужно обработать, чтобы…

🔥13

1.53K views10:30

Data Engineering / Инженерия данных / Data Engineer / DWH

Как устроена база данных? Схемы, ограничения, индексы, кластеры

Для начинающих будет полезно

https://youtu.be/8L51FUsjMxA?si=z8uPvZjbnphQC3cx

YouTube

Как устроена База Данных? Кластеры, индексы, схемы, ограничения

Разбираем, как устроены базы данных: кластеры, схемы, таблицы, ограничения, индексы. Просто и на практике — без лишней теории.
Если ты хочешь глубоко разобраться в основах баз данных, научиться ориентироваться в PostgreSQL и уверенно проходить собеседования…

👍2👀2👎1

1.27K viewsedited 07:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Apache Iceberg + StarRocks YouTube Playlist

StarRocks as LakeHouse Query Engine

24 видосика.
https://youtu.be/8Q5Vev4O1lQ?si=7DIuO3IuIOmf6aHi

=== PS ===

В доке пишут, что StarRocks превосходит по производительности ClickHouse и Trino https://docs.starrocks.io/docs/benchmarking/

Понятно, что надо смотреть на типы задач, настройки и структуры данных, но интересный инструмент в любом случае.

Еще 1 статья Сравнение трино и старрокс https://gavrilov.info/all/sravnenie-query-dvizhkov-trino-i-starrocks/

#Iceberg #StarRocks

YouTube

Apache Iceberg + StarRocks: Your Recipe for Superior Lakehouse Performance

Apache Iceberg brought reliability and simplicity to the open data lake, and now it’s helping drive query performance too. Thanks to new integrations with the StarRocks project, Apache Iceberg users no longer need to copy their data into a proprietary data…

👍3

2.2K views06:09

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод Analytics Engineering with SQL and dbt. Глава 1

Немного о концепции Analytics Engineering и терминологии.

https://datatalks.ru/analytics-engineering-with-sql-and-dbt-chapter-1/

#dbt

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод Analytics Engineering with SQL and dbt. Глава 1

Инженерия аналитики (Analytics Engineering) История аналитики включает важные этапы и технологии, которые сформировали эту область в том виде, какой мы знаем сегодня. Всё началось с появления концепции хранилищ данных в 1980-х годах, что стало основой для…

🔥8

1.51K views10:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Понимание инкрементальных стратегий dbt, часть 1

Вторую часть не буду переводить, этот перевод сделал больше с целью ознакомить с вариантами обновления данных в таблицах. По технической реализации лучше доку смотреть и анализировать, как каждая стратегия работает на уровне макросов (или сгенерированного sql).

https://datatalks.ru/understanding-dbt-incremental-strategies-part-1/

#dbt

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Понимание инкрементальных стратегий dbt, часть 1

Перевод статьи, исходный текст: https://medium.com/indiciumtech/understanding-dbt-incremental-strategies-part-1-2-22bd97c7eeb5 Данный перевод выполнен с небольшими примечаниями. Используйте статью как ориентир, проверяя по каждой базе и каждому адаптеру возможность…

🔥3👍1

1.65K views07:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Курс по dbt для инженеров данных

https://youtube.com/playlist?list=PLzvuaEeolxkyx7XruoatSFdYDyLji_o1J&si=oH5Bne-fU2lCqJl1

#dbt

👍12❤7

1.39K views07:01

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод 2 главы "Моделирование данных для аналитики (dbt)"

https://datatalks.ru/dbt-data-modeling-for-analytics/

#dbt

DataTalks.RU. Data Engineering / DWH / Data Pipeline

Перевод 2 главы «Моделирование данных для аналитики (dbt)»

Перевод 2 главы "Моделирование данных для аналитики" книги Analytics Engineering with sql and dbt. Модели данных Звезда, Снежинка Data Vault

❤10👍1

1.13K views07:04

Data Engineering / Инженерия данных / Data Engineer / DWH

Чеклист для разработчиков по подготовке к техническому собеседованию — bool.dev
https://bool.dev/blog/detail/checklist-dlya-deva-po-podgotovke-tech-interview

bool.dev

Чеклист для разработчиков по подготовке к техническому собеседованию

В данной статье описываем как подготовиться к техническому собеседованию и какие темы стоит повторить

🔥5

2.24K views13:01

Data Engineering / Инженерия данных / Data Engineer / DWH

data load tool (dlt) is an open source Python library that makes data loading easy 🛠️

🔹Автоматическая схема: проверка структуры данных и создание схемы для места назначения.
🔹 Нормализация данных: согласованные и проверенные данные перед загрузкой.
🔹Полная интеграция: Colab, AWS Lambda, Airflow и локальные среды.
🔹Масштабируемость: адаптируется к растущим потребностям в данных в производстве.
🔹Простота обслуживания: понятная структура конвейера данных для обновлений.
🔹Быстрое исследование: быстрое исследование и получение информации из новых источников данных.
🔹Универсальное использование: подходит для несистематических исследований и создания сложных погрузочных инфраструктур.
🔹Начните работу за считанные секунды с помощью CLI: Мощный CLI для управления, развертывания и проверки локальных pipelines.
🔹Поэтапная загрузка: загружайте только новые или измененные данные и избегайте повторной загрузки старых записей.
🔹Открытый исходный код: бесплатно и под лицензией Apache 2.0.

https://github.com/dlt-hub/dlt

GitHub

GitHub - dlt-hub/dlt: data load tool (dlt) is an open source Python library that makes data loading easy 🛠️

data load tool (dlt) is an open source Python library that makes data loading easy 🛠️ - GitHub - dlt-hub/dlt: data load tool (dlt) is an open source Python library that makes data loading easy 🛠️

👍4

1.32K views07:00

About

Blog

Apps

Platform