Почему обучение на ML-инженера сейчас актуально:
Обучение базируется на реальных кейсах, которые вы сможете использовать в своем портфолио и получить явное преимущество при трудоустройстве.
Примеры моделей, которые будете разрабатывать:
Преподаватели курса:
Первый поток курса стартует уже завтра. Не упустите шанс стать частью быстрорастущей области — записывайтесь на консультацию!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤5👍4
🧑💻 Вебинар: Собираем витрину данных, как в бигтехе, от описания до результата
Представьте, что вы тренер футбольной команды. И у вас есть витрина данных, которая собирает информацию о каждом игроке, включая количество забитых голов, ассистов, время на поле и количество проведенных матчей. Такая витрина помогает выявить слабые места в команде и сфокусироваться на их улучшении.
О том, как аналитику строить витрину данных, разберём в прямом эфире на примере реальной задачи 28 января в 19:00 по МСК. Спикер вебинара — Айгуль Сибгатуллина, Data Engineer в Сбер, автор телеграм-канала @data_engineerette.
Вебинар пройдёт в нашем любимом режиме «решение тестового задания» — представим, что мы владельцы бизнеса, и на практическом примере покажем, зачем и почему мы это делаем.
Что будет:
🟠 Построение воркфлоу от этапа получения ТЗ до создания полноценной витрины;
🟠 Какие инструменты нужны для дата-инженера;
🟠 Как разобраться с методологией на разных диалектах;
🟠 Как объединить данные из нескольких источников;
🟠 Spark в работе дата-инженера: преобразования и оптимизации;
🟠 Как AI может ускорить процессы.
➡️ Зарегистрироваться
#вебинар
Представьте, что вы тренер футбольной команды. И у вас есть витрина данных, которая собирает информацию о каждом игроке, включая количество забитых голов, ассистов, время на поле и количество проведенных матчей. Такая витрина помогает выявить слабые места в команде и сфокусироваться на их улучшении.
О том, как аналитику строить витрину данных, разберём в прямом эфире на примере реальной задачи 28 января в 19:00 по МСК. Спикер вебинара — Айгуль Сибгатуллина, Data Engineer в Сбер, автор телеграм-канала @data_engineerette.
Вебинар пройдёт в нашем любимом режиме «решение тестового задания» — представим, что мы владельцы бизнеса, и на практическом примере покажем, зачем и почему мы это делаем.
Что будет:
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍11🔥10👏1
Сортировка результатов SQL запроса с помощью оператора ORDER BY
Представим рабочую ситуацию: вы оцениваете несколько продуктов и вашему стейкхолдеру (заказчику) важно понимать какой продукт приносит наибольшую прибыль.
На небольшом количестве данных это можно оценить визуально, но если таких продуктов более 100, то это становится настоящей проблемой. Конечно, это можно сделать в экселе, скопировав туда значения и выполнив сортировку в нужном порядке. Но как быть когда вас просят вывести только 30 наиболее прибыльных продуктов из 100?
Сегодня расскажем, как проводить сортировку данных прямо внутри SQL-запроса, используя оператор ORDER BY.
➡️ Читать статью
Ждём ваши 🔥 и комментарии.
Представим рабочую ситуацию: вы оцениваете несколько продуктов и вашему стейкхолдеру (заказчику) важно понимать какой продукт приносит наибольшую прибыль.
На небольшом количестве данных это можно оценить визуально, но если таких продуктов более 100, то это становится настоящей проблемой. Конечно, это можно сделать в экселе, скопировав туда значения и выполнив сортировку в нужном порядке. Но как быть когда вас просят вывести только 30 наиболее прибыльных продуктов из 100?
Сегодня расскажем, как проводить сортировку данных прямо внутри SQL-запроса, используя оператор ORDER BY.
Ждём ваши 🔥 и комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14❤8👍7
🤖 SQL в действии: запросы, которые должен знать каждый аналитик
Для аналитика важно не только знать базовые запросы, но и уметь использовать более сложные конструкции: агрегатные функции, подзапросы, оконные функции и объединения таблиц. Эти навыки помогут находить инсайты, анализировать метрики и строить отчеты на основе больших объемов данных.
В этом посте мы продолжаем разбирать полезные SQL-запросы, которые пригодятся каждому аналитику. Они помогут вам работать с данными быстрее и эффективнее.
1. Анализ продаж с использованием агрегатных функций
Допустим, у нас есть таблица
Этот запрос позволяет быстро понять, какой регион приносит больше всего выручки.
2. Использование подзапросов для поиска аномалий
Предположим, мы хотим найти товары, продажи которых ниже среднего уровня по всем товарам:
Здесь мы используем подзапрос для вычисления среднего уровня продаж по всем товарам и фильтруем те товары, которые находятся ниже этого уровня.
3. Оконные функции для анализа трендов
Оконные функции позволяют анализировать данные без группировки. Например, найдем кумулятивную выручку (накопительный итог) по датам:
Такой запрос поможет увидеть динамику роста выручки за определенный период.
4. Сравнение текущих и предыдущих периодов
Чтобы сравнить продажи текущего месяца с предыдущим, можно использовать оконные функции:
Этот запрос покажет динамику продаж по регионам с учетом разницы между месяцами.
5. Объединение таблиц для анализа
Допустим, у нас есть две таблицы:
Такой запрос помогает объединять данные из нескольких таблиц для более глубокого анализа.
Попробуйте эти запросы на своих данных и убедитесь в их эффективности! 🚀
Для аналитика важно не только знать базовые запросы, но и уметь использовать более сложные конструкции: агрегатные функции, подзапросы, оконные функции и объединения таблиц. Эти навыки помогут находить инсайты, анализировать метрики и строить отчеты на основе больших объемов данных.
В этом посте мы продолжаем разбирать полезные SQL-запросы, которые пригодятся каждому аналитику. Они помогут вам работать с данными быстрее и эффективнее.
1. Анализ продаж с использованием агрегатных функций
Допустим, у нас есть таблица
sales с колонками: sale_id, product_id, region, sale_date, amount. Мы хотим узнать общую сумму продаж и средний чек по регионам:SELECT
region,
SUM(amount) AS total_sales,
AVG(amount) AS avg_check
FROM sales
GROUP BY region
ORDER BY total_sales DESC;
Этот запрос позволяет быстро понять, какой регион приносит больше всего выручки.
2. Использование подзапросов для поиска аномалий
Предположим, мы хотим найти товары, продажи которых ниже среднего уровня по всем товарам:
SELECT product_id, SUM(amount) AS total_sales
FROM sales
GROUP BY product_id
HAVING SUM(amount) < (
SELECT AVG(total_sales)
FROM (
SELECT SUM(amount) AS total_sales
FROM sales
GROUP BY product_id
) AS subquery
);
Здесь мы используем подзапрос для вычисления среднего уровня продаж по всем товарам и фильтруем те товары, которые находятся ниже этого уровня.
3. Оконные функции для анализа трендов
Оконные функции позволяют анализировать данные без группировки. Например, найдем кумулятивную выручку (накопительный итог) по датам:
SELECT
sale_date,
SUM(amount) OVER (ORDER BY sale_date) AS cumulative_sales
FROM sales;
Такой запрос поможет увидеть динамику роста выручки за определенный период.
4. Сравнение текущих и предыдущих периодов
Чтобы сравнить продажи текущего месяца с предыдущим, можно использовать оконные функции:
SELECT
region,
DATE_TRUNC('month', sale_date) AS month,
SUM(amount) AS monthly_sales,
LAG(SUM(amount)) OVER (PARTITION BY region ORDER BY DATE_TRUNC('month', sale_date)) AS prev_month_sales,
SUM(amount) - LAG(SUM(amount)) OVER (PARTITION BY region ORDER BY DATE_TRUNC('month', sale_date)) AS sales_diff
FROM sales
GROUP BY region, DATE_TRUNC('month', sale_date)
ORDER BY region, month;
Этот запрос покажет динамику продаж по регионам с учетом разницы между месяцами.
5. Объединение таблиц для анализа
Допустим, у нас есть две таблицы:
products (с информацией о товарах) и sales (с информацией о продажах). Чтобы получить список товаров с их категориями и общей суммой продаж, используем JOIN:SELECT
p.product_name,
p.category,
SUM(s.amount) AS total_sales
FROM products p
LEFT JOIN sales s ON p.product_id = s.product_id
GROUP BY p.product_name, p.category
ORDER BY total_sales DESC;
Такой запрос помогает объединять данные из нескольких таблиц для более глубокого анализа.
Попробуйте эти запросы на своих данных и убедитесь в их эффективности! 🚀
🔥37❤12👍10
Друзья, вы знаете, что мы делимся полезной для вас информацией. Разумеется, мы не собираемся останавливаться и будем только наращивать обороты.
📑 Сейчас мы готовим серию статей про SQL и хотели бы знать, какая тема для вас наиболее интересна и важна?
📑 Сейчас мы готовим серию статей про SQL и хотели бы знать, какая тема для вас наиболее интересна и важна?
Anonymous Poll
20%
JOIN в SQL — виды, описание и примеры
71%
Оконные функции в SQL — что это и для чего они нужны
44%
CTE или Обобщенные Табличные Выражения
🔥11❤5👍2
Simulative
🧑💻 Вебинар: Собираем витрину данных, как в бигтехе, от описания до результата Представьте, что вы тренер футбольной команды. И у вас есть витрина данных, которая собирает информацию о каждом игроке, включая количество забитых голов, ассистов, время на поле…
Присоединяйтесь сегодня в 19:00 по МСК к нашему вебинару «Собираем витрину данных, как в бигтехе, от описания до результата». Спикер вебинара — Айгуль Сибгатуллина, Data Engineer в Сбер, автор телеграм-канала @data_engineerette.
Что будет:
— Построение воркфлоу от этапа получения ТЗ до создания полноценной витрины;
— Какие инструменты нужны для дата-инженера;
— Как разобраться с методологией на разных диалектах;
— Как объединить данные из нескольких источников;
— Spark в работе дата-инженера: преобразования и оптимизации;
— Как AI может ускорить процессы.
➡️ Зарегистрироваться
Что будет:
— Построение воркфлоу от этапа получения ТЗ до создания полноценной витрины;
— Какие инструменты нужны для дата-инженера;
— Как разобраться с методологией на разных диалектах;
— Как объединить данные из нескольких источников;
— Spark в работе дата-инженера: преобразования и оптимизации;
— Как AI может ускорить процессы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤4🔥4
Оконные функции в SQL – что это и для чего они нужны
В своей практике аналитики зачастую имеют нестандартные задачи, для решения которых приходится прибегать к нестандартным методам. Чтобы упросить код и ускорить решение задачи можно использовать оконные функции.
Подготовили для вас статью, где разберемся что это такое, какие они бывают и как их использовать.
➡️ Читать статью
Рассчитываем на ваши 🔥 и комментарии.
В своей практике аналитики зачастую имеют нестандартные задачи, для решения которых приходится прибегать к нестандартным методам. Чтобы упросить код и ускорить решение задачи можно использовать оконные функции.
Подготовили для вас статью, где разберемся что это такое, какие они бывают и как их использовать.
Рассчитываем на ваши 🔥 и комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤12👍5
Отличные новости — мы запустили реферальную программу!
Рекомендуйте нас и получайте классный подарок на выбор за каждого приведенного друга. Как это работает:
🟠 Скопируйте ссылку в личном кабинете (внутри курса) и отправьте тому, кому хочется посоветовать курсы Simulative.
🟠 Попросите друга перейти по ссылке и оставить заявку на обучение.
🟠 После того как друг пройдет консультацию с менеджером и оплатит обучение, у вас появится кнопка выбора любого из подарков.
Виды подарков:
🟠 Дополнительная консультация ментора или HR-специалиста;
🟠 Premium подписка на IT Resume на 3 месяца для практики решения задач и подготовки к техническим собеседованиям;
🟠 Дополнительная скидка 5% на наши программы. Скидка суммируется с нашими акциями и предоставляется на еще не приобретенное обучение на наших симуляторах.
❗️ Программа доступна всем, кто регистрировался на наших платных или бесплатных программах.
Если вы еще не обучаетесь на наших программах, но хотите порекомендовать нас другу и начать учиться вместе – для получения реферальной ссылки вы можете зарегистрироваться в одной из наших бесплатных программ:
🟠 Бесплатный курс по Python (Базовый);
🟠 Демоверсия курса-симулятора «Аналитик данных».
Рекомендуйте нас и получайте классный подарок на выбор за каждого приведенного друга. Как это работает:
Виды подарков:
Если вы еще не обучаетесь на наших программах, но хотите порекомендовать нас другу и начать учиться вместе – для получения реферальной ссылки вы можете зарегистрироваться в одной из наших бесплатных программ:
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉6❤4🔥4👍2
Как быстро загружать данные в Postgres?
Подготовили для вас небольшое исследование (можно даже сказать — пет-проект) о способах вставки данных из CSV в POSTGRES с помощью PYTHON.
С помощью этого материала вы научитесь:
🟠 организовывать окружение для комфортной работы;
🟠 поднимать базу данных с помощью Docker;
🟠 скачивать набор данных из сети с помощью requests;
🟠 работать с набором данных формата parquet;
🟠 познакомимся с тем, что такое декоратор;
🟠 определять наиболее эффективный и быстрый способ вставки данных в Postges.
➡️ Получить материал
#полезность
Подготовили для вас небольшое исследование (можно даже сказать — пет-проект) о способах вставки данных из CSV в POSTGRES с помощью PYTHON.
С помощью этого материала вы научитесь:
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤7🔥6
🌟 Отзыв студента: путь в карьеру аналитика
Получать такой фидбек, пожалуй, самая ценная награда. Этот отзыв мы получили от студентки курса-симулятора «Аналитик данных», при этом она трудоустроилась по специальности ещё не завершив обучение. А самое ценное в этом то, что отзыв подтверждает все наши тезисы, о которых мы так много говорим:
🟠 Практика на настоящих задачах бизнеса:
🟠 87% выпускников находят работу своей мечты в течение 2 месяцев:
🟠 Обучаем с нуля, предоставляя реальные задачи:
🟠 Поддерживаем в процессе обучения:
Это лишь один из многих примеров того, как наши курсы помогают людям достигать своих целей и строить карьеру в аналитике данных.
Уже завтра мы запускаем новый поток курса-симулятора «Аналитик данных» — приглашаем стать его частью!
➡️ Записаться на консультацию
#отзыв
Получать такой фидбек, пожалуй, самая ценная награда. Этот отзыв мы получили от студентки курса-симулятора «Аналитик данных», при этом она трудоустроилась по специальности ещё не завершив обучение. А самое ценное в этом то, что отзыв подтверждает все наши тезисы, о которых мы так много говорим:
Я уже месяц работаю и каждый день радуюсь что выбрала именно ваш курс, потому что без ваших «фишечек» и лайфхаков, наработанных опытом, которые вы даете в уроках, я бы точно не смогла так быстро и эффективно решать задачи.
Благодаря вам я нашла работу в абсолютно новой для себя сфере с 0 опытом работы!
...то что даете вы, это лучший материал, который встречала, действительно реальные и рабочие задачи.
...зайдя к Андрону ты слышишь: «Для начала вам нужна только базовая база, у вас все получится!» тут ты понимаешь, что попал в нужные руки🫶
А еще тут очень классное комьюнити
Это лишь один из многих примеров того, как наши курсы помогают людям достигать своих целей и строить карьеру в аналитике данных.
Уже завтра мы запускаем новый поток курса-симулятора «Аналитик данных» — приглашаем стать его частью!
#отзыв
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍9❤6
Как Docker упрощает жизнь аналитиков и инженеров данных
Когда вы работаете с данными, например, анализируете их или строите модели машинного обучения, Docker позволяет вам сосредоточиться на самой работе, не отвлекаясь на настройку окружения. Это как иметь готовую мастерскую со всеми нужными инструментами, где вы можете сразу приступить к работе.
Благодаря Docker, вы можете упаковывать приложения вместе со всеми зависимостями, избегать проблем с несовместимостью, что повышает эффективность работы и экономит время на настройку окружения.
5 февраля в 19:00 по МСК Евгений Кахновский, Full-stack Software Engineer в Devscribed и преподаватель нашего курса-симулятора «Инженер данных», проведет вебинар «Как Docker упрощает жизнь аналитиков и инженеров данных».
Что будем делать:
🟠 Разберём основы Docker и как контейнеры упрощают работу;
🟠 Выполним анализ данных, запустив Python прямо внутри контейнера;
🟠 Автоматизируем окружение с помощью Docker Compose (Python + PostgreSQL);
🟠 Настроим удобный доступ к результатам анализа;
🟠 Организуем ускоренную обработку больших данных.
➡️ Зарегистрироваться
#вебинар
Когда вы работаете с данными, например, анализируете их или строите модели машинного обучения, Docker позволяет вам сосредоточиться на самой работе, не отвлекаясь на настройку окружения. Это как иметь готовую мастерскую со всеми нужными инструментами, где вы можете сразу приступить к работе.
Благодаря Docker, вы можете упаковывать приложения вместе со всеми зависимостями, избегать проблем с несовместимостью, что повышает эффективность работы и экономит время на настройку окружения.
5 февраля в 19:00 по МСК Евгений Кахновский, Full-stack Software Engineer в Devscribed и преподаватель нашего курса-симулятора «Инженер данных», проведет вебинар «Как Docker упрощает жизнь аналитиков и инженеров данных».
Что будем делать:
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤7👍7
Что такое дата-сторителлинг и как с его помощью выделиться?
Представьте, что у вас есть куча цифр и данных, но вы хотите сделать их интересными и понятными для всех. Вот тут на помощь приходит дата-сторителлинг.
Дата-сторителлинг превращает сухие цифры в увлекательные истории, которые могут мотивировать людей совершить покупку, подписаться на новости или поддержать вашу идею.
Как пример, HeadHunter публикует статьи о трендах на рынке труда, используя интерактивные графики и инфографику.
🟠 Подготовили для видео, где про дата-сторителлинг рассказывает Наталья Киселева — опытный датавиз-тренер и BI-аналитик, ментор в Data Visualization Society и автор телеграм-канала (даже не одного!).
➡️ Смотрите там, где удобно:
VKVideo
YouTube
За вечерний пятничный видеоподгон ждём ваши 🔥 и комментарии
Представьте, что у вас есть куча цифр и данных, но вы хотите сделать их интересными и понятными для всех. Вот тут на помощь приходит дата-сторителлинг.
Дата-сторителлинг превращает сухие цифры в увлекательные истории, которые могут мотивировать людей совершить покупку, подписаться на новости или поддержать вашу идею.
Как пример, HeadHunter публикует статьи о трендах на рынке труда, используя интерактивные графики и инфографику.
VKVideo
YouTube
За вечерний пятничный видеоподгон ждём ваши 🔥 и комментарии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥34👍8❤4
📌 Запросы под контролем: Как избежать ошибок при работе с SQL
Продолжаем разбирать SQL-запросы, а сегодня — рассмотрим основные ошибки и советы по их устранению.
1. Неправильное использование JOIN
Проблема: Ошибки в соединениях JOIN могут привести к дублированию данных или к отсутствию нужных записей.
Пример "до":
Если в
Пример "после":
Используя
2. Игнорирование условий фильтрации
Проблема: Отсутствие условий фильтрации может привести к выборке избыточного объема данных.
Пример "до":
Этот запрос возвращает все записи из таблицы
Пример "после":
Теперь мы ограничиваем выборку только записями за 2024 год, что делает данные более управляемыми.
3. Неправильное использование агрегатных функций
Проблема: Неправильное использование группировки может привести к неожиданным результатам.
Пример "до":
Этот запрос вернет общее количество сотрудников без группировки по отделам.
Пример "после":
Теперь мы получаем количество сотрудников по каждому отделу, что дает более точную информацию.
4. Проблемы с производительностью из-за подзапросов
Проблема: Сложные подзапросы могут значительно замедлить выполнение запросов.
Пример "до":
Этот запрос может быть медленным из-за подзапроса.
Пример "после":
Используя
5. Пренебрежение обработкой NULL
Проблема: Необработанные значения NULL могут привести к неправильным результатам, поскольку SQL не учитывает строки с NULL при выполнении операций сравнения.
Пример "до":
Если в таблице
Пример "после":
Используя функцию
Сохраняйте себе, поделитесь с коллегами и поддержите нас 🔥
Продолжаем разбирать SQL-запросы, а сегодня — рассмотрим основные ошибки и советы по их устранению.
1. Неправильное использование JOIN
Проблема: Ошибки в соединениях JOIN могут привести к дублированию данных или к отсутствию нужных записей.
Пример "до":
SELECT a.id, b.value
FROM table_a a
INNER JOIN table_b b ON a.id = b.a_id;
Если в
table_a есть записи без соответствующих значений в table_b, они не будут отображены.Пример "после":
SELECT a.id, b.value
FROM table_a a
LEFT JOIN table_b b ON a.id = b.a_id;
Используя
LEFT JOIN, мы получаем все записи из table_a, даже если в table_b нет соответствующих значений.2. Игнорирование условий фильтрации
Проблема: Отсутствие условий фильтрации может привести к выборке избыточного объема данных.
Пример "до":
SELECT * FROM sales;
Этот запрос возвращает все записи из таблицы
sales, что может быть очень большим объемом данных.Пример "после":
SELECT * FROM sales WHERE sale_date BETWEEN '2024-01-01' AND '2024-12-31';
Теперь мы ограничиваем выборку только записями за 2024 год, что делает данные более управляемыми.
3. Неправильное использование агрегатных функций
Проблема: Неправильное использование группировки может привести к неожиданным результатам.
Пример "до":
SELECT department_id, COUNT(*)
FROM employees;
Этот запрос вернет общее количество сотрудников без группировки по отделам.
Пример "после":
SELECT department_id, COUNT(*)
FROM employees
GROUP BY department_id;
Теперь мы получаем количество сотрудников по каждому отделу, что дает более точную информацию.
4. Проблемы с производительностью из-за подзапросов
Проблема: Сложные подзапросы могут значительно замедлить выполнение запросов.
Пример "до":
SELECT e.name
FROM employees e
WHERE e.department_id IN (SELECT d.id FROM departments d WHERE d.location = 'New York');
Этот запрос может быть медленным из-за подзапроса.
Пример "после":
SELECT e.name
FROM employees e
JOIN departments d ON e.department_id = d.id
WHERE d.location = 'New York';
Используя
JOIN, мы улучшаем производительность запроса.5. Пренебрежение обработкой NULL
Проблема: Необработанные значения NULL могут привести к неправильным результатам, поскольку SQL не учитывает строки с NULL при выполнении операций сравнения.
Пример "до":
SELECT name FROM Clients WHERE city = 'Москва';
Если в таблице
Clients есть записи с NULL в поле city, они не будут отображены в результате, даже если это важные данные.Пример "после":
SELECT name, COALESCE(city, 'Не указано') AS city FROM Clients;
Используя функцию
COALESCE, мы заменяем значения NULL на 'Не указано', что позволяет отобразить все записи и избежать потери информации.Сохраняйте себе, поделитесь с коллегами и поддержите нас 🔥
🔥24❤11👍9🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
👨💻 Бесплатный курс «Основы Python»
Друзья, если вы обучаетесь и планируете стать аналитиками, задумайтесь: зачем вы изучаете Python? Этот язык программирования крайне важен для аналитиков, но часто не объясняют, в каких задачах он будет полезен.
Чтобы помочь вам разобраться, мы предлагаем наш бесплатный курс «Основы Python». Даже если у вас нет опыта, после его прохождения вы сможете решать реальные бизнес-задачи, такие как автоматизация обработки кассовых чеков или контроль просроченных платежей.
Почему стоит пройти курс?
🟠 Мы начинаем с основ и постепенно переходим к сложным темам, предоставляя прочную базу знаний.
🟠 Вы будете работать с реальными кейсами и получите поддержку в обучении через наш чат.
🟠 Курс уже прошли более 1500 человек, так что вы будете учиться в отличной компании! 🧡
❗️ Бонус: зарегистрированные студенты платных и бесплатных курсов могут пользоваться нашей реферальной программой и другими плюшками ;)
➡️ Записаться на бесплатный курс
Друзья, если вы обучаетесь и планируете стать аналитиками, задумайтесь: зачем вы изучаете Python? Этот язык программирования крайне важен для аналитиков, но часто не объясняют, в каких задачах он будет полезен.
Чтобы помочь вам разобраться, мы предлагаем наш бесплатный курс «Основы Python». Даже если у вас нет опыта, после его прохождения вы сможете решать реальные бизнес-задачи, такие как автоматизация обработки кассовых чеков или контроль просроченных платежей.
Почему стоит пройти курс?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤6👍2😁1
📌 Оптимизация SQL-запросов: Как улучшить производительность запросов с помощью индексов и правильной структуры
В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.
I. Зачем нужны индексы?
Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.
Пример использования индекса
Пример "до":
Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.
Пример "после":
С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.
II. Разновидности индексов
1. Первичные индексы: Создаются автоматически для столбцов с первичным ключом.
Индекс на
2. Уникальные индексы: Предотвращают дублирование значений.
Это гарантирует уникальность адресов электронной почты в таблице пользователей.
3. Составные индексы: Создаются для нескольких столбцов.
Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.
III. Как избежать чрезмерного количества индексов
Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:
- Анализируйте использование запросов: Создавайте индексы только для тех столбцов, которые часто используются в условиях фильтрации.
- Проверяйте использование индексов: Используйте команду
- Удаляйте неиспользуемые индексы: Это поможет освободить место и улучшить производительность.
IV. Примеры оптимизации запросов
1. Ускорение фильтрации с WHERE
Пример "до":
Запрос без индекса может занять много времени.
Пример "после":
Индекс на
2. Оптимизация сортировки с ORDER BY
Пример "до":
Запрос может быть медленным без индекса.
Пример "после":
С индексом сортировка выполняется быстрее.
3. Поиск по нескольким колонкам
Пример "до":
Запрос может выполняться медленно без составного индекса.
Пример "после":
Составной индекс значительно ускоряет выполнение запроса.
Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.
Нравятся наши посты? Сохраняйте себе, пересылайте коллегам и просто поддержите нас лайком!👍
В мире анализа данных производительность запросов имеет критическое значение. Оптимизация SQL-запросов может существенно сократить время выполнения и снизить нагрузку на базу данных. В этом посте мы рассмотрим, как использовать индексы и правильную структуру таблиц для достижения максимальной эффективности.
I. Зачем нужны индексы?
Индексы — это специальные структуры данных, которые помогают ускорить поиск и выборку данных в таблицах. Они работают как указатели, позволяя системе управления базами данных (СУБД) быстро находить нужные строки без необходимости сканировать всю таблицу. Это особенно важно при работе с большими объемами данных.
Пример использования индекса
Пример "до":
SELECT * FROM employees WHERE department = 'HR';
Без индекса СУБД будет выполнять полное сканирование таблицы, что может занять много времени.
Пример "после":
CREATE INDEX idx_department ON employees(department);
SELECT * FROM employees WHERE department = 'HR';
С индексом запрос выполняется значительно быстрее, так как СУБД использует индекс для быстрого поиска нужных строк.
II. Разновидности индексов
1. Первичные индексы: Создаются автоматически для столбцов с первичным ключом.
CREATE TABLE orders (
order_id SERIAL PRIMARY KEY,
customer_id INT,
order_date DATE
);
Индекс на
order_id обеспечивает быструю выборку по этому полю.2. Уникальные индексы: Предотвращают дублирование значений.
CREATE UNIQUE INDEX idx_email ON users(email);
Это гарантирует уникальность адресов электронной почты в таблице пользователей.
3. Составные индексы: Создаются для нескольких столбцов.
CREATE INDEX idx_orders_customer_date ON orders(customer_id, order_date);
Этот индекс ускоряет запросы, фильтрующие данные по клиенту и дате одновременно.
III. Как избежать чрезмерного количества индексов
Хотя индексы значительно улучшают производительность, их чрезмерное количество может замедлить операции вставки и обновления. Вот несколько рекомендаций:
- Анализируйте использование запросов: Создавайте индексы только для тех столбцов, которые часто используются в условиях фильтрации.
- Проверяйте использование индексов: Используйте команду
EXPLAIN для анализа выполнения запросов.- Удаляйте неиспользуемые индексы: Это поможет освободить место и улучшить производительность.
IV. Примеры оптимизации запросов
1. Ускорение фильтрации с WHERE
Пример "до":
SELECT * FROM products WHERE price > 1000;
Запрос без индекса может занять много времени.
Пример "после":
CREATE INDEX idx_price ON products(price);
SELECT * FROM products WHERE price > 1000;
Индекс на
price ускоряет выполнение запроса.2. Оптимизация сортировки с ORDER BY
Пример "до":
SELECT name, salary FROM employees ORDER BY salary DESC;
Запрос может быть медленным без индекса.
Пример "после":
CREATE INDEX idx_salary ON employees(salary);
SELECT name, salary FROM employees ORDER BY salary DESC;
С индексом сортировка выполняется быстрее.
3. Поиск по нескольким колонкам
Пример "до":
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';
Запрос может выполняться медленно без составного индекса.
Пример "после":
CREATE INDEX idx_customer_date ON orders(customer_id, order_date);
SELECT * FROM orders WHERE customer_id = 42 AND order_date BETWEEN '2024-01-01' AND '2024-12-31';
Составной индекс значительно ускоряет выполнение запроса.
Используя индексы и правильную структуру таблиц, вы можете значительно улучшить производительность своих запросов. Не забывайте регулярно анализировать использование индексов и корректировать их в зависимости от изменяющихся требований вашей базы данных.
Нравятся наши посты? Сохраняйте себе, пересылайте коллегам и просто поддержите нас лайком!👍
👍50🔥20❤6🤩4👏1🎉1
Simulative
Как Docker упрощает жизнь аналитиков и инженеров данных Когда вы работаете с данными, например, анализируете их или строите модели машинного обучения, Docker позволяет вам сосредоточиться на самой работе, не отвлекаясь на настройку окружения. Это как иметь…
Присоединяйтесь сегодня в 19:00 по МСК к открытому вебинару «Как Docker упрощает жизнь аналитиков и инженеров данных».
Спикер — Евгений Кахновский, Full-stack Software Engineer в Devscribed и преподаватель нашего курса-симулятора «Инженер данных».
Что будем делать:
🟠 Разберём основы Docker и как контейнеры упрощают работу;
🟠 Выполним анализ данных, запустив Python прямо внутри контейнера;
🟠 Автоматизируем окружение с помощью Docker Compose (Python + PostgreSQL);
🟠 Настроим удобный доступ к результатам анализа;
🟠 Организуем ускоренную обработку больших данных.
➡️ Зарегистрироваться
Спикер — Евгений Кахновский, Full-stack Software Engineer в Devscribed и преподаватель нашего курса-симулятора «Инженер данных».
Что будем делать:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Вебинар по дата-инженерии прошел «феерично» (с)
Вчера провели вебинар с Евгением Кахновским — разработчиком и, по совместительству, преподавателем нашего курса-симулятора «Инженер данных». Евгений рассказал о том, как Docker упрощает жизнь аналитиков и инженеров данных. И получилось классно — только взгляните на отзывы.
Хотим поблагодарить всех, кто вчера присутствовал на вебинаре — ваше участие и поддержка очень важны для нас!
Хотя вебинар по Docker продлился 2,5 часа (рекорд!), даже за это время невозможно было охватить все фишки и особенности этой платформы. Для этого у нас есть целый модуль в программе курса-симулятора «Инженер данных».
Но не только Docker делает нашу программу уникальной — она включает все необходимые навыки и инструменты для инженера данных:
🟠 Базы данных: PostgreSQL, DBeaver, Clickhouse;
🟠 Программирование: Python, Pandas, Numpy, Matplotlib, Seaborn, Plotly, gspread, VS Code, Google Colab, Jupyter Notebook;
🟠 Визуализация данных (BI): Metabase;
🟠 Автоматизация и деплой: Linux, Docker, bash, Airflow.
Самое главное: обучение построено на практике по настоящим бизнес-задачам. Это позволяет создать портфолио на основе реальных проектов — оно точно выделит вас на рынке труда.
Если вы давно хотели стать дата-инженером или прокачать свои навыки на следующий уровень — завтра стартует новый поток нашего курса. Ждем вас среди наших студентов!
➡️ Запишитесь прямо сейчас
Вчера провели вебинар с Евгением Кахновским — разработчиком и, по совместительству, преподавателем нашего курса-симулятора «Инженер данных». Евгений рассказал о том, как Docker упрощает жизнь аналитиков и инженеров данных. И получилось классно — только взгляните на отзывы.
Хотим поблагодарить всех, кто вчера присутствовал на вебинаре — ваше участие и поддержка очень важны для нас!
Хотя вебинар по Docker продлился 2,5 часа (рекорд!), даже за это время невозможно было охватить все фишки и особенности этой платформы. Для этого у нас есть целый модуль в программе курса-симулятора «Инженер данных».
Но не только Docker делает нашу программу уникальной — она включает все необходимые навыки и инструменты для инженера данных:
Самое главное: обучение построено на практике по настоящим бизнес-задачам. Это позволяет создать портфолио на основе реальных проектов — оно точно выделит вас на рынке труда.
Если вы давно хотели стать дата-инженером или прокачать свои навыки на следующий уровень — завтра стартует новый поток нашего курса. Ждем вас среди наших студентов!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤8👍5
Гайд по JOIN в SQL — виды, описание и примеры
В реальной практике часть данных может находиться в одной таблице, часть – в другой, еще одна часть в третьей. Для того, чтобы объединить эти данные, в Excel можно использовать ВПР, а в SQL для этого используется оператор JOIN.
JOIN (в переводе с английского «присоединять») — это оператор, позволяющий объединить несколько таблиц, является одним из самых частых операторов SQL, который используют аналитики и разработчики.
Чем полезен материал:
🟠 Поможет глубже понять JOIN — ключевой инструмент для объединения данных;
🟠 Расскажет о разных типах JOIN для разных задач с примерами запросов;
🟠 Содержит практические рекомендации по оптимизации JOIN.
Сохраняйте материал себе, чтобы обратиться к нему в любом момент. А случаи бывают разные 🙃
➡️ Получить материал
#полезность
В реальной практике часть данных может находиться в одной таблице, часть – в другой, еще одна часть в третьей. Для того, чтобы объединить эти данные, в Excel можно использовать ВПР, а в SQL для этого используется оператор JOIN.
JOIN (в переводе с английского «присоединять») — это оператор, позволяющий объединить несколько таблиц, является одним из самых частых операторов SQL, который используют аналитики и разработчики.
Чем полезен материал:
Сохраняйте материал себе, чтобы обратиться к нему в любом момент. А случаи бывают разные 🙃
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤5👍3
Вебинар: 10 полезных приемов SQL от тимлида аналитиков
Основная задача аналитиков данных в бизнесе — поиск и выявление закономерностей в больших объемах информации. И побыстрее, и покачественнее. Знание лайфхаков поможет сделать работу и эффективно, и быстро. Меньше работы, конечно, от этого не станет, но облегчит и поможет принимать обоснованные решения.
12 февраля в 19:00 по МСК Павел Беляев, тимлид аналитиков в сервисе eLama, проведет вебинар (даже мастер-класс), где покажет 10 приёмов и приёмчиков в работе с данными на SQL, которые использует его команда в реальной практике.
Что будет на вебинаре:
🟠 Проведем проверку на повторяющиеся комбинации в таблице с данными;
🟠 Найдём последний элемент в исторических данных;
🟠 Проведём сравнение разных версий таблиц;
🟠 Заполним пропущенные даты во входящих данных и другое.
➡️ Зарегистрироваться
#вебинар
Основная задача аналитиков данных в бизнесе — поиск и выявление закономерностей в больших объемах информации. И побыстрее, и покачественнее. Знание лайфхаков поможет сделать работу и эффективно, и быстро. Меньше работы, конечно, от этого не станет, но облегчит и поможет принимать обоснованные решения.
12 февраля в 19:00 по МСК Павел Беляев, тимлид аналитиков в сервисе eLama, проведет вебинар (даже мастер-класс), где покажет 10 приёмов и приёмчиков в работе с данными на SQL, которые использует его команда в реальной практике.
Что будет на вебинаре:
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍8❤5
📎 CTE — важный помощник аналитика
CTE (Common Table Expression или Обобщенные Табличные Выражения) — это временный результат запроса SQL, или, проще говоря, это временная таблица, которая удаляется после выполнения запроса.
Подготовили для вас статью об особенностях и функциях СТЕ, как всегда, с примерами.
➡️ Прочитать статью
Рассчитываем на ваши 🔥 и комментарии.
CTE (Common Table Expression или Обобщенные Табличные Выражения) — это временный результат запроса SQL, или, проще говоря, это временная таблица, которая удаляется после выполнения запроса.
Подготовили для вас статью об особенностях и функциях СТЕ, как всегда, с примерами.
Рассчитываем на ваши 🔥 и комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25❤6👍4