Сегодня делимся историей нашего студентки Елены, которая пришла на курс-симулятор «Инженер данных» в конце прошлого года.
Ее целью было переход в область Data Science без смены компании. В своем отзыве Елена делится своим опытом обучения, подчеркивая, что курс помог ей перейти от интуитивного понимания SQL к более структурированному и логичному подходу. Подробнее — в карточках.
Kind reminder: Завтра у нас стартует новый поток курса «Инженер данных», и мы приглашаем вас стать частью этого обучения.
#отзыв
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍4❤3
🚀 [Вебинар] Создаем эффективный дашборд как в Wildberries
Продуктовые дашборды позволяют визуализировать ключевые метрики и принимать обоснованные решения. Но как создать действительно эффективный дашборд?
Приглашаем вас на вебинар 8 апреля в 18:30 по МСК, где Егор Чеменев, опытный продуктовый аналитик из Wildberries и автор телеграм-канала «Data Brew», проведет прямой эфир, посвященный созданию продуктового дашборда.
➡️ Зарегистрироваться
На этой неделе мы уже проводили эфир по WB — анализировали продажи с помощью Python. Теперь идем дальше — Егор, благодаря своему опыту в Wildberries, продемонстрирует, как эффективно использовать данные и инструменты для создания дашбордов.
*️⃣ Что будем делать:
🟠 Выберем метрики: узнаем, какие ключевые показатели необходимо отслеживать для развития продукта;
🟠 Напишем запросы в PostgreSQL;
🟠 Научимся визуализировать данные в Power BI так, чтобы они были понятны и полезны для принятия решений;
🟠 Отталкиваясь от визуализации поищем идеи для будущих исследований.
➡️ Зарегистрироваться
#вебинар
Продуктовые дашборды позволяют визуализировать ключевые метрики и принимать обоснованные решения. Но как создать действительно эффективный дашборд?
Приглашаем вас на вебинар 8 апреля в 18:30 по МСК, где Егор Чеменев, опытный продуктовый аналитик из Wildberries и автор телеграм-канала «Data Brew», проведет прямой эфир, посвященный созданию продуктового дашборда.
На этой неделе мы уже проводили эфир по WB — анализировали продажи с помощью Python. Теперь идем дальше — Егор, благодаря своему опыту в Wildberries, продемонстрирует, как эффективно использовать данные и инструменты для создания дашбордов.
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤7👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня погрузимся в реальные кейсы с собеседований по Pandas — разберём 4 задачи, обсудим хитрости и ловушки.
В материале разберём простым языком, как:
👉 Получить материал
1. Базовые инструменты: как группировать данные и считать статистику, заполнять пропуски в данных (например, средними значениями или специальными методами) и не запутаться в больших таблицах.
2. Пошаговые примеры: группировка данных по категориям и подсчет нужных показателей (например, средние или суммы), замена пропусков в данных так, чтобы интервьюер это оценил м создание сводных таблиц.
groupby() + agg() — это как швейцарский нож для анализа (подсчёт нескольких статистик за раз).👉 Получить материал
Ждём ваши 🔥 — будем выкладывать больше разборов задачек
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍6❤4
🔥 Ускоряем работу в Pandas в 1000 раз
Мы никого не удивим, если скажем, что
И сегодня мы ускорим работу
Начнем, как всегда, с импортов и создадим датафрейм для наших экспериментов.
Теперь мы хотим каждому человеку в соответствии с условиями — дать вознаграждение. Это будет наша функция
Рассмотрим 3 способа применить подобную логику к набору данных, пойдем от самого медленного к самому быстрому. Что бы вам пришло в первую очередь при такой формулировке задачи?
1️⃣ Наш первый кандидат ЦИКЛ
Запрашиваем новый датафрейм, итерируем по каждой строке и применяем
И время —
2️⃣ Проверим APPLY
Мы снова запросим датафрейм и применим к нему
Итого —
3️⃣ И все-таки у нас есть третий кандидат — векторизация
Итак, мы напишем векторизованную версию того же кода с условиями. Она будет выглядеть так:
И возвращать серию булевых значений.
Теперь мы запрашиваем новый датафрейм, создаем
И мы получаем
Вот так мы смогли ускорить наш код в 1000 раз и потому, очень рекомендуем вам использовать векторизацию там, где это возможно. Ведь по мере того, как вы начнете работать со все бóльшими и бóльшими наборами данных, этот трюк может стать незаменимым!
Мы никого не удивим, если скажем, что
Pandas — один из самых популярных пакетов python для работы с данными. Даже используя его каждый день, мы все равно находим новые фишечки, которые делают код быстрее, эффективнее и читабельнее. И сегодня мы ускорим работу
Pandas в 1000 раз, внеся всего несколько корректировок в код.Начнем, как всегда, с импортов и создадим датафрейм для наших экспериментов.
import pandas as pd
import numpy as np
def get_data(size = 10_000):
df = pd.DataFrame()
df['age'] = np.random.randint(0, 100, size)
df['time_in_bed'] = np.random.randint(0, 9, size)
df['pct_sleeping'] = np.random.rand(size)
df['favorite_food'] = np.random.choice(['pizza', 'taco', 'ice-cream'], size)
df['hate_food'] = np.random.choice(['broccoli', 'candy corn', 'eggs'], size)
return df
Теперь мы хотим каждому человеку в соответствии с условиями — дать вознаграждение. Это будет наша функция
reward_calc:def reward_calc(row):
if row['age'] >= 90:
return row['favorite_food']
if (row['time_in_bed'] > 5) & (row['pct_sleeping'] > 0.5):
return row['favorite_food']
return row['hate_food']
Рассмотрим 3 способа применить подобную логику к набору данных, пойдем от самого медленного к самому быстрому. Что бы вам пришло в первую очередь при такой формулировке задачи?
1️⃣ Наш первый кандидат ЦИКЛ
Запрашиваем новый датафрейм, итерируем по каждой строке и применяем
reward_calc().df = get_data()
for index, row in df.iterrows():
df.loc[index, 'reward'] = reward_calc(row)
И время —
597 ms. Неплохо, можем ли мы лучше?2️⃣ Проверим APPLY
Мы снова запросим датафрейм и применим к нему
reward_calc() построчно. По сути, мы делаем то же самое, что и в цикле, но apply делает это эффективнее.df = get_data()
df['reward'] = df.apply(reward_calc, axis = 1)
Итого —
107 ms. Это, конечно, не в миллион раз быстрее, чем цикл, а всего в 5,5. Но в больших датасетах, не как наш фиктивный на 10 000 строк, это будет крайне существенное ускорение.3️⃣ И все-таки у нас есть третий кандидат — векторизация
Итак, мы напишем векторизованную версию того же кода с условиями. Она будет выглядеть так:
((df['pct_sleeping'] > 0.5) &
(df['time_in_bed'] > 5)) |
(df['age'] > 90) И возвращать серию булевых значений.
Теперь мы запрашиваем новый датафрейм, создаем
reward, который будет равен hate_food, кроме случаев, где удовлетворены наши условия.df['reward'] = df['hate_food']
df.loc[((df['pct_sleeping'] > 0.5) &
(df['time_in_bed'] > 5)) |
(df['age'] > 90), 'reward'] = df['favorite_food']
И мы получаем
4.41 ms, и бóльшая часть этого времени — это вызов get_data(). Без неё код отработает за 567 µs.Вот так мы смогли ускорить наш код в 1000 раз и потому, очень рекомендуем вам использовать векторизацию там, где это возможно. Ведь по мере того, как вы начнете работать со все бóльшими и бóльшими наборами данных, этот трюк может стать незаменимым!
🔥20👍7❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Понедельник начался...
👍 — тихо-спокойно
❤️ — раскидываю таски
🔥 — нифигасебе я незаменимый
👍 — тихо-спокойно
❤️ — раскидываю таски
🔥 — нифигасебе я незаменимый
🔥26❤18👍12😁5
This media is not supported in your browser
VIEW IN TELEGRAM
Чтобы найти работу аналитика без опыта, нужно (сюрприз-сюрприз!) приложить усилия. Да, путь может быть сложным, но каждый шаг приближает вас к цели. Представьте, что ваши проекты помогают бизнесу расти, а ваши решения влияют на стратегию крупных компаний. Всё это возможно, если вы начнёте действовать уже сегодня!
Вот что можно сделать:
Пример: проведите анализ продаж интернет-магазина, визуализируйте ключевые метрики и предложите рекомендации. Опубликуйте проект на GitHub или в блоге.
Пример: помогите локальному кафе проанализировать продажи и определить наиболее популярные позиции меню.
Пример: выполните задание по анализу клиентской базы для маркетинговой кампании и сравните свои результаты с референсами.
В результате вы получаете:
Следующий поток программы стартует уже завтра, осталось еще 3 места.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤5👍3🤩1
Уже сегодня в 18:30 по МСК встречаемся на вебинаре, где Егор Чеменев, опытный продуктовый аналитик из Wildberries и автор телеграм-канала «Data Brew», проведет прямой эфир, посвященный созданию продуктового дашборда.
Что будем делать:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5👍3
Егор ждёт вас сегодня в 18:30 на вебинаре, чтобы:
➕ Выбрать ключевые показатели необходимо отслеживать для развития продукта;
➕ Написать запросы в PostgreSQL;
➕ Построить понятные и полезные дашборды в Power BI;
➕ Сгенерировать идеи для будущих исследований.
Напоминаем: материалы кейса будут доступны на самом вебинаре. Ждём всех! 😉
➡️ Зарегистрироваться
Напоминаем: материалы кейса будут доступны на самом вебинаре. Ждём всех! 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍3🔥3
Сейчас мы вместе с Егором Чеменевым погружаемся в процесс создания эффективного продуктового дашборда.
Егор уже рассказал о себе и своем опыте, а теперь мы переходим к практике: выбираем метрики, потом напишем запросы в PostgreSQL и начнем визуализировать данные в Power BI.
Материалы, которыми будет делиться спикер, будут доступны зрителям в прямом эфире. А еще в прямом эфире можно задать вопросы и получить еще больше пользы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍4🔥4
📎 Что должен знать инженер машинного обучения?
Продолжаем нашу серию роадмапов по различным специализациям в сфере технологий. На этот раз мы поговорим об инженере машинного обучения.
Если вы только начинаете свой путь в этой профессии, то наверняка сталкиваетесь с множеством вопросов:
🔹 Какие технологии и алгоритмы учить в первую очередь?
🔹 Как не запутаться в огромном объеме информации?
🔹 Что нужно освоить, чтобы быстро войти в профессию и не тратить годы на бессистемное обучение?
Роадмап для инженера машинного обучения для вас подготовил опытный ML-инженер и преподаватель нашего курса-симулятора «Инженер машинного обучения» Савелий Батурин. Это пошаговый план, который поможет вам выстроить четкую траекторию обучения и быстрее достичь профессиональных целей.
Роадмап состоит из 4-х основных этапов:
🟠 Основы машинного обучения;
🟠 Базовые алгоритмы;
🟠 Продвинутые методы;
🟠 Спец-темы.
Скачайте роадмап, сохраните его и используйте как чек-лист для систематического обучения. Это поможет вам избежать хаоса и сосредоточиться на действительно важных навыках.
➡️ Получить материал
#полезность
Продолжаем нашу серию роадмапов по различным специализациям в сфере технологий. На этот раз мы поговорим об инженере машинного обучения.
Если вы только начинаете свой путь в этой профессии, то наверняка сталкиваетесь с множеством вопросов:
🔹 Какие технологии и алгоритмы учить в первую очередь?
🔹 Как не запутаться в огромном объеме информации?
🔹 Что нужно освоить, чтобы быстро войти в профессию и не тратить годы на бессистемное обучение?
Роадмап для инженера машинного обучения для вас подготовил опытный ML-инженер и преподаватель нашего курса-симулятора «Инженер машинного обучения» Савелий Батурин. Это пошаговый план, который поможет вам выстроить четкую траекторию обучения и быстрее достичь профессиональных целей.
Роадмап состоит из 4-х основных этапов:
Скачайте роадмап, сохраните его и используйте как чек-лист для систематического обучения. Это поможет вам избежать хаоса и сосредоточиться на действительно важных навыках.
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤5🔥4
Media is too big
VIEW IN TELEGRAM
Почему так важно иметь в своем портфолио кейсы из реального бизнеса?
Краткий ответ: именно с таким портфолио вы будете самым приоритетным кандидатом для трудоустройства.
Где взять такое портфолио?
И опять краткий ответ: брать реальные бизнесовые задачи и на их основе собирать кейсы для портфолио. Вы можете это сделать даже сейчас — делимся нашим старым постом с пошаговым алгоритмом проведения RFM-анализа и примером его упаковки от нашей студентки.
Как выбрать обучение?
Сразу выбирайте то обучение, которое приведет вас к результату. А чаще всего ожидаемый результат обучения — получить твердые знания и устроиться на на работу.
Уже завтра у нас стартует очередной поток курса-симулятора «Аналитик данных», где вы уже через 5-6 месяцев сможете стать конкурентоспособным junior-специалистом, а продолжать обучение сможете и после трудоустройства.
А ещё мы убеждены, что вклад в своё образование — это не пустая трата денег и времени, а инвестиция в своё будущее в профессии.
Как принять верное решение, где обучаться?
Вы можете попросить нашего менеджера провести вам экскурсию по Симулятору. Так вы сможете «пощупать» платформу прежде, чем инвестировать в обучение.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥6❤4😢1
Знаете ли вы, что данные, прежде чем стать действительно полезными, проходят долгий путь? Он называется «конвейер данных» и в его работе принимают участие разные специалисты: дата-инженеры, дата-аналитики, BI-аналитики (хотя часто это один и тот же человек 😉).
Об этапах этого процесса расскажет на вебинаре 15 апреля в 18:30 по МСК Павел Беляев — руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике».
Павел расскажет, как в целом данные собираются, обрабатываются и анализируются. Тема богатая, тянет на целый курс, но за вебинар можно дать верхнеуровневый взгляд, дающий понимание процесса.
Может быть, взгляд на весь процесс поможет вам определить своё место в нём!
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥6❤4
📎 Машинное обучение без сложностей: краткий курс для начинающих
Хотите понять, как работает машинное обучение, без погружения в сложные математические формулы? 🤔
Сегодня мы разберем основные термины и концепции простым языком. Вы узнаете, как использовать логистическую регрессию для предсказания ошибок в коде и повышения зарплаты, как визуализировать данные с помощью графиков, чтобы лучше понять результаты. 📊
➡️ Получить материал
В тетрадке вы найдете:
🟠 Краткий словарь терминов ML;
🟠 Основные концепции ML с примерами из жизни;
🟠 Простые примеры кода на Python для логистической регрессии;
🟠 Графики рассеяния для визуализации данных;
🟠 Практические советы для начала работы с машинным обучением.
➡️ Получить материал
#полезность
Хотите понять, как работает машинное обучение, без погружения в сложные математические формулы? 🤔
Сегодня мы разберем основные термины и концепции простым языком. Вы узнаете, как использовать логистическую регрессию для предсказания ошибок в коде и повышения зарплаты, как визуализировать данные с помощью графиков, чтобы лучше понять результаты. 📊
В тетрадке вы найдете:
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5👍4
Media is too big
VIEW IN TELEGRAM
Если у вас нет такого коллеги, задумайтесь — не являетесь ли вы таковым...
🔥 — есть такой коллега
❤️ — мы все молодцы и умницы
🔥 — есть такой коллега
❤️ — мы все молодцы и умницы
❤16🔥4😁3👍1
Уже сегодня в 18:30 по МСК встречаемся на вебинаре, где Павел Беляев, руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике», проведет прямой эфир и расскажет об этапах конвейера данных, без которого не обходится ни один бизнес, работающий со своими данными.
Что разберем:
Материалы, которыми будет делиться спикер, будут доступны только зрителям вебинара.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍3🤩3
This media is not supported in your browser
VIEW IN TELEGRAM
Атмосфера на наших вебинарах be like:
А если серьезно, у нас на вебинарах всегда лампово, а зрители получают то, что им необходимо: знания и ответы на вопросы.
➡️ Присоединяйтесь!
Кстати, чтобы сделать наш вебинар еще более насыщенным, адресным и полезным, напишите в комментариях: чего вы конкретно ждете от вебинара?
А если серьезно, у нас на вебинарах всегда лампово, а зрители получают то, что им необходимо: знания и ответы на вопросы.
Кстати, чтобы сделать наш вебинар еще более насыщенным, адресным и полезным, напишите в комментариях: чего вы конкретно ждете от вебинара?
Please open Telegram to view this post
VIEW IN TELEGRAM
😁25❤5👍2