NEW BOT Телеграм, страница - 214461342

Simulative

@simulative_official

7.39K subscribers

1.7K photos

70 videos

1 file

1.26K links

Привет! Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support

Download Telegram

About

Blog

Apps

Platform

7.39K subscribers

⚡️

Карьерный рост в IT с помощью курса «Инженер данных»

Сегодня делимся историей нашего студентки Елены, которая пришла на курс-симулятор «Инженер данных» в конце прошлого года.

Ее целью было переход в область Data Science без смены компании. В своем отзыве Елена делится своим опытом обучения, подчеркивая, что курс помог ей перейти от интуитивного понимания SQL к более структурированному и логичному подходу. Подробнее — в карточках.

Kind reminder: Завтра у нас стартует новый поток курса «Инженер данных», и мы приглашаем вас стать частью этого обучения.

❗️Хотите научиться разрабатывать архитектуру данных и уже через 5 месяцев обучения начните работать по профессии инженер данных?

➡️

Запишитесь на консультацию

#отзыв

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍4❤3

2.4K views12:34

🚀 [Вебинар] Создаем эффективный дашборд как в Wildberries

Продуктовые дашборды позволяют визуализировать ключевые метрики и принимать обоснованные решения. Но как создать действительно эффективный дашборд?

Приглашаем вас на вебинар 8 апреля в 18:30 по МСК, где Егор Чеменев, опытный продуктовый аналитик из Wildberries и автор телеграм-канала «Data Brew», проведет прямой эфир, посвященный созданию продуктового дашборда.

➡️

Зарегистрироваться

На этой неделе мы уже проводили эфир по WB — анализировали продажи с помощью Python. Теперь идем дальше — Егор, благодаря своему опыту в Wildberries, продемонстрирует, как эффективно использовать данные и инструменты для создания дашбордов.

*️⃣

Что будем делать:

🟠 Выберем метрики: узнаем, какие ключевые показатели необходимо отслеживать для развития продукта;
🟠 Напишем запросы в PostgreSQL;
🟠 Научимся визуализировать данные в Power BI так, чтобы они были понятны и полезны для принятия решений;
🟠 Отталкиваясь от визуализации поищем идеи для будущих исследований.

➡️

Зарегистрироваться

#вебинар

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤7👍5

3.69K viewsedited 12:15

This media is not supported in your browser

VIEW IN TELEGRAM

📝

Задачи с собеседований по Pandas

Сегодня погрузимся в реальные кейсы с собеседований по Pandas — разберём 4 задачи, обсудим хитрости и ловушки.

В материале разберём простым языком, как:
🟠 Превратить сложные задачи в пошаговые действия;
🟠 Объяснять интервьюеру, что вы не просто группируете данные, а видите в них закономерности;
🟠 Избежать ошибок, из-за которых даже опытные кандидаты проваливают тесты.

👉 Получить материал

#️⃣Чему научимся:

1. Базовые инструменты: как группировать данные и считать статистику, заполнять пропуски в данных (например, средними значениями или специальными методами) и не запутаться в больших таблицах.

2. Пошаговые примеры: группировка данных по категориям и подсчет нужных показателей (например, средние или суммы), замена пропусков в данных так, чтобы интервьюер это оценил м создание сводных таблиц.

#️⃣ Секретик: как объяснить, что groupby() + agg() — это как швейцарский нож для анализа (подсчёт нескольких статистик за раз).

👉 Получить материал

Ждём ваши 🔥 — будем выкладывать больше разборов задачек

#полезность

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥27👍6❤4

2.32K viewsedited 09:12

🔥 Ускоряем работу в Pandas в 1000 раз

Мы никого не удивим, если скажем, что Pandas — один из самых популярных пакетов python для работы с данными. Даже используя его каждый день, мы все равно находим новые фишечки, которые делают код быстрее, эффективнее и читабельнее.

И сегодня мы ускорим работу Pandas в 1000 раз, внеся всего несколько корректировок в код.

Начнем, как всегда, с импортов и создадим датафрейм для наших экспериментов.

import pandas as pd
import numpy as np

def get_data(size = 10_000):
    df = pd.DataFrame()
    df['age'] = np.random.randint(0, 100, size)
    df['time_in_bed'] = np.random.randint(0, 9, size)
    df['pct_sleeping'] = np.random.rand(size)
    df['favorite_food'] = np.random.choice(['pizza', 'taco', 'ice-cream'], size)
    df['hate_food'] = np.random.choice(['broccoli', 'candy corn', 'eggs'], size)
    return df

Теперь мы хотим каждому человеку в соответствии с условиями — дать вознаграждение. Это будет наша функция reward_calc:

def reward_calc(row):
    if row['age'] >= 90:
        return row['favorite_food']
    if (row['time_in_bed'] > 5) & (row['pct_sleeping'] > 0.5):
        return row['favorite_food']
    return row['hate_food']

Рассмотрим 3 способа применить подобную логику к набору данных, пойдем от самого медленного к самому быстрому. Что бы вам пришло в первую очередь при такой формулировке задачи?

1️⃣ Наш первый кандидат ЦИКЛ

Запрашиваем новый датафрейм, итерируем по каждой строке и применяем reward_calc().

df = get_data()
for index, row in df.iterrows():
    df.loc[index, 'reward'] = reward_calc(row)

И время — 597 ms. Неплохо, можем ли мы лучше?

2️⃣ Проверим APPLY

Мы снова запросим датафрейм и применим к нему reward_calc() построчно. По сути, мы делаем то же самое, что и в цикле, но apply делает это эффективнее.

df = get_data()
df['reward'] = df.apply(reward_calc, axis = 1)

Итого — 107 ms. Это, конечно, не в миллион раз быстрее, чем цикл, а всего в 5,5. Но в больших датасетах, не как наш фиктивный на 10 000 строк, это будет крайне существенное ускорение.

3️⃣ И все-таки у нас есть третий кандидат — векторизация

Итак, мы напишем векторизованную версию того же кода с условиями. Она будет выглядеть так:

((df['pct_sleeping'] > 0.5) & 
 (df['time_in_bed'] > 5)) | 
 (df['age'] > 90)

И возвращать серию булевых значений.

Теперь мы запрашиваем новый датафрейм, создаем reward, который будет равен hate_food, кроме случаев, где удовлетворены наши условия.

df['reward'] = df['hate_food']
df.loc[((df['pct_sleeping'] > 0.5) &
            (df['time_in_bed'] > 5)) | 
            (df['age'] > 90), 'reward'] = df['favorite_food']

И мы получаем 4.41 ms, и бóльшая часть этого времени — это вызов get_data(). Без неё код отработает за 567 µs.

Вот так мы смогли ускорить наш код в 1000 раз и потому, очень рекомендуем вам использовать векторизацию там, где это возможно. Ведь по мере того, как вы начнете работать со все бóльшими и бóльшими наборами данных, этот трюк может стать незаменимым!

🔥20👍7❤4

2.33K views13:48

This media is not supported in your browser

VIEW IN TELEGRAM

Понедельник начался...

👍 — тихо-спокойно
❤️ — раскидываю таски
🔥 — нифигасебе я незаменимый

🔥26❤18👍12😁5

2.13K views08:16

This media is not supported in your browser

VIEW IN TELEGRAM

❓ Как найти работу аналитика данных без опыта?

Чтобы найти работу аналитика без опыта, нужно (сюрприз-сюрприз!) приложить усилия. Да, путь может быть сложным, но каждый шаг приближает вас к цели. Представьте, что ваши проекты помогают бизнесу расти, а ваши решения влияют на стратегию крупных компаний. Всё это возможно, если вы начнёте действовать уже сегодня!

Вот что можно сделать:

1️⃣ Создайте портфолио. Выполняйте задания и выкладывайте результаты в интернет. Это покажет ваши способности. При этом, выбирайте условия задач, близкие к реальным бизнес-кейсам.

Пример: проведите анализ продаж интернет-магазина, визуализируйте ключевые метрики и предложите рекомендации. Опубликуйте проект на GitHub или в блоге.

2️⃣ Принимайте участие в конкурсах на площадках, подобных Kaggle, и хакатонах, где нужно проанализировать пользовательское поведение и предложить улучшения для продукта. Это не только опыт, но и возможность заявить о себе работодателям.

3️⃣ Пройдите практику. Ищите стажировки и проекты не только в бигтехе, но и в малом бизнесе. Обращайтесь к небольшим компаниям или стартапам с предложением помочь с анализом данных. Даже если это будет бесплатная работа, вы получите ценный опыт.

Пример: помогите локальному кафе проанализировать продажи и определить наиболее популярные позиции меню.

4️⃣ Практикуйтесь на тестовых заданиях из вакансий. Скачивайте тестовые задания из открытых источников или просите примеры у знакомых аналитиков. Это поможет лучше понять ожидания работодателей. Мы и сами часто разбираем тестовые — следите за обновлениями!

Пример: выполните задание по анализу клиентской базы для маркетинговой кампании и сравните свои результаты с референсами.

5️⃣ Используйте менторство как ускоритель развития. Как пример – наша менторская программа «Аналитик данных». Её суть — провести студента через индивидуальный трек обучения напрямую к офферу от работодателя.

В результате вы получаете:
🟠 Твердые профессиональные знания и навыки, подкрепленные практикой и дипломом государственного образца;
🟠 Сильное портфолио, которое выгодно выделит вас среди других;
🟠 Карьерное сопровождение вплоть до получения оффера;
🟠 Индивидуальное менторство от действующих аналитиков, погружающее вас в реалии рабочей практики.

Следующий поток программы стартует уже завтра, осталось еще 3 места.

➡️

Записаться на консультацию

🧡

Не ждите идеального момента — создавайте его сами. Ваша настойчивость и готовность развиваться станут главными инструментами на пути к новой профессии!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7❤5👍3🤩1

2.19K views14:28

⚡️ Как создать продуктовый дашборд для эффективного анализа данных?

Уже сегодня в 18:30 по МСК встречаемся на вебинаре, где Егор Чеменев, опытный продуктовый аналитик из Wildberries и автор телеграм-канала «Data Brew», проведет прямой эфир, посвященный созданию продуктового дашборда.

Что будем делать:

🟠 Выберем метрики: узнаем, какие ключевые показатели необходимо отслеживать для развития продукта;
🟠 Напишем запросы в PostgreSQL;
🟠 Научимся визуализировать данные в Power BI так, чтобы они были понятны и полезны для принятия решений;
🟠 Отталкиваясь от визуализации поищем идеи для будущих исследований.

❗️Материалы, которыми будет делиться спикер, будут доступны только зрителям вебинара.

➡️

Зарегистрироваться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥5👍3

2.44K views08:46

Егор ждёт вас сегодня в 18:30 на вебинаре, чтобы:

➕ Выбрать ключевые показатели необходимо отслеживать для развития продукта;
➕ Написать запросы в PostgreSQL;
➕ Построить понятные и полезные дашборды в Power BI;
➕ Сгенерировать идеи для будущих исследований.

Напоминаем: материалы кейса будут доступны на самом вебинаре. Ждём всех! 😉

➡️ Зарегистрироваться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍3🔥3

2.4K views12:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

2.31K views12:01

❤9🔥4👍3

➡️

Вебинар стартовал!

Сейчас мы вместе с Егором Чеменевым погружаемся в процесс создания эффективного продуктового дашборда.

Егор уже рассказал о себе и своем опыте, а теперь мы переходим к практике: выбираем метрики, потом напишем запросы в PostgreSQL и начнем визуализировать данные в Power BI.

Материалы, которыми будет делиться спикер, будут доступны зрителям в прямом эфире. А еще в прямом эфире можно задать вопросы и получить еще больше пользы.

➡️

Присоединяйтесь!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍4🔥4

2.25K views15:43

📎 Что должен знать инженер машинного обучения?

Продолжаем нашу серию роадмапов по различным специализациям в сфере технологий. На этот раз мы поговорим об инженере машинного обучения.

Если вы только начинаете свой путь в этой профессии, то наверняка сталкиваетесь с множеством вопросов:
🔹 Какие технологии и алгоритмы учить в первую очередь?
🔹 Как не запутаться в огромном объеме информации?
🔹 Что нужно освоить, чтобы быстро войти в профессию и не тратить годы на бессистемное обучение?

Роадмап для инженера машинного обучения для вас подготовил опытный ML-инженер и преподаватель нашего курса-симулятора «Инженер машинного обучения» Савелий Батурин. Это пошаговый план, который поможет вам выстроить четкую траекторию обучения и быстрее достичь профессиональных целей.

Роадмап состоит из 4-х основных этапов:
🟠 Основы машинного обучения;
🟠 Базовые алгоритмы;
🟠 Продвинутые методы;
🟠 Спец-темы.

Скачайте роадмап, сохраните его и используйте как чек-лист для систематического обучения. Это поможет вам избежать хаоса и сосредоточиться на действительно важных навыках.

➡️

Получить материал

#полезность

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤5🔥4

2.28K viewsedited 13:28

Media is too big

VIEW IN TELEGRAM

Почему так важно иметь в своем портфолио кейсы из реального бизнеса?

Краткий ответ: именно с таким портфолио вы будете самым приоритетным кандидатом для трудоустройства.

Где взять такое портфолио?

И опять краткий ответ: брать реальные бизнесовые задачи и на их основе собирать кейсы для портфолио. Вы можете это сделать даже сейчас — делимся нашим старым постом с пошаговым алгоритмом проведения RFM-анализа и примером его упаковки от нашей студентки.

Как выбрать обучение?

Сразу выбирайте то обучение, которое приведет вас к результату. А чаще всего ожидаемый результат обучения — получить твердые знания и устроиться на на работу.

Уже завтра у нас стартует очередной поток курса-симулятора «Аналитик данных», где вы уже через 5-6 месяцев сможете стать конкурентоспособным junior-специалистом, а продолжать обучение сможете и после трудоустройства.

А ещё мы убеждены, что вклад в своё образование — это не пустая трата денег и времени, а инвестиция в своё будущее в профессии.

Как принять верное решение, где обучаться?

Вы можете попросить нашего менеджера провести вам экскурсию по Симулятору. Так вы сможете «пощупать» платформу прежде, чем инвестировать в обучение.

➡️

Оставить заявку на экскурсию

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥6❤4😢1

2.29K views14:33

⚡️

[Вебинар] Конвейер данных: путь данных от сбора до анализа

Знаете ли вы, что данные, прежде чем стать действительно полезными, проходят долгий путь? Он называется «конвейер данных» и в его работе принимают участие разные специалисты: дата-инженеры, дата-аналитики, BI-аналитики (хотя часто это один и тот же человек 😉).

Об этапах этого процесса расскажет на вебинаре 15 апреля в 18:30 по МСК Павел Беляев — руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике».

Павел расскажет, как в целом данные собираются, обрабатываются и анализируются. Тема богатая, тянет на целый курс, но за вебинар можно дать верхнеуровневый взгляд, дающий понимание процесса.

Может быть, взгляд на весь процесс поможет вам определить своё место в нём!

➡️

Зарегистрироваться

#вебинар

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🔥6❤4

2.58K viewsedited 11:56

📎 Машинное обучение без сложностей: краткий курс для начинающих

Хотите понять, как работает машинное обучение, без погружения в сложные математические формулы? 🤔

Сегодня мы разберем основные термины и концепции простым языком. Вы узнаете, как использовать логистическую регрессию для предсказания ошибок в коде и повышения зарплаты, как визуализировать данные с помощью графиков, чтобы лучше понять результаты. 📊

➡️

Получить материал

В тетрадке вы найдете:

🟠 Краткий словарь терминов ML;
🟠 Основные концепции ML с примерами из жизни;
🟠 Простые примеры кода на Python для логистической регрессии;
🟠 Графики рассеяния для визуализации данных;
🟠 Практические советы для начала работы с машинным обучением.

➡️

Получить материал

#полезность

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥5👍4

2.59K viewsedited 11:28

Media is too big

VIEW IN TELEGRAM

Если у вас нет такого коллеги, задумайтесь — не являетесь ли вы таковым...

🔥 — есть такой коллега
❤️ — мы все молодцы и умницы

❤16🔥4😁3👍1

2.33K views16:25

❓ Кто и как превращает сырые данные в ценные инсайты?

Уже сегодня в 18:30 по МСК встречаемся на вебинаре, где Павел Беляев, руководитель группы дата-аналитиков в компании Яндекс eLama и автор телеграм-канала «Тимлидское об аналитике», проведет прямой эфир и расскажет об этапах конвейера данных, без которого не обходится ни один бизнес, работающий со своими данными.

Что разберем:
🟠 Весь процесс работы с данными: от источников данных до получения выводов;
🟠 Методики сбора данных: ETL и ELT;
🟠 Построение витрин данных;
🟠 Визуализацию, которая помогает принимать эффективные решения;
🟠 И наконец: как по результатам проделанной работы с данными делать максимально верные и полезные выводы.

Материалы, которыми будет делиться спикер, будут доступны только зрителям вебинара.

➡️

Зарегистрироваться

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍3🤩3

2.28K views09:03

This media is not supported in your browser

VIEW IN TELEGRAM

Атмосфера на наших вебинарах be like:

А если серьезно, у нас на вебинарах всегда лампово, а зрители получают то, что им необходимо: знания и ответы на вопросы.

➡️

Присоединяйтесь!

Кстати, чтобы сделать наш вебинар еще более насыщенным, адресным и полезным, напишите в комментариях: чего вы конкретно ждете от вебинара?

Please open Telegram to view this post

VIEW IN TELEGRAM

😁25❤5👍2

2.2K views12:04