Simulative – Telegram
7.39K subscribers
1.7K photos
70 videos
1 file
1.26K links
Привет! Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support
Download Telegram
Следующая карточка адвента уже открыта!

Приходите вечером на вебинар — расскажем, как живёт и работает универсальный аналитик:

Старший аналитик данных Dodo Brands Илья Ковалёв на живых кейсах покажет, где брать данные, как их готовить, во что превращать и как на их основе принимают решения.

А HR-эксперт Наталья Рожкова разберёт, каких специалистов сейчас реально нанимают и что отличает кандидата, которому дают оффер, от того, кто «не дотягивает» до ожиданий рынка.

Ждём вас 3 декабря в 19:00 МСК!


➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
75🔥4
Ищем новых менторов и преподавателей в Simulative

Мы в Simulative ищем специалистов в DA/DE/BI/ML, которые будут сопровождать группы наших студентов с первого дня обучения.

Если вы:
🟠 Любите обучать людей;
🟠 Вам интересно вести вебинары;
🟠 Вы любите писать статьи/посты/полезные материалы;
🟠 Вы хотите записывать уроки или ещё как-то хотите повзаимодействовать с нашей школой;
🟠 Не боитесь (или даже хотите!) проявляться медийно —

То мы точно ждём вашу заявку и в ближайшее время с вами свяжемся!

🔗 Ссылка на короткую форму

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2🔥2
Привет, это Андрон, основатель Simulative 👋🏻

На днях думал о том, какие уровни владения аналитикой проходил я сам, какие проходят все мои знакомые из индустрии и что отличает крутышей от начального уровня. И выявил несколько общих паттернов.

➡️ Движение по наитию

В этой стадии решения принимаются без оглядки на данные вообще. Захотели запустить рекламу — запустили. Захотели привести 500 лидов — привели 500. Решили отключить пару кампаний — отключили.

➡️ Данные — это важно, «но»

На следующем шаге ты понимаешь и признаёшь, что данные — это важно. Например, ты прошел какой-то курс и решил принимать решения на основании данных. Но у тебя нет глубокого понимания, как это должно работать — почти любая инициатива упирается во что-то и в итоге гаснет.

Например, ты понял, что нельзя просто так планировать следующий год — нужно опираться на исторические данные, смотреть поведение текущих когорт и прогнозировать будущие когорты. Но сразу же ты сталкиваешься с кучей проблем:

У тебя есть только часть данных. Не понятно, какие брать.
Компания последние несколько лет растёт и прогноз получается слишком плоским, позитивным и нереалистичным.
...

В итоге ты потратил кучу времени, а никакой пользы это не принесло — возникла куча «но», из-за которых твоя аналитика стала просто «аналитикой для галочки».

➡️ Владение аналитикой на уровне рабочего инструмента

Это последняя стадия, когда ты реально умеешь применять аналитические подходы в реальной жизни, даже если есть куча «но».

Когда ты достиг этой стадии, ты можешь спрогнозировать следующий год с помощью когорт, сезонности и прочих штук, даже если возникает много «но». Ты можешь проанализировать ассортиментную матрицу, даже если там 10 000 SKU, есть ограничения по месту на полке, требования к минимальной представленности брендов и другие «но». Ты можешь провести достоверное тестирование гипотезы, даже если невозможно провести чистый A/B-тест, потому что много разных «но».
Самое интересное, что с точки зрения технических знаний, между вторым и третьим уровнем нет абсолютно никакой разницы — оба человека будут абсолютно одинаково считать когорты, абсолютно одинаково делать какую-нибудь кластеризацию товаров и т. д.

Основное отличие — как в раз в умении адаптировать тот или иной аналитический подход даже под самую нетривиальную задачу с большим количеством «но».

И этому можно научиться. В этом вопросе главное — совершить единоразовый квантовый скачок со второго на третий уровень. А дальше реакция необратима — ваше мышление навсегда перестроится.

Такой «скачок» можно запустить двумя вещами:

Ты подробно посмотрел на стороннем примере, как это работает и словил эффект «о, а так можно было?!»
Ты на примере какой-то близкой тебе темы прочувствовал, почему твой старый «топорный» подход не работал и какой результат может дать новый подход.

Именно такой эффект я хочу активировать у студентов своего тренинга «Как делать аналитику». Чтобы после прохождения вы не просто прокачались в продвинутых подходах к проведению аналитики, а чтобы случился этот самый квантовый переход на новый уровень.


Если чувствуете, что находитесь на втором уровне и хотите запустить квантовый переход на третий — приглашаю вас сделать это вместе на новом потоке тренинга, который стартует уже завтра 😎

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍11
Не только мы делимся своими адвентами!

У наших друзей и партнёров AW BI стартовал новогодний адвент-календарь — уютный интерактив, где каждый день открывает что-то приятное и полезное ☃️

Нам такая идея показалась тёплой и по-праздничному правильной, поэтому мы тоже решили присоединиться к этому формату.

🎁 В одном из окошек вас будет ждать небольшой сюрприз от Simulative. Бонус, который мы подготовили специально для календаря. Пусть пока останется интригой, но уверены: тем, кто развивается в аналитике данных и любит узнавать новое, подарок придётся по вкусу.


🔔 Подключайтесь к адвенту, ловите настроение приближающихся праздников и не пропускайте наше окошко!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥2🎄1
Привет, коллеги! На связи Павел Беляев, ментор курса «Аналитик данных» и ведущий канала Тимлидское об аналитике 👋🏻

Важнейший инструмент дата-аналитика (не считая его головы, конечно) — это SQL. Очевидно, нужно не только знать синтаксис и структуру запросов — нужно расширять свой арсенал приёмов использования SQL.

Предлагаю пару лайфхаков SQL, которые мы используем в своей работе.

📌 Последний элемент в исторических данных

В таблицах с историческими данными строки, отражающие состояние некоей сущности, не изменяют своё значение со временем. Если состояние изменилось, к таблице добавляется новая строка для той же сущности, но с другим значением соответствующего поля (например, поля status). Каждая строка при этом снабжена полем date_updated, содержащим дату и время обновления.

Так вот, чтобы вытащить строку с текущим состоянием сущности, можно использовать оконную функцию:

SELECT *
FROM
(
SELECT *
MAX(updated_at) OVER (PARTITION BY payment_id) AS last_update
FROM payment
)
WHERE updated_at = last_update


📌 Сводные таблицы

Предположим, у нас есть таблица с фильмами, где для каждого из них имеется столбец release_year с годом выпуска и length с длительностью в минутах. Мы хотим подсчитать количество фильмов до 90 минут, до 120 минут и более 120 минут.

Когда нужно подсчитать суммы или количество величин из разных категорий, содержащихся в одном столбце, в PostgreSQL можно делать так:

WITH films AS
(
SELECT 2006 AS release_year, 86 AS "length"
UNION ALL
SELECT 2006 AS release_year, 180 AS "length"
UNION ALL
SELECT 2006 AS release_year, 95 AS "length"
UNION ALL
SELECT 2006 AS release_year, 135 AS "length"
UNION ALL
SELECT 2006 AS release_year, 120 AS "length"
UNION ALL
SELECT 2007 AS release_year, 85 AS "length"
UNION ALL
SELECT 2007 AS release_year, 130 AS "length"
UNION ALL
SELECT 2007 AS release_year, 120 AS "length"
UNION ALL
SELECT 2007 AS release_year, 97 AS "length"
)
SELECT release_year,
SUM(CASE WHEN "length"<90 THEN 1 ELSE 0 END) AS less_90 ,
SUM(CASE WHEN "length">=90 AND "length"<120 THEN 1 ELSE 0 END) AS less_120,
SUM(CASE WHEN "length">=120 THEN 1 ELSE 0 END) AS over_120
FROM films
GROUP BY 1
-- GROUP BY ROLLUP (1) -- добавляет в конец строку с итогом
ORDER BY 1


Больше приёмов SQL смотрите в моих статьях — и сохраняйте к себе, чтобы не потерять:
💡 Семь лайфхаков SQL
💡 Ещё шесть лайфхаков SQL


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1663
Изучаем SQL с нуля

За новой карточкой нашего адвент-календаря — полезный курс для начинающих аналитиков, ведь SQL это база 😎

Уже через несколько дней вы поймёте основы SQL, решите 70+ практических задач в PostgreSQL и создадите свой первый проект — анализ активных пользователей платформы. Мы на связи, если что-то непонятно!

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥642
Мини-курс в прямом эфире: протестируйте профессию аналитика данных за 3 дня

На этом бесплатном мини‑курсе вы за три вечера пройдёте путь от «ничего не знаю» до первого реального аналитического кейса: поработаете с таблицами, SQL и Python, выполните практические задания и соберёте понятный отчёт по данным. В итоге вы примерите на себя рабочие задачи аналитика, поймёте, насколько комфортно чувствуете себя с инструментами и цифрами, и наконец-то снимете страх перед кодом и «сложной аналитикой».​

Все три дня с вами в прямом эфире будет Денис Иванов, Senior Product Analyst с опытом более 5 лет в Тинькофф и других крупных компаниях, который запускал аналитические системы с нуля.


Что будет на трёхдневном мини-курсе:

➡️ 9 декабря, 19:00 МСК: разберётесь, чем занимается аналитик и какие метрики помогают бизнесу зарабатывать. Научитесь смотреть на продукт через цифры и соберёте простую воронку в таблицах.
➡️ 10 декабря, 19:00 МСК: напишете свои первые запросы на SQL и посчитаете ключевые показатели из базы. Увидите, что код писать запросы на SQL можно освоить с нуля и быстро извлекать пользу из данных.
➡️ 11 декабря, 19:00 МСК: откроете для себя Python, загрузите данные, очистите их и сделаете простые графики. В итоге получите понятный отчёт и поймёте, готовы ли идти в аналитику дальше.

❗️ Смотрите занятия в прямом эфире, чтобы успевать делать домашки и получать разбор от спикера. Самые сильные участники получат грант на дальнейшее обучение!


➡️ Зарегистрироваться на мини-курс

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥854
Simulative pinned a photo
🔥 — жизненно
☃️ — уже жду Новый год!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1710😁21
Исследуем Seaborn

Новая карточка в нашем адвент-календаре! Из неё вы узнаете, как работать с Seaborn — мощной библиотекой для визуализации данных в Python. Она предоставляет высокоуровневый интерфейс для создания привлекательных и информативных статистических графиков.

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥732
Большой пак знаний по SQL со скидкой 20%

Вы просили, мы сделали — собрали все наши модули по SQL в отдельный курс! В нём будут как основы SQL, так и продвинутый модуль из авторского тренинга Владимира Лунёва.

Что вас ждёт на полном курсе:

Подробная база: ознакомитесь с SQL и получите первые навыки, даже если до этого никогда не работали с базами данных;

Продвинутый SQL для работы с большими данными: анонимные блоки и переменные, условные операторы и циклы, курсоры функции и процедуры, триггеры, обработка ошибок и оптимизация.

Авторский тренинг «Продвинутый SQL» и ещё больше практических задачек;

ClickHouse и хранилища данных: все ключевые функции в ClickHouse, соединения данных, работа с сырыми данными и закрепление всего пройденного на кейсах.

Для первых записавшихся держим ранние цены — скидка 20% на курс. Чем не повод начать обучение в этом году?


💪 Узнать больше о курсе и оставить заявку

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥742
Отбор признаков в машинном обучении

Привет! На связи Кристина Желтова, ментор курса «ML-инженер» 👋🏻

Представьте, что вы обучаете ML-модель на датасете из 50-ти признаков с точностью 87%. Добавили еще 20 признаков и качество упало до 83% — разве больше данных не значит лучше? Нет, если данные некачественные. Чем больше бесполезных признаков, тем быстрее модель переобучается и хуже обобщается на новые данные.

В этой ситуации на помощь приходит отбор признаков (feature selection) — одна из самых недооценённых техник классического ML. Во многих моделях есть «встроенные» способы отбора признаков — например, для случайного леса можно оценить важности признаков простым способом за 30 секунд:

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification

X, y = make_classification(n_samples=1000, n_features=50, n_informative=10, random_state=42)

# Обучили модель
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X, y)

# Посмотрели важность признаков
importances = rf.feature_importances_
top_features = sorted(range(len(importances)), key=lambda i: importances[i], reverse=True)[:10]
print(f"Топ-10 признаков: {top_features}")


Почему это работает? Потому что случайный лес рассчитывает, насколько каждый признак уменьшает ошибку на каждом шаге построения каждого дерева решений. Если признак не помогает, он не будет использоваться часто.


Однако этот метод не лишён недостатков, поэтому на практике есть большое количество алгоритмов отбора признаков, которые можно разделить на три группы:

1️⃣ Filter-методы (фильтруем признаки по статистике)

Это самый быстрый способ. Мы смотрим на каждый признак отдельно без построения модели: например, удаляем признаки с низкой дисперсией (по сути делаем предположение, что раз они не очень разнообразны, то и не очень полезны).

from sklearn.feature_selection import VarianceThreshold

selector = VarianceThreshold(threshold=0.01)
X_filtered = selector.fit_transform(X)


Отличный вариант на случай, если у вас очень много признаков и нужно быстро сократить их количество.

2️⃣ Wrapper-методы (обёртки)

Более медленные, но умные методы — тренируем модель много раз, удаляя или добавляя признаки.

from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression

# RFE (recursive feature elimination): обучаем модель, удаляем худший признак, повторяем
estimator = LogisticRegression(random_state=42, max_iter=1000)
rfe = RFE(estimator, n_features_to_select=10, step=1)
X_rfe = rfe.fit_transform(X, y)

print(f"Выбранные признаки: {rfe.support_}")


Отличный баланс скорости и качества, когда признаков не слишком много, и есть время подождать.

3️⃣ Embedded-методы (встроенные в модель)

Как раз к ним относятся feature_importances_ из случайного леса. Быстро, но зависит от конкретной модели.

Эти методы в совокупности помогут вам отобрать лучшие признаки для своих моделей и быстро улучшить качество.

Ставьте 🔥, если интересно!


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2032
Собеседуемся в Яндекс Лавку

В новой карточке нашего адвент-календаря разбираем вопросы с собеседования в Яндекс Лавку. Некоторые кажутся простыми… пока не задумаешься.

1️⃣ Нормальное распределение с медианой = 5. Чему равны среднее и мода?

2️⃣ SQL: COUNT(*) vs COUNT(column) — в чём разница и когда что использовать?

3️⃣ Магазин отдаёт вам 1% от оборота, но не меньше фиксированной суммы. Вдруг ваша доля стала 2%, а денег вы получили столько же. Что произошло?

4️⃣ Считаем вероятности с кубиками.

5️⃣ Курьер и светофор: красный горит 60 секунд. Какую погрешность заложить в расчёт времени доставки?

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥632
Привет, друзья! На связи Павел Беляев, ментор курса «Аналитик данных» и ведущий канала Тимлидское об аналитике 👋🏻

Предлагаю прямо сейчас посмотреть, какие вакансии уровня джуна в аналитике предлагает нам рынок. Сделаем небольшую подборку и суммаризируем требования.

Все вакансии на удалёнке, поэтому город не важен.

Аналитик данных без опыта:
https://hh.ru/vacancy/127825352
https://hh.ru/vacancy/127474353
https://hh.ru/vacancy/128050059
https://hh.ru/vacancy/128396273
https://hh.ru/vacancy/127929400

Как и ожидалось, требования «классические»:
SQL;
Python для автоматизации, интеграций, сбора данных;
Базовый матстат;
Электронные таблицы;
Аналитический склад ума, системное мышление, внимательность;
Коммуникативные навыки;
BI-системы базово.

Надо сказать, вакансий, где не требуется опыт, очень немного. Но можно схитрить! Учебный опыт непременно нужно описать, указав его длительность и характер.

Когда я искал сотрудников себе в команду, я часто видел, что кандидаты добавляли в резюме прохождение какого-либо релевантного курса как отдельное место работы. А почему бы и нет? Если человек освоил системно поданные знания и справился с учебными проектами и задачами, он может быть не менее или даже более подкованным, чем иные специалисты, отработавшие пару лет на какой-нибудь скромной позиции в неайти-компании.


А вот вакансии аналитика данных / BI-аналитика, где нужен опыт 1-3 года:
https://hh.ru/vacancy/127944026
https://hh.ru/vacancy/128325537
https://hh.ru/vacancy/127488381
https://hh.ru/vacancy/128051399
https://hh.ru/vacancy/127734119
https://hh.ru/vacancy/127925855

К требованиям добавляются:
Более глубокое знание всё того же SQL;
Python для анализа данных;
BI-системы — продвинутый уровень;
Ориентация в ETL-процессах;
Понимание качества данных и Data Governance (руководство данными);
Автономность и проактивность;
Плюсом является опыт аналитики в сфере данной компании;
Способность живо участвовать в процессах компании, помогать выстраивать аналитику.

А еще бывают даже вакансии для стажёров:
https://hh.ru/vacancy/128174505
https://hh.ru/vacancy/127925086

Подобный анализ вакансий вы можете проводить иногда и сами, чтобы уточнить картину о требованиях и задачах дата-аналитика.

Ну а если настроитесь серьёзно войти и закрепиться в сфере аналитики, рекомендую пройти полноценный курс, где собраны в единый комплекс знания, отвечающие всем требованиям работодателей. Курс «Fullstack-аналитик» от Simulative как раз такой — в нём разбираем и SQL, и BI-системы, и ETL-процессы, и многое другое. DA и BI-модули будут под моим менторством!


Наберём 50 реакций на пост — и сделаем такой обзор для вакансий в BI и DE 😉

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍298🔥52
Узнаём лайфхаки оконных функций в SQL

Сегодня видеокарточка в адвент-календаре! CEO Simulative Андрон Алесанян делится интересным способом индексировать данные в SQL Задача — найти в массиве данных самое раннее действие.

Решения будет два — более очевидное, и более изящное и оптимальное по времени.

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥522
Что нужно уметь и знать, чтобы устроиться аналитиком?

Нам часто задают вопрос: «А что нужно знать, чтобы быстро устроиться аналитиком в крутую компанию на хорошую зарплату?»

Мы подготовили для вас список навыков, которые вам точно нужно освоить для комфортного трудоустройства.

Знания:
Продуктовые метрики (MAU/WAU/DAU, retention, LTV, Lifetime, CAC, CPL, CR и т. д.);
Математическая статистика, теория вероятностей;
А/B тестирование и проверка гипотез.

Навыки:
SQL на продвинутом уровне;
Базовый синтаксис Python на высоком уровне;
Библиотеки Python для анализа данных (Numpy, Pandas);
Библиотеки Python для визуализации данных (Matplotlib, Seaborn, Plotly).

Инструменты:
BI-системы (Power BI, Metabase/Redash/Superset);
Git / GitHub.

Что ещё нужно уметь?

Приносить пользу для бизнеса. Нужно не просто уметь писать SQL-запросы, а подобрать нужный вид анализа под задачу, провести аналитику с помощью SQL и сгенерировать выводы.
Собрать портфолио. Когда ты только в начале пути, правильно оформленное резюме/портфолио — ключ к успеху.
Уметь проходить собеседования. Тестовые задания и технические собеседования — всегда большой стресс. Нужно иметь высокий уровень подготовки и натренированность, чтобы достойно проходить все этапы найма.

В целом, это основной арсенал, который понадобится вам при поиске работы в сфере анализа данных. Выглядит массивно, согласитесь?

Если вы только присматриваетесь к сфере аналитики, то приглашаем вас на наш интенсив 9-11 декабря — вы примерите на себя рабочие задачи аналитика, поймёте, насколько комфортно чувствуете себя с инструментами и цифрами, и наконец-то снимете страх перед кодом и «сложной аналитикой».​


Зарегистрироваться на интенсив

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥44
Интенсив по аналитике данных стартует сегодня!

Следующая карточка адвент-календаря поможет вам начать путь в аналитике данных. Подключайтесь к первому дню интенсива, где мы расскажем, чем занимается аналитик и какие метрики помогают бизнесу зарабатывать. Вы научитесь смотреть на продукт через цифры и соберёте простую воронку в таблицах.

Стартуем в 19:00 МСК!

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥2🎄1