Simulative – Telegram
7.39K subscribers
1.7K photos
70 videos
1 file
1.26K links
Привет! Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support
Download Telegram
Мини-курс в прямом эфире: протестируйте профессию аналитика данных за 3 дня

На этом бесплатном мини‑курсе вы за три вечера пройдёте путь от «ничего не знаю» до первого реального аналитического кейса: поработаете с таблицами, SQL и Python, выполните практические задания и соберёте понятный отчёт по данным. В итоге вы примерите на себя рабочие задачи аналитика, поймёте, насколько комфортно чувствуете себя с инструментами и цифрами, и наконец-то снимете страх перед кодом и «сложной аналитикой».​

Все три дня с вами в прямом эфире будет Денис Иванов, Senior Product Analyst с опытом более 5 лет в Тинькофф и других крупных компаниях, который запускал аналитические системы с нуля.


Что будет на трёхдневном мини-курсе:

➡️ 9 декабря, 19:00 МСК: разберётесь, чем занимается аналитик и какие метрики помогают бизнесу зарабатывать. Научитесь смотреть на продукт через цифры и соберёте простую воронку в таблицах.
➡️ 10 декабря, 19:00 МСК: напишете свои первые запросы на SQL и посчитаете ключевые показатели из базы. Увидите, что код писать запросы на SQL можно освоить с нуля и быстро извлекать пользу из данных.
➡️ 11 декабря, 19:00 МСК: откроете для себя Python, загрузите данные, очистите их и сделаете простые графики. В итоге получите понятный отчёт и поймёте, готовы ли идти в аналитику дальше.

❗️ Смотрите занятия в прямом эфире, чтобы успевать делать домашки и получать разбор от спикера. Самые сильные участники получат грант на дальнейшее обучение!


➡️ Зарегистрироваться на мини-курс

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥854
Simulative pinned a photo
🔥 — жизненно
☃️ — уже жду Новый год!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1710😁21
Исследуем Seaborn

Новая карточка в нашем адвент-календаре! Из неё вы узнаете, как работать с Seaborn — мощной библиотекой для визуализации данных в Python. Она предоставляет высокоуровневый интерфейс для создания привлекательных и информативных статистических графиков.

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥732
Большой пак знаний по SQL со скидкой 20%

Вы просили, мы сделали — собрали все наши модули по SQL в отдельный курс! В нём будут как основы SQL, так и продвинутый модуль из авторского тренинга Владимира Лунёва.

Что вас ждёт на полном курсе:

Подробная база: ознакомитесь с SQL и получите первые навыки, даже если до этого никогда не работали с базами данных;

Продвинутый SQL для работы с большими данными: анонимные блоки и переменные, условные операторы и циклы, курсоры функции и процедуры, триггеры, обработка ошибок и оптимизация.

Авторский тренинг «Продвинутый SQL» и ещё больше практических задачек;

ClickHouse и хранилища данных: все ключевые функции в ClickHouse, соединения данных, работа с сырыми данными и закрепление всего пройденного на кейсах.

Для первых записавшихся держим ранние цены — скидка 20% на курс. Чем не повод начать обучение в этом году?


💪 Узнать больше о курсе и оставить заявку

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥742
Отбор признаков в машинном обучении

Привет! На связи Кристина Желтова, ментор курса «ML-инженер» 👋🏻

Представьте, что вы обучаете ML-модель на датасете из 50-ти признаков с точностью 87%. Добавили еще 20 признаков и качество упало до 83% — разве больше данных не значит лучше? Нет, если данные некачественные. Чем больше бесполезных признаков, тем быстрее модель переобучается и хуже обобщается на новые данные.

В этой ситуации на помощь приходит отбор признаков (feature selection) — одна из самых недооценённых техник классического ML. Во многих моделях есть «встроенные» способы отбора признаков — например, для случайного леса можно оценить важности признаков простым способом за 30 секунд:

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification

X, y = make_classification(n_samples=1000, n_features=50, n_informative=10, random_state=42)

# Обучили модель
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X, y)

# Посмотрели важность признаков
importances = rf.feature_importances_
top_features = sorted(range(len(importances)), key=lambda i: importances[i], reverse=True)[:10]
print(f"Топ-10 признаков: {top_features}")


Почему это работает? Потому что случайный лес рассчитывает, насколько каждый признак уменьшает ошибку на каждом шаге построения каждого дерева решений. Если признак не помогает, он не будет использоваться часто.


Однако этот метод не лишён недостатков, поэтому на практике есть большое количество алгоритмов отбора признаков, которые можно разделить на три группы:

1️⃣ Filter-методы (фильтруем признаки по статистике)

Это самый быстрый способ. Мы смотрим на каждый признак отдельно без построения модели: например, удаляем признаки с низкой дисперсией (по сути делаем предположение, что раз они не очень разнообразны, то и не очень полезны).

from sklearn.feature_selection import VarianceThreshold

selector = VarianceThreshold(threshold=0.01)
X_filtered = selector.fit_transform(X)


Отличный вариант на случай, если у вас очень много признаков и нужно быстро сократить их количество.

2️⃣ Wrapper-методы (обёртки)

Более медленные, но умные методы — тренируем модель много раз, удаляя или добавляя признаки.

from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression

# RFE (recursive feature elimination): обучаем модель, удаляем худший признак, повторяем
estimator = LogisticRegression(random_state=42, max_iter=1000)
rfe = RFE(estimator, n_features_to_select=10, step=1)
X_rfe = rfe.fit_transform(X, y)

print(f"Выбранные признаки: {rfe.support_}")


Отличный баланс скорости и качества, когда признаков не слишком много, и есть время подождать.

3️⃣ Embedded-методы (встроенные в модель)

Как раз к ним относятся feature_importances_ из случайного леса. Быстро, но зависит от конкретной модели.

Эти методы в совокупности помогут вам отобрать лучшие признаки для своих моделей и быстро улучшить качество.

Ставьте 🔥, если интересно!


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2032
Собеседуемся в Яндекс Лавку

В новой карточке нашего адвент-календаря разбираем вопросы с собеседования в Яндекс Лавку. Некоторые кажутся простыми… пока не задумаешься.

1️⃣ Нормальное распределение с медианой = 5. Чему равны среднее и мода?

2️⃣ SQL: COUNT(*) vs COUNT(column) — в чём разница и когда что использовать?

3️⃣ Магазин отдаёт вам 1% от оборота, но не меньше фиксированной суммы. Вдруг ваша доля стала 2%, а денег вы получили столько же. Что произошло?

4️⃣ Считаем вероятности с кубиками.

5️⃣ Курьер и светофор: красный горит 60 секунд. Какую погрешность заложить в расчёт времени доставки?

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥632
Привет, друзья! На связи Павел Беляев, ментор курса «Аналитик данных» и ведущий канала Тимлидское об аналитике 👋🏻

Предлагаю прямо сейчас посмотреть, какие вакансии уровня джуна в аналитике предлагает нам рынок. Сделаем небольшую подборку и суммаризируем требования.

Все вакансии на удалёнке, поэтому город не важен.

Аналитик данных без опыта:
https://hh.ru/vacancy/127825352
https://hh.ru/vacancy/127474353
https://hh.ru/vacancy/128050059
https://hh.ru/vacancy/128396273
https://hh.ru/vacancy/127929400

Как и ожидалось, требования «классические»:
SQL;
Python для автоматизации, интеграций, сбора данных;
Базовый матстат;
Электронные таблицы;
Аналитический склад ума, системное мышление, внимательность;
Коммуникативные навыки;
BI-системы базово.

Надо сказать, вакансий, где не требуется опыт, очень немного. Но можно схитрить! Учебный опыт непременно нужно описать, указав его длительность и характер.

Когда я искал сотрудников себе в команду, я часто видел, что кандидаты добавляли в резюме прохождение какого-либо релевантного курса как отдельное место работы. А почему бы и нет? Если человек освоил системно поданные знания и справился с учебными проектами и задачами, он может быть не менее или даже более подкованным, чем иные специалисты, отработавшие пару лет на какой-нибудь скромной позиции в неайти-компании.


А вот вакансии аналитика данных / BI-аналитика, где нужен опыт 1-3 года:
https://hh.ru/vacancy/127944026
https://hh.ru/vacancy/128325537
https://hh.ru/vacancy/127488381
https://hh.ru/vacancy/128051399
https://hh.ru/vacancy/127734119
https://hh.ru/vacancy/127925855

К требованиям добавляются:
Более глубокое знание всё того же SQL;
Python для анализа данных;
BI-системы — продвинутый уровень;
Ориентация в ETL-процессах;
Понимание качества данных и Data Governance (руководство данными);
Автономность и проактивность;
Плюсом является опыт аналитики в сфере данной компании;
Способность живо участвовать в процессах компании, помогать выстраивать аналитику.

А еще бывают даже вакансии для стажёров:
https://hh.ru/vacancy/128174505
https://hh.ru/vacancy/127925086

Подобный анализ вакансий вы можете проводить иногда и сами, чтобы уточнить картину о требованиях и задачах дата-аналитика.

Ну а если настроитесь серьёзно войти и закрепиться в сфере аналитики, рекомендую пройти полноценный курс, где собраны в единый комплекс знания, отвечающие всем требованиям работодателей. Курс «Fullstack-аналитик» от Simulative как раз такой — в нём разбираем и SQL, и BI-системы, и ETL-процессы, и многое другое. DA и BI-модули будут под моим менторством!


Наберём 50 реакций на пост — и сделаем такой обзор для вакансий в BI и DE 😉

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍298🔥52
Узнаём лайфхаки оконных функций в SQL

Сегодня видеокарточка в адвент-календаре! CEO Simulative Андрон Алесанян делится интересным способом индексировать данные в SQL Задача — найти в массиве данных самое раннее действие.

Решения будет два — более очевидное, и более изящное и оптимальное по времени.

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥522
Что нужно уметь и знать, чтобы устроиться аналитиком?

Нам часто задают вопрос: «А что нужно знать, чтобы быстро устроиться аналитиком в крутую компанию на хорошую зарплату?»

Мы подготовили для вас список навыков, которые вам точно нужно освоить для комфортного трудоустройства.

Знания:
Продуктовые метрики (MAU/WAU/DAU, retention, LTV, Lifetime, CAC, CPL, CR и т. д.);
Математическая статистика, теория вероятностей;
А/B тестирование и проверка гипотез.

Навыки:
SQL на продвинутом уровне;
Базовый синтаксис Python на высоком уровне;
Библиотеки Python для анализа данных (Numpy, Pandas);
Библиотеки Python для визуализации данных (Matplotlib, Seaborn, Plotly).

Инструменты:
BI-системы (Power BI, Metabase/Redash/Superset);
Git / GitHub.

Что ещё нужно уметь?

Приносить пользу для бизнеса. Нужно не просто уметь писать SQL-запросы, а подобрать нужный вид анализа под задачу, провести аналитику с помощью SQL и сгенерировать выводы.
Собрать портфолио. Когда ты только в начале пути, правильно оформленное резюме/портфолио — ключ к успеху.
Уметь проходить собеседования. Тестовые задания и технические собеседования — всегда большой стресс. Нужно иметь высокий уровень подготовки и натренированность, чтобы достойно проходить все этапы найма.

В целом, это основной арсенал, который понадобится вам при поиске работы в сфере анализа данных. Выглядит массивно, согласитесь?

Если вы только присматриваетесь к сфере аналитики, то приглашаем вас на наш интенсив 9-11 декабря — вы примерите на себя рабочие задачи аналитика, поймёте, насколько комфортно чувствуете себя с инструментами и цифрами, и наконец-то снимете страх перед кодом и «сложной аналитикой».​


Зарегистрироваться на интенсив

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥44
Интенсив по аналитике данных стартует сегодня!

Следующая карточка адвент-календаря поможет вам начать путь в аналитике данных. Подключайтесь к первому дню интенсива, где мы расскажем, чем занимается аналитик и какие метрики помогают бизнесу зарабатывать. Вы научитесь смотреть на продукт через цифры и соберёте простую воронку в таблицах.

Стартуем в 19:00 МСК!

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥2🎄1
Как пройти техническое интервью в Т-Банк

Ура, первый этап отбора пройден! И первая радость сменилась лёгкой паникой: «А что будут спрашивать на техсобесе?».

Расписали в блоге все этапы отбора, а также варианты вопросов на техническом интервью — с решениями и ответами:

https://simulative.ru/blog/t-bank-interview

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥54
Пишем первые запросы на SQL на интенсиве

Открываем новую карточку адвент-календаря — из неё вы напишете свои первые запросы на SQL и посчитаете ключевые показатели из базы.

Присоединяйтесь, даже если пропустили второй день — мы сохраним все записи!

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥3👍1
4 сценария, когда линейные модели лучше нейросетей

Привет! На связи Кристина Желтова, ментор курса «ML-инженер» 👋🏻

Представим ситуацию: вы потратили месяц работы на обучение нейросетевой модели, потом за 10 минут интереса ради обучили логистическую регрессию, и логрег победил. Это не шутка и не сказка, это происходит довольно часто.

Одно из самых больших заблуждений в ML — это мысль «нейросети сложнее, значит лучше».


На самом деле, бритва Оккама вот уже много сотен лет говорит: «Не следует множить сущее без необходимости». В машинном обучении это можно переформулировать так: «Если простая модель решает задачу, сложная модель её только усложнит».

Есть довольно много сценариев, когда простая линейная модель выигрывает по различным параметрам у более сложных моделей:

🟠 Сценарий 1: данные линейны по своей природе. Тогда линейная модель для них — то, что доктор прописал! А более сложные модели рискуют переобучиться и страдают от избыточной сложности.

🟠 Сценарий 2: мало данных. Если у вас всего несколько сотен примеров в обучающей выборке, риск переобучения велик при любой природе зависимости. Выбор будет снова не в пользу нейросетей и ансамблей.

🟠 Сценарий 3: интерпретируемость критична. В некоторых задачах важно не просто сделать предсказание, а объяснить, почему оно получилось именно таким. Чем сложнее и умнее модель, тем сложнее понять, как она принимает решения. В противовес, линейные модели максимально просты и прозрачны.

🟠 Сценарий 4: есть ограничения по ресурсам. Если в проде ограниченное количество ресурсов (память, GPU/CPU) или критично быстродействие, тяжелая нейросеть, как бы мы её ни оптимизировали, может всё равно не подойти.

Прежде чем переходить на более сложную модель, спросите себя:

Я попробовал базовую линейную модель?
Базовая модель показала плохое качество (< baseline или ожидаемого порога)?
Я выбрал следующую по сложности модель?
Новая модель даёт значимый прирост метрики?
Прирост оправдывает сложность (для прода и поддержки)?
У меня достаточно данных (> параметры × 10)?
Я валидировал на правильно разделённых данных (train/test, кроссвалидация)?
Новая модель не переобучилась?
Я точно знаю, почему новая модель лучше? (Не просто «она сложнее и круче», а именно почему)
Я готов поддерживать сложность в проде?

Если даже один ответ «нет», это весомый аргумент вернуться к более простой модели.

Ставьте 🔥, если было полезно!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥933
Строим графики на Python

Завершаем наш интенсив! В третий день вы откроете для себя Python, загрузите данные, очистите их и сделаете простые графики. В итоге получите понятный отчёт и поймёте, готовы ли идти в аналитику дальше.

Присоединяйтесь и регистрируйтесь в адвент-календаре!

➡️ Перейти в адвент-календарь

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🎄6🔥22
This media is not supported in your browser
VIEW IN TELEGRAM
Учитесь у профессионалов и достигайте успеха в построении эффективных дашбордов!

BI-аналитик — специалист, помогающий компаниям принимать обоснованные решения на основе анализа данных, представляя их в виде наглядных отчётов и дашбордов.

Уже в эту пятницу стартует новый поток курса «BI-аналитик». Какие компетенции вы получите в конце обучения:

🟠 Разберётесь в продуктовых метриках, которые используются чаще всего;
🟠 Освоите правила визуализации данных и научитесь строить красивые и понятные дашборды;
🟠 Сможете строить сложные дашборды в трёх самых популярных BI-системах — Power BI, Superset и Metabase, а также визуализировать и писать SQL-запросы;
🟠 Научитесь работать с классическими базами данными и хранилищами данных на примере самых популярных — PostgreSQL и ClickHouse.

На продвинутом и VIP-тарифах доступен карьерный модуль — поможем в подготовке к техническому собеседованию и разберём тестовые задания в компании.


➡️ Оставляйте заявку, уточняйте условия и выбирайте свое лучшее будущее в профессии!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥22
Ещё 5 полезных инструментов для аналитика

Привет, будущие дата‑аналитики! С вами Павел Беляев, ментор курсов «Аналитик данных» и «BI-аналитик» и ведущий канала Тимлидское об аналитике 👋🏻

Как-то я писал об основных библиотеках Python для аналитиков. Сегодня разберём наиболее популярные приложения для работы с данными.

1️⃣ DBeaver

DBeaver позволяет работать с базами данных на SQL и подключаться к разным СУБД, писать и выполнять запросы, визуализировать схемы БД.

Как установить:
Зайдите на официальный сайт dbeaver.io;
Выберите версию Community (бесплатная);
Скачайте установочный файл для вашей ОС;
Запустите установку и следуйте инструкциям.

Почему удобен:
🟠 Поддержка множества СУБД (PostgreSQL, MySQL, Oracle, ClickHouse и др.);
🟠 Удобный интерфейс для написания SQL‑запросов;
🟠 Возможность экспорта данных в CSV и Excel;
🟠 Встроенные инструменты для анализа структуры БД.

2️⃣ Notepad++

Это лёгкий текстовый редактор для работы с кодом, логами и CSV‑файлами. Идеален для быстрого просмотра и правки текстовых данных.

Как установить: перейдите на notepad-plus-plus.org, скачайте установщик и установите.

Почему удобен:
🟠 Малый вес и быстрая работа;
🟠 Подсветка синтаксиса для разных языков, сворачивание блоков кода;
🟠 Поиск и замена по регулярным выражениям;
🟠 Поддержка большого количества кодировок;
🟠 Множество дополнительных модулей (например, приведение JSON-файла в удобный вид).

3️⃣ VS Code (Visual Studio Code)

Это профессиональный универсальный редактор кода с поддержкой Python, SQL и других языков, используемых в аналитике.

Как установить:
Откройте сайт code.visualstudio.com;
Скачайте версию для вашей ОС;
Установите, следуя подсказкам;
Дополнительно, если нужно, установите расширения для Python, SQL и Jupyter.

Почему удобен:

🟠 Богатая экосистема расширений;
🟠 Встроенная интеграция с Git;
🟠 Отладка кода;
🟠 Поддержка Jupyter Notebook прямо в редакторе;
🟠 Возможность подключаться к удалённым виртуальным машинам и даже к БД;
🟠 Терминал (командная строка).

4️⃣ Anaconda

Это целый пакет программ, в который в т.ч. входит JupyterLab — расширенный редактор-интерпретатор питона Jupiter Notebook.

Как установить:
Зайдите на anaconda.com;
Скачайте дистрибутив Anaconda для вашей ОС;
Установите, выбрав опцию добавления в PATH;
После установки откройте Anaconda Navigator и запустите JupyterLab. Он откроется в браузере.

Почему удобен:
🟠 Jupiter/JupyterLab позволяет комбинировать код, визуализации и текст в одном документе;
🟠 Возможность запускать код по ячейкам, не выполняя всё сразу;
🟠 Можно работать в офлайне, результаты сохраняются на локальном диске;
🟠 Есть инструменты отладки кода.

5️⃣ Google Colab

Это облачная среда для работы с Jupyter Notebook. Не требует установки — всё работает в браузере.

Как открыть:
Перейдите на colab.research.google.com;
Войдите через аккаунт Google;
Создайте новый блокнот или загрузите существующий.

Почему удобно:
🟠 Бесплатный доступ к вычислительным мощностям Google для ресурсоёмких задач;
🟠 Автосохранение в Google Drive;
🟠 Возможность совместного редактирования;
🟠 Готовые примеры кода и шаблоны;
🟠 Не требует мощности локального компьютера.

Пробуйте, экспериментируйте и выбирайте то, что подходит именно вам! А если наберём 50 реакций под этим постом, сделаем ещё одну подборку полезных инструментов для аналитика 😉

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3174