Друзья, прямой эфир с Марией прошел отлично — спасибо, что присоединились! 🧡
А теперь обещанные плюшки для всех, кто с нами:
*️⃣ Сначала бонус от нас: подготовили для вас скидку 20% на курс-симулятор «BI-аналитик» — только до пятницы 25 апреля включительно!
В этом курсе вы научитесь:
🟠 Мыслить как аналитик: формулировать гипотезы, искать инсайты и формулировать идеи роста;
🟠 Освоите фишки визуализации, чтобы отчёты говорили сами за себя;
🟠 Разберётесь в продуктовых метриках и освоите SQL;
🟠 Сможете создавать понятные и сочные отчёты для любого бизнеса — даже с нуля!
Поток стартовал вчера, но вы еще успеваете включиться в обучение.
👉 Оставляйте заявку с указанием промокода BI20 — время ограничено!
*️⃣ И, наконец, собрали список рекомендаций от Марии в один файлик — открывайте, изучайте, вдохновляйтесь!
📎 Открыть список
А теперь обещанные плюшки для всех, кто с нами:
В этом курсе вы научитесь:
Поток стартовал вчера, но вы еще успеваете включиться в обучение.
👉 Оставляйте заявку с указанием промокода BI20 — время ограничено!
📎 Открыть список
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍6❤4
📌 Хотите выделиться на собеседовании? Разбираем алгоритмы сортировки на Python
Если вы хотите уверенно пройти интервью и показать глубокое знания, вам обязательно нужно знать алгоритмы сортировки без использования встроенной функции sort в Python.
*️⃣ Почему это важно?
В реальных задачах и на технических собеседованиях часто проверяют не только умение применять готовые инструменты, но и понимание базовых алгоритмов, их эффективности и особенностей. Кандидаты, объясняющие разницу между устойчивой и неустойчивой сортировкой, сразу попадают в топ-лист.
*️⃣ В нашем новом материале:
➕ Разберем 4 ключевых алгоритма с детализацией шагов и визуализацией
➕ Сравним эффективность: когда O(n²) — это норма, а когда нужен O(n log n)
➕ Реальные примеры кода — от «наивных» реализаций до оптимизированных версий
*️⃣ Что внутри?
🟠 Bubble Sort — почему он «пузырьковый» и зачем его знать;
🟠 Insertion Sort — в каких случаях он быстрее QuickSort;
🟠 Selection Sort — принцип «минимального элемента» на пальцах;
🟠 Merge Sort — как разделяй-и-властвуй спасает при больших данных.
👉 Переходите по ссылке и приступайте к изучению
#полезность
Если вы хотите уверенно пройти интервью и показать глубокое знания, вам обязательно нужно знать алгоритмы сортировки без использования встроенной функции sort в Python.
В реальных задачах и на технических собеседованиях часто проверяют не только умение применять готовые инструменты, но и понимание базовых алгоритмов, их эффективности и особенностей. Кандидаты, объясняющие разницу между устойчивой и неустойчивой сортировкой, сразу попадают в топ-лист.
👉 Переходите по ссылке и приступайте к изучению
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤4🔥4
Мы — образовательная платформа по обучению аналитиков и других специалистов в сфере данных. Наша фишка — обучение на кейсах из реального бизнеса и индивидуальный подход к студентам.
Несколько фактов о нас:
🧑💻 Simulative — это ещё и комьюнити
Мы верим, что аналитика — это не удел гиков, а мощный инструмент для любого бизнеса. Поэтому мы регулярно делимся статьями, бесплатными полезными материалами и проводим открытые онлайн-мероприятия — вебинары и стримы.
Наши программы:
Приглашаем вас на экскурсию в наш Симулятор! Посмотрите платформу вживую и узнайте, как начать карьеру в данных. Так вы сможете «пощупать» платформу прежде, чем инвестировать в обучение.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14🔥7👍6
Simulative pinned «📊 Главный пост этого канала и навигация Мы — образовательная платформа по обучению аналитиков и других специалистов в сфере данных. Наша фишка — обучение на кейсах из реального бизнеса и индивидуальный подход к студентам. Несколько фактов о нас: 🟠 Учим не…»
✨ Вебинар: Как собрать и автоматизировать анализ данных в Airflow с оповещениями в Telegram
29 апреля в 18:30 по МСК проведем вебинар, где вместе с Александром Дарьиным развернем пайплан в Airflow на датасетах Kaggle и алертах в Telegram. Александр — старший аналитик данных ООО СберТройка, автор канала «Аналитик на минималках».
А теперь расшифровка, что же мы будем делать:
🟠 Выберем данные — заглянем в огромный каталог Kaggle (450+ тысяч наборов данных) и возьмём любой для примера;
🟠 Настроим автоматическую загрузку — покажем, как это делается в Airflow (инструменте для управления задачами);
🟠 Исследуем данные — простыми методами проверим их качество и построим наглядные графики;
🟠 Соберем весь процесс в один пайплайн — чтобы всё работало само, без ручного вмешательства;
🟠 Добавим уведомления в Telegram — если в данных что-то пошло не так, бот сразу вас предупредит.
— Новичкам в аналитике / data-инженерии: чтобы не тратить часы на рутину и сразу фокусироваться на важном — анализе и выводах.
— Всем, кому интересно, как автоматизируют работу с данными, масштабировать работу, избегать ошибок и освободить время для сложных задач.
✔️ И, как всегда, ответим на все вопросы в прямом эфире.
Присоединяйся к вебинару — никакой нудятины, только нужная теория и толькохардкор практика!
➡️ Зарегистрироваться
#вебинар
29 апреля в 18:30 по МСК проведем вебинар, где вместе с Александром Дарьиным развернем пайплан в Airflow на датасетах Kaggle и алертах в Telegram. Александр — старший аналитик данных ООО СберТройка, автор канала «Аналитик на минималках».
А теперь расшифровка, что же мы будем делать:
Кому подойдёт?
— Новичкам в аналитике / data-инженерии: чтобы не тратить часы на рутину и сразу фокусироваться на важном — анализе и выводах.
— Всем, кому интересно, как автоматизируют работу с данными, масштабировать работу, избегать ошибок и освободить время для сложных задач.
✔️ И, как всегда, ответим на все вопросы в прямом эфире.
Присоединяйся к вебинару — никакой нудятины, только нужная теория и только
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥7❤5🎉1🤩1
Типичная ошибка в SQL: не использовать CASE 😱
А вы используете CASE? Иногда вы можете сократить свои запросы в несколько раз, используя его, но мы часто наблюдаем, что новички игнорируют использование этого оператора.
Вот, например, была задача — вывести поле
Пользователь предложил такое решение:
В целом, не так плохо. Но это всего лишь промежуточный запрос, задача была намного масштабней и таких конструкций в итоге было наворочено очень много.
А вот то же самое с
Согласитесь, это намного лаконичнее и понятнее! 👍
Так более того,
А еще, кстати, COALESCE — это просто «синтаксический сахар» и обертка вокруг CASE.
Используя оператор CASE в SQL, вы можете легко выполнять различные условные операции и улучшать читаемость ваших запросов. Не игнорируйте этот мощный инструмент!
А вы используете CASE? Иногда вы можете сократить свои запросы в несколько раз, используя его, но мы часто наблюдаем, что новички игнорируют использование этого оператора.
Вот, например, была задача — вывести поле
sum со знаком -, если type=1 и со знаком +, если type=0.Пользователь предложил такое решение:
SELECT id, sum FROM transactions t
WHERE type = 0
UNION ALL
SELECT id, -sum FROM transactions t
WHERE type = 1
В целом, не так плохо. Но это всего лишь промежуточный запрос, задача была намного масштабней и таких конструкций в итоге было наворочено очень много.
А вот то же самое с
CASE:SELECT id,
CASE
WHEN type = 0
THEN sum
ELSE -sum
END
FROM transactions t
Согласитесь, это намного лаконичнее и понятнее! 👍
Так более того,
CASE можно использовать еще много для чего. Например, чтобы сделать из «длинной» таблицы «широкую». Или для суммирования/подсчета количества внутри агрегатных функций (да, CASE можно использовать внутри агрегатных функций!).А еще, кстати, COALESCE — это просто «синтаксический сахар» и обертка вокруг CASE.
Используя оператор CASE в SQL, вы можете легко выполнять различные условные операции и улучшать читаемость ваших запросов. Не игнорируйте этот мощный инструмент!
❤28👍10🔥6
Бесплатный мини-курс по SQL для начинающих 🔥
Этот мини-курс подойдет Вам, если:
🔹 У вас совсем нет опыта в SQL;
🔹 Вы немного владеете базовым SQL, но нет системности;
🔹 Вы никогда не применяли SQL для решения бизнес-задач.
На мини-курсе помимо лекций будет доступ к боевому кластеру, который позволит вам самостоятельно отработать задачи.
❓Что вас ждет:
🔸 2 обучающих лекции с разбором практических заданий;
🔸 Доступ к боевому кластеру;
🔸 Работа с профессиональными инструментами и программами.
➡️ Получить материал
#полезность
Этот мини-курс подойдет Вам, если:
🔹 У вас совсем нет опыта в SQL;
🔹 Вы немного владеете базовым SQL, но нет системности;
🔹 Вы никогда не применяли SQL для решения бизнес-задач.
На мини-курсе помимо лекций будет доступ к боевому кластеру, который позволит вам самостоятельно отработать задачи.
❓Что вас ждет:
🔸 2 обучающих лекции с разбором практических заданий;
🔸 Доступ к боевому кластеру;
🔸 Работа с профессиональными инструментами и программами.
#полезность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤2👍2
Друзья, по техническим причинам, последние пару дней часть пользователей столкнулась с отсутствием реакции в телеграм-боте.
На текущий момент проблема устранена — поэтому рекомендуем попробовать еще раз получить материал или зарегистрироваться на вебинар.
— Вебинар завтра в 18:30 на тему «Как собрать и автоматизировать анализ данных в Airflow с оповещениями в Telegram».
— Полезность «Бесплатный мини-курс по SQL для начинающих»
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥6❤2
Simulative
✨ Вебинар: Как собрать и автоматизировать анализ данных в Airflow с оповещениями в Telegram 29 апреля в 18:30 по МСК проведем вебинар, где вместе с Александром Дарьиным развернем пайплан в Airflow на датасетах Kaggle и алертах в Telegram. Александр — старший…
Уже сегодня в 18:30 по МСК проведем вебинар с Александром Дарьиным — старшим аналитиком данных ООО СберТройка, автором канала «Аналитик на минималках».
Что же мы будем делать:
✔️ И, как всегда, ответим на все вопросы в прямом эфире!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4🔥3
Александр ждёт вас на вебинаре в 18:30 по МСК!
А еще предлагает задуматься над таким вопросом: в IT есть такое направление как наука о данных.
🤔 Как думаете, какое слово чаще всего встречается в таких вакансиях?
Ответ сможете узнать на вебинаре😉
➡️ Зарегистрироваться
А еще предлагает задуматься над таким вопросом: в IT есть такое направление как наука о данных.
Ответ сможете узнать на вебинаре😉
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤3👍1
Сейчас мы познакомились с Александром Дарьиным — старшим аналитиком данных ООО СберТройка, автором канала «Аналитик на минималках».
Теперь приступаем к выбору датасета в Kaggle, проверим их качество и начнем работу в Airflow.
Материалы, которыми будет делиться спикер, будут доступны только зрителям в прямом эфире. А еще в прямом эфире можно задать вопросы спикеру и получить еще больше пользы!
Кстати, видели как спрашивают — а есть ли истории от «вкатунов» с самого нуля, кто вообще в IT не работал? Александр рассказал свою историю: пришел в аналитику из рабочей профессии и уже через 2,5 года — старший аналитик данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍4❤3
🔥 Прямой эфир с Евгением — студентом, который сменил профессию!
Сегодня в 15:00 по МСК ждём вас на стриме, где Андрон Алексанян, СЕО Simulative и один из ведущих преподавателей, и наш студент Евгений Козляев обсудят:
🟠 Как Евгений перешёл из продаж в аналитику — личный опыт и лайфхаки.
🟠 Сложности и победы в обучении: что давалось легко, а где пришлось попотеть.
🟠 Бонус от нас: анонсируем эксклюзивное предложение по трудоустройству для аналитиков!
Почему стоит зайти?
🔹 Для новых студентов — это шанс вдохновиться, увидеть реальный пример смены профессии и избежать типичных ошибок;
🔹 Для действующих студентов — получить вдохновение не сдаваться на пути и реальную возможность получить offer!
❗️ Эфир пройдет в нашем телеграм-канале — без регистрации и СМС. Вопросы можно задавать в комментариях к этому посту или в прямом эфире — для этого во время трансляции надо будет нажать «поднять руку».
До встречи на эфире!
Сегодня в 15:00 по МСК ждём вас на стриме, где Андрон Алексанян, СЕО Simulative и один из ведущих преподавателей, и наш студент Евгений Козляев обсудят:
Почему стоит зайти?
🔹 Для новых студентов — это шанс вдохновиться, увидеть реальный пример смены профессии и избежать типичных ошибок;
🔹 Для действующих студентов — получить вдохновение не сдаваться на пути и реальную возможность получить offer!
До встречи на эфире!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🎉5🔥4
⚡️ Друзья, начали наш эфир! Подключайтесь: https://news.1rj.ru/str/itresume_chat/18190
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Разбор SQL-задач для собеседований и не только
SQL и агрегация — основа 80% задач на собеседованиях в аналитику и Data Science. Но даже опытные кандидаты теряются, когда нужно быстро написать запрос под давлением.
В материале — разбор 5 реальных задач по агрегации и группировке данных с подробными объяснениями и примерами на Python + SQL.
Что внутри:
🟠 Работа с реальными таблицами (сотрудники, заказы, продажи, Airbnb, платежи);
🟠 Понятные SQL-запросы с разбором ключевых операторов GROUP BY, HAVING, агрегатных функций;
🟠 Практический код для запуска и проверки запросов в Python (Google Colab-ready!);
🟠 Таблицы с примерами данных для быстрого старта.
Зачем читать?
🟠 Научитесь решать типовые задачи с собеседований;
🟠 Поймёте, как правильно группировать и агрегировать данные;
🟠 Получите готовый шаблон для практики и подготовки.
Прокачайте свои SQL-навыки и будьте готовы к любым вопросам на интервью! 🚀
➡️ Получить материал
SQL и агрегация — основа 80% задач на собеседованиях в аналитику и Data Science. Но даже опытные кандидаты теряются, когда нужно быстро написать запрос под давлением.
В материале — разбор 5 реальных задач по агрегации и группировке данных с подробными объяснениями и примерами на Python + SQL.
Что внутри:
Зачем читать?
Прокачайте свои SQL-навыки и будьте готовы к любым вопросам на интервью! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤4👍4😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🐼 Pandas для всех — бесплатный курс от Simulative
Pandas — must-have инструмент для аналитика. Хотите работать с данными как профи?
Наша команда приглашает вас на бесплатный онлайн-курс, где на практических примерах и задачах вы прокачаете навыки и знания библиотеки Pandas в Python.
За неделю вы:
🟠 Освоите Pandas от нуля до продвинутого уровня: от базовых операций до сложной агрегации и оконных функций;
🟠 Научитесь решать реальные бизнес-задачи: ABC/XYZ-анализ, динамика продаж, автоматизация отчётов;
🟠 Создадите кейс для портфолио — автоматизация обработки финансовых данных аптечной сети.
➡️ Записаться на курс
🎁 Бонусы для участников:
🟠 Шпаргалка по Pandas — все основные функции под рукой;
🟠 Практические задачи с разборами;
🟠 Роадмап аналитика — что учить дальше?
🟠 Разбор реального кейса от Андрона.
➡️ Записаться на курс
Pandas — must-have инструмент для аналитика. Хотите работать с данными как профи?
Наша команда приглашает вас на бесплатный онлайн-курс, где на практических примерах и задачах вы прокачаете навыки и знания библиотеки Pandas в Python.
За неделю вы:
🎁 Бонусы для участников:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🤩4🔥3👍2
Media is too big
VIEW IN TELEGRAM
Аналитика в России — это хардкор)
Да, рынок аналитики требует от соискателей довольно серьезные познания. Мы знаем это не понаслышке — наша программа построена на реальных кейсах из топовых компаний, а не абстрактных примерах.
На видео — фрагмент подкаста с Дмитрием Аношиным, работающим Data Engineering Leader и автором телеграм-канала «Инжиниринг Данных», 15 лет в аналитике и инжиниринге данных.
Уже завтра стартует новый поток нашего курса-симулятора «Инженер данных».
🔥 Почему выбирают нас?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤4🔥3
Друзья, буквально позавчера провели прямой эфир с нашим студентом, который уже успешно работает по своей новой специальности. Делимся записью эфира!
😶 VK Video
😶 YouTube
Смотрите и вдохновляйтесь, а мы всегда рядом!
‼️ Kind reminder: сегодня стартует новый поток еще одной нашей программы — Fullstack аналитик.
Fullstack-аналитик — универсальный специалист, который в одиночку может выстроить аналитику любому бизнесу:
🟠 Готовит данные как дата-инженер.
🟠 Анализирует как аналитик данных.
🟠 Визуализирует понятные отчёты как BI-специалист.
Один человек — полный цикл аналитики. Именно таких экспертов ищут компании!
👉 Успейте записаться — старт уже сегодня!
P.S. А если сомневаетесь — посмотрите эфир. Наш студент тоже когда-то сомневался ;)
Смотрите и вдохновляйтесь, а мы всегда рядом!
Fullstack-аналитик — универсальный специалист, который в одиночку может выстроить аналитику любому бизнесу:
Один человек — полный цикл аналитики. Именно таких экспертов ищут компании!
👉 Успейте записаться — старт уже сегодня!
P.S. А если сомневаетесь — посмотрите эфир. Наш студент тоже когда-то сомневался ;)
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Видео
Как стать аналитиком с нуля? Переход от продаж к аналитике данных. Реальная история студента
Станьте аналитиком данных, за которым работодатели выстраиваются в очередь: https://vk.cc/cLtA56 Данное видео - запись прямого эфира в телеграм-канале Simulative https://news.1rj.ru/str/+jf2U-xoiOwRmYTZi К сожалению, первая минута не записалась, но критически это ни…
👍8❤7🔥4
🔥 Пошаговый план: как стать аналитиком данных в 2025
Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?
6 мая в 18:30 по МСК с Андроном Алексаняном — CEO Simulative и автором телеграм-канала ANDRON ALEXANYAN — разберем реальные кейсы, покажем рабочие схемы и четкий план, как устроиться в аналитику быстрее, даже если у вас нет опыта.
Что будет на вебинаре?
🟠 Разберем полный роадмап: что учить, в каком порядке, до какого уровня, на что не тратить время и какие проекты делать;
🟠 Лайфхаки трудоустройства:
— Покажем реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— Обсудим какие отклики работают, а какие сразу отправляют в корзину;
— Изнанка найма: инсайдерский взгляд на процессы отбора и как использовать это знание для трудоустройства.
🟠 Практические техники для новичков: разберём, как компенсировать недостаток опыта и быстро закрывать пробелы в знаниях.
➡️ Зарегистрироваться
Вам будет полезно, если:
✔️ Только начинаете путь в аналитике и не знаете, как устроиться без опыта.
✔️ Учитесь сами, но не понимаете, какие навыки действительно востребованы.
✔️ Отправляете резюме, но не получаете откликов.
❗️ Разберем только конкретику, без воды. Кроме того, узнаете про дополнительный бонус от нас, который поможет бустануть вам карьеру.
➡️ Зарегистрироваться
#вебинар
Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?
6 мая в 18:30 по МСК с Андроном Алексаняном — CEO Simulative и автором телеграм-канала ANDRON ALEXANYAN — разберем реальные кейсы, покажем рабочие схемы и четкий план, как устроиться в аналитику быстрее, даже если у вас нет опыта.
Что будет на вебинаре?
— Покажем реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— Обсудим какие отклики работают, а какие сразу отправляют в корзину;
— Изнанка найма: инсайдерский взгляд на процессы отбора и как использовать это знание для трудоустройства.
Вам будет полезно, если:
✔️ Только начинаете путь в аналитике и не знаете, как устроиться без опыта.
✔️ Учитесь сами, но не понимаете, какие навыки действительно востребованы.
✔️ Отправляете резюме, но не получаете откликов.
#вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤5👍3
3 варианта ранжирования в Pandas — какой правильный? 🔥
Pandas — один из основных инструментов аналитика: с его помощью можно решить огромное количество аналитических задач + он сильно помогает в оптимизации рутинной работы. А еще его большое преимущество — его вполне реально выучить всего за 2 недели.
Однако в Pandas есть много тонких моментов, хотим поделиться как раз одним из них.
Ниже мы будем описывать свои действия, а под постом прикрепим карточки с таблицей.
✅ Рассмотрим пример
Допустим, у вас есть датафрейм Pandas с информацией о менеджерах и их продажах. Ваша задача — отранжировать продажи в рамках каждого менеджера от минимальной до максимальной.
Код для создания датафрейма:
Сделаем это тремя способами и посмотрим на разницу:
▪️rank
▪️rank + dense
▪️cumcount
✅ Способ 1: rank
Самый простой способ — сделать это с помощью метода
Это связано с тем, что по умолчанию rank ставит средний ранг в группе — в данном случае среднее значение между (2, 3, 4).
Что еще интересно — после 3 сразу идет 5, то есть ни 2, ни 4 у нас в этом наборе нет.
✅ Способ 2: rank + dense
Есть способ немного «улучшить» ранжирование, сделав ранг «плотным». Это значит, что не будет разрывов, как в предыдущем случае.
Давайте снова посмотрим на 4 менеджера - теперь у него все значения 700 имеют ранг 2, а после него логично идет ранг 3. Это уже сильно лучше!
✅ Способ 3: cumcount
А что, если мы вообще не хотим повторять ранги, даже если значения совпадают?
Тогда можно воспользоваться методом cumcount, который просто ранжирует значения по порядку, даже если они совпадают.
По сути, мы получаем аналог функции
✅ Заключение
Вот такая тонкая фишка — теперь вы сможете подбирать нужный вариант, в зависимости от задачи.
Кстати, последнее время в аналитике активно развивается аутсоринг и фриланс — даже с минимальным набором знаний вы можете начать их монетизировать и нарабатывать опыт через фриланс-платформы.
Например, за написание скрипта, который автоматизирует обработку эксельки вполне могут дать более 10 000 рублей, а займет это у вас 2 часа времени. Даже выполняя 1 заказ в день, сидя дома, вы можете делать от 150 000 рублей в месяц без напряга. Хорошая прибавка к зарплате 😁 Если интересно — примеры нескольких классных проектов скинем в комментарии.
Хотите тоже освоить один из востребованных инструментов аналитика и начать монетизировать свои знания через несколько месяцев? Записывайтесь на наши бесплатные курсы, таких как «Бесплатный курс по Pandas» 👉🏻 ссылка
Pandas — один из основных инструментов аналитика: с его помощью можно решить огромное количество аналитических задач + он сильно помогает в оптимизации рутинной работы. А еще его большое преимущество — его вполне реально выучить всего за 2 недели.
Однако в Pandas есть много тонких моментов, хотим поделиться как раз одним из них.
Ниже мы будем описывать свои действия, а под постом прикрепим карточки с таблицей.
✅ Рассмотрим пример
Допустим, у вас есть датафрейм Pandas с информацией о менеджерах и их продажах. Ваша задача — отранжировать продажи в рамках каждого менеджера от минимальной до максимальной.
Код для создания датафрейма:
import pandas as pd
df = pd.DataFrame({
'manager': [1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4],
'sales': [100, 200, 300, 200, 100, 500, 700,
700, 700, 600, 800]
})
Сделаем это тремя способами и посмотрим на разницу:
▪️rank
▪️rank + dense
▪️cumcount
✅ Способ 1: rank
df['rank1'] = (
df
.groupby('manager')['sales']
.rank()
)
Самый простой способ — сделать это с помощью метода
rank. И кажется, что все нормально - но посмотрите на продажи 4 менеджера. Всем записям со значением 700 почему-то присвоен ранг 3. Это связано с тем, что по умолчанию rank ставит средний ранг в группе — в данном случае среднее значение между (2, 3, 4).
Что еще интересно — после 3 сразу идет 5, то есть ни 2, ни 4 у нас в этом наборе нет.
✅ Способ 2: rank + dense
df['rank2'] = (
df
.groupby('manager')['sales']
.rank(method='dense')
)
Есть способ немного «улучшить» ранжирование, сделав ранг «плотным». Это значит, что не будет разрывов, как в предыдущем случае.
Давайте снова посмотрим на 4 менеджера - теперь у него все значения 700 имеют ранг 2, а после него логично идет ранг 3. Это уже сильно лучше!
✅ Способ 3: cumcount
df['rank3'] = (
df
.sort_values(['manager', 'sales'])
.groupby('manager')['sales']
.cumcount() + 1
)
А что, если мы вообще не хотим повторять ранги, даже если значения совпадают?
Тогда можно воспользоваться методом cumcount, который просто ранжирует значения по порядку, даже если они совпадают.
По сути, мы получаем аналог функции
ROW_NUMBER в SQL, что также полезно в некоторых ситуациях. ✅ Заключение
Вот такая тонкая фишка — теперь вы сможете подбирать нужный вариант, в зависимости от задачи.
Кстати, последнее время в аналитике активно развивается аутсоринг и фриланс — даже с минимальным набором знаний вы можете начать их монетизировать и нарабатывать опыт через фриланс-платформы.
Например, за написание скрипта, который автоматизирует обработку эксельки вполне могут дать более 10 000 рублей, а займет это у вас 2 часа времени. Даже выполняя 1 заказ в день, сидя дома, вы можете делать от 150 000 рублей в месяц без напряга. Хорошая прибавка к зарплате 😁 Если интересно — примеры нескольких классных проектов скинем в комментарии.
Хотите тоже освоить один из востребованных инструментов аналитика и начать монетизировать свои знания через несколько месяцев? Записывайтесь на наши бесплатные курсы, таких как «Бесплатный курс по Pandas» 👉🏻 ссылка
🔥17👍6❤3