Госпожа аналитик 💚 Ия Зотова – Telegram
Госпожа аналитик 💚 Ия Зотова
2.38K subscribers
129 photos
9 videos
3 files
85 links
IT-лид направления сквозной аналитики в Сбер. Mентор.
- Об аналитике data/web/product
- О работе и карьерном треке
- О когнитивных искажениях, которые мешают расти специалисту

По вопросам менторства, сотрудничества: @IyaZotova
Download Telegram
🎩Подводя итоги этого года, сделала для вас сборник по постам в канале . Это был мощный год для меня и для канала

😱Поздравляю вас с наступающим Новым 2024 годом!

🎁Желаю вам, дорогие подписчики, чтобы в новом году были новые вызовы, с которыми вы бы справлялись и росли!

🥂Пусть в новом году вас ждет новая работа, увеличение зарплаты и все, что сами захотите!

Открытку с драконом персонально для вас сгенерировал Кандинский💚

📊Аналитика и hard skills
Ошибки в дашбордах
Нужно ли ООП аналитику
5 базовых визуализаций И Правила выбора
Серия постов про базовые принципы визуализаций
Фишки для аналитика в Clickhouse
Серия постов про функцию сбора цепочек событий в Clickhouse
• Серия постов про метрики: один, два, три, четыре, пять
Гайд для установки ClickHouse и MS SQL
• Серия постов Pandas: df.rename()
Сэмплирование в Я.Метрика
• Где брать пет-проект для вашего резюме: один, два

💚Soft skills
Самозванец и внутренний критик
Что мешает джуну при поиске работы
Система поощрений
Может это не твое?
Адаптация в крупной компании
Офис vs. Удаленка
Существует ли удача?
Выгорание
«Я ошибся, меня уволят!»
Ситуация в IT сложная!
Про гнев на работе
Эмоциональный тим лид

🚀Задачи:
• py: Очистка url, решение задачи
На логику
• SQL: один, два, три

🎞 Видео:
Прожарка резюме
Про МатеМаркетинг
Первый подкаст про карьерный трек из химика в аналитика
DATA ENGINEER: По любви или за деньги
JAVA DEVELOPER: с 0 до middle за 3 года
DATA АНАЛИТИК: Как из зарплаты в 25 000 ₽ войти в IT в BIG DATA
НОВОГОДНИЙ выпуск: Дубайские модели, карьера, обучение, LeetCode и другие радости айтишника

🖥Прочее:
#обратная_связь от ребята, которые у меня в менторстве
#МатеМаркетинг2023
Please open Telegram to view this post
VIEW IN TELEGRAM
20🎄42👍2🍾2
🥂Исполнение желаний

Вы можете смеяться, но лично я составляю карты желаний на год и они сбываются с пугающей оригинальностью.

Несколько лет назад на моей карте было ведро с подписью "уборка легко и быстро". Мало ли что я в это закладывала, но у меня появилась в тот год подработка у блогера, который продает курсы по уборке и чей слоган был "уборка легко и играючи". После этого случая надо мной и моими картами окружающие смеяться перестали😂

Я честно считаю, что карты желаний, списки целей, медитации, заичьи лапки и прочие магические вещи не работают, пока не работаете вы сами.

Списки целей - это не магия, а по сути ваш навигатор, то, куда вы собираетесь направлять ваше внимание. А там, где внимание, там и результат.

Правда иногда, конечно, судьба может подыграть вам и подкинуть интересные ветки развития событий, но их не будет, если вы только давите диван😁 и не рискуете.

В общем, назову составление карт своим постыдным удовольствием и открыто его оглашаю на все 622 подписчика😂

Поделитесь, есть ли у вас подобное? Планируете ли год? Носите с собой талисман или верите в гадания?🧙‍♀ Или вы проженный аналитик до мозга костей и вы все планируете по смарт целям?🧑‍💻👩‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
🎄146🦄3👍1🤣1
🚀Если посты в канале принесли вам пользу, работу, радость, инсайт, то буду рада донату на любую сумму

💚Задонатившим прилипает удача в деньгах и поиске работы

Спасибо тем, кто уже донатит, вы вдохновляете двигаться дальше и делать контент более глубокий

P.S.: Ссылка на СберЧаевые, данные карт не сохраняю, никуда не передаю😁
Please open Telegram to view this post
VIEW IN TELEGRAM
8😁5🤷‍♂4👍3🗿2
👵🏼Что делать после 50 лет в IT?

Я задалась этим вопросом где-то в начале сентябре в окрестностях своего дня рождения, когда поняла, что до этих 50ти осталось каких-то 15 лет.

Для меня карьерный путь аналитика данных не упирается в ML/DS (мое мнение вы можете посмотреть в новогоднем подкасте🎞), поэтому я пошла учиться на MBA.

🔠Но что делать тем, кому уже 50 и хочется в IT?

• Не буду вас обнадеживать: будет 100% непросто. Нужно будет делать гораздо больше и скорее всего соглашаться на гораздо меньшее.

Ко мне на менторство ходит одна ученица, которая уже на пенсии. Я искренне восхищена ее настойчивостью и снимаю шляпу🎩 Она не пасует перед трудностями, не сливается, и каждую неделю приходит с результатами и работой над ошибками. Пожалуй, практически никто не проявлял такого упорства, как она

Есть ли кейсы успешных переходов в возрасте? Есть и даже не один, лично я встречала.

• Искать альтернативы, в которых вы можете перейти в IT и при этом использовать накопленный опыт на предыдущих местах работы. Может рассмотреть менеджерскую историю.

Есть ли кейсы, когда менеджеры приходят на софтах и делают айтишный пиодукт? Да, есть.

• Выбрать профессию более лайтовую для вкатывания: тех.писатель, проджект менеджер, тестировщик. И да, тут тоже учиться, напрягаться придется, нет простого пути

• Ну и на крайняк стать блогером, транслирующим свое обучение и свои успехи/неудачи😁 но тут тоже качать харизму и актерское/ораторское надо, бороться со страхом проявляться в медиа-пространстве

💊Короче, таблетки «Войти в айти» нет, которая вас на ракете внесет в профессию. Нужно напрягаться хоть в 20, хоть в 30, хоть в 50 лет. А еще, чтобы удержаться там, тоже постоянно надо учиться🤡 прохлаждаться не получится.

Поделитесь, есть ли у вас среди знакомых успешные кейсы вкатывания в айти после 45-50 лет и как думаете, что им помогло?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103👍2
Forwarded from Иван Луценко
Отец военный, радиотехник, у него много однокурсников с армейки лет с 55 вкатились в АйТи, разработчиками или безопасниками, сисадминами.

Работодатель доволен по ряду причин:
1. Весьма исполнительны;
2. Все делают в указанный срок;
3. Через год не свалят));
4. С учетом не плохой пенсии, просят меньше денег.
👍12
🎮 Геймификация жизни, как в WoW

Жизнь - это хардкорная игра без интерфейса. По сути, чтобы стало интересно, ваша задача придумать этот интерфейс. Первое время будет сложно, но потом станет нативно

Я уже как-то писала про систему поощрений, но вчера наткнулась на видео с более широким взгдядом на это. Хочу поделиться с вами основными тезисами и подискутировать👨‍💼

В чем принципы игр, в которых люди залипают:
🔠Понятный список квестов и что делать дальше в любой момент времени.

Это как раз про понятные цели. В игре нет абстрактных задач, они все конкретные: убей босса, выживи и найди священный грааль и т.д.
Выбираем удобную методику постановки целей (smart, okr и т.п) и работаем играем😎

🔠 За каждое минимальное действие тебе что-то дают (даже за убийство кабанчиков) и виден прогресс

Я прям серьёзно задумалась как сделать прогресс-бар в жизни как в игре, чтобы он рос при любом микро-действии.

Вовремя приехала на работу +10⭐️, разместила пост в телеге +20⭐️, записали подкаст +1000⭐️
А в конце дня: 1030⭐️

И в команду сегодня закинула идею геймификации индивидуального плана развития, будем пробовать😁

🔠 Удовлетворяет разные потребности.

В хорошей игре можно делать не однотипные задания: торговля, создание ресурсов, квесты поиска, головоломки, квесты с уничтожением врагов и т.д.
Аналогично в жизни: работа, хобби, семья, медийная жизнь, обучение и т.п. То есть, если геймифицировать жизнь, то все в ней, а не отдельные части.

Понравилась аналогия с Героями: у вас в городе есть цитадель, казармы, гильдия магов и т.д. Они соответствуют разным сферам жизни или продуктам (как пример из видео) и по каждой сфере можно определить уровни прокачки и как/чем их прокачать и какие бенефиты от прокачки хотите получить

🔠 Кроме квестинга есть прокачка героя. После прокачки игра только начинается.

Все ваше обучение на джуна - это и есть прокачка персонажа. Ваша задача наубивать кабанчиков сделать проекты, нафармить ресурсов отправить отклики и пройти собесы, чтобы дальше было интереснее.

Идея приносить в жизнь и работу игровые механики кажется очень жизнеспособной и по результатам эксперимента я апну эту тему повторно.

Если кто-то знает классные источники по гейм дизайну и механикам, пишите в комменты. Ну и пишите, что вы на этот счёт думаете и какие механики, которые есть в играх, у вас уже работают

Источник вдохновения: https://youtu.be/1dkhlZM87ko?si=pisgnz7jCJmgp9tz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11💊1👾11
Forwarded from Denis
Народ, привет!
Кому интересно - Сбер, 9 грейд, есть вакансия на джуниор DE.

Обязанности - разработка витрин с данными Рисков, техстек - кластер на Hadoop.

Требования - отличное знание SQL + python (pandas), плюсом - pyspark.

Условия - офис на Кутузовской, удаленки нет, график 5/2.

Кому интересно - пишите в личку пообщаемся.
🎄6😱1
🧐 По вакансии сверху писать сюда @denis_lomakov
Please open Telegram to view this post
VIEW IN TELEGRAM
🎞 JAVA-DEVELOPER: Кто такой Senior и что спрашивают на собесах
https://youtu.be/hbsYbE31zXc

Гость: Анастасия Андреева, Senior Java Developer

Анастасия поделится:
• Кто такой senior разработчик и как им стать
• Честно о том, как проходила собесы и что не получилось
• Какие вопросы и задания даёт, когда сама проводит собеседования, поделится лайфхаками
• Расскажет зачем нужны алгоритмы и как использует искусственный интеллект

Подписывайтесь на наши каналы:
• Ия, Team Lead DA: https://news.1rj.ru/str/Lady_Analyst
• Евгений, DE: https://news.1rj.ru/str/halltape_data
• Анастасия, Java Developer: https://news.1rj.ru/str/itdevgrl

Если было полезно, весело, то поддержите наш канал донатами:
💲 https://pay.mysbertips.ru/92484472

#ЗаПределамиКода
Please open Telegram to view this post
VIEW IN TELEGRAM
62🔥2
Audio
🎧По просьбе подписчиков аудио-версия подкаста😁

Я прям советую вам посмотреть/послушать, так как в подкасте очень много про собесы и про кто такие сеньоры

💚Настя даёт такую инфу, которая не привязана к профессии

Пишите инсайты и дайте знать, если такой формат заходит, сделаю аудио и по другим нашим видео😁

#ЗаПределамиКода
Please open Telegram to view this post
VIEW IN TELEGRAM
103🔥2🗿1
🩸Интроверты и карьера

Что делать, если тебе не нравится и не хочется общаться с людьми, а рост по вертикальной карьерной лестнице предполагает развитие коммуникативных навков?

Во-первых, честно ответить себе на вопрос: точно ли вы хотите расти по вертикали (лид, лид лидов и т.д😁)? Есть другие варианты: тех лиды и лидеры компетенций, например. И решить идти вглубь разных направлений

Во-вторых, если вы все-таки хотите в продакты, тим лиды, C-level, но общение даётся напросто, то придётся принять необходимость общаться и искать гармонию между необходимым общением и соц. изоляцией.

Есть лидеры и топ-менеджеры, которые в ядре своей личности интроверты и выгорают в общении, но эффективно и профессионально это делают. А потом после общения, могут долго сидеть и смотреть в одну точку - восстанавливаться.

Ваш вектор развития сильно зависит от ваших целей (что-то год как начался с постов о целях, так и подолжается😁).

Давайте на моем примере.
Я отношу себя к интровертам. Моя цель - менеджмент. Ещё пол года назад я общалась примерно ни с кем. Навык общения стремился к 0. Но я понимаю, что без этого навыка я вряд ли чего-то добьюсь в своей цели.

Что я сделала:
• работала с менторами и психологами
• сама менторила, училась на ментора и пообщалась с большим количеством людей
• училась выстраивать дружеские отношения и быть более открытой
• искренне говорила о своих чувствах и эмоциях, уменьшила количество игр в драму, качание на эмоциональных качелях и качание других🙈
• училась слушать и задавать вопросы
• пошла в блогерство и интервью
• читала книги по теме
• начала заниматься вокалом

☕️Считаю, что на процентов 20-30 навык вырос, я результатом довольна и продолжу его развивать😁

Рецепт развития будет уникальный для каждого, это просто пример того, как было у меня. Если есть намеренье что-то изменить, то у вас обязательно это получится: хоть вы интроверт, хоть экстраверт, хоть ...верт😁

Посмотрим сколько кого😁
Интроветры ставьте: 👨‍💻
Экставерты: 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💻4910861
👩‍💻 В начале изучения Python я особо не копалась в его особенностях, а на обучении почему-то об этом не говорили

Если мы складываем DataFrame (DF) в новую переменную, то можем столкнуться с тем, что изменяя новый DF, мы изменяем и исходный

Это связано с тем, что присваивание создает ссылку на исходный DF, а не на новый.

Поэтому, если вы хотите создать новый DF и не изменять исходный, то используйте функцию
df.copy()


📰Upd.: в pandas 3.0 по умолчанию будет включён CoW. Это значит, что при присваивании будет более предсказуемое поведение и будет создаваться копия автоматически
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍6
🗞 Конференции для аналитков 2024

Без лишних слов переходите на
статью на Хабре, кажется, что там не хватает Ахи и smart.dev (но он не только для аналитков и думаю он снова будет в этом году)

В комментах дополнительный список мероприятий. Собираетесь куда-нибудь?
Please open Telegram to view this post
VIEW IN TELEGRAM
72
🧠 Групповое занятие по "Исследованию данных".
Набираю группу, которая хочет провести часок-другой за исследованием данных)

🖥 Как будет проходить занятие:
1. Заранее пришлю ecomm-датасет и тетрадку с небольшой теорией и набором заданий/вопросов
2. Вы решаете, гуглите, отвечаете на вопросы
3. Собираемся группой из 2-4 учеников и обсуждаем все вопросы и решение. Если будут дополнительные вопросы - готова так же ответить, если останется время

🖥 Уровень:
Начальный. Подойдет, если вам нужно структурировать знания по первичному исследованию и/или у вас есть вопросы по этой теме. Или вы вообще об этом никогда не слышали

🖥 Когда:
28.01.2024 (вск) 15:00 МСК (если наберется хотя бы 2 человека)
04.02.2024 (вск) 20:00 МСК

🖥 Продолжительность:
1-1,5 часа

🤑 Стоимость
• В группе: 2 500 р.
• При личной работе со мной: 3 500 р.
Оплата до старта занятия. Если группа не наберется: верну деньги или предложу апгрейднуть тариф и поработать лично😁

✍️ Пишите @IyaZotova
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🤔3🤨1
🐍 Разбиение строки на столбцы в пандах.

У нас есть DataFrame, в котором хранятся ячейки со строками вида:
sd-website-_-yandex-_-organic-_--_-переход на самозанятость-_-

Так передается информация об источниках из веба в мобилку

# Создадим пример таких данных
df = pd.DataFrame({'dt': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04', '2022-01-05'],
'source': ['sd-website-_-yandex-_-cpc-_-svoedelo_corporate_perform_god_20220100017_context_search_registration_general_rus_mob|6...',
'sd-website-_-yandex-_-cpc-_-svoedelo_corporate_perform_god_20220100017_context_search_registration_general_rus_mob|6...',
'sd-website-_-yandex-_-organic-_--_--_-',
'sd-website-_-yandex-_-organic-_--_-переход на самозанятость-_-',
'sd-website-_-yandex-_-organic-_--_-самозанятый стать-_-_y_1623381085233722262_d_c54f1823-3b1b-47fa-8739-4fcd5025fffe...'],
})


Простой способ быстро раскидать данные по разделителю:
df[['1', '2', '3', '4', '5', '6']] = df['source'].apply(lambda x: pd.Series(x.split('-_-')))


🔠🔠🔠
А теперь, внимание, вопрос.
Как преобразовать этот метод так, чтобы он работал на незаполненных ячейках или ячейках в которых написано 'organic' и ничего не потерять?
Какие ещё ограничения/неудобства видите и как бы их решали?
✍️Пишите решения в комментах
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1🤔1
🤖Решение от ИИ. Валерий, спасибо за пример решения.
Направление мысли хорошее, но недостаточное👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Для разделения строки по колонкам с разным количеством элементов можно использовать условный оператор или цикл. Например, можно проверить количество элементов в строке и разделить ее соответственно.

Пример кода:

def split_column(row):
elements = row.split('-_-')
if len(elements) == 4:
return pd.Series(elements)
elif len(elements) == 3:
return pd.Series([np.nan] + elements)
elif len(elements) == 2:
return pd.Series([np.nan, np.nan] + elements)
elif len(elements) == 1:
return pd.Series([np.nan, np.nan, np.nan, np.nan, elements[0]])

df[['1', '2', '3', '4', '5', '6']] = df['source'].apply(split_column)


В этом примере функция split_column разделяет строку на элементы и возвращает их в виде объекта pd.Series. В зависимости от количества элементов в строке, функция заполняет пробелами (np.nan) недостающие столбцы.
🤷‍♂1👍1
🎞 DATA АНАЛИТИК: Следователь продал авто и стал аналитиком | Интервью с Middle DA

Гость: Алексей Яцына, Middle Data Analyst, Сбер

Алексей в интервью поделится:
• Как продал свой Феррари авто и перешел из следователя в аналитики
• Как профессия следователя пересекается с аналитиком данных
• Какие курсы на аналитика прошел и какие оказались лучше. Карпов vs Я.Практикум
• Про стажировку и почему отказался от нее
• Почему нравится ходить по собесам и про первую работу в банке
• Про карьерный трек аналитка и куда хочет двигаться дальше

https://youtu.be/znR94HAbf9s

Подписывайтесь на наши каналы:
• Ия, Team Lead DA: https://news.1rj.ru/str/Lady_Analyst
• Евгений, DE: https://news.1rj.ru/str/halltape_data

Если было полезно, весело, то поддержите наш канал донатами:
💲 https://pay.mysbertips.ru/92484472
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1853🤷1
Audio
🎧 Аудио версия подкаста для любителей послушать в дороге/в фоне
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93
Типичные ошибки новичка в исследовании и подготовки данных. Часть 1

Вот попал впервые к вам в руки датасет, вы его загрузили и погнали исследовать, графики строить, задание выполнять. В лучшем случае df.describe() написали.

Это плохо. Особенно для тестового задания.

Если в больших компаниях многое автоматизировано, минимум ручного труда и, следовательно, данные более структурированы и хранятся без ошибок🦄, то в тестовых заданиях для вас могли подготовить набор подводных камней. И ошибки при работе с этими камнями у всех примерно одни и те же:

1. Загрузили датафрейм и не проверили, что лежит в столбцах. Числа - обжект, даты зафакапились, в категориях неявные дубликаты и ошибки в нейминге.

У меня в самом начале как-то встретился кейс с ИНН. Когда данные грузили в панду, то поле с ИНН интерпретировалось как число и все ИНН, которые начинались с 0 или 00, преобразовались в числа без первых нулей, а я долго не могла найти причины возникновения невероятных ИНН в 11 и 9 символов

2. После преобразования подозрительных чисел-обжектов не проверили результат.

Так, например, в одном тестовом датасете из-за преобразования терялось 90% данных о деньгах, а решающие это задание, в ус не дули и выбросы там ещё искали.

Преобразовали? Проверьте, что у вас ничего не потерялось. Это касается не только чисел, но и в принципе любых преобразований на данными

3. Дубликаты не проверяем.
Или проверяем, но бездумно.

Так, например, встречались кейсы, когда при загрузке датафрейма в нем находился неименнованный столбец в виде старых лишних индексов, который вероятно будет мешать вам найти дубли.

Включайте голову, задавайте себе вопрос: я точно вижу все дубли? И могут ли они тут быть? И точно ли это дубли?

Советую так же смотреть дубли по идентификаторам (например, user_id, product_id, id и т.п.), но голову не отключать, конечно, не все айди одинаково полезны😁

В любом случае, если сейчас все непонятно, то знайте, что все эти моменты приходят с опытом.

Пишите в комментах, с какими приколами в данных сами сталкивались?
Please open Telegram to view this post
VIEW IN TELEGRAM
185👍4
Forwarded from Grigoriy
Первая ссылка после поиска: https://www.datalytics.ru/all/kak-v-pandas-razbit-kolonku-na-neskolko-kolonok/
Ну или как я бы решил, если уж в pandas:
# Максимальное число столбцов: 
# s - разделитель на подстроки

s = '-_-'
cols_x_max = df['source'].str.split(s)
x_max = cols_x_max.str.len().max()

# Новые столбцы:

new_columns = [str(i) for i in range(1, x_max+1)]

def split_columns(x: str, x_max: int, s: str) -> list:
'''
Разбиваем строку на подстроки
:param x: строка
:param x_max: максимальное количество подстрок
:param s: символ - разделитель
:return: подстроки
'''
x = str(x)
y = x.split(s)
y = y + [None]*(x_max - len(y))

return y

cols = df['source'].apply(lambda x: split_columns(x=x, x_max=x_max, s=s))
df = pd.concat([df, pd.DataFrame(list(cols), columns=new_columns)], axis=1)
👍4