Главный инженер – Telegram
Главный инженер
109 subscribers
5 photos
22 links
про junior analysis в авиасэйлс
если есть вопросы, интересно почитать что-то определенное, о чем я не написала, предложить новость, смело пиши - @anyaazrva
Download Telegram
🔔 Начинаем онлайн-чат с нашей командой рекрутинга, посвященный стажировкам в McKinsey.

До 20:00 Надежда и Александра будут отвечать на ваши вопросы в специальном Телеграм-чате: @Imbellus.

Не пропустите!
#поиск_работы
с тех пор, как я надобавляла контактов в linkedIn, мне начали писать HR с предложением стажировок и вакансий. Вот, например, последняя
https://spb.hh.ru/vacancy/36034561
может, кому-то будет интересна, идет активный поиск!
совет - если у вас еще нет линкедина, пора завести и заполнить его как следует, а потом начать добавлять сокурсников, других учеников практикума, HRов всех мастей в околоайти. Не стесняйтесь, это хороший нэтворкинг. Ваша цель - 500 контактов.
Этот совет мне дал одногруппник, так ему предложили работу. После определенной отметки контактов, вам обязательно начнут писать с предложениями. Это работает
а вот мой линкедин, добавляйтесь - https://www.linkedin.com/in/anna-azarova-579b511a7/
Всем советую подписаться на Карпова. Сегодня, например, у них очередной вебинар по статистике. Но это продолжение, если успеете, посмотрите первый о том, как не запутаться в статистических методах. Для продуктового аналитика это маст хэв. Также советую его курсы по статистике на Stepik. То, что дают в Яндекс.Практикуме, конечно, недостаточно, для полноценного понимания что, зачем и как проверять.
Forwarded from karpov.courses
Продолжаем серию вебинаров по статистике!

Все мы знаем, что статистика - штука настолько многогранная, что одну и ту же гипотезу можно проверить абсолютно разных способами, и наоборот - использовать один метод для анализа данных в различных задачах.

На прошлом вебинаре мы разобрали, как не запутаться в задачах регрессии и корреляции. В этот раз будем говорить о том, как:

⚫️ Сравнить несколько групп с использованием такого метода как t-test
⚫️ Выжить, если в данных много нулей и пункт выше не работает (спойлер: с помощью Mann–Whitney U-test)
⚫️ Повысить точность предсказания с Bootstrap

Вебинар проведёт Анатолий Карпов, ведущий аналитик в Mail.Ru, создатель Karpov Courses.

Эта пятница, 25 сентября, 19.00.

Да пребудет с нами статистика!

Запись по ссылке
#поиск_работы
вот еще классное мероприятие для тех, кто только начинает искать работу в айти или вот-вот начнет. регистрация до 27 включительно!
пока я искала работу, поняла, что поиск работы в айти, это отдельный навык, и его нужно грамотно прокачивать. в Яндекс.Практикуме есть хорошая программа акселерации для выпускников, которая действительно помогает, как в составлении резюме, так и прокачивает навыки прохождения интервью (не пропускайте публичные интервью и сами в них участвуйте, если еще не)
простите за длинную ссылку, лень заморачиваться 😬
https://careersimulator.tech/?utm_source=mailchimp&utm_medium=email&utm_campaign=announcement&utm_source=DS+School+august&utm_campaign=9fa42cd1f7-EMAIL_CAMPAIGN_2020_06_10_11_36_COPY_01&utm_medium=email&utm_term=0_d2902be873-9fa42cd1f7-601673506
#стажировки
есть два неплохих варианта по стажировкам:
Тинькофф - https://fintech.tinkoff.ru/study/start/
и Mars https://careers.mars.com/ru/ru/digital-tech
есть ощущение, что отдают предпочтение выпускникам вузов, но, если хорошо написать сопроводительное, уверена, что есть все шансы.
есть еще Сбер, они тоже часто предлагают различные стажировки, но не знаю, есть ли сейчас наборы https://sbergraduate.ru/internships/
#из_личного
После того, как я закончила курсы, я искала работу примерно пять месяцев. Это было непростое время, потому что с каждым новым отказом вера в то, что поиск закончится успехом, уменьшалась. Первые три собеседования были просто провальными. Но они дали представление о том, какими примерно будут следующие. Я выработала систему подготовки к собеседованиям в зависимости от того, кто будет на другом конце - HR, Product manager или тех.специалист. Ко всем у меня был свой подход. Для HR важнее была история - что делала, что умею, ключевые слова по скилам. Продакту уже больше важны кейсы, причём продуктовые - AB тесты(какие метрики смотреть), воронки, событийная аналитика. Тех.спецы, понятно, больше про hard skills - те же AB тесты, но уклон в методы проверки, Python и способы хранения данных в нем (помимо наших любимых датафреймов, есть ещё списки, словари, сэты, кортежи и проч, что не дают, например, в курсе Яндекс.Практикум), конечно, SQL. И перед каждым собеседованием - подготовка: повторение старого, изучение нового. И нужно прокачивать умение рассказывать занимательные истории. Если при рассказе о том, как вы считали ROMI и что вам пришлось преодолеть при этом, у вас горят глаза - вы у цели!
Помимо самих курсов у меня был небольшой опыт копания в данных «по знакомству». Так или иначе, данные сейчас есть у многих бизнесов, но они не всегда знают, что с ними делать. Мне удалось попасть в частную медицинскую клинику и на практике применить мои знания - посчитать LTV, спрогнозировать загрузку врачей, поотвечать на вопросы маркетинга. В общем, в моем резюме появилась важная графа - релевантный опыт работы и несколько историй для собеседования.
Для себя я сделала вывод, что поиск работы в айти - это отдельный навык. Ему я училась немногим меньше, чем самой аналитике на курсах.
Кстати, это не мой случай, но вам может помочь - если у вас есть опыт хотя бы опосредованно связанный с аналитикой (опыт в маркетинге, опыт построения отчётов в 1С, автоматизация в эксель, работа с кодом, может что-то ещё, о чем я даже не знаю), это надо выставить на первое место в резюме и упомянуть на собеседовании.
Ну и напоследок - к пятому месяцу я была порядочно всем этим вымотана. С трудом верила в успех, но стискивала зубы перед каждым собесом. Некоторое случайное стечение обстоятельств (ну и, конечно, мои мольбы о том, чтобы меня взяли уже наконец и я покажу класс), и я получила отличный оффер. И у вас получится 🦾, если вы в поисках. Ко всем вашим знаниям и умениям, приложится подходящий случай.
где искать, если не на HH:
1) Telegram
помимо всем известной группы Работа ищет аналитиков https://news.1rj.ru/str/analysts_hunter в телеграме, есть еще ряд интересных каналов: https://news.1rj.ru/str/analyst_careerspace, https://news.1rj.ru/str/foranalysts – эти самые полезные, на мой взгляд. Также есть https://news.1rj.ru/str/analyst_job, https://news.1rj.ru/str/forpython , https://news.1rj.ru/str/jobforjunior
2) Linkedin и FB, про это писала выше
3) Сайты интересующих вас компаний. Многие крупные периодически проводят набор на стажировки
Чтобы вам ещё больше казалось, что все интересное и важное не пересмотреть, и чтобы оно копилось и давило своей массой, закидываю супер интересные очень важные лекции (7!) по АБ тестам от Experiment Fest и Яндекс.Практикум

https://www.youtube.com/playlist?list=PL6Wui14DvQPz-s7nng8Sedzj1Q5xLOs69

Пусть лежат в закладочках, как у меня 😬
#авиасэйлс
мой первый рабочий день прошёл примерно так:
В 11 был намечен онбординг с Ваней Байдиным. Так мне представили Head of всея Travelpayouts. Ну, то есть это главный чувак той компании, в которой я буду работать.
Окей, онбординг с Ваней. Это типа «добро пожаловать на борт»? Все же авиасэйлс, самолёты... Или в айти везде так называют погружение в рабочие процессы? А Ваню, видимо, так и надо называть, никаких Иванов?
В общем, вопросы были, но я предпочла промолчать и почитать максимум о том, что же этот Ваня Байдин из себя представляет и что мне ожидать. Нашла его в фэйсбуке и линкедине, нашла интервью на vc.ru и его профиль там же, его комментарии к разным заметкам об авиасэйлс, блог Travelpayouts и его интервью от 2016 года там. Короче, решила подготовиться почти как к собеседованию.
Ваня по зуму (он на Пхукете) показал мне презентацию о том, что же это такое Travelpayouts, сказал, что со всеми вопросами я могу обращаться прямо к нему, не стесняться, пожелал удачи, и все. Я сама между делом упомянула, что подготовилась и читала блог трэвелпэйаутс (сокращённо TP или ТП), чтобы мои старания не остались незамеченными.
Потом меня перехватила Ксюша, вторая HR которая меня собеседовала, зарегистрировала меня в местной HR системе, объяснила, что вместо новогодних каникул и майских праздников мне полагается два дополнительных Дэй офф (дух стартапа, нехер две недели балду гонять), зарегала в Slack и передала другой HR, которая сообщила что она скучный эйчар по бумажкам, с которой мы подписали кучу разных документов, один из которых до конца года позволяет не ходить в офис, если не хочется, а потом меня перехватила Таня, мой непосредственный Head, а для всех Head of BisDev, чтобы провести свой онбординг.
А я думала: пиздец, они говорят на другом языке, у них вода из крана с газом и в холодильнике куча йогуртов, офис с панорамным остеклением и видом на Исакий. Как влиться в коллектив и не чувствовать себя белой вороной?
Но через неделю оказалось, что ворона я не белая, а йогурт предпочитаю с манго. В общем, чувствую себя достаточно комфортно, чтобы говорить, что орешки в маленьких пакетиках - это не очень удобно. А бананы чернеют, если их не убирать в холодильник.
И, кстати, тут все матерятся. Так что и я буду. Не удивляйтесь!
http://thisisdata.ru/blog/uchimsya-primenyat-okonnyye-funktsii/
очень подробный гайд по оконным функциям в sql.
Оконки - это то, что точно пригодится. Более того, использовать их можно к датафреймам в питоне. Для этого нужно установить библиотеку
$ pip install -U pandasql
from pandasql import sqldf
а потом к вашему датафрейму писать запросы
query = '''
SELECT * FROM df'''
sqldf(query, locals())
еще есть вариант
sqldf(query, locals())
в чем разница, можно почитать тут
когда может пригодиться:
изучив, в чем прелесть оконок, и попробовав это на практике, вы точно заходите, чтобы также просто было делать что-то подобное в питоне, но выходят только танцы с бубнами, а не шикарные стройные partition by;
еще пригодится, когда вас будут грузить тестовыми по sql, а вам негде проверить запрос - накидываете датафрейм прямо в джупитере, и к нему пишите запрос.
Коллеге, продуктовому аналитику, при попытке проанализировать результаты аб теста, часть экспериментальной выборки пришлось исключить из теста по техническим причинам, и выборки получились сильно неравномерными.
Это один из примеров, когда может потребоваться решить, можно ли считать результаты достоверными, несмотря на то, что в выборках есть сильный дисбаланс.
Рассуждения на эту тему от experiment fest
вот закончится испытательный срок, попрошусь к ним на курсы за счет компании 😈
Работа учит смирению.
С утра (ну как с утра, мой рабочий день сегодня начался почти в 12) пришёл запрос - посчитать сколько наших аффилиатов (пользователи ТП) зарегистрированы в экскурсионных офферах (компании, чьи услуги продвигают аффилиаты), и сколько из них получили за пять последних месяцев хотя бы одну бронь. В общем, нехитрая задачка. Решила ее усложнить тем, что добавлю ещё и профит по каждому аффу, если он есть.
Но вот уже половина третьего, а я до сих пор её не сделала.
Сначала я пыталась выяснить, откуда в таблице с выплатами отрицательные значения. Потом поняла, что часть инфы, по которой хотела джойнить таблички, не льётся как надо и в табличке с выплатами я не смогу посмотреть нужные мне строки, написала ребятам, которые эту табличку долго делали и совсем недавно выкатили в продакшн, вопрос о том, что ещё пока в этой табличке сырое.. пошла к старой табличке с букингами, вспомнила, что в неё инфа доходит с опозданиями, вспомнила, что ещё вчера пыталась выяснить почему, но так и не выяснила, забыла, какая у меня была изначальная задача, прочитала статью про индексы в пандас, почитала слак, выдохнула, решила, что проблема с опаздывающими данными не такая уж большая и этим можно принебречь..
В общем, так или почти так, проходят мои рабочие будни всегда. Надеюсь, что когда-нибудь я переломлю ход истории и задача на полчаса будет занимать не более сорока минут 🦾
Если вы еще как следует не оформили портфолио на github, пора это сделать. А чтобы ваши проекты хорошо смотрелись, используйте https://nbviewer.jupyter.org/
Работает это так:
1 - загружаем ноутбук на гитхаб
2 - оформляем readme.md. этот документ можно оформить на html, сделать табличку и проч.
3 - ссылки на проекты в readme дать не на гитхаб, а преобразовав их с помощью nbviewer, так ноутбуки будут читабельнее
а потом этим портфолио можно делиться в резюме или в сопроводительных
Главный инженер pinned «Всем привет! Никто не спрашивали, но я отвечу: главный инженер - потому что я долгое время была инженером, 9 лет проектировала и организовывала проектирование зданий. А потом все бросила и погрузилась в аналитику данных. Но главный инженер так и останется…»
Срочно в номер #поиск_работы
Как я уже писала, линкедин - один из способов найти нужную вам вакансию. Туда приходят HR и сами вам пишут - удобно. Но сначала нужно озаботится контактами линкедин, чем больше, тем лучше.
Только что написала HR, предложила рассмотреть вакансии Data Analyst, но, т.к. я пока всем довольна и никуда не собираюсь, она спросила, может, у меня кто есть на примете. В общем, ловите:
ссылка на профиль Линкедин
описание вакансий тут
кстати, я прикрутила возможность комментирования. вдруг вам есть что сказать 🐣
Как тут устроена система сбора и хранения данных
Именно так, а не система аналитики. Потому что изначально весь этот процесс сбора и хранения не был подстроен под аналитику. Так бывает часто, но все равно за аналитику обидно.
Аналитика тут надстраивалась где-то сверху и без всякой системы под ежеминутные нужды.
До меня в ТР работали два аналитика: один, продуктовый, стремительно слился не проработав, кажется и года, и вторая дата аналитик (выдам приз, если придумаете хороший феминитив), которая мало занималась продуктом, в основном ее задачи вертелись вокруг ad-hoc отчётов под нужды отделов биздева и маркетинга. На это место и пришла я.
Биздев так и привык обращаться к аналитику как к sql-обезьяне (как сказал тут Head of analytics). Почти все их запросы могли бы снять грамотно построенные отчеты и дашборды. Парадокс состоит в том, что отчётов и дашбордов тут примерно миллион. Но вопросов меньше не становится.
Под аналитику в авиасэйлс выделена БД Impala, куда стекаются данные бэкэнда (и фронтэнда, но с этим я пока не взаимодействовала). Данные бэкэнда - это куча табличек, которые нужны для работы бэкэнда, а для него чем более денормализированы данные, тем лучше. Отсюда - чтобы выгрузить любые данные, кроме select * from, нужно заджойнить несколько таблиц. Даже если тебе нужно просто получить информацию о компании, а не специфические данные о том, как в течение определенной промо-акции вели себя пользователи ios, подключённые к определённой компании, где сам бох велел джойнить. Например, у меня есть табличка с базовой информацией по компании, есть табличка с ‘id компании’ и ‘id категории компании’ и есть словарик ‘id категории’ - ‘название категории’. То есть, чтобы узнать категорию компании, надо сджойнить три таблички. И так любой другой запрос. Это удобно бэкэнду, для его работы, и бесит аналитиков. Плюс, название одного и того же по сути столбца в разных таблицах может быть разным, табличек много, разбираться долго и больно. Плюс, часть инфы в Импалу иногда просто не доходит. Потому что что-то сломалось на этапе CDC. Потому что CDC специфический процесс, под капотом у него что-то нестабильное, лучше вообще этим не пользоваться, а лить данные из Кафки, но в Кафку бэкэнд не всё пишет.
Последний кусок текста для меня не до конца понятен, сформулировала я его по памяти, объединив комментарии дата инженера и хэда аналитики авиасэйлс, поэтому в нем могут быть семантические ошибки. Но смысл в том, что все можно сделать хорошо! Это процесс не быстрый, надо как минимум сначала сформулировать запрос с четким ТЗ, какие данные и в какой форме нужны мне и продуктовому аналитику, описать данные и бизнес-логику. Потом дата инженеры сами попросят бэкэндеров писать в Кафку то, что нужно, и перетащат все это в красивые таблички для аналитики в Импалу. Данные перестанут теряться, джойнить станет удобно, аналитики будут довольны.
И это даже круче, чем если бы аналитика тут уже была настроена от и до. Потому что при каких ещё обстоятельствах джуну доверят настраивать систему аналитики? 😈
А поверх всего этого нужно будет настроить систему отчётов, которые смогут покрывать 90% запросов биздева и маркетинга. И заживём!
P.S. это как все устроено в travelpayouts, в авиасэйлс всё иначе, там настроены таблички и с десяток аналитиков
В авиасэйлс глобальные изменения в организации работы сотрудников. Теперь официально любой желающий может работать на удалёнке. А может ходить в офис, если так больше нравится. А может и ходить и не ходить. В любой из трёх офисов - Мск, СПб и Пхукет.
Видимо, скоро отойдут в прошлое закреплённые рабочие места и офис будет таким бесплатным коворкингом. Пока, конечно, те, кто привыкли ходить в офис, так просто свои стулья не обобществят. И вообще сейчас к такому нововведению много вопросов.
Но это говорит о том, что вынужденная удалёнка показала свою эффективность, что компания более чем способна существовать в таком режиме.
Вчерашнее сообщение звучит очень по-корпоратски. Но я не об этом думала. Просто нам с вами скоро жить в новой реальности.
Первое - специалисты в регионах смогут работать в компаниях по всей стране. Это может привести к тому, что зп в регионах подтянется к столичным цифрам. При этом не исключено, что столичные цифры тоже подтянутся к региональным.
Второе - большая мобильность и возможность путешествовать не только тогда, когда отпуск, но в любой момент.
Я уже сейчас вижу, как мои знакомые уезжают на пмж или просто на долгий срок в другие страны, при этом продолжают работать на российском рынке. Это не новое веяние, но такого станет больше.

Вообще современный мир - очень интересная среда. Из-за быстрых изменений в нем привычные системы перестают работать, потому что в их основе лежит долгий цикл. Такой системой, например, является система образования. Она не поспевает за изменениями и не может выпускать специалистов только что появившихся профессий настолько быстро, насколько того требует рынок.Отсюда - всевозможные курсы, которые справляются с задачей гораздо лучше, быстро реагируют на потребности рынка и позволяют осваивать новое за гораздо более короткий срок, чем классические институты образования.
То, что ещё пару десятилетий назад являлось практически неизменяемым - профессия и место жительства - благодаря новой реальности перестают быть тем фундаментом, на котом выстраивается жизнь человека. Фундаментом может стать что-то более личное, а профессия и дом будут надстраиваться над этим.