Forwarded from Канал Саши Михайлова
В прошлом году закончил курс по аналитике данных в Яндекс Практикуме и сменил профессию.
Почему не в Data Science?
Аналитик данных — для меня это быстрый старт в новой отрасли; такой MVP. «Быстрый» — относительно Data Science:
1. Ниже порог входа по необходимым знаниям. Соответственно, быстрее обучение.
2. Больше потребность на рынке (167 вакансий по запросу «Data Scientist» против 2669 «аналитиков данных» по данным hh.ru). Соответственно, быстрее поиск новой работы.
Ещё три абзаца в блоге
https://sashamikhailov.ru/blog/all/data-analyst-and-data-scientist/
Почему не в Data Science?
Аналитик данных — для меня это быстрый старт в новой отрасли; такой MVP. «Быстрый» — относительно Data Science:
1. Ниже порог входа по необходимым знаниям. Соответственно, быстрее обучение.
2. Больше потребность на рынке (167 вакансий по запросу «Data Scientist» против 2669 «аналитиков данных» по данным hh.ru). Соответственно, быстрее поиск новой работы.
Ещё три абзаца в блоге
https://sashamikhailov.ru/blog/all/data-analyst-and-data-scientist/
sashamikhailov.ru
Почему анализ данных, а не Data Science
Слышал, что при боевых действиях есть приём идти не основным путём, а параллельным. Типа всем говоришь, что пойдешь долиной, а отряд ведёшь по соседнему хребту
Forwarded from Канал Саши Михайлова
Forwarded from Канал Саши Михайлова
Про базы данных со стороны бэкэнда
Лекция Татьяны Денисовой для курса по бэкэнду от Яндекса
Это лекция, которая проходится по верхам основных тем для работы с базами данных. Темы, о существований которых надо знать — чтобы при необходимости знать, что писать в поисковый запрос.
https://youtu.be/YjSIdz8DnAo
Лекция Татьяны Денисовой для курса по бэкэнду от Яндекса
Это лекция, которая проходится по верхам основных тем для работы с базами данных. Темы, о существований которых надо знать — чтобы при необходимости знать, что писать в поисковый запрос.
https://youtu.be/YjSIdz8DnAo
YouTube
04. Базы Данных – Татьяна Денисова
Во время лекции мы поговорим о том, что такое данные, какие базы данных бывают и чем они отличаются. Вы узнаете, какие особенности работы с базами данных нужно иметь в виду разработчику.Обсудим, как характеризовать, структурировать и хранить данные — с расчетом…
Forwarded from Канал Саши Михайлова
Аналитика рынка аналитиков от агентства New.HR
Результаты анализа упаковали в презентацию. Что-то из презентации опубликовали в виде статьи на виси. Получился набор блоков с буллетами 🙂
Судя по слайдам с зарплатами, продуктовые аналитики ценятся выше, чем маркетинговые. А дата саентистов — ешё выше.
Также там есть список необходимых инструментов и навыков для каждого уровня развития.
Результаты анализа упаковали в презентацию. Что-то из презентации опубликовали в виде статьи на виси. Получился набор блоков с буллетами 🙂
Судя по слайдам с зарплатами, продуктовые аналитики ценятся выше, чем маркетинговые. А дата саентистов — ешё выше.
Также там есть список необходимых инструментов и навыков для каждого уровня развития.
vc.ru
Аналитика для хантинга аналитиков (продуктовых, маркетинговых и data scientists) — Карьера на vc.ru
Сколько денег хотят аналитики, которые не ищут работу и как можно повлиять на их мотивацию. Отдельно рассказали про продуктовых аналитиков, маркетинговых и data scientists.
Forwarded from Канал Саши Михайлова
Интерактивный обновляющийся дешборд на открытых данных
Как сделать из простого Jupyter ноутбука полноценный сайт в интернете.
1. получить данные с Reddit через их API — pushshift (облегчив себе жизнь с помощью функции-обёртки с **kwargs); слегка обработать эти данные и сложить их в pandas.
2. добавить чуток NLP через библиотеку TextBlob. Через неё текст оценивается по двум параметрам: субъективность и эмоциональный окрас (негативный или позитивный).
3. Сделать из Jupyter ноутбука HTML страницу через Voilà.
4. Сделать так, чтобы Jypter ноутбук с Voilà можно было открыть как обычный сайт в интернете и чтобы при этом он обновлялся. Простой вариант — через Binder. Сложный вариант — через Linux сервер. Ещё один простой — через Heroku или Google Cloud Platform.
Статья с поэтапным объяснением, примерами кода и всем ссылками на все перечисленные инструменты.
Как сделать из простого Jupyter ноутбука полноценный сайт в интернете.
1. получить данные с Reddit через их API — pushshift (облегчив себе жизнь с помощью функции-обёртки с **kwargs); слегка обработать эти данные и сложить их в pandas.
2. добавить чуток NLP через библиотеку TextBlob. Через неё текст оценивается по двум параметрам: субъективность и эмоциональный окрас (негативный или позитивный).
3. Сделать из Jupyter ноутбука HTML страницу через Voilà.
4. Сделать так, чтобы Jypter ноутбук с Voilà можно было открыть как обычный сайт в интернете и чтобы при этом он обновлялся. Простой вариант — через Binder. Сложный вариант — через Linux сервер. Ещё один простой — через Heroku или Google Cloud Platform.
Статья с поэтапным объяснением, примерами кода и всем ссылками на все перечисленные инструменты.
Pbpython
Creating Interactive Dashboards from Jupyter Notebooks
This article discusses how to build an interactive dashboard to analyze reddit content and display interactive graphs of the result using Voilà.
Forwarded from Канал Саши Михайлова
на визуализации странный выбор параметра для обозначения цветом — эмоциональный окрас сообщения. По сути этот же параметр уже передаётся положением точки на вертикальной оси: все точки выше нуля зелёные, ниже — красные. Получается, что информация дублируется.
РазTextBlob даёт два параметра, можно было бы показать их оба: положением показывать эмоцию сообщения, а цветом — его эмоциональный окрас.
РазTextBlob даёт два параметра, можно было бы показать их оба: положением показывать эмоцию сообщения, а цветом — его эмоциональный окрас.
Forwarded from Канал Саши Михайлова
Дмитрий Аношин работает в Амазон и неспешно пишет бесплатный курс по аналитике и инжинирингу данных.
В очередном уроке разбирает структуру аналитического решения в компании: откуда данные приходят, где хранятся, и как потом попадают к бизнесу.
И как называются роли, которые отвечают за каждый вид работа. Где там BI аналитик, а где — data engineer.
https://youtu.be/_M8yxr2Inyo
В очередном уроке разбирает структуру аналитического решения в компании: откуда данные приходят, где хранятся, и как потом попадают к бизнесу.
И как называются роли, которые отвечают за каждый вид работа. Где там BI аналитик, а где — data engineer.
https://youtu.be/_M8yxr2Inyo
👍1
Forwarded from Канал Саши Михайлова
как я делал тестовое задание в Welltory и анализировал данные с фитнес-трекеров.
внутри нет технических деталей, зато есть полудетективная история про то, как я нашёл владельца трекера и получил приглашение на собеседование в полседьмого утра 🙂
https://sashamikhailov.ru/blog/all/welltory-data-engineer/
внутри нет технических деталей, зато есть полудетективная история про то, как я нашёл владельца трекера и получил приглашение на собеседование в полседьмого утра 🙂
https://sashamikhailov.ru/blog/all/welltory-data-engineer/
sashamikhailov.ru
Тестовое задание в Welltory
…или как я нашёл пользователя по данным фитнес-трекера
Forwarded from Канал Саши Михайлова
Влад Исмагилов из Яндексю.Маркет о том, что нужно знать начинающему аналитику:
1. Любознательность.
2. Базовая практика. Для начала для себя: спарсить погоду или Циан.
3. Базовое понимание, что за цифрами есть математическая база
4. Понимание, зачем цифры нужны бизнесу и как будут приниматься решения на их основе.
https://news.1rj.ru/str/just_analytics/15
П.С.: будет легче читаться, если хотя бы разбить текст на абзацы 🙃
https://telegra.ph/chto-nuzhno-znat-dzhunior-analitiku-07-30
1. Любознательность.
2. Базовая практика. Для начала для себя: спарсить погоду или Циан.
3. Базовое понимание, что за цифрами есть математическая база
4. Понимание, зачем цифры нужны бизнесу и как будут приниматься решения на их основе.
https://news.1rj.ru/str/just_analytics/15
П.С.: будет легче читаться, если хотя бы разбить текст на абзацы 🙃
https://telegra.ph/chto-nuzhno-znat-dzhunior-analitiku-07-30
Telegram
Аналитика для всех
5. В таком случае, что нужно знать, чтобы прийти в аналитику, скажем, на стажера/джуна. Что нужно выучить, чтобы пройти собеседование и получить работу, которую они хотят?
С одной стороны, собеседование далеко не самый первый шаг у кандидата, который хочет…
С одной стороны, собеседование далеко не самый первый шаг у кандидата, который хочет…
Forwarded from Канал Саши Михайлова
Если посмотреть ближайшую кофейню или купить билет в кино, то это к Яндексу.
А если надо найти нужную функцию в питоне или понять, почему код не работает, то я открываю Гугл.
Да, приходится искать на английском, но в этом больше плюсов, чем минусов. Не нужно спрягать слова или выдумывать синонимы, как могли бы описать мою проблему другие: вопросы задают такие же «знатоки» английского, как и я: хватит даже школьного уровня.
Обычно прям забиваю ключевые слова в поиск:
python string to datetime
(я даже мануал по pandas каждый раз открываю через гугл ¯\_(ツ)_/¯ )
А если надо найти нужную функцию в питоне или понять, почему код не работает, то я открываю Гугл.
Да, приходится искать на английском, но в этом больше плюсов, чем минусов. Не нужно спрягать слова или выдумывать синонимы, как могли бы описать мою проблему другие: вопросы задают такие же «знатоки» английского, как и я: хватит даже школьного уровня.
Обычно прям забиваю ключевые слова в поиск:
python string to datetime
(я даже мануал по pandas каждый раз открываю через гугл ¯\_(ツ)_/¯ )
Forwarded from Канал Саши Михайлова
Кого почитать про аналитику. Алексей Макаров сделал большой список людей, кто пишет про аналитику.
http://datalytics.ru/all/kogo-chitat-po-teme-analitiki-dannyh/
http://datalytics.ru/all/kogo-chitat-po-teme-analitiki-dannyh/
www.datalytics.ru
Кого читать по теме аналитики данных
«Мы видим больше и дальше, чем они, не потому, что взгляд у нас острее и сами мы выше...
Forwarded from Канал Саши Михайлова
Роман Бунин поговорил с Дмитрием Аношиным про карьеру дата инженера в Амазоне.
(я сейчас прохожу курс Дмитрия по введение в дата инжиниринг и очень рекомендую. Курсы бесплатный, выложен на Ютубе)
Дмитрий — человек большой активности, только послушав про его опыт уже хочется запилить какую-нибудь презентацию. Дикая мотивация.
Очень полезно про поиск работы: мониторить рынок и требования, откликаться на любые подходящие вакансии, участвовать в любой движухе.
Слушать и смотреть:
https://news.1rj.ru/str/revealthedata/122
Читать:
https://news.1rj.ru/str/revealthedata/123
А вот сам курс Дмитрия «введение в дата инжиниринг и аналитику»
(я сейчас прохожу курс Дмитрия по введение в дата инжиниринг и очень рекомендую. Курсы бесплатный, выложен на Ютубе)
Дмитрий — человек большой активности, только послушав про его опыт уже хочется запилить какую-нибудь презентацию. Дикая мотивация.
Очень полезно про поиск работы: мониторить рынок и требования, откликаться на любые подходящие вакансии, участвовать в любой движухе.
Слушать и смотреть:
https://news.1rj.ru/str/revealthedata/122
Читать:
https://news.1rj.ru/str/revealthedata/123
А вот сам курс Дмитрия «введение в дата инжиниринг и аналитику»
Telegram
Reveal the Data
Записал подкаст с Дмитрием Аношиным — Data Engineer Амазон и автор канала Инжиниринг данных и проекта Datalearn.
Получился насыщенный разговор: Дима рассказал про свой подход к поиску работу, почему обилие технологий затрудняет вход в профессию и чем занимается…
Получился насыщенный разговор: Дима рассказал про свой подход к поиску работу, почему обилие технологий затрудняет вход в профессию и чем занимается…
Forwarded from Канал Саши Михайлова
Классная заметка про нулевой тариф в Яндекс.Драйве. Показывает, как принимать нетривиальные решения и потом оценивать итоги, закапываясь на несколько уровней вглубь
https://news.1rj.ru/str/UnderTheHood/29
https://news.1rj.ru/str/UnderTheHood/29
Telegram
Под капотом Яндекс.Такси
Две мысли:
1. Иногда продавать что-то за 0 рублей может быть выгодно.
2. Вот вам отличный пример, как аналитики, умеющие глубоко копать, помогли принять верное решение, в то время как неверное решение лежало на поверхности и манило своей простотой.
Коллеги…
1. Иногда продавать что-то за 0 рублей может быть выгодно.
2. Вот вам отличный пример, как аналитики, умеющие глубоко копать, помогли принять верное решение, в то время как неверное решение лежало на поверхности и манило своей простотой.
Коллеги…
Forwarded from Канал Саши Михайлова
EDA — вебинар от karpov.courses
тот самый Анатолий Карпов из курса по статистике на Степике делает свою школу по работе с данными. Ребята провели полезный вебинар по анализу данных. Вебинар полезен чтобы познакомиться и разобраться с нуля или чтобы вспомнить основы.
Exploratory Data Analysis — разведывательный анализ данных — первое, что надо сделать с данными.
данные почти всегда «грязные»
нужны метаданные — описания к признакам
могут быть пропуски — отвалилось устройство сбора или просто криво собрали данные
есть интересные применение pd.crosstab, .style.background и pandas profiling
https://youtu.be/wKrsanSXzk0
тот самый Анатолий Карпов из курса по статистике на Степике делает свою школу по работе с данными. Ребята провели полезный вебинар по анализу данных. Вебинар полезен чтобы познакомиться и разобраться с нуля или чтобы вспомнить основы.
Exploratory Data Analysis — разведывательный анализ данных — первое, что надо сделать с данными.
данные почти всегда «грязные»
нужны метаданные — описания к признакам
могут быть пропуски — отвалилось устройство сбора или просто криво собрали данные
есть интересные применение pd.crosstab, .style.background и pandas profiling
https://youtu.be/wKrsanSXzk0
YouTube
Exploratory data analysis в Pandas | Вебинар Лаврентия Данилова | karpov.courses
Курс «Аналитик данных»: https://bit.ly/3zExQ5c
EDA — первая, и пожалуй, самая важная часть анализа данных. Перед тем, как приступить к построению сложных моделей и поиску инсайтов в данных, нужно убедиться, что с данными всё хорошо, в них нет ошибок и противоречий.…
EDA — первая, и пожалуй, самая важная часть анализа данных. Перед тем, как приступить к построению сложных моделей и поиску инсайтов в данных, нужно убедиться, что с данными всё хорошо, в них нет ошибок и противоречий.…
Forwarded from Канал Саши Михайлова
Сделал отдельный канал про дата-отрасль и всё такое
Изначально не хотел плодить множество каналов: казалось, что будет пусто и там, и там; плюс не хотелось каждый раз запариваться, куда отправить тот или иной пост — нужно было одно место.
Последнее время столкнулся с дилеммой: с одной стороны хочу писать просто про жизнь, про семью и детей, про ментальное и физическое здоровье, собирать скриншоты сайтиков из интернета; а с другой — приводить прям код на питоне и сиквеле или разбираться в тонкостях баз данных и матстатистики. Кажется, что в одном канале таким разным постам будет тесно.
В итоге завёл отдельный канал, куда буду писать про всё связанное с данными. Для начала накидал туда все релевантные посты за последние пару месяцев — чтобы было понятно, что я понимаю под «всё связанное с данными».
В общем, велком!
https://news.1rj.ru/str/data_days
Изначально не хотел плодить множество каналов: казалось, что будет пусто и там, и там; плюс не хотелось каждый раз запариваться, куда отправить тот или иной пост — нужно было одно место.
Последнее время столкнулся с дилеммой: с одной стороны хочу писать просто про жизнь, про семью и детей, про ментальное и физическое здоровье, собирать скриншоты сайтиков из интернета; а с другой — приводить прям код на питоне и сиквеле или разбираться в тонкостях баз данных и матстатистики. Кажется, что в одном канале таким разным постам будет тесно.
В итоге завёл отдельный канал, куда буду писать про всё связанное с данными. Для начала накидал туда все релевантные посты за последние пару месяцев — чтобы было понятно, что я понимаю под «всё связанное с данными».
В общем, велком!
https://news.1rj.ru/str/data_days
Telegram
data будни
работаю инженером данных и пишу в основном про это.
Профильные ссылки с коротким резюме (статьи, доклады, подкасты), иногда «софтовое» — например, про поиск работы.
Профильные ссылки с коротким резюме (статьи, доклады, подкасты), иногда «софтовое» — например, про поиск работы.
