VICDS – Telegram
VICDS
573 subscribers
197 photos
76 videos
9 files
205 links
Канал о Data Science, ML, AI - книги, курсы, статьи.

тг: @VictoriaDS
Download Telegram
Audio
🔥🔥 Записи первого стрима 🔥🔥
Audio
🔥🔥 Записи второго стрима 🔥🔥
Forwarded from Kantor.AI (Victor Kantor)
24 марта в 18:00 мы в МТС проводим онлайн-митап для дата саентистов, дата инженеров и других дата гайз

Коллеги из МТС и ivi.ru расскажут про PU Learning и разберут принципы сортировки блоков с фильмами на главной странице IVI. После этого мы с Валерой Бабушкиным и Пашей Мягких устроим панельную дискуссию про использование Data Science в разных сферах бизнеса.

Участие, бесплатное, регистрируйтесь по ссылке:
https://mts-digital.timepad.ru/event/1962458/
1
Интервью с Дмитрием Браженко.

Работа за границей: Яндекс ➡️ Microsoft

Ссылка: https://telemost.yandex.ru/j/81595513320297

О чем будем говорить:
1. Расскажи о себе: где учился, где работал( кратко карьерный путь в России, сколько лет опыта наработал).
2. Почему решил уехать работать за границу?
3. Карьерный путь за границей.
4. Что необходимо для устройства?
5. Особенности собеседований?
6. Как и где готовился к собеседованиям?
7. Уровень зп относительно уровня жизни там?
8. Какие планы дальше?
9. Если какие-то грабли/ тонкости, о которых хотел бы рассказать/ предупредить?
10. Можешь порекомендовать с чего начать этот путь релокации?
Краткое саммари и полезные ссылочки:

Дмитрий прошёл путь: МГУ(экономический факультет) -> ШАД -> Яндекс (аналитик)-> небольшая компания по разработке игр на Кипре(аналитик) - Microsoft Прага (software engineer)

Важное замечание: в Яндексе на позицию аналитика/ аналитика- разработчика требуют больше hard skills, чем в Microsoft, по их меркам это полноценный разработчик.

Дмитрий владел английским на старте примерно B2-С1, но никакие специализированные тесты не сдавал, т.к требований таких нет.

В Microsoft готовился около 6 месяцем в своем темпе.
Начал с тренировок решения задач на: https://leetcode.comLeetCode
Затем на канале https://news.1rj.ru/str/FaangInterview
готовился к собеседованию, там же находил людей, с которыми устраивали друг другу тестовые собеседования, тренировался так раз 8-10.
Так же для собеседования рекомендует пройти курс https://www.educative.io/courses/grokking-the-system-design-interview

О зарплатных вилках в разрезе гео/позиции/компании смотреть тут levels.fyi, соответсвует действительности.

Об остальных подробностях:

Как нашёл вакансию?
Почему устройство заняло 6 месяцев, хотя оффер получил быстро?
Какие ещё вопросы спрашивают на собеседовании?

Смотрите, слушайте запись

❗️Вывод: все возможно/ реально , если определить план и двигаться к цели 🎯 , хотя это и может занять не мало времени и усилий.
Live stream scheduled for
КАК УЗНАТЬ КАКИЕ ВОПРОСЫ ЗАДАДУТ НА СОБЕСЕДОВАНИИ???

Классическое собеседование можно разделитесь на три части:
1. Звонок от HR, расскажут о вакансии, узнают релевантно ли вам и ваш опыт, передадут резюме команде, если ок, назначат встречу;
2. Первый этап собеседования — рассказываете о себе и своём опыте подробно: какие задачи решали, какие подходы использовали, на какую метрику ориентировались и почему. 🙉Тут важно хорошо вспомнить, что вы делали, или прям просмотреть проекты, для этого хорошо бы иметь портфолио на git, к которому можно быстро обратиться. ☝🏻Это очень важно, так как чаще всего вопросы задают именно по вашим проектам, что, как и почему, разбираются на сколько хорошо вы понимаете то, что делали. ❗️После этого теоретического этапа могут дать тестовое задание - новичкам обязательно соглашаться и делать, потом можно будет так же добавить проект в портфолио. Если прошли первый этап, по итогам созвона или тестового задания идете дальше.
3. Второй этап собеседования проходит обычно с тимлидом/ техлидом и представляет собой техническое собеседование, где проверяют навыки программирования, знания алгоритмов и структур данных и тд.. ⁉️Вопросов может быть великое множество, но подготовиться вполне реально и полезно, выучив один раз будите счастливы многие годы. Если было тестовое, то могут задать вопросы по нему.
Сегодня, 02.06 в 19:00 будет стрим, поговорим о собесах 🤯 c DS @nikolay_frolov

Подключайтесь, задавайте свои вопросы 😅
Live stream started
Запись стрима о собеседованиях в DS.
Ссылка на упомянутое соревнование:

https://www.kaggle.com/competitions/image-matching-challenge-2022
+ полезности по Python
ЧТО ОБЯЗАТЕЛЬНО НУЖНО ЗНАТЬ В DATA SCIENCE?

1. Машинное обучение

Машинное обучение - это основа науки о данных. Специалисты по обработке данных должны хорошо разбираться в ML.

2. Моделирование

Математические модели позволяют выполнять быстрые вычисления и делать прогнозы на основе данных. Моделирование является частью машинного обучения и включает в себя определение того, какой алгоритм является наиболее подходящим для решения конкретной задачи.

3. Статистика

Статистика лежит в основе науки о данных. Уверенное владение статистикой может помочь извлечь больше информации и получить более значимые результаты.

4. Программирование

Для успешного выполнения проекта по DS требуется определенный уровень программирования. Наиболее распространенными языком программирования является Python. Он особенно популярен, потому что прост в освоении и поддерживает множество библиотек для data science и ML.

5. Базы данных

Специалист по обработке данных должен понимать, как работают базы данных, как ими управлять и как извлекать из них данные.

⁉️Продолжите список?
КАК УПРАВЛЯТЬ DATA SCIENCE ПРОЕКТОМ?

В классической разработке программисты взаимодействуют с несколькими версиями кода - любая доработка это изменение исходной версии кода.
Чтобы предотвратить путаницу и ошибки, разработчики используют системы управления версиями, например, Git.
В системе управления версиями есть центральный репозиторий кода, представляющий текущее состояние проекта. Далем его копию, вносим нужные правки, тестируем и, если все хорошо, добавляем к исходной версии👌

😑В проектах связанных с машинным обучением все немного сложнее, помимо кода, есть ещё данные, модели и куча экспериментов, версии которых тоже необходимо отслеживать.

Так вот для контроля версий моделей можно использовать библиотеки с открытием исходным кодом ClearML/MlFlow.
А масштабные эксперименты удобно проводить в AirFlow, так как удобно использовать асинхронный граф между задачами.

А вы следите за своими экспериментами?
Стажировки лучший способ притронуться к реальным задачам и получить первый опыт, а если повезёт то первый offer.

Поэтому я собрала несколько актуальных стажировок в крупных компаниях:

https://vk.tinkoff.ru/start_osen2022

https://job.mts.ru/youth#section-steps

https://job.megafon.ru/internship

https://job.ozon.ru/internships/

https://yandex.ru/yaintern/?ysclid=l5ebax4k61718876020


Рекомендую попытаться, подготовить резюме и порешать тестовые, пройти собесы🔥

Удачи 🍀
Forwarded from Pavel Dubinin
Полезные ссылки для знакомства и работы с DataLens

Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования

Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных видео на YouTube

Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты

FAQ
- FAQ в документации
- ETL для DataLens?
- Яндекс.Метрика и DataLens

Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Datanomics - Анализ результатов прогнозирования в ритейле
- Кинопоиск - Публичная статистика оценок фильмов

Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa

Презентации:
- DataLens
- Yandex Cloud Data Platform

Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Оставить заявку на помощь партнера Yandex Cloud
- Публичный каталог партнеров
👍2
Forwarded from AvitoTech
Олег Харатов из команды DWH выступит 21 июля на IT’s Tinkoff Data Meetup, чтобы поделиться знанием, как найти данные о данных. Приглашаем зарегистрироваться!

Тем временем в открытом доступе появился доклад Жени Николаева, коллеги Олега, который презентовался на Smart Data 2021. В нём — о продуктовом подходе к разработке платформы хранилища данных.

Кстати, мы даже статью такую писали. Помните?

#dwh_avitotech #видео_avitotech #avitoteam