Data Science Guy – Telegram
Data Science Guy
3.6K subscribers
106 photos
10 videos
4 files
174 links
Канал проекта Data Science Guy на ютубе.

https://www.youtube.com/c/DataScienceGuy


Есть вопросы по обучению Data science и ML? Пишем в чат - https://news.1rj.ru/str/dsguy_chat
Download Telegram
Слепил для вас жизненный мемчик
Forwarded from OpenDataScience RU
Мы запустили первую Летнюю школу ODS Summer of Code! 🔥

Вдохновившись GSoC, наша школа на 100% состоит из проектов и практики. Хотите что-то по-настоящему поделать своими руками — ждём вас!

Уже в эту субботу, 17 июля, мы устроим onboarding в Spatial.Chat ODS, где вы сможете задать вопросы организаторам и поболтать с другими участниками. Пароль доступен на странице Феста в разделе “Нетворкинг”. Да, школа — прямое продолжение Data Fest 2021. Если вы уже зарегистрировались - вперёд выбирать проекты себе по интересам.
Вас ждут 3 направления проектов:

⚒️ Open Source — проекты открытых библиотек, которым вы можете помочь: LightAutoML, Catalyst, Deep Pavlov, scikit-uplift и DVC.

🔮 Open Science — исследовательские проекты с крутейшими ML задачами: RL среда для Heroes 3, твиты на языке урду, ML в маммографии, metric learning с Qdrant, community baseline в Про//Чтение, и онлайн галерея ML Art.

😇 ML4SG — проекты, которые делают мир чуть лучше: можно помочь фонду Lacmus в поиске пропавших людей, вместе с MaritimeAI поработать над сегментацией морского льда, или поддержать NewsVis во множестве их задач.

🤝 Наши партнеры Intel® и Sbercloud подготовили для вас совместный трек Cloud Сity и дали возможность всем участникам школы попробовать свои крутые инструменты как oneAPI ☁️

И это ещё не всё!
У нашей школы уже есть призовой фонд более 💰1,000,000 рублей! Но и 👕мерч для победителей и самых активных участников тоже будет. Все подробности тут. Присоединяйтесь! 💫
https://www.youtube.com/watch?v=F5-TDP7DYUE
Посмотрел с удовольствием. И вам советую)
По своему опыту прохождения собеседований могу сказать, что вопросы обсуждаемые в видео, правда очень часто спрашивают. Так что мотайте на ус, кто хочет ворваться в компьютерное зрение)
Встретился на просторах одс курс по линуксу. Может кому то пригодится!
Крэш-курс для начинающих по линуксу, гиту, ssh и прочей работе в командной строке.
https://linuxcourse.ru/
Всем хорошей пятницы и выходных!
Появилась идея сделать рубрику в телеграмм канале: "Вопрос с реального собеседования"
Раз в пару дней я буду выкладывать вопрос с интервью и мы вместе его обсуждаем в комментариях. Как вам такая идея?
Final Results
96%
Годнота
4%
Давай лучше что-то другое
Большинство проголосовали за новую рубрику!
Со след недели начинаем
#interview_questions
#промо
На рекрутинговых сайтах представлено более 5 000 вакансий для аналитиков данных с зарплатой на старте от 50 000 рублей. Если вы хотите построить карьеру в этой сфере, самое время сделать первый шаг! 18 августа в 19:00 приходите на бесплатный вебинар «Профессия аналитика данных: как пройти отбор в топовую компанию». Трансляцию проведет Федор Лисицын — независимый эксперт с многолетним опытом. Ранее он окончил Harvard MBA и работал в McKinsey, Amazon, Сбермаркет и Kraft Heinz HQ.

На вебинаре вы узнаете:
— кто такой аналитик данных и подходит ли вам эта профессия;
— какие навыки нужны эксперту в этой сфере;
— чем занимаются специалисты ежедневно и где работают;
— как пройти отбор на позицию аналитика данных на старте.

Успейте зарегистрироваться до 18 августа включительно: https://clck.ru/Wr3eF
#interview_questions
Итак, начнем.
Думаю многие согласятся, топ 1 по частоте вопрос на собеседованиях в любую сферу DS - это метрики.

⭐️Вопросы на сегодня:
1. Какие вы знаете метрики для классификации (на примере бинарной)?
Вкратце расскажите о каждой (как она считается, какой смысл несет).
2. Какие из них лучше не использовать на датасетах с выраженным дисбалансом классов?

Отвечайте в комментариях, ведь когда вы формулируете мысли на публику, то сами намного лучше запоминаете. Старайтесь сначала ответить без подглядки в интернет, будто вы правда на интервью
На связи Team Leads Ваня Горбань и Артём Глазунов. Мы решили провести серию voice chats со спикерами из DS-сообщества, а потом эти записи смонтировать в выпуски подкаста «Данные люди».

Это будут эфиры про данные и людей, которые с ними работают. Их истории и деятельность, как они к этому пришли и куда идут. В каждом выпуске приглашаем известных в сообществе Data Science и за его пределами и просто очень интересных людей поговорить об анализе данных.

Все voice chats будут проходить в тг-канале @bigdatapeople.

📢 Ближайшее расписание эфиров (время объявим позже):

18 августа — Алексей Драль (Founder & CEO BigData Team)
24 августа — Рубен Ениколопов, PhD (Ректор Российской Экономической Школы)
1 сентября — Юрий Кашницкий (Senior ML Scientist @ Elsevier, к.т.н., лидер открытого курса по машинному обучению mlcourse.ai)

Каждый выпуск будем будем выбирать самый интересный вопрос в чате и отправлять подарок победителю.
Чтобы не пропустить voice chats, присоединяйтесь в наш чат Данные люди

Услышимся 🤘🏻

#промо
1
#interview_questions

Продолжим с метриками. Напоминаю, что это очень важно знать. Скорее всего если вы не ответите на вопросы про метрики, шансов получить работу станет маловато.

⭐️Вопросы на сегодня:
1. Какие вы знаете метрики для регрессии?
Вкратце расскажите о каждой (как она считается, какой смысл несет).
2. Логистическая регрессия - это задача регрессии или классификации, может кластеризации?


Пишите в комментариях свои ответы, так будто вам задали этот вопрос на собеседовании. Ссылки на источники информации только приветствуются, чтобы те кто не знает ответ, могли сразу найти нужную инфу)
#interview_questions

⭐️Задание на сегодня:
1. Зарегистрироваться на leetcode
2. https://leetcode.com/problems/two-sum/ - решить эту задачку
3. Изучить, что есть по обучающим курсам https://leetcode.com/explore/learn/ и возможно какой то из них взять себе в работу (а лучше постепенно все)

Советуйте в комментах, какие книги и курсы по алгоритмам вы читали\проходили и они вам понравились)
#промо
В последние годы спрос на бизнес-аналитиков вырос во всех отраслях экономики. Для этих специалистов, кроме работы в консалтинге, есть другой путь - карьера в индустрии!
26 августа в 19:00 приходите на бесплатный вебинар «Как освоить профессию бизнес-аналитика в индустрии». Трансляцию проведёт Искандар Рахматов, руководитель подразделения по развитию бизнеса на новых рынках в Ozon.

На вебинаре вы узнаете:
— чем работа бизнес-аналитика в индустрии отличается от работы в консалтинге;
— какие навыки нужны эксперту в этой сфере;
— как пройти отбор в топовую компанию;
— какие карьерные перспективы ждут бизнес-аналитика в индустрии.

Успейте зарегистрироваться до 26 августа включительно: https://clck.ru/WzoDa
#interview_questions

Даже если вы собираетесь заниматься исключительно нейросетями, все равно очень важно знать "классические" алгоритмы машинного обучения.

⭐️Вопросы:
1. Расскажите какие алгоритмы машинного обучения вы знаете. (могут попросить один из них более подробно рассказать, или даже накидать на бумаге всевдокод). Что такое обучение с учителем и без учителя
2. Что такое bagging и boosting?
3. Чем отличается дерево решений от рандомного леса?
4. Что такое и какая бывает регуляризация в машинном обучении

В следующий раз будут вопросы по валидации и разбиению датасетов на трейн, вал и тест под выборки)
This media is not supported in your browser
VIEW IN TELEGRAM
#промо

В robot_dreams стартует курс для аналитиков, разработчиков, начинающих Data Scientists и всех, кто знает базовый синтаксис Python и хочет использовать этот язык для работы с большими массивами данных.

За 16 практических онлайн-занятий вы:
- научитесь работать с разными типами и структурами данных
- освоите 11 библиотек Python для анализа и визуализации
- разберетесь в построении простых ML-моделей
- будете решать задачи прогнозирования, классификации и кластеризации данных

Регистрируйтесь на курс, чтобы открыть новый подход в работе с большими данными - https://bit.ly/3yJLuB3
#interview_questions

Очень важный раздел машинного обучения, особенно для любителей kaggle - валидирование моделей

⭐️Вопросы:
1. Что такое кросс- валидация?
2. Какие основные методы кросс валидации вы знаете?
3. Какой из методов самый распространённый в сфере нейросетей? Почему?
4. Можно ли применять кросс валидацию, если у нас сильный дизбаланс классов в датасете?
5. Как бы вы поделили на трейн, вал, тест выборку состоящую из 2000 картинок? А из 20 000? А из 20 000 000?
6. Как валидироваться в задаче с временными рядами? (если не знаете, попробуйте поразмышлять)

В следующий раз будут вопросы по валидации и разбиению датасетов на трейн, вал и тест под выборки)
👍1
#interview_questions
Пока размышляете над предыдущей карточкой с валидацией, вот вам мини задачка:
Попробуйте без ввода кода куда-либо ответить, что получится в результате выполнения строки а и б (см. картинку к посту)?
#промо
Мечтаете стать аналитиком, но не можете пройти отбор в топовую компанию? Тогда 9 сентября в 19:00 приходите на бесплатный вебинар, где вам ответят на главный вопрос: «За какими аналитиками охотятся работодатели?» Трансляцию проведёт Андрей Алясов, CEO Changellenge », за спиной которого не только работа в A.T. Kearney и Microsoft, но и сотрудничество с половиной топ-50 рейтинга Universum.

На вебинаре вы узнаете:
— какими навыками обладает востребованный аналитик;
— как умение структурно мыслить поможет в карьере;
— как эффективно решать бизнес-задачи;
— как покорить HR- специалиста и получить оффер.

Успейте зарегистрироваться до 9 сентября включительно: https://clck.ru/XK7Gz