Data Science Guy – Telegram
Data Science Guy
3.6K subscribers
106 photos
10 videos
4 files
174 links
Канал проекта Data Science Guy на ютубе.

https://www.youtube.com/c/DataScienceGuy


Есть вопросы по обучению Data science и ML? Пишем в чат - https://news.1rj.ru/str/dsguy_chat
Download Telegram
#interview_questions

Перейдем к нейросетям.

⭐️Сегодня первая часть вопросов про нейросети:

1. Градиентный спуск, что это такое? Расскажите про проклятие размерности, локальные минимум и седловые точки, а так же как с ними бороться.
2. Что такое перцептрон? Что такое shallow networks, deep networks?
3. Что такое СNN? Расскажите историю развития сверточных нейросетей начиная с LeNet и до наших дней.
4. Что за такие гиперпараметры и как их подбирать?

Вторая часть будет скоро!)
Forwarded from Start Career in DS
Как рассказать про ту или иную тему на собеседовании? Какие вопросы могут задать?
Запускаю цикл видео, которые ответят на эти и многие другие вопросы.
https://youtu.be/MM4onsNaLlI

P.S. На первый выпуск ушло прям очень много сил и времени, огромнейшее спасибо всем, кто в той или иной степени помогал 🙂
#промо
В последние годы спрос на продуктовых аналитиков значительно вырос — и не случайно: это важные специалисты любой продуктовой команды и ключевые партнеры продакт-менеджеров. Продуктовый аналитик изучает потребительский опыт и предлагает решения по улучшению продукта, основываясь на данных. 12 октября в 19:00 приходите на бесплатный вебинар от Changellenge >> о том, как начать карьеру в продуктовой аналитике.

Вы узнаете:
— с какими задачами сталкивается продуктовый аналитик;
— какие навыки должны быть в арсенале специалиста;
— как войти в профессию и построить успешную карьеру.

Регистрируйтесь до 12 октября включительно: https://clck.ru/Y84YL
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🔥StyleGAN3 от NVIDIA! Ура!

Помните Alias-Free GAN с офигенно гладкими результатами, о котором я писал ранее? Так вот, исследователи наконец выложили код, и теперь можно пилить свои поделки на этой основе. Не знаю, как у вас, но у меня уже чешутся руки попробовать.

Автор канала @nn_for_science любезно подготовил Colab со StyleGAN3.

Код | Сайт проекта | Колаб
#промо
SQL входит в топ-3 самых востребованных навыков для работы с базами данных. Данный инструмент позволяет оптимизировать бизнес-процессы и эффективно использовать время и ресурсы, чего и ждут от своих специалистов топовые работодатели! 13 октября в 19:00 приходи на бесплатный вебинар Changellenge >>. Трансляцию проведет Василий Ключарев — дата-аналитик в международной розничной сети гипермаркетов «Глобус», за спиной которого работа в «Ростелекоме» и RADAR Research.

Что узнаем:
— область применения и функционал SQL;
— почему SQL востребован на рынке труда;
— инструменты SQL для работы с базами данных;
— решение бизнес-задач вместе с экспертом в режиме реального времени.

Регистрируйся до 13 октября включительно: https://clck.ru/Y9kGf
Походу мы выбрали правильную профессию 😀
#interview_questions
Продолжаем рубрику, Сегодня SQL

⭐️ Вопросы:
1. В чем разница между MySQL, SQL, PostgreSQL?
2. Что делает Union?
3. В чем разница между INNER JOIN и LEFT\RIGHT JOIN?
4. Что за NoSQL базы данных? В чем их принципиальное отличие от SQL?
5. Что такое индекс и какие они бывают?
6. Что такое подзапрос и для чего они нужны?
7. Расскажите про 6 нормальных форм

Так же обычно дают какую-нибудь небольшую игрушечную задачку (1-2 штуки), типа напишите запрос, чтобы из предоставленной базы, вытащить какие то определенные данные. Допустим зарплату сотрудников Бостонского отдела за декабрь 2014 года.
👍1
Forwarded from OpenDataScience RU
Сап чат!
Мы так увлеклись нашим сезоном курсов, что забыли рассказать о нём здесь 🦜

Тем временем, у нас запустились 6 новых курсов от сообщества 🎉
🦙 Для учащихся автоматизировать сам ML, в курсе по AutoML уже началась вторая часть (первая часть тут)
📚 Курс по NLP уже активно идёт и ждёт желающих влиться в современный анализ текстов
🦋 Мощнейший фундаментальный курс по анализу графов и GraphML уже запущен!
📂 Запустился и курс про лицензии и Open Source - для всех причастных к DS Open Source
🔥 С пылу с жару, запустился курс по рекомендательным системам
⚛️ Уникальный курс по Quantum ML стартует уже сегодня!
Скоро стартуют и другие курсы от сообщества

🎃Мы расскажем про всё-всё уже на этой неделе на Data Halloween 2021. Будет и стрим с авторами на youtube, и обилие networking в spatial.chat 🤗К тому же, можно задать вопросы по DS в этой форме и, возможно, урвать что-нибудь сувенирное на память 👀

Ждём вас в эту субботу на Data Halloween 2021, и в наших новых курсах!
Когда-то я уже писал в блоге на тему самого главного навыка в DS. Но дело было давно, так что решил обновить и записать коротенькое видео. Немного о адекватности:)
https://youtu.be/oJIXla41H1E
👍1
Наверняка многие уже слышали про сервис генерации картинок по текстовому описанию. Недавно "Сбер" выкатил русскоязычную версию.

Попробовать можно тут:
https://rudalle.ru/demo

или через коллаб: тут Ссылочка

или через бота: @sber_rudalle_xl_bot

Вот что мне выдало на запрос "Инженер машинного обучения"
Нагенерили тут с помощью Rudalle (пост с ссылками выше).
#образование
Если кто-то учит ML и хочет быстро повторить основные вещи, то можно воспользоваться ресурсом типа этого (собраны описания основных терминов в ML)
https://machinelearningfaq.com/
#промо

Знание SQL — must have в сфере аналитики

На бесплатном курсе-симуляторе в Нетологии «Введение в SQL и работу с базой данных» вы изучите основы SQL, научитесь подключаться к реляционным базам данных, делать SQL-запросы и создавать простые отчёты и аналитику. Все задания основаны на реальных кейсах из практики аналитиков. Курс подойдет всем, кто работает с данными или хочет начать.

Попробуйте ↓
https://netolo.gy/hev
Иногда люди не до конца понимают, в чем разница между стажером (еще их иногда называют trainee) и джуниор разработчиком. Предлагаю подискутировать на эту тему в комментариях. Вот мое мнение:

🧑‍💻Джуниор - специалист начинающего уровня, который уже может сесть и делать какую то задачу. Да, часто эти задачи простые и джун находится под зорким контролем коллеги постарше, но все же проблемы базового уровня он в состоянии решить самостоятельно. То есть, джуниор должен уже иметь знания и навыки.
⭐️Зачем нанимают джунов?
Для компании часто бывает проще нанять джуна и вырастить его в мидла. Кажется, что это странно, но иногда найти полностью подходящего под ваши запроса спеца, бывает очень сложно (случается, что позиция висит не закрытая месяцами). Так же это хорошая возможность закрыть большое количество мелких, несложных задач, не тратя ресурсы более высокооплачиваемого и занятого мидла или сеньера и не отнимать их время от более серьезных задач.


👶 Стажер
В отличии от джуна, стажером можно стать с нулевым количеством знаний. Просто прийти и сказать, очень хочу, научите пожалуйста. (Знаю даже пару случаев когда это прокатывало). Дают учебные задачки или датасетики поразмечать например.
Основное отличие в том, что стажерам либо платят мало, либо не платят совсем.

⭐️Зачем нанимают стажеров?
Посмотреть и выбрать из них наиболее перспективных чтобы взять их уже джунами. (Ну или за дешево разметить датасеты) 😀 Стажировки обычно практикуются только в очень больших компаниях и почти всегда оканчиваются конкурсом (отбором), т.е. кто остается на джуна тут, а кто идет пытать счастья в других компаниях.


⚡️Но это в идеальном мире. Часто компании манипулируют этими понятиями, чтобы,например, платить зарплату поменьше. Или наоборот любого стажера называют джуном. Еще есть такая штука как джун+. Это способ нанять мидла на зарплату джуна 🤨

Если есть что рассказать по этой теме, добро пожаловать в комменты.! 👇
Хочешь ещe студентом работать в «Сбер», «билайн», EY или других топовых компаниях? Тогда приходи на Hack & Change от Changellenge >> — первый онлайн-хакатон, после которого ты сможешь стать сотрудником одной из компаний-партнеров. За три дня ты решишь реальную задачу по мобильной разработке или Data Engineering и прокачаешься на практике. Мы ждем студентов и недавних выпускников IT-специальностей.

Почему стоит участвовать:
— Шанс попасть в штат компаний-партнеров хакатона: «Сбер», «билайн», «Открытие Инвестиции», EY и IPONWEB.
— Крутые призы: бизнес-завтрак с CIO, сертификаты в сеть ресторанов, а также фирменный мерч от партнеров.
— Помощь для новичков: бесплатный to-do list для подготовки к соревнованию, вебинар с опытными хакатонщиками и поддержка менторов — опытных IT-специалистов.
— Встречи с экспертами отрасли и топами компаний-партнеров.

Собери свою команду или подай индивидуальную заявку — мы поможем тебе подобрать единомышленников. Регистрируйся до 21 ноября включительно: https://clck.ru/YjdTq
👍1
Недавно обсуждали различия стажеров от джунов.
Чтобы разобраться с различиями между джуном, мидлом и так далее, можно прочитать эту замечательную статью (вообще весь блог Вастрика рекомендую полистать, там много всего)
https://news.1rj.ru/str/JDScientist/42
Когда сидишь на удаленке уже почти 2 года
Как бы вы предпочли работать? Напишите в комментариях почему)
Anonymous Poll
10%
Работать из офиса
36%
Работать из дома
54%
Смешанный график (3 дома - 2 офис например)
#interview_questions

⭐️Вторая часть вопросов по нейросетям (CV edition) с собеседований:

1. Расскажите про оптимизаторы. Что это, зачем это. В чем особенность SGD, ADAM?
2. Расскажите что такое и для чего нужен слой batchnorm.
3. Какие архитектуры вы знаете для решения задач сегментации? Расскажите об FPN, U-net, DeepLabv3 в 2х словах.
4. Допустим вам нужно сделать сетку для сегментации, предназначенную для мобильных устройств, какую архитектуру с каким энкодером вы возьмете? Почему?
5. Что такое Focal Loss?
6. Механизм attention в компьютерном зрении.
7. Расскажите про возникновение и прогресс в сфере сеток для детекции. В чем разница сингл шот сеток от 2х стадийных? Знаете ли про RetinaNet, Faster R-CNN, Effdet, DETR? Расскажите в чем их особенность.
8. Расскажите про DW свертки
9. В чем основное отличие GAN от VAE
10. Если мы подадим картинку размером 32х32х3 на слой свертки, имеющий 5х5 фильтр, 16 выходных каналов, stride=1, pad= 0. Сколько получится обучаемых параметров у этого слоя?

Успехов!
#interview_questions

⭐️Третья заключительная часть вопросов про нейросети (NLP edition)

1. Расскажите, что знаете об LSTM слоях, GRU слоях? В чем их отличия? Сколько в них гейтов?
2. Что такое embeddings? История их развития. Как работает W2V архитектура?
3. Attention в NLP, positional encoding.
4. Трансформеры, что это, принцип работы.
5. Какие задачи решают с помощью NLP (NER, QA и тд). Какие подходы существуют к их решению?
6. Нормализация текста. Что это, и когда она нужна\не нужна?
7. Слышали про модель CLIP? Что это и какой принцип работы?
8. «Будешь делом заниматься или в слаке полдня сидеть?»