Data Science Guy – Telegram
Data Science Guy
3.6K subscribers
106 photos
10 videos
4 files
174 links
Канал проекта Data Science Guy на ютубе.

https://www.youtube.com/c/DataScienceGuy


Есть вопросы по обучению Data science и ML? Пишем в чат - https://news.1rj.ru/str/dsguy_chat
Download Telegram
#образование
Если кто-то учит ML и хочет быстро повторить основные вещи, то можно воспользоваться ресурсом типа этого (собраны описания основных терминов в ML)
https://machinelearningfaq.com/
#промо

Знание SQL — must have в сфере аналитики

На бесплатном курсе-симуляторе в Нетологии «Введение в SQL и работу с базой данных» вы изучите основы SQL, научитесь подключаться к реляционным базам данных, делать SQL-запросы и создавать простые отчёты и аналитику. Все задания основаны на реальных кейсах из практики аналитиков. Курс подойдет всем, кто работает с данными или хочет начать.

Попробуйте ↓
https://netolo.gy/hev
Иногда люди не до конца понимают, в чем разница между стажером (еще их иногда называют trainee) и джуниор разработчиком. Предлагаю подискутировать на эту тему в комментариях. Вот мое мнение:

🧑‍💻Джуниор - специалист начинающего уровня, который уже может сесть и делать какую то задачу. Да, часто эти задачи простые и джун находится под зорким контролем коллеги постарше, но все же проблемы базового уровня он в состоянии решить самостоятельно. То есть, джуниор должен уже иметь знания и навыки.
⭐️Зачем нанимают джунов?
Для компании часто бывает проще нанять джуна и вырастить его в мидла. Кажется, что это странно, но иногда найти полностью подходящего под ваши запроса спеца, бывает очень сложно (случается, что позиция висит не закрытая месяцами). Так же это хорошая возможность закрыть большое количество мелких, несложных задач, не тратя ресурсы более высокооплачиваемого и занятого мидла или сеньера и не отнимать их время от более серьезных задач.


👶 Стажер
В отличии от джуна, стажером можно стать с нулевым количеством знаний. Просто прийти и сказать, очень хочу, научите пожалуйста. (Знаю даже пару случаев когда это прокатывало). Дают учебные задачки или датасетики поразмечать например.
Основное отличие в том, что стажерам либо платят мало, либо не платят совсем.

⭐️Зачем нанимают стажеров?
Посмотреть и выбрать из них наиболее перспективных чтобы взять их уже джунами. (Ну или за дешево разметить датасеты) 😀 Стажировки обычно практикуются только в очень больших компаниях и почти всегда оканчиваются конкурсом (отбором), т.е. кто остается на джуна тут, а кто идет пытать счастья в других компаниях.


⚡️Но это в идеальном мире. Часто компании манипулируют этими понятиями, чтобы,например, платить зарплату поменьше. Или наоборот любого стажера называют джуном. Еще есть такая штука как джун+. Это способ нанять мидла на зарплату джуна 🤨

Если есть что рассказать по этой теме, добро пожаловать в комменты.! 👇
Хочешь ещe студентом работать в «Сбер», «билайн», EY или других топовых компаниях? Тогда приходи на Hack & Change от Changellenge >> — первый онлайн-хакатон, после которого ты сможешь стать сотрудником одной из компаний-партнеров. За три дня ты решишь реальную задачу по мобильной разработке или Data Engineering и прокачаешься на практике. Мы ждем студентов и недавних выпускников IT-специальностей.

Почему стоит участвовать:
— Шанс попасть в штат компаний-партнеров хакатона: «Сбер», «билайн», «Открытие Инвестиции», EY и IPONWEB.
— Крутые призы: бизнес-завтрак с CIO, сертификаты в сеть ресторанов, а также фирменный мерч от партнеров.
— Помощь для новичков: бесплатный to-do list для подготовки к соревнованию, вебинар с опытными хакатонщиками и поддержка менторов — опытных IT-специалистов.
— Встречи с экспертами отрасли и топами компаний-партнеров.

Собери свою команду или подай индивидуальную заявку — мы поможем тебе подобрать единомышленников. Регистрируйся до 21 ноября включительно: https://clck.ru/YjdTq
👍1
Недавно обсуждали различия стажеров от джунов.
Чтобы разобраться с различиями между джуном, мидлом и так далее, можно прочитать эту замечательную статью (вообще весь блог Вастрика рекомендую полистать, там много всего)
https://news.1rj.ru/str/JDScientist/42
Когда сидишь на удаленке уже почти 2 года
Как бы вы предпочли работать? Напишите в комментариях почему)
Anonymous Poll
10%
Работать из офиса
36%
Работать из дома
54%
Смешанный график (3 дома - 2 офис например)
#interview_questions

⭐️Вторая часть вопросов по нейросетям (CV edition) с собеседований:

1. Расскажите про оптимизаторы. Что это, зачем это. В чем особенность SGD, ADAM?
2. Расскажите что такое и для чего нужен слой batchnorm.
3. Какие архитектуры вы знаете для решения задач сегментации? Расскажите об FPN, U-net, DeepLabv3 в 2х словах.
4. Допустим вам нужно сделать сетку для сегментации, предназначенную для мобильных устройств, какую архитектуру с каким энкодером вы возьмете? Почему?
5. Что такое Focal Loss?
6. Механизм attention в компьютерном зрении.
7. Расскажите про возникновение и прогресс в сфере сеток для детекции. В чем разница сингл шот сеток от 2х стадийных? Знаете ли про RetinaNet, Faster R-CNN, Effdet, DETR? Расскажите в чем их особенность.
8. Расскажите про DW свертки
9. В чем основное отличие GAN от VAE
10. Если мы подадим картинку размером 32х32х3 на слой свертки, имеющий 5х5 фильтр, 16 выходных каналов, stride=1, pad= 0. Сколько получится обучаемых параметров у этого слоя?

Успехов!
#interview_questions

⭐️Третья заключительная часть вопросов про нейросети (NLP edition)

1. Расскажите, что знаете об LSTM слоях, GRU слоях? В чем их отличия? Сколько в них гейтов?
2. Что такое embeddings? История их развития. Как работает W2V архитектура?
3. Attention в NLP, positional encoding.
4. Трансформеры, что это, принцип работы.
5. Какие задачи решают с помощью NLP (NER, QA и тд). Какие подходы существуют к их решению?
6. Нормализация текста. Что это, и когда она нужна\не нужна?
7. Слышали про модель CLIP? Что это и какой принцип работы?
8. «Будешь делом заниматься или в слаке полдня сидеть?»
Мой знакомый завел канал в помощь всем изучающим английский язык, Я ему помогаю тоже. Контента пока немного, но каждый день будут появляться новые посты.
Предлагаю вам ознакомиться и подписаться, ведь английский просто must have для всех изучающих data science!

https://news.1rj.ru/str/english_wth_mems
Если хочешь подтянуть уровень знаний английского языка 🇬🇧, подучить новых слов и начать лучше читать английские тексты, то этот канал поможет тебе в этом.
С помощью смешных картинок - мемов, мы будем разбирать различную лексику английского языка: устойчивые фразы, сленг и просто слова, которые точно пригодятся любому изучающему английский язык человеку. Этот канал подойдет для любого уровня владения языком от А1 до С1.
‼️Стоит учитывать, что вы не сможете выучить язык, только читая мемасики, так что этот канал подойдет как дополнительный источник знаний к вашему основному курсу или учебнику.
Присоединяйтесь!
Неплохая подборочка программ для тех, кто хочет программировать не только на комьютере или ноутбуке, но и на планшете или даже телефоне! Подборка исключительно под Android.

Пишите в комментариях, в каких мобильных редакторах доводилось кодить вам?

https://pythonru.com/baza-znanij/python-na-android
#промо

Хотите получить предложение о работе уже в эти выходные? Тогда приходите на Weekend Offer в Авито для аналитиков. Приглашаются junior-, middle- и senior-специалисты.

И вот пять причин отправить заявку:
— Возможность влиять на продукт: приложением Авито пользуются 40 млн человек ежемесячно.
— Работа с более 1000 разных сервисов: вы будете обсуждать продуктовые решения с командой, предлагать идеи и внедрять их.
— Комфортные условия: бюджет на обучение, уютный офис на «Белорусской», ДМС, техника Apple и другие возможности.
— Разные задачи: вы займетесь созданием аналитических фреймворков, формулированием и проверкой гипотез, а также созданием операционной отчетности с выбором ключевых метрик.
— Готовые инструменты: надежное DWH на базе HP Vertica + Clickhouse и собственная платформа для AB-тестов.

Успейте занять позицию в компании — подавайте заявку до 1 декабря включительно: https://clck.ru/YxgTX
👍1
Подборочка актуальных соревнований с kaggle:

1. https://www.kaggle.com/c/sartorius-cell-instance-segmentation - многоклассовая сегментация, нужно находить клетки на снимках с микроскопа. - CV
2. https://www.kaggle.com/c/petfinder-pawpularity-score - Нужно определить "няшность" животных по фото и метаданным. - CV
3. https://www.kaggle.com/c/jigsaw-toxic-severity-rating - Определяем токсичность комментариев - NLP
4. https://www.kaggle.com/c/santa-2021/overview/evaluation - Новогодняя сорева, составляем расписание вещания телепередач
5. https://www.kaggle.com/c/nfl-big-data-bowl-2022 - Анализируем статистику с игр NFL
6. https://www.kaggle.com/c/tensorflow-great-barrier-reef - Детектим морских звезд в риалтайме на видеозаписях морского дна.

Выбирайте на свой вкус и принимайте участие!
#Промо

3 канала для тех, кто хочет прокачаться в определённом направлении программирования:

— нейронные сети и ИИ: @neuro_channel
— вопросы и задачки по Python: @quiz_python
— разработка на Java: @a_cup_of_java
This media is not supported in your browser
VIEW IN TELEGRAM
Мне кажется примерно так будут выглядеть субтитры если закинуть эту песню в нейронку для Speech Recognition
#промо

Хотите начать карьеру в «билайн»? Тогда регистрируйтесь на бесплатную образовательную программу от экспертов компании в онлайн-формате. Здесь вы погрузитесь в разработку web-интерфейсов, пройдете курс из трех блоков и получите шанс попасть на работу в компанию. Приглашаются студенты последних курсов бакалавриата, магистранты, а также выпускники 2018-2021 годов со всей России.

На программе вас ждут:
— Карьерные бонусы и предложение о работе. Вы сможете добавить в резюме диплом о прохождении курса и рекомендательное письмо, а лучшие интерны получат шанс попасть в команду «билайн».
— Возможность бесплатно выучить HTML/CSS, JAVASCRIPT и REACT. Вас ждет курс лекций от IT-специалистов — лучших разработчиков «билайн» и приглашенных экспертов — похожие программы стоят сотни тысяч.
— Персональный ментор, который будет вас сопровождать на протяжении всего курса.

Регистрируйтесь до 15 декабря включительно: https://clck.ru/Z8JHQ
Говорят тут запускают новый курс по дата инжинирингу. Как я понял бесплатный. Делюсь ссылкой, вся инфа в описании к репозиторию

Старт после новогодних праздников.

https://github.com/DataTalksClub/data-engineering-zoomcamp
🎓 Помните такой стереотип — основатели успешных стартапов бросают учебу и идут делать бизнес?

В общем, это полная фигня, по крайней мере в США. На графике — данные по >500 единорогам из США за 1997-2019. Лишь 4% фаундеров бросили учебу, остальные — доктора наук, MBA, магистры или как минимум бакалавры.

Без качественного образования бизнес не построишь. В комментариях еще интересная статистика о том, где учились фаундеры американских единорогов — сплошной Стэнфорд-Гарвард-MIT-Беркли.

UPD В комментариях правильно дополняют: помимо образования такие университеты дают мощный нетворк, который потом помогает в бизнесе, фандрейзинге и т.д.
👍5