Start Career in DS – Telegram
Start Career in DS
11.8K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
Вопросы про #сложность алгоритмов часто встречаются на интервью.
В этой теме очень важно понимать ассиптотику питоновских структур данных и уметь их комбинировать:
https://proglib.io/p/slozhnost-algoritmov-i-operaciy-na-primere-python-2020-11-03
МегаФон Data scientist (стажировка).pdf
78.9 KB
#стажировки
Друзья из МегаФона запускают новую волну стажировок. Я сам когда-то начинал с точно такой же, поэтому очень рекомендую 🙂
Писать можно напрямую hr: @svetlana_stakanova
Подробности в файле
Хорошая статья про #shap:
https://towardsdatascience.com/shap-explain-any-machine-learning-model-in-python-24207127cad7

Для тех, кто не знаком: SHAP - инструмент, который позволяет оценить вклад каждого признака как в итоговую модель, так и в конкретное предсказание. Очень удобная и полезная штука. Понимать как она работает - большой плюсик в карму
Start Career in DS
Как рассказать про ту или иную тему на собеседовании? Какие вопросы могут задать? Запускаю цикл видео, которые ответят на эти и многие другие вопросы. https://youtu.be/MM4onsNaLlI P.S. На первый выпуск ушло прям очень много сил и времени, огромнейшее спасибо…
🔥Вторая часть видео про линейную регрессию!
В нём разбираются уже более сложные вещи.
Ключевые моменты: внутрянка sklearn LinearModel, решение линейной регрессии через SVD, градиентный спуск, стохастический градиентный спуск.
Как и всегда, буду рад любой обратной связи (как положительной, так и отрицательной) где угодно.
https://youtu.be/gZxtdPY6e_o
DLStories — канал о глубоком обучении и искусственном интеллекте, который ведут ребята из DLSchool — школы глубокого обучения на базе МФТИ.

В канале вы найдете:
- разборы архитектур новых нейросетей
- обучающие материалы: статьи, видео, подкасты на DL-тематику
- рассуждения о влиянии ИИ на социум
- новости и веселые истории из мира ИИ

Будьте в курсе последних тенденций в области DL и ИИ! ⬇️

@dl_stories
Наверное, кто-то меня невзлюбит за эту статью и я получу большой отток в канале, но поделиться очень хочется 🙂
Автора лично не знаю, статью взял у ребят из @quas6
Ключевая мысль, которую я хочу ею донести - DS'ы бывают разными. Не ведитесь на название позиции, обязательно узнавайте чем вы будете заниматься и в каких условиях будете работать. Лучше - просите прямо конкретные примеры задач команды и равняйте их на себя, а ещё лучше - находите людей, которые в отделе работают.
mesyarik.ru/18/sberbank.html

P.S. Даже в рамках компании от отдела к отделу задачи и условия могут отличаться кардинально, поэтому не воспринимайте статью в штыки
👍1
Карта базовой математики для ML: https://app.learney.me
В вершинах - материалы, которые помогут изучить тему. Очень полезная штука.
👍4
Легендарная статья, которая позволит вам объяснить любому человеку с улицы что такое Data Science:

https://vas3k.ru/blog/machine_learning/
👍6🔥2
Прекрасный тренажёр по #pandas, позволит вспомнить основные хинты перед собеседованием (и не только):
https://www.machinelearningplus.com/python/101-pandas-exercises-python/
👍7
Всех с наступающим, а кого-то уже и с наступившим :)

Прошедший год в цифрах:
• Канал в телеграмме вырос более чем в 2 раза!
• Суммарные просмотры канала превысили 250k
Более 150 постов были собраны в единую страничку на Notion
• Был запущен канал на Youtube, он уже набрал >350 подписчиков :)
Там уже есть и интервью, и обучающие видео. Дальше - больше!
Записаны и находятся в монтаже видео с несколькими очень интересными личностями:
1. С лидом из MTS AI (мастер и грандмастер Kaggle!)
2. С легендой российского и лондонского Data Science :)
Ссылочка: https://youtube.com/channel/UC58kXi5NtsovarEcx4FfsiA

А чего бы вам хотелось бы видеть больше в канале в 2022 году?)
👍21🔥9
Ключевые распределения.
На собеседованиях очень любят задачки на классический тервер а-ля
• Из ящика, в котором 4 красных, 5 зелёных и 1 синий шар вытаскиваются шары с возвращением. Каково матожидание первого вытягивание синего шара?
• В среднем в магазин заходят 3 человека в минуту. Какова вероятность того, что за 2 минуты в магазин зайдет не более 1 человека?
• Согласно какому распределению распределяется число изюминок в булочках?

Для того, чтобы в этом всём разобраться, здорово понимать какие ключевые распределения есть.
Вот эта статья позволит это вспомнить: https://habr.com/ru/post/311092/
👍22🔥19
К слову про задачки на теорию вероятностей.
Я тут недавно нашёл вот такой вот такую подборку задач из Я, которую давали на одном из дней карьеры в МГУ.
За, кажется, 4 решённых задачи можно было получить что-то вроде футболки и скип одного из первых этапов отбора на стажировку :)
👍17🔥10
🔥🔥🔥 Интервью с Андреем Лукьяненко, лидом из MTS AI, мастером соревнований и грандмастером ноутбуков на Kaggle!

Андрей прошёл путь из ERP консалтинга в DL и сейчас является одним из самых узнаваемых участников российского DS-комьюнити 🙂

https://youtu.be/pjvJoGwXVXU

P.S. Поддержите видео лайком + комментом, это будет безумно полезно для продвижения канала!
🔥16👍7🎉1
Курс по нейронкам с уклоном в CV от Samsung.
Буквально вчера допрошёл очень зашедший мне курс "Нейронные сети и компьютерное зрение".
Зашёл он мне по ряду причин:
1. Большинство сложных вещей объясняют реально на пальцах. Вплоть до того, что "Для того, чтобы понять градиентный спуск - представьте что вам нужно спуститься с горы к озеру. Как вы это будете делать?"
2. Достаточное количество теоретических задач. Их я бы сказал много, но необходимо их решать на сертификат с отличием, если проходите курс просто по фану - можно пропустить. Тем не менее, многие из них - вопросы, которые во-первых реально позволяют лучшие понять тему (к примеру, руками считать производные выхода нейронки по параметрам), во-вторых - реально встречаются на собеседованиях
3. Хорошие практические задания. Местами дебильные и муторные (ручная реализация свёрточного слоя), но, опять же, позволяющие лучше понять что происходит
4. Последний семинар - фактически готовый гайд для старта участия в соревнованиях по CV на Kaggle. Ну и, собственно, задание там - побить baseline в одном из мейнстримных соревнований (Cleaned vs Dirty).
5. Курс целиком и полностью бесплатный 🙂

Имхо если вы помните универскую математику, +- уверенно программируете на питоне и хотите познать CV - он вам зайдёт.

В общем, рекомендую:
https://stepik.org/course/50352
👍33🔥4🤩1
Учебник ШАДа продолжает пополняться!
Почитал про алгоритмы и оценку моделей - одни из лучших объяснений, которые я видел. В том плане, что погружение достаточно плавное: сначала даётся интуитивное понимание (которого и многим не хватает), а потом уже постепенное погружение в детали.

Очень советую всем как минимум почитать блок про градиентный бустинг, как максимум - прям поразбираться со всеми блоками.
Ссылка: https://ml-handbook.ru
👍29🔥4🤩4
В канале часто появляются материалы относительно тех или иных ML-алгоритмов. Но вот конкретные приложения к прикладным задачам найти не так просто.
У Вани Максимова есть очень хороший канал ML for Value. В нем он разбирает применение различных подходов к решению практических задач.
Ваня долгое время работал в DS консалтинге, сейчас руководит одной из DS команд в Delivery Club, так что ему есть что рассказать 🙂
Ссылка на канал: https://news.1rj.ru/str/ml4value
🔥8👍7