#DL #курсы
"Хочу понять нейронки, куда пойти?"
Мне в своё время очень зашла Deep Learning School от ФМПИ МФТИ: https://www.dlschool.org/
Сейчас ребята даже сделали курс на степике, стало вдвойне удобно.
В их курсах есть вообще всё - начиная с базовой математики, заканчивая соревнованиями на кэгле по распознаванию изображений
"Хочу понять нейронки, куда пойти?"
Мне в своё время очень зашла Deep Learning School от ФМПИ МФТИ: https://www.dlschool.org/
Сейчас ребята даже сделали курс на степике, стало вдвойне удобно.
В их курсах есть вообще всё - начиная с базовой математики, заканчивая соревнованиями на кэгле по распознаванию изображений
Если вы уже разобрались с материалами выше про #SQL, то очень советую поковыряться с оконными функциями.
Вот хорошая статья, которая объясняет зачем они нужны и как с ними работать: https://m.habr.com/ru/post/268983/
Оконные функции вообще считаются достаточно продвинутым уровнем SQL. И понимать где их использовать - прям очень круто. Но очень желательно иметь возможность где-то практиковаться - например, на том же sql-ex.ru
Вот хорошая статья, которая объясняет зачем они нужны и как с ними работать: https://m.habr.com/ru/post/268983/
Оконные функции вообще считаются достаточно продвинутым уровнем SQL. И понимать где их использовать - прям очень круто. Но очень желательно иметь возможность где-то практиковаться - например, на том же sql-ex.ru
Хабр
Как посчитать всё на свете одним SQL-запросом. Оконные функции PostgreSQL
Я с удивлением обнаружил, что многие разработчики, даже давно использующие postgresql, не понимают оконные функции, считая их какой-то особой магией для избранных. Ну или в лучшем случае...
👍1
#git
Вот этот интерактивный туториал поможет понять как грамотно работать с гитом:
https://learngitbranching.js.org/?locale=ru_RU
Вот этот интерактивный туториал поможет понять как грамотно работать с гитом:
https://learngitbranching.js.org/?locale=ru_RU
learngitbranching.js.org
Learn Git Branching
An interactive Git visualization tool to educate and challenge!
#визуализация
Целая куча хороших примеров по построению самых разных визуализаций с помощью matplotlib: https://habr.com/ru/post/468295/
Целая куча хороших примеров по построению самых разных визуализаций с помощью matplotlib: https://habr.com/ru/post/468295/
Хабр
50 оттенков matplotlib — The Master Plots (с полным кодом на Python)
Те, кто работает с данными, отлично знают, что не в нейросетке счастье — а в том, как правильно обработать данные. Но чтобы их обработать, необходимо сначала про...
#git
Курс для ребят, которые с гитом прежде вообще не работали. Он помягче и поподробнее предыдущего :)
https://githowto.com/ru
Курс для ребят, которые с гитом прежде вообще не работали. Он помягче и поподробнее предыдущего :)
https://githowto.com/ru
Githowto
Git How To: курс обучения Git на русском
Git How To — это интерактивный тур, который познакомит вас с основами Git. Тур создан с пониманием того, что лучший способ научиться использовать Git — попробовать его своими руками.
Спешу поделиться материалами курса, который сам не так давно прошёл.
Сошлюсь на страницу с подробным описанием и ссылкой на плейлист с видео, но далее будет серия из нескольких постов про те лекции, которые показались мне наиболее интересными.
В целом могу сказать, что это один из самых подробных и интересных курсов по анализу данных из всех, что я видел.
https://dyakonov.org/2020/12/30/pzad/
Сошлюсь на страницу с подробным описанием и ссылкой на плейлист с видео, но далее будет серия из нескольких постов про те лекции, которые показались мне наиболее интересными.
В целом могу сказать, что это один из самых подробных и интересных курсов по анализу данных из всех, что я видел.
https://dyakonov.org/2020/12/30/pzad/
Анализ малых данных
курс «Прикладные задачи анализа данных»
На сайте появилась новая вкладка «Курсы», а главное, выложены материалы этого года (слайды и видео) курса ПЗАД, который читается для студентов ВМК МГУ, а ниже немного об истории курса.…
Несколько наиболее полезных лично для меня лекций.
На собеседованиях (особенно на джуновые позиции) очень любят спрашивать про #метрики
Во многих курсах их введению и объяснению уделяют совсем немного времени, но вот в курсе ПЗАД Александр Геннадьевич провёл две большие лекции по метрикам регрессии и классификации. Очень советую посмотреть - там всё вводится крайне последовательно и понятно.
Лекция 9. Функции ошибки в задаче регрессии: https://youtu.be/7zE1wGk3TVA
Лекция 10. Качество в задачах классификации: https://youtu.be/zX7hzjVBqeM
На собеседованиях (особенно на джуновые позиции) очень любят спрашивать про #метрики
Во многих курсах их введению и объяснению уделяют совсем немного времени, но вот в курсе ПЗАД Александр Геннадьевич провёл две большие лекции по метрикам регрессии и классификации. Очень советую посмотреть - там всё вводится крайне последовательно и понятно.
Лекция 9. Функции ошибки в задаче регрессии: https://youtu.be/7zE1wGk3TVA
Лекция 10. Качество в задачах классификации: https://youtu.be/zX7hzjVBqeM
YouTube
ПЗАД2020. Лекция 9. Функции ошибки в задаче регрессии
курс "Прикладные задачи анализа данных", ВМК МГУ, Дьяконов Александр (https://dyakonov.org/ag/)
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
Продолжение про #метрики в курсе ПЗАД
В этих видео подробно рассматриваются Log Loss, ROC-AUC + ещё ряд интересных и специфичных метрик. В лекциях много практических примеров, мне это прям очень зашло :)
Лекция 11. Скоринговые функции ошибки: https://youtu.be/oKf86OZMf3w
Лекция 12. Кривые в машинном обучении: https://youtu.be/Y3BD_z2DF3M
В этих видео подробно рассматриваются Log Loss, ROC-AUC + ещё ряд интересных и специфичных метрик. В лекциях много практических примеров, мне это прям очень зашло :)
Лекция 11. Скоринговые функции ошибки: https://youtu.be/oKf86OZMf3w
Лекция 12. Кривые в машинном обучении: https://youtu.be/Y3BD_z2DF3M
YouTube
ПЗАД2020. Лекция 11. Скоринговые функции ошибки
курс "Прикладные задачи анализа данных", ВМК МГУ, Дьяконов Александр (https://dyakonov.org/ag/)
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
#тестирование
Сейчас аналитика и Data Science очень часто идут бок-о-бок.
Поэтому на собеседованиях часто спрашивают о том, как работать с A/B тестами и порой даже просят писать код.
Вот эта статья из Академии Яндекса поможет вам чуточку лучше с этим разобраться:
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python?utm_source=smm&utm_medium=tg&utm_campaign=prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Сейчас аналитика и Data Science очень часто идут бок-о-бок.
Поэтому на собеседованиях часто спрашивают о том, как работать с A/B тестами и порой даже просят писать код.
Вот эта статья из Академии Яндекса поможет вам чуточку лучше с этим разобраться:
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python?utm_source=smm&utm_medium=tg&utm_campaign=prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Говоря о Data Science, очень сложно не упомянуть о крупнейшем в СНГ (думаю, уже и в Восточной Европе) сообществе - Open Data Science.
Оно представлено каналом в слаке, в котором публикуют целую кучу полезной информации - курсы, вакансии, предстоящие конференции. Кроме того, сообщество очень активное - там вполне можно задать свой вопрос и получить на него грамотный ответ.
Зарегестрироваться: https://ods.ai/
Приложил парочку своих скринов, чтобы вы примерно представляли о чём речь :)
Оно представлено каналом в слаке, в котором публикуют целую кучу полезной информации - курсы, вакансии, предстоящие конференции. Кроме того, сообщество очень активное - там вполне можно задать свой вопрос и получить на него грамотный ответ.
Зарегестрироваться: https://ods.ai/
Приложил парочку своих скринов, чтобы вы примерно представляли о чём речь :)
👍2
Позволю себе взять в канале @kupchanski пост, который здорово поможет при подготовке к собеседованиям в части #python
Некоторые вопросы из списка я реально встречал и задавал на собеседованиях, так что сохраняйте :)
Некоторые вопросы из списка я реально встречал и задавал на собеседованиях, так что сохраняйте :)
Forwarded from Data Science Guy
Неплохая статья, для оценки собственных навыков в python. Рекомендую пробежаться, освежить знания или узнать новое)
https://mcs.mail.ru/blog/spisok-voprosov-s-sobesedovaniy-python-dlya-data-sayentistov
https://mcs.mail.ru/blog/spisok-voprosov-s-sobesedovaniy-python-dlya-data-sayentistov
Конспект лекций Анатолия Карпова на тему #статистика в формате ноутбука.
В нём рассматриваются многие базовые термины с примерами в знакомом всем формате
https://nbviewer.jupyter.org/github/KlukvaMors/basic_stat/blob/main/%D0%BA%D0%BE%D0%BD%D1%81%D0%BF%D0%B5%D0%BA%D1%82.ipynb?flush_cache=true
В нём рассматриваются многие базовые термины с примерами в знакомом всем формате
https://nbviewer.jupyter.org/github/KlukvaMors/basic_stat/blob/main/%D0%BA%D0%BE%D0%BD%D1%81%D0%BF%D0%B5%D0%BA%D1%82.ipynb?flush_cache=true
Ещё один достойный список вопросов для подготовки к собеседованию, наткнулся на просторах интернета.
Он на английском, но возможно это будет кому-то и в плюс :)
Многие из вопросов действительно очень годные.
+ к практически всем есть ответы, по ним удобно готовиться
https://github.com/alexeygrigorev/data-science-interviews/blob/master/theory.md
Он на английском, но возможно это будет кому-то и в плюс :)
Многие из вопросов действительно очень годные.
+ к практически всем есть ответы, по ним удобно готовиться
https://github.com/alexeygrigorev/data-science-interviews/blob/master/theory.md
GitHub
data-science-interviews/theory.md at master · alexeygrigorev/data-science-interviews
Data science interview questions and answers. Contribute to alexeygrigorev/data-science-interviews development by creating an account on GitHub.
Ещё один хороший сборник вопросов с собеседований на тему #статистика.
Важно: лично мне кажется, что ответы на некоторые вопросы тут даны ну прям уж совсем краткие (та же стат. значимость). Так что советую перед собесом более подробно пробежаться по ним и покопаться в теме.
https://proglib.io/sh/q6rCD0Nca1
Важно: лично мне кажется, что ответы на некоторые вопросы тут даны ну прям уж совсем краткие (та же стат. значимость). Так что советую перед собесом более подробно пробежаться по ним и покопаться в теме.
https://proglib.io/sh/q6rCD0Nca1
Библиотека программиста
🎲 40 вопросов по статистике с собеседований на должность Data Scientist
40 популярных вопросов, которые задавали на собеседованиях соискателям на должность Data Scientist. Приведены также и ответы – c рисунками, формулами и ссылками для самостоятельного изучения.
На собеседованиях часто задают вопросы с используемыми в работе DS'a библиотеками.
В частности, про #numpy
Если хотите поупражняться, вот хороший репозиторий для этого:
https://github.com/rougier/numpy-100
Там 100 заданий самого разного уровня - над тремя звёздочками уверен, что многим придётся подумать :)
P.S. Для тех кто боится гита.
Можете просто тыкнуть зелёную кнопку Code, затем Download ZIP. Потом разахривируйте на своём компьютере и используйте файлики 100_Numpy_exercises.ipynb (сами задания), 100_Numpy_exercises_with_hints.md (задания с подсказками), 100_Numpy_exercises_with_hints_with_solutions.md (решения)
В частности, про #numpy
Если хотите поупражняться, вот хороший репозиторий для этого:
https://github.com/rougier/numpy-100
Там 100 заданий самого разного уровня - над тремя звёздочками уверен, что многим придётся подумать :)
P.S. Для тех кто боится гита.
Можете просто тыкнуть зелёную кнопку Code, затем Download ZIP. Потом разахривируйте на своём компьютере и используйте файлики 100_Numpy_exercises.ipynb (сами задания), 100_Numpy_exercises_with_hints.md (задания с подсказками), 100_Numpy_exercises_with_hints_with_solutions.md (решения)
GitHub
GitHub - rougier/numpy-100: 100 numpy exercises (with solutions)
100 numpy exercises (with solutions). Contribute to rougier/numpy-100 development by creating an account on GitHub.
#визуализация
Копаясь по работе с графиками, наткнулся на вот эту классную заметку: https://neptune.ai/blog/pandas-plot-deep-dive-into-plotting-directly-with-pandas
Честно признаюсь - сам долго не знал, что графики можно рисовать просто приписав .plot() к датафрейму в Pandas. В этой статьей есть куча примеров рисования разнообразных визуализаций с помощью этого
Копаясь по работе с графиками, наткнулся на вот эту классную заметку: https://neptune.ai/blog/pandas-plot-deep-dive-into-plotting-directly-with-pandas
Честно признаюсь - сам долго не знал, что графики можно рисовать просто приписав .plot() к датафрейму в Pandas. В этой статьей есть куча примеров рисования разнообразных визуализаций с помощью этого
neptune.ai
Pandas Plot: Deep Dive Into Plotting Directly With Pandas
Explore direct plotting with Pandas, from dataset imports to exploring various plot styles and essential Pandas plotting tools.
super-cheatsheet-machine-learning.pdf
1.3 MB
Наткнулся тут на просторах интернета на "Super VIP Cheatsheet: Machine Learning" от ребят из Stanford University.
Я бы описал его так: оочень краткий конспект некоторых основных тем в ML с самыми важными формулами и наглядными иллюстрациями.
Некоторые темы раскрыты прям круто: функции потерь, град. спуск, регрессии, обучение без учителя, метрики. А вот про деревянные модели рассказали как-то не очень подробно.
Кроме того, в конце есть блок "Refreshers", который покрывает, как мне кажется, очень большую часть базовой математической теории, которая используется в алгоритмах.
Для тех кто не любит большие книжки - там всего 16 страниц! Прям самое то на полистать и вспомнить формулы перед собеседованием.
#книжки
Я бы описал его так: оочень краткий конспект некоторых основных тем в ML с самыми важными формулами и наглядными иллюстрациями.
Некоторые темы раскрыты прям круто: функции потерь, град. спуск, регрессии, обучение без учителя, метрики. А вот про деревянные модели рассказали как-то не очень подробно.
Кроме того, в конце есть блок "Refreshers", который покрывает, как мне кажется, очень большую часть базовой математической теории, которая используется в алгоритмах.
Для тех кто не любит большие книжки - там всего 16 страниц! Прям самое то на полистать и вспомнить формулы перед собеседованием.
#книжки
👍1🔥1
#алгоритмы
Выше в этом треде писалось о том, что в некоторых компаниях на собеседованиях любят спрашивать про алгоритмы и структуры данных.
Удобная шпаргалка по сложности взаимодействия с разными структурами данных:
Выше в этом треде писалось о том, что в некоторых компаниях на собеседованиях любят спрашивать про алгоритмы и структуры данных.
Удобная шпаргалка по сложности взаимодействия с разными структурами данных: