Forwarded from Data-comics
Команда datacamp делится читшитом на тему датавиза.
Почитать подробности и посмотреть в качестве получше можно по ссылке.
В целом, все кто Storytelling with data читал, ничего нового не увидят. Но компактная подача может кому-то пригодится. 😁👌
https://www.datacamp.com/cheat-sheet/data-storytelling-and-communication-cheat-sheet
Почитать подробности и посмотреть в качестве получше можно по ссылке.
В целом, все кто Storytelling with data читал, ничего нового не увидят. Но компактная подача может кому-то пригодится. 😁👌
https://www.datacamp.com/cheat-sheet/data-storytelling-and-communication-cheat-sheet
Forwarded from Математика, Вычислительные Физика и Финансы
I will posting notebooks with lectures here: https://github.com/grinisrit/noa/tree/master/docs/quant
GitHub
noa/docs/quant at master · grinisrit/noa
Differentiable Programming Algorithms in Modern C++ - grinisrit/noa
Forwarded from Ivan Novikov
kulikov_2a5.pdf
5 MB
Есть один курс на ФТ для магистратуры "Математическая теория финансов". В нем есть и лекции и семинары. Вот ссылка на лмс для физтехов: https://lms.mipt.ru/enrol/index.php?id=4190
Записывайся, смотри. Там даже записи доступны, кажется.
Для не физтехов прикрепляю методичку на русском по этому курсу.
Записывайся, смотри. Там даже записи доступны, кажется.
Для не физтехов прикрепляю методичку на русском по этому курсу.
Forwarded from Борис опять
Если кто-то хочет понять, кто такой этот ваш StableDiffusion, то вот отличный коллаб:
https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb#scrollTo=-xMJ6LaET6dT#fromHistory
Не только код, но и объяснение что к чему, и ссылки для любителей закопаться глубже. Мне не трудно было адаптировать этот коллаб, чтобы поиграться конкретно с VAE.
https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb#scrollTo=-xMJ6LaET6dT#fromHistory
Не только код, но и объяснение что к чему, и ссылки для любителей закопаться глубже. Мне не трудно было адаптировать этот коллаб, чтобы поиграться конкретно с VAE.
Google
stable_diffusion.ipynb
Run, share, and edit Python notebooks
Forwarded from Start Career in DS
🧑💻 Подготовка к собеседованиям
Один из лучших способов подготовиться к интервью - попробовать поставить себя на место кандидата заранее.
В этом могут здорово помочь открытые собседования на ютубе. Подготовили для вас подборку из них.
Для джунов
1. Ключевые блоки: Python, A/B-тесты, Работа с данными (SQL+Pandas), ML алгоритмы
Junior Data Scientist | Собеседование | karpov.courses
2. Ключевые блоки: Python, SQL, ML и работа с данными, статистика
Типичное собеседование #1. Позиция Junior Data Scientist. Accepted!
3. Собеседование на работу с данными c помощью Python и SQL (проводит сам Анатолий Карпов!):
Junior аналитик данных | Собеседование | karpov.courses
Для мидлов
1. Двухсерийная версия: по ML Design и Python
Middle Data Scientist | Выпуск 1. Секция ML | Собеседование | karpov.courses
Middle Data Scientist | Часть 2. Секция Python и работы с данными | Собеседование | karpov.courses
2. Ключевые блоки: Теория вероятностей, SQL, ML, бизнес-кейс
Собеседование на Middle Data Scientist | #Нанято S1E01RU
3. Не совсем формат собеседования, но вопросы хорошие.
Ключевые блоки: Python, SQL, статистика, ML
100 Data Science вопросов мидлу! Парень c Физтеха проходит собеседование
Материал полезен? Тыкайте 🔥👍!
Один из лучших способов подготовиться к интервью - попробовать поставить себя на место кандидата заранее.
В этом могут здорово помочь открытые собседования на ютубе. Подготовили для вас подборку из них.
Для джунов
1. Ключевые блоки: Python, A/B-тесты, Работа с данными (SQL+Pandas), ML алгоритмы
Junior Data Scientist | Собеседование | karpov.courses
2. Ключевые блоки: Python, SQL, ML и работа с данными, статистика
Типичное собеседование #1. Позиция Junior Data Scientist. Accepted!
3. Собеседование на работу с данными c помощью Python и SQL (проводит сам Анатолий Карпов!):
Junior аналитик данных | Собеседование | karpov.courses
Для мидлов
1. Двухсерийная версия: по ML Design и Python
Middle Data Scientist | Выпуск 1. Секция ML | Собеседование | karpov.courses
Middle Data Scientist | Часть 2. Секция Python и работы с данными | Собеседование | karpov.courses
2. Ключевые блоки: Теория вероятностей, SQL, ML, бизнес-кейс
Собеседование на Middle Data Scientist | #Нанято S1E01RU
3. Не совсем формат собеседования, но вопросы хорошие.
Ключевые блоки: Python, SQL, статистика, ML
100 Data Science вопросов мидлу! Парень c Физтеха проходит собеседование
Материал полезен? Тыкайте 🔥👍!
YouTube
Junior Data Scientist | Собеседование | karpov.courses
Курс Start ML: https://bit.ly/3SdB7Am
Лучший способ подготовиться к собеседованию — пройти его в тестовом режиме.
Мы записали mock-интервью, которое состоит из 4-х секций: Python, ML, работа с данными и А/В Тесты. В независимости от уровня соискателя есть…
Лучший способ подготовиться к собеседованию — пройти его в тестовом режиме.
Мы записали mock-интервью, которое состоит из 4-х секций: Python, ML, работа с данными и А/В Тесты. В независимости от уровня соискателя есть…
Forwarded from DevFM
Продолжаем о собеседованиях
В статье Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов (2021) предложена таблица с примерами вопросов по темам.
Например, по теме "тестирование" для джуна вопрос такой:
"Что такое TDD?"
Для миддла в той же теме вопросы уже сложнее:
"Какие тесты приходилось писать? Что такое мок-объекты? Приходилось ли использовать?". Мы, кстати, писали о Mock, с этими знаниями вы теперь middle developer, поздравляю.
Часть вопросов ужасно нелепы, типа "Где в Django применяется паттерн мост?". Но важно понимать, что на собеседовании могут спрашивать самые странные вопросы. И неплохо бы научиться на такие вопросы отвечать. Иногда ответ может быть неожиданным.
Если у вас на вопросы из статьи не получается сформулировать ответ, то имеет смысл изучить тему подробнее. Таким образом можно почерпнуть направления для изучения.
#skills
В статье Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов (2021) предложена таблица с примерами вопросов по темам.
Например, по теме "тестирование" для джуна вопрос такой:
"Что такое TDD?"
Для миддла в той же теме вопросы уже сложнее:
"Какие тесты приходилось писать? Что такое мок-объекты? Приходилось ли использовать?". Мы, кстати, писали о Mock, с этими знаниями вы теперь middle developer, поздравляю.
Часть вопросов ужасно нелепы, типа "Где в Django применяется паттерн мост?". Но важно понимать, что на собеседовании могут спрашивать самые странные вопросы. И неплохо бы научиться на такие вопросы отвечать. Иногда ответ может быть неожиданным.
Если у вас на вопросы из статьи не получается сформулировать ответ, то имеет смысл изучить тему подробнее. Таким образом можно почерпнуть направления для изучения.
#skills
Хабр
Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов
Собеседование — одна из наиболее стрессовых тем для разработчиков, но только первые двадцать раз. Привет! Меня зовут Руслан, я один из наставников курса «Мидл Python-разработчик» в Яндекс.Практикуме....
Forwarded from Градиент обреченный (Sergei Averkiev)
#ml #prod
🔺 ML System Design
Материалы по внешней стороне машинного обучения (за внутреннюю считаем research / исследования) — проектирование того, как это все будет работать, поддерживаться и обновляться (system design).
Тема важная и начать в нее погружаться можно из актуального курса Стэнфорда cs 329s (содержание курса). Все это похоже на системное программирование, только в контексте ML. Сами лекции в виде текста, есть слайды и пара ноутбуков. Лекции прикольные, можно читать как книжку. Сам курс не очень длинный, так что будут шансы пройти до конца 😁.
👉 Лекции и TLDR;
1️⃣ Отличия ML для продакшена. tldr; Данные — сырые и меняются во времени. Приоритеты — быстрый инференс, важна интерпретируемость. Много заказчиков и требований от них.
2️⃣ Основы проектирования. tldr; Понимаем проблему (нужен ли тут вообще ML?). Источники и формат данных. ETL (процессинг и хранение данных).
3️⃣ Тренировочные данные. tldr; Тут довольно понятная тема — что делать с сырыми данными, как собрать из них хороший датасет, нехватка разметки, active learning и т.д.
4️⃣ Feature Engineering. tldr; Данные есть, как будем подавать их в модель? Аугментации (делаем данные разнообразней), придумываем новые признаки. И внезапно про позиционные эмбеддинги.
5️⃣ Model Development. tldr; Six tips for model selection. Важная мысль — не надо сразу брать SOTA, топовый результат на статическом датасете не обязательно будет лучше для вас, начните с простого. kaggle хаки/подходы — bagging, boosting, stacking.
6️⃣ Распределенное обучение и оценка модели. tldr; Про обучение на кластере и виды параллелизма. Сделай бейзлайн (рандомный, эвристики, человеческий, готовые решения). Советы по оценке моделей.
7️⃣ Деплой модели. tldr; Онлайн / оффлайн предсказания. Оптимизация модели — дистилляция, прунинг, квантизация. ML в облаке.
8️⃣ Мониторинг и дрифт данных. tldr; Хьюстон, у нас дрифт данных. Про feedback loop. Различные виды дрифта (covariate, label, concept drifts). Observability — собирай метрики, чтобы понять, что пошло не так.
🔺 ML System Design
Материалы по внешней стороне машинного обучения (за внутреннюю считаем research / исследования) — проектирование того, как это все будет работать, поддерживаться и обновляться (system design).
Тема важная и начать в нее погружаться можно из актуального курса Стэнфорда cs 329s (содержание курса). Все это похоже на системное программирование, только в контексте ML. Сами лекции в виде текста, есть слайды и пара ноутбуков. Лекции прикольные, можно читать как книжку. Сам курс не очень длинный, так что будут шансы пройти до конца 😁.
👉 Лекции и TLDR;
1️⃣ Отличия ML для продакшена. tldr; Данные — сырые и меняются во времени. Приоритеты — быстрый инференс, важна интерпретируемость. Много заказчиков и требований от них.
2️⃣ Основы проектирования. tldr; Понимаем проблему (нужен ли тут вообще ML?). Источники и формат данных. ETL (процессинг и хранение данных).
3️⃣ Тренировочные данные. tldr; Тут довольно понятная тема — что делать с сырыми данными, как собрать из них хороший датасет, нехватка разметки, active learning и т.д.
4️⃣ Feature Engineering. tldr; Данные есть, как будем подавать их в модель? Аугментации (делаем данные разнообразней), придумываем новые признаки. И внезапно про позиционные эмбеддинги.
5️⃣ Model Development. tldr; Six tips for model selection. Важная мысль — не надо сразу брать SOTA, топовый результат на статическом датасете не обязательно будет лучше для вас, начните с простого. kaggle хаки/подходы — bagging, boosting, stacking.
6️⃣ Распределенное обучение и оценка модели. tldr; Про обучение на кластере и виды параллелизма. Сделай бейзлайн (рандомный, эвристики, человеческий, готовые решения). Советы по оценке моделей.
7️⃣ Деплой модели. tldr; Онлайн / оффлайн предсказания. Оптимизация модели — дистилляция, прунинг, квантизация. ML в облаке.
8️⃣ Мониторинг и дрифт данных. tldr; Хьюстон, у нас дрифт данных. Про feedback loop. Различные виды дрифта (covariate, label, concept drifts). Observability — собирай метрики, чтобы понять, что пошло не так.
Forwarded from настенька и графики
15 частых ошибок в данных от Visual Capitalist. Помню первый день, когда столкнулась с парадоксом Симпсона, очень долго не могла понять, что же не так))
Forwarded from Data-comics
Важные навыки в периоды стресса.pdf
5.5 MB
[ File : Важные навыки в периоды стресса.pdf ]
Методичка от ВОЗ в комиксах:
"Важные навыки в периоды стресса"
Тут описывается 5 методик, что делать в момент стресса или любых сильных эмоций. Очень понятная, и по ссылке внутри есть аудиофайлы на русском, в которых объясняются техники.
Всем сил! 🤗
Методичка от ВОЗ в комиксах:
"Важные навыки в периоды стресса"
Тут описывается 5 методик, что делать в момент стресса или любых сильных эмоций. Очень понятная, и по ссылке внутри есть аудиофайлы на русском, в которых объясняются техники.
Всем сил! 🤗
Forwarded from Alexey Neznanov
Самые основы:
1. Анатомия рекомендательных систем. Часть первая ( http://habr.com/company/lanit/blog/420499/)
2. Анатомия рекомендательных систем. Часть вторая ( http://habr.com/company/lanit/blog/421401/)
3. Рекомендательные системы: идеи, подходы, задачи https://habr.com/ru/company/jetinfosystems/blog/453792/
1. Анатомия рекомендательных систем. Часть первая ( http://habr.com/company/lanit/blog/420499/)
2. Анатомия рекомендательных систем. Часть вторая ( http://habr.com/company/lanit/blog/421401/)
3. Рекомендательные системы: идеи, подходы, задачи https://habr.com/ru/company/jetinfosystems/blog/453792/
Habr
Анатомия рекомендательных систем. Часть первая
Я работаю дата-саентистом в компании CleverDATA . Мы занимаемся проектами в области машинного обучения, и один из наиболее частых запросов на разработку основанных на машинном обучении маркетинговых...
Forwarded from Roman
Неплохая обзорная статья https://arxiv.org/abs/2011.02260