Интересное что-то – Telegram
Интересное что-то
517 subscribers
2.71K photos
252 videos
138 files
4.51K links
Материалы и мысли, понадерганные отовсюду
Блог: https://news.1rj.ru/str/asisakov_channel
Чат: https://news.1rj.ru/str/youknowds_chat
Download Telegram
Forwarded from Data-comics
Команда datacamp делится читшитом на тему датавиза.
Почитать подробности и посмотреть в качестве получше можно по ссылке.

В целом, все кто Storytelling with data читал, ничего нового не увидят. Но компактная подача может кому-то пригодится. 😁👌

https://www.datacamp.com/cheat-sheet/data-storytelling-and-communication-cheat-sheet
#quant
Лекции для квантов по вычислительным финансам
Forwarded from Ivan Novikov
kulikov_2a5.pdf
5 MB
Есть один курс на ФТ для магистратуры "Математическая теория финансов". В нем есть и лекции и семинары. Вот ссылка на лмс для физтехов: https://lms.mipt.ru/enrol/index.php?id=4190
Записывайся, смотри. Там даже записи доступны, кажется.
Для не физтехов прикрепляю методичку на русском по этому курсу.
#dl
Colab со stable diffusion
Forwarded from Борис опять
Если кто-то хочет понять, кто такой этот ваш StableDiffusion, то вот отличный коллаб:
https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb#scrollTo=-xMJ6LaET6dT#fromHistory

Не только код, но и объяснение что к чему, и ссылки для любителей закопаться глубже. Мне не трудно было адаптировать этот коллаб, чтобы поиграться конкретно с VAE.
Forwarded from Start Career in DS
🧑‍💻 Подготовка к собеседованиям

Один из лучших способов подготовиться к интервью - попробовать поставить себя на место кандидата заранее.
В этом могут здорово помочь открытые собседования на ютубе. Подготовили для вас подборку из них.

Для джунов
1. Ключевые блоки: Python, A/B-тесты, Работа с данными (SQL+Pandas), ML алгоритмы
Junior Data Scientist | Собеседование | karpov.courses
2. Ключевые блоки: Python, SQL, ML и работа с данными, статистика
Типичное собеседование #1. Позиция Junior Data Scientist. Accepted!
3. Собеседование на работу с данными c помощью Python и SQL (проводит сам Анатолий Карпов!):
Junior аналитик данных | Собеседование | karpov.courses

Для мидлов
1. Двухсерийная версия: по ML Design и Python
Middle Data Scientist | Выпуск 1. Секция ML | Собеседование | karpov.courses
Middle Data Scientist | Часть 2. Секция Python и работы с данными | Собеседование | karpov.courses
2. Ключевые блоки: Теория вероятностей, SQL, ML, бизнес-кейс
Собеседование на Middle Data Scientist | #Нанято S1E01RU
3. Не совсем формат собеседования, но вопросы хорошие.
Ключевые блоки: Python, SQL, статистика, ML
100 Data Science вопросов мидлу! Парень c Физтеха проходит собеседование

Материал полезен? Тыкайте 🔥👍!
Forwarded from DevFM
Продолжаем о собеседованиях

В статье Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов (2021) предложена таблица с примерами вопросов по темам.

Например, по теме "тестирование" для джуна вопрос такой:
"Что такое TDD?"
Для миддла в той же теме вопросы уже сложнее:
"Какие тесты приходилось писать? Что такое мок-объекты? Приходилось ли использовать?". Мы, кстати, писали о Mock, с этими знаниями вы теперь middle developer, поздравляю.

Часть вопросов ужасно нелепы, типа "Где в Django применяется паттерн мост?". Но важно понимать, что на собеседовании могут спрашивать самые странные вопросы. И неплохо бы научиться на такие вопросы отвечать. Иногда ответ может быть неожиданным.

Если у вас на вопросы из статьи не получается сформулировать ответ, то имеет смысл изучить тему подробнее. Таким образом можно почерпнуть направления для изучения.

#skills
Forwarded from Градиент обреченный (Sergei Averkiev)
#ml #prod

🔺 ML System Design

Материалы по внешней стороне машинного обучения (за внутреннюю считаем research / исследования) — проектирование того, как это все будет работать, поддерживаться и обновляться (system design).

Тема важная и начать в нее погружаться можно из актуального курса Стэнфорда cs 329s (содержание курса). Все это похоже на системное программирование, только в контексте ML. Сами лекции в виде текста, есть слайды и пара ноутбуков. Лекции прикольные, можно читать как книжку. Сам курс не очень длинный, так что будут шансы пройти до конца 😁.

👉 Лекции и TLDR;

1️⃣ Отличия ML для продакшена. tldr; Данные — сырые и меняются во времени. Приоритеты — быстрый инференс, важна интерпретируемость. Много заказчиков и требований от них.

2️⃣ Основы проектирования. tldr; Понимаем проблему (нужен ли тут вообще ML?). Источники и формат данных. ETL (процессинг и хранение данных).

3️⃣ Тренировочные данные. tldr; Тут довольно понятная тема — что делать с сырыми данными, как собрать из них хороший датасет, нехватка разметки, active learning и т.д.

4️⃣ Feature Engineering. tldr; Данные есть, как будем подавать их в модель? Аугментации (делаем данные разнообразней), придумываем новые признаки. И внезапно про позиционные эмбеддинги.

5️⃣ Model Development. tldr; Six tips for model selection. Важная мысль — не надо сразу брать SOTA, топовый результат на статическом датасете не обязательно будет лучше для вас, начните с простого. kaggle хаки/подходы — bagging, boosting, stacking.

6️⃣ Распределенное обучение и оценка модели. tldr; Про обучение на кластере и виды параллелизма. Сделай бейзлайн (рандомный, эвристики, человеческий, готовые решения). Советы по оценке моделей.

7️⃣ Деплой модели. tldr; Онлайн / оффлайн предсказания. Оптимизация модели — дистилляция, прунинг, квантизация. ML в облаке.

8️⃣ Мониторинг и дрифт данных. tldr; Хьюстон, у нас дрифт данных. Про feedback loop. Различные виды дрифта (covariate, label, concept drifts). Observability — собирай метрики, чтобы понять, что пошло не так.
15 частых ошибок в данных от Visual Capitalist. Помню первый день, когда столкнулась с парадоксом Симпсона, очень долго не могла понять, что же не так))
Forwarded from Data-comics
Важные навыки в периоды стресса.pdf
5.5 MB
[ File : Важные навыки в периоды стресса.pdf ]
Методичка от ВОЗ в комиксах:
"Важные навыки в периоды стресса"

Тут описывается 5 методик, что делать в момент стресса или любых сильных эмоций. Очень понятная, и по ссылке внутри есть аудиофайлы на русском, в которых объясняются техники.

Всем сил! 🤗
Forwarded from Roman
Неплохая обзорная статья https://arxiv.org/abs/2011.02260