Интересное что-то – Telegram
Интересное что-то
517 subscribers
2.71K photos
253 videos
138 files
4.51K links
Материалы и мысли, понадерганные отовсюду
Блог: https://news.1rj.ru/str/asisakov_channel
Чат: https://news.1rj.ru/str/youknowds_chat
Download Telegram
#ml
Инструментальные методы отбора переменных

https://econml.azurewebsites.net/spec/flowchart.html
Forwarded from Machine Learning REPA (RU) (Mikhail Rozhkov)
Всем привет! Сегодня день большого анонса! Команда Iterative.ai выпустила новый open source инструмент MLEM!
https://mlem.ai/

Этот крутой тул был невозможен без @mike0sv и @agusch1n ! Большой им респект!

Пока все материалы на английском, но думаю скоро появится что-нибудь на русском. Если хотите поддержать проект, небольшой гайд:

- ⭐️ the repo
- ✍️ Check out the blog post
- 🎬 Watch the video and like it!
- Like/share/comment posts on Twitter (the repo one with dog giphy is most important)
- Like/share/comment posts on LinkedIn (the repo one with dog giphy is most important)
- Go to HackerNews and look for it to upvote
- Join us tomorrow for the Release Party Meetup
- We also got a GREAT article in Tech Crunch! Please share!
Forwarded from Ilya
DP это применение мемоизации (https://en.wikipedia.org/wiki/Memoization). Давайте выберем какой-нибудь язык где легко добавить мемоизацию, например Питон, и возьмем задачу на DP, например https://leetcode.com/problems/coin-change/ . Тогда есть наивный, экспоненциальный алгоритм

def coinChange(self, coins: List[int], amount: int) -> int:
def fewest(val):
if not val:
return 0
if val < 0:
return inf
return min(fewest(val - c) for c in coins) + 1

return clamp_inf(fewest(amount))

а есть элитный, решающий задачу за О(М ⨉ N) time O(N) space алгоритм dynamic programming (найдите на картинке одно отличие)

def coinChange(self, coins: List[int], amount: int) -> int:
@cache
def fewest(val):
if not val:
return 0
if val < 0:
return inf
return min(fewest(val - c) for c in coins) + 1

return clamp_inf(fewest(amount))

(где clamp_inf определена для удобства как return v if v != inf else -1)

Поэтому надо научиться решать задачи экспоненциально, а потом оптимизировать.
Вот тут есть похожий подход к этой задаче на C++ и упоминание какой-то серии лекций, возможно она будет полезной https://leetcode.com/problems/coin-change/discuss/1371738/C%2B%2B-Recursion-greater-DP-Memoization-greater-DP-Tabulation
#ml #dl
Determined.ai
всем советую и сам пользовался. и self-hosted, и внутри как хочешь ресурсы аллоцируешь, и эксперименты логгируешь, и модель реджистри делаешь, прям вах какая красота. а для визуализаций обычный такой тензоборд, но атвоматом поднимается
upd. еще у них есть слэк и там всё можно спрашивать. как я понял, за банкет платит HPE, который их купил и развивает опенсорс
MLFlow - медленно и некрасиво (зато бесплатно)
Neptune - быстро и красиво
W&B - быстро, красиво и дорого шо пипец
#mlops
Airflow – это оркестратор/шедулер для пайплайнов обработки данных. Типичный пайплайн: раз в сутки налить одни логи, потом другие логи, потом третьи логи, затем перелить это куда-то ещё, затем обучить модель и сохранить её куда-то. И здесь не должно быть капитальной разницы между как-нибудь бустингом и prophet.
В вашем случае ничего не сказано про регулярность запуска. Если нужно сделать предсказания для каждой из колонок только один раз, то airflow не нужен. У него основная цель – более-менее удобно запускать и мониторить регулярные задачи: в динамике смотреть, что когда падало, что сколько времени выполнялось и т.д.
Forwarded from Start Career in DS
Про прогноз спроса в ритейле 🛒

Одна из самых важных и денежных задач в ритейле - предсказание спроса. Именно проекты связанные со спросом часто бывают ключевыми в работе DS команд крупнейших игроков рынка.
Причём спрос как таковой можно прогнозировать как для первостепенной цели - автопополнения распределительных центров/торговых точек, так и для косвенных. К примеру, можно построить зависимость спроса от цен (фактически, усложнённую эластичность) и таким образом управлять ценообразованием, чтобы максимизировать ожидаемую выручку. Либо же строить зависимость спроса от ассортимента и формировать ассортимент, который будет максимизировать спрос.

Подборка материалов, которые помогут разобраться в теме:
1. Прогноз спроса для промо акций в Магните: часть 1 (более бизнесовая) и часть 2 (более техническая). Ребята выиграли несколько премий в этом году, так что знают о чём говорят 🙂
2. Доклад про предсказание спроса от ребят из Rubbles и х5. Есть ещё один от Саши Фонарёва, более подробный. Оба скорее бизнесовые.
3. #кудажебезвалеры Валерий Бабушкин про предсказание спроса в х5 (но обратите внимание что видео от 2020 года, часть инфы устарела). Тут есть.и про признаки, и про построение непосредственно моделей.
4. Евгений Бурнаев: Топологический анализ временных рядов для прогнозирования спроса
5. Топовый вебинар Богдана Печёнкина по ценообразованию (тут есть модели спроса и целый блок про признаки)
6. Доклад Максима Гончарова про управление ассортиментом на основе моделей спроса
7. Учебное соревнование по прогнозу продаж на Kaggle. А ещё есть соренование от Walmart и от Favorita.
Здесь в ноутбуках можно найти примеры применения различных подходов.

За помощь в создании подборки большое спасибо Максиму
Forwarded from Записки Ппилифа (Ppilif Ulyankin)
Вчера у меня прошёл последний семинар по машинному обучению на ФКН в этом сезоне. Семинарить у самого Жени Соколова было большой честью.

Коли курсера закрыта, курсы ещё не особо куда-то переехали, а на дворе лето — лучшее время для самообразования, держите плейлисты с видосами с курса.

лекции МО-1 лекции МО-2 мои семинары репозиторий

Знать всё невозможно. Поэтому в течение курса я узнал что-то, что не знал раньше. Хочу поделиться с вами самыми крупными открытиями. Некоторые из них довольно стыдные:

- Я очень мало знал про обучение эмбеддингов на графах. Семинарист Ильдус сделал про это богоподобный конспект [ru] и тетрадку в питоне.

- Я вообще ничего не знал про differential privacy и то, как можно добавить эту штуку в свои модели.

пост 1 [en] пост 2 [en] статья от apple [en]

- У нас был классный семинар про бустинг с ручными задачками [ru]. Кажется, что я перешёл в его понимании на какой-то качественно новый уровень.

- Я ничего не знал про uplift-моделирование и никогда не встречался с ним на практике. Узнал чуть больше из обзорной статьи [en]

- Я вообще ничего не знал о спектральной кластеризации. Ни разу не слышал о таком методе, а он есть даже в sklearn.

лекция [ru] семинар [ru] туториал [en]

- Я никогда не уважал ядра и SVM. После курса стал относиться к ним немного получше.
#math
Книги по доказательной математике
Интересное что-то pinned «#math Книги по доказательной математике»
#financial
Крутой чувак по подготовке к CFA и финансовым рынкам

https://m.youtube.com/c/MarkMeldrumPhD/playlists
#opensource
Подборочка опенсурс проектов
https://awesomeopensource.com/