NEW BOT Телеграм, страница - 799345158

Интересное что-то

517 subscribers

2.72K photos

253 videos

138 files

4.51K links

Материалы и мысли, понадерганные отовсюду
Блог: https://news.1rj.ru/str/asisakov_channel
Чат: https://news.1rj.ru/str/youknowds_chat

Download Telegram

About

Blog

Apps

Platform

Интересное что-то

517 subscribers

Интересное что-то

Channel name was changed to «Интересное что-то»

23:35

Интересное что-то

Проверка обсуждений

34 views16:53

Интересное что-то

#quantitative #learn #quant
Какая математика требуется для квантов?

Тервер, матстат, непараметрический матстат, слупы, эконометрика, теория мартингалов, теория больших уклонений, стохастические дифференциальные уравнения, байесовские методы так же не лишними будут, а так же много и много другого в удивительном мире математики

34 views17:01

Интересное что-то

https://telegra.ph/Nebolshaya-podborka-ssylok-na-vsyakie-poleznosti-po-Solidity-11-26

Небольшая подборка ссылок на всякие полезности по Solidity и не только )

Для гуманитариев :) https://vas3k.ru/blog/blockchain/ https://vas3k.ru/blog/ethereum/ База и основы https://ethereum.org/en/developers/ https://ethereum.org/en/learn/ https://docs.soliditylang.org/en/latest/index.html https://solidity-by-example.org/ htt…

34 views17:12

Интересное что-то

#learn #mipt #course #ml #advanced
https://www.youtube.com/watch?v=74Kd-rNxSm0

ml-mipt basic Лекция 01: Введение, Naive Bayes, kNN | Осень 2021

Слайды и материалы занятия: https://github.com/girafe-ai/ml-mipt/tree/21f_basic/week0_01_org_knn_and_naive_bayes

Полные материалы курса: https://github.com/girafe-ai/ml-mipt

Timestamps
TBD

33 views17:34

Интересное что-то

#cv #resume #ds #career
Темплейт для резюме
https://ru.overleaf.com/latex/templates/data-science-tech-resume-template/zcdmpfxrzjhv

data-science-tech-resume-template

Простой в использовании онлайн редактор LaTeX. Не требует установки, поддерживает совместную работу в реальном времени, контроль версий, сотни шаблонов LaTeX и многое другое.

29 views17:55

Интересное что-то

#cv #resume #ds #career
Чтука для улучшения резюме и профиля LI
https://resumeworded.com/

Resume Worded - Free instant feedback on your resume and LinkedIn profile

Our online resume and LinkedIn grader instantly scores your resume and LinkedIn profile and gives you detailed feedback on how to get more opportunities and interviews.

26 views17:56

Интересное что-то

26 views19:38

Интересное что-то

Forwarded from ML for Value / Ваня Максимов

В канале уже почти месяц не было постов: это потому что я готовил нечто интересное для вас всех) Но обо всем по порядку: на этой неделе небольшие вводные истории, а все лакомое буду писать уже с понедельника

Итак, примерно полгода назад я выступал и рассказывал о способах ускорить А/В тесты. Даже тогда я много времени уделял процессам или "культуре экспериментов"

Можно бесконечно применять CUPED, CUPAC и другие методы, но что делать если:
- Менеджер говорит: "Фича супер важна, нужно выкатить ее еще вчера"?
- Ключевая метрика не красится и предлагается посчитать еще десяток других, которых не было в изначальном дизайне?
- Хотим запустить сразу 20 маркетинговых баннеров в тест?
- Аналитик дизайнит тест аж целый спринт?

Имхо, успешность фичей определяется ответами именно на эти вопросы в вашей "культуре экспериментов". Верхнеуровнево все довольно просто:

1. Появилась идея + ее побрейнштормили внутри команды = конкретное описание фичи
2. Посчитан ожидаемый импакт от фичи в конкретных 1-3 метриках
3. Оцениваем адекватность фичи на пользователях через UX
4. Делаем фичу и проверяем, что она технически работает
5. Смотрим на нескольких боевых пользователях и тестируем edge кейсы
6. Дизайним А/В = приемочные, барьерные и контрольные метрики, сроки и % пользователей
7. Запускаем тест
8. Принимаем решение в соответствии с дизайном

Звучит легко, но в реальности gap между аналитиком, продактом и разработчиком сильно усложняет процесс)
Забыли прокинуть событие в аналитику, не учли важную метрику соседней команды, покатили фичу в пятницу вечером - Узнаете ли свой опыт?)

Серия постов на этой неделе будет посвящена "культуре экспериментов" или "как избежать таких сложностей"

Иван Максимов | 13 способов ускорить А/В тест, или "Не CUPED-ом единым"

ML in Marketing hub: https://ods.ai/hubs/ml-in-marketing
Телеграм-канал https://news.1rj.ru/str/mlinmarketing

Спикер: Иван Максимов, Data Science Team Lead at Delivery Club

Многие аналитики для ускорения А/В тестов в первую очередь используют достаточно сложные статистические…

26 views19:38

Интересное что-то

22 views20:01

Интересное что-то

#career
https://nnov.hse.ru/dk/wq

Всё о карьере в WorldQuant на весеннем Дне Карьеры ВШЭ!

21 views22:50

Интересное что-то

19 views14:22

Интересное что-то

Forwarded from MISTER SOSISTER ~ CHINESE TIME OF MY LIFE

Как устроен AI в нашем “AI-стартапе”, или что нового я понял перейдя из рисерча в топ-лабах о решении реальных проблем. Рассказываю инженерам.

Это майндсет бизнес-овнера, чем раньше вы его усвоите, тем быстрее вы вылезете из своей песочницы с формулами и начнете делать импакт, а с ним и расти в лид-позиции.

1. Всем поебать что вы там используете, на сколько большие у вас сетки, на сколько инновационный подход, доказана ли у вас полнота пространства, и какой сплит кросс валидации. По большому счету все, за что у вас в академии откусят жёпу, юзеру не интересно, и не влияет на ваш бизнес. Влияет только одно: работает или нет. “Это реально сделать?”, “Много менять придется?”, “Петрович, готов уже МЛ или остужать контейнеры?” – это вопросы которые определяют развитие продукта и ценность МЛ для него. Следовательно.

2. Работать сделать проще всего то, что ты понимаешь и можешь запустить малой кровью. Поэтому самые полезные в реальном применение вещи это эвристики или коробочные решения с простым интерфейсом. Если что-то нужно дописывать, настраивать, подстраивать, контролировать – для этого нужна отдельная команда, и в стартапе на это времени нет. Pro tip: очень хорошо работают комбинации сложных черных ящиков (например трансформеров), которые дают примитивы (например векторы фичей), и простая логика для обработки этих примитивов поверх.

3. Дебажить проще всего то, что ты понимаешь. Никому не нужны сюрпризы в проде. Даже если модель фейлит в 2% случаев, но фейлит конкретно – ее уже нельзя использовать. Поэтому, или такие случаи нужно очень хорошо знать, и подкреплять их эвристикой, или использовать эвристику и простые правила с самого начала.

4. Реальный мир непредсказуем, никаких контролируемых условий нет, все должно быть универсально и пуленепробиваемо. То-есть, никаких 5 гиперпараметров, которые нужно подкручивать для разных knowledge domains, и никакие приближения, типо ограничимся товарами с заказами или магазинами одежды, не проканают. Я вам скажу больше, мы очень старались над тем, чтобы полностью уйти от абсолютных значений, и перевести все в относительную форму. Практически все можно нормализовать, отсортировать и отсечь через статистику (топ-5, нижний квартиль, и тд). Константы вызывают рак.

5. Вы должны хорошо понимать проблему которую юзер решает, и быть способным описать идеальное решение из первых принципов. Жирным, потому что самое важное. Не 1., потому что проебался. Но. Вы не должны оперировать “какими-то” коэффициентами. Вы упростите себе жизнь когда станете понимать, что каждый коэффициент значит, и выбросите все то, что не понимаете. Меньше иногда больше. Таким образом вы сами сможете приходить к известным решениям, но уже с пониманием как они работают, и как они относятся к другим вариантам решения. И я не говорю знать все формулы или доказывать теоремы, я говорю понимать, что вы делаете, и главное почему так, а не иначе. Мы так сами вывели много формул, без сложной теории, а чисто из логики и базовой статистики, и смогли улучшить для нашего конкретного случая то, что другие берут не думая. Например, мы понимаем общий принцип для которого коллаборативная фильтрация является частным случаем, знаем как там информация движется, и можем ее улучшить. Из знания матричной факторизации, что является просто имплементацией, к этому не прийти, вы сможете улучшить только имплементацию. Это как понимать реализацию формулы в коде против понимания того как формула работает. Проверки понимания – вы должны мочь объяснить принцип работы пошагово на пальцах, можно с абстракциями, но без формул.

6. У всего есть цена. Рисерчить новый алгоритм ради рисерча не получится. R&D стоит денег и времени, и в стартапе еще неизвестно что из этого дороже. Как правило, последние 10% результата будут занимать 90% времени, поэтому однозначно надо ориентироваться на первые 10% усилий, и на соотношение impact/effort, а не на accuracy или AUC. (Это как elbow метод, нужно найти момент когда прирост падает я и ваши усилия выходят на асимптоту).

21 views14:22

Интересное что-то

18 views14:22

Интересное что-то

Forwarded from MISTER SOSISTER ~ CHINESE TIME OF MY LIFE

7. МЛ не существует в вакууме. Для него нужны данные, для данных нужно хранилище, для запуска нужны ресурсы, нужна инфра, нужна бекенд-логика. Здесь, опять же, не получится просто прикрутить вторую модель на ТФ когда первая на пайторче, потому что зависимости улетят в космос. Не получится использовать любые данные, и не получится съедать все ресурсы машины или допускать краши. Нужно думать про соседей, потому что дырка в стене это проблема для обоих.

8. МЛ не существует в моменте, и точно запускается не только во время тестирования. Вы должны понимать что ваша модель будет крутиться в облаке 24/7, и если вы заранее не позаботитесь, чтобы ее кручению ничего не препятствовало, то будете просыпаться ночами и крутиться вместе с ней. МЛ нужно поддерживать, и чем этой поддержки меньше, тем лучше.

Итого: бизнес не оценит крутость, модность, новизну, и даже интеллектуальность ваших алгоритмов, что действительно ценится это простота, прозрачность, эффективность в решении поставленной задачи, и стоимость внедрения и поддержки. Тащемта, то же можно сказать и про самого МЛ-инженера 🙈

21 views14:22

Интересное что-то

#ml #recommender

18 views08:46

Интересное что-то

Forwarded from Andrey Kamyshan

если правильно понял постановку проблемы, то начать можно с https://en.m.wikipedia.org/wiki/Learning_to_rank#

Learning to rank

Learning to rank or machine-learned ranking (MLR) is the application of machine learning, typically supervised, semi-supervised or reinforcement learning, in the construction of ranking models for information retrieval systems. Training data may, for example…

20 views08:46

Интересное что-то

21 views08:47

Интересное что-то

Forwarded from Anton Eryomin

You should really learn to DEPLOY your Machine Learning models! Focus less on the algorithms and understand the products you are building. A junior data scientist tends to think about algorithms and model performance. A senior data scientists will think more efficient deployment pipelines, products, user experience and business metrics.

There are many ways to deploy ML models, but the most common one is as a ML microservice: a backend application would communicate to your ML service through http API calls (usually REST or RPC). There are many online tutorials to get you started. The first entries when searching on google:
- https://lnkd.in/gtUjMqaK
- https://lnkd.in/grPjpqz7
- https://lnkd.in/g4eGEyFr
- …

For example, you will be able to get a better feel on the latency of your model inference, you will be able to participate to system design conversations and you will be able to think about edge cases like “what happens when the data payload is empty?”, “what happens to the overall system when the ML server crashes?”. When trying to convince stakeholders, I always like to present a “product” instead of a “model”. A “model” or performance metrics are not really convincing to non-technical people, but show them in action what ML can do and they get impressed. I often like to use Dash (https://plotly.com/dash/) to prototype a quick UI to show the power of ML.

After learning to deploy API endpoints, learn about dockerizing your applications, about orchestrating your applications and push them to the cloud! After that learning this, you will be a long way in being a more senior data scientist.

Нашел пост чувака с ФБ в продолжении того, о чем писалось выше. Что мол МЛ это уже далеко не только какие-то метрики и модельки, это в первую очередь задача бизнеса и то, как ты свои модельки доведёшь до продакшена.

This link will take you to a page that’s not on LinkedIn

24 views08:47

Интересное что-то

#book #dl
https://d2l.ai/index.html

23 views16:36

Интересное что-то

21 views19:38