ML-легушька – Telegram
ML-легушька
3.46K subscribers
1.39K photos
162 videos
6 files
91 links
Гений, стартапер, плейбой, филантроп
Для связи: @MLfroge
Download Telegram
42❤‍🔥9🤡2
Завтра будет пост про теорвер и дейтинг
32🔥5🤡4
This media is not supported in your browser
VIEW IN TELEGRAM
❤‍🔥25😁6🤮4
❤‍🔥56🔥6😁52
Идёт кто завтра на концерт мейби бейби в мск?
🤔24🤡15🔥7🤮7👎6
Иду из яндекс офиса, меня останавливает молодой человек который какие-то опросы проводит, но говорит что мне явно ещё не 28 и он меня задерживать не будет, просто хотел сделать комплимент моему костюму
44👎4❤‍🔥3👍2😱2
🔥30😢7😁4👏2
Кстати среда мои чуваки
46❤‍🔥2
ML-легушька
Завтра будет пост про теорвер и дейтинг
Я немного продолбался, но сейчас все будет))
Надеюсь на максимальный репост ибо контент вроде норм
💔22❤‍🔥5👎4
Как школьный теорвер помогает в разработке дейтинга?
Я состою в команде разработки умного дейтинга, и отвечаю там за рекомендации. Задача подбора анкет в дейтинге с одной стороны похожа на задачу поиска, но с другой стороны является менее строгой, так как не произойдёт ничего страшного, если мы сразу не покажем человеку всех релевантных кандидатов - скорее даже наоборот)
Выделим эту ключевую особенность: мы хотим показывать пользователю достаточно релевантных кандидатов, при этом делать это максимально быстро при малом железе и с некоторым элементом случайности, так ещё и zero-shot, так как мы только запускаемся.
Дополнительную сложность, что не позволяет так легко использовать условный FAISS, вносит фактор уже показанных анкет - мы не хотим показывать человеку того, кого он уже видел.
Экскурс в поисковые системы: классический поиск обычно состоит из двух главных компонентов - подбора кандидатов и реранжирования. На первой стадии, с помощью простых моделей, мы сужаем множество возможных релевантных ответов до некоторого небольшого подмножества. После этого идёт реранжирование - мы используем сложные модели, которые на небольшом подмножестве отработают достаточно быстро и смогут из кандидатов сделать хорошую выдачу.
Из особенностей задачи дейтинга мы можем заметить, что первая стадия нам фактически не так важна, как вторая. Поэтому у меня родилась простая идея: что будет, если мы просто брать k случайных пользователей, и уже среди них выбирать, кого мы покажем?
Встаёт вопрос: насколько хорошо это будет работать? Метрики в дейтинге это отдельная интересная тема, однако тут мы можем все формально описать.
Пусть у нас всего n пользователей, которых мы можем показать. Мы выбираем k случайных из них. Какова вероятность, что среди выбранных будет кто-то из m лучших возможных кандидатов? Обозначим это событие за A.
Тогда P(A)=1-P(не A). Что такое не А? Это значит, что среди случайно выбранных кандидатов нет никого из m лучших. Эту вероятность мы можем посчитать по определению. Количество благоприятных исходов - C[k, n-m] (сколько способов существует набрать кандидатов, чтобы среди них не было m лучших), количество исходов всего - C[k, n] (количество всех возможных наборов кандидатов).
Получаем, что P(A)=1-C[k, n-m]/C[k, n]. Сколько пользователей будет в нашем дейтинге? Ну очень не скоро более десяти тысяч. Тогда, например, возьмём k=n/100, m=n/10. То есть каждый раз мы хотим показывать кандидата в топ-10% среди возможных. k=n/100 - всего лишь 100 анкет, на них мы точно успеем прогнать наши тяжёлые модели. При таких параметрах P(A)~0.999975, то есть при таком небольшом количестве сэмплов мы добились чего хотели!
Возможно это все тривиально, либо не лучшее инженерное решение, но мне было интересно провести такие рассуждения и попробовать подобную идею.
26❤‍🔥5👎4👍2🤔1
Доры на концерте нет, но после 4 коктейлей я в контексте
💯43❤‍🔥5👍3😁2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
😁27❤‍🔥9👎21
❤‍🔥34🔥6👎2🤮2👍1
Yandex moment
47😁6❤‍🔥3🥴3🔥2
Яндекс прощай, Москва увидимся не скоро)
🤔314👏2❤‍🔥1👎1
Based ML engineer
19❤‍🔥5🔥1🥰1
Не прошло и дня в Пущино а я уже провел маленькую лекцию по ML😎😎😎
33❤‍🔥6👍3🥰2🤡2
Биофизический кот
❤‍🔥47🥰3
Первый полноценный день на летней школе. Я очень много социализируюсь, сильно больше чем обычно, и мне нравится.
На лекциях было относительно норм, но я параллельно сидел кое-какие нейродиффуры решал.
Вечером была классная тусовка, вот только закончили.
Я все больше задумываюсь над тем, что надо уходить из работы в индустрии и подаваться чисто в науку, ибо тут весело приятно комфортно. Тут, и много где на таких школах, максимально приятная и нежная движужа. Но и деняк хочется... Все ещё нерешенный трейдофф.
Нейротурнир будет для всех команд, я взял себе задачу про раннюю диагностику Альцгеймера, думаю про это будут посты.
❤‍🔥28😢3