Запрети мне псевдолейблить – Telegram
Запрети мне псевдолейблить
2.76K subscribers
153 photos
3 files
147 links
Канал о пути к Kaggle competitions (теперь уже) GrandMaster и пиве, которым обливаешься в процессе

Последний авторский канал про мл, претендующий на искренность и позволяющий ставить клоунов
Download Telegram
Постепенно возвращаюсь к Kaggle-кранчам и набросал ядро для Open-Problems Single-Cell Pertrubation
Говорят, если его немножко докрутить (в коде есть подсказка) и сблендить с текущими популярными блендами, то можно влететь в медали
🔥10👍1
Стало ли фармить кагл легче, чем в 2018? 🤔

Поспорил с Криптовалерием насчет того, сложнее или проще стало фармить каггл сейчас, чем годами ранее. Спор был горячий и чуть не закончился поломанными ногами, но в споре родилась истина.

Для того, чтобы решать вопрос датадривенно, был использован Google Sheets. Какая датадривенность и без экселя? 📊
Ссылка на таблицу

Я прошелся по вебархиву за разные года и перенес данные в эксель, руками подсчитав количество кгм/мастеров/экспертов и построив базовые графики. Перейдем же к ним!

На первом графике видно, что число мастеров/экспертов/кгм исчезающе медленно прирастает по сравнению с общим числом пользователей. 🔽

График второй:
График нормированных производных по годам для конкретных тайтлов. Придумал Валерий, так что expert approved
Например, в 2018 новых экспертов стало сильно больше, а вот количество контрибьюторов осталось примерно прежним. 📈📈📈

Вот отсюда и можно сделать вывод: в 2018 стать экспертом было проще, чем в 2022. Потому что процентный прирост относительно прошлого года выше. С другой стороны, стать мастером из эксперта стало чуть проще. Но суммарно прорваться из новайсов в мастера стало все же сложнее, чем в 2018. Из двух графиков можно сделать вывод: каглить становится суммарно конкуретнее!

И да, в 2018 Кагл поменял политику и перебанил/даунгрейднул кучу работяг из контрибьюторов в новайсов. А еще не смотрим на 2023 год, он не полный, но крайне многообещающий.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍4😍3👏21
График первый
🔥9
График второй
🔥9
Через несколько часов закончится Open Problems, так что в следующую пятницу будет разбор соревы
🔥5
Если всех гусей вырежут- может и золото поднимем

UPD: первого уже вырезали, осталось 7
🔥18🙏1🆒1
Ну что ты будешь делать!
😢23😭20
Коротенько расскажу про соревнование и решения на стриме у Алерона сегодня
Привет, чемпионы! 🏆

📣 Завтра, 8 декабря в 17:00, проведём ещё один стрим.

Расскажем про 3 соревы:

1) Дима @dimitriy_rudenko расскажет, как участвовал в Open Porblems, про топовые находки победителей, с фокусом на том, что можно переиспользовать. Канал Димы.
2) Артём @cosheimil расскажет про 2 соревы: как взял🥉 на LWP и про идущую сореву Enefit.

🔥Тем кто пропустил стрим прошлой пятницы советуем посмотреть. Мы там в начале уже затронули Enefit.

Помните:
🧑🏻‍💻 пишите в комментах про какие соревы вам интересно послушать в следующие пятницы!
🕵🏻‍♂️ вы всегда можете поделиться обзором соревы, в которую планируете залететь или той в которой уже поучаствовали. Пишите в лс @dfeeler ⚡️
🤡21👎1🔥1🤮1👀11
Hello there!
😁5🍓2💋111
Написал простенький кернел для UBC:
Все картинки нарисовал
Для всех картинок посчитал соотношения сторон к тамбнейлам
Отпечатал классы для каждой картинки

Например тут можно увидеть, что некоторые картиники- это снимок в двух срезах, а некоторые в трех. Планирую посмотреть вообще все картинки из трейна, мб там что-то совершенно великолепное найдется.

Наслаждайтесь
🔥4🕊2👍111
überподробный writeup нашего решения для open problems:
https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/460858

В соревновании есть приз за лучшие writeup'ы: 10к для 5 команд из топ-100, выбранных судьями.

Апвоуты, апвоуты, апвоуты! Помогите мне забрать денег с каггла! 🔝🔝🔝
А еще если вы осилите эту стену текста и хотите покритиковать части поста, как непонятные или нашли опечатки- пишите в комменты или мне в личку обязательно. Ваш альтруизм не будет забыт!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥211
🚀 @SBERLOGACOMPETE webinar on bionformatics and data science:
👨‍🔬 Дмитрий Руденко, Александр Червов "Обзор прошедшего соревнования "Open Problems – Single-Cell Perturbations""
⌚️ Четверг 20.00 (по Москве) 14 Декабря

Добавить в Гугл календарь

В соревнование требовалось предсказать как под действием лекарств (146 разных) меняются экспрессии генов. Было только две фичи и они категорные - название клеточного типа (6 типов клеток крови) и название лекарств. Семплов мало - 600+ в трейне, 255 в тесте, но таргетов было много 18211 (все гены). Удивительно, но особого шейкапа не было, хотя СВ-ЛБ билось плохо и семплов мало. Основные решения строились на PYBOOST и нейронках (удивительно, но нейронки хорошо работают даже при таком малом числе семплов).

Наша команда (Антонина Долгорукова, Дмитрий Руденко, Дмитрий Ершов, Антон Вахрушев, Александр Червов) заняла "счастливое" 13 место - ровно на 1 ниже золота (((((

Но у нас есть шанс еще на приз от экспертов - и ваши апвоуты - нам не помешают:
"U900 team - PYBOOST is what you need"
https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/460858 описание решения и ответы на вопросы оргов. (Ваш альтруизм не будет забыт!)

В данном докладе мы напомним в чем была задача, немного расскажем о подходе на PYBOOST и перейдем к обзору решений других команд.


Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
PS
Подписывайтесь на канал Дмитрия о дата сайнс и Каггл: https://news.1rj.ru/str/pseudolabeling
8🔥111
Завтра выступаем на воркшопе NeurIPS 2023 как выбор организаторов!
Подключайтесь, радуйтесь с нами 😍

Время:
В Москве 1:00
В Европе 23:00

В комменты кину приведенное время и дату
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20211
Вчера закончилось соревнование CAFA5. Заняли с командой 132 место и зафармили бронзовую медальку 🥉
Разбирать эту сореву нет особого смысла: случилась она давно и только сейчас подбили лб нормально. Я даже биологический контекст не помню

Тем самым переполз с 1213 места на 1121 в глобальном рейтинге соревнований. Видимо в этом календарном году это последняя медалька 😭

Стало быть примерно за год получилось:
Вползти в Competition Expert
Выступить на Мюнхенском каггл митапе
Дать кучу разборов прошедших соревнований
Зафармить серебро 🥈и три бронзы 🥉️️️️️️ в компетишнах

И самое главное: познакомиться с кучей мотивированныих и интересных людей
Please open Telegram to view this post
VIEW IN TELEGRAM
👍205🔥4🏆3🕊111
Тинькофф запустил игру в слова, и я в ней не мог проиграть

Правила просты: 6 попыток, слово из 5 букв.
Нужно предложить существительное.
Игра подсветит, каких букв нет, какие есть, но не на той позиции, и угаданные буквы.

Пример: правильное слово 'канат', а вы пишете 'набат' – последние две и вторая буква угаданы, первая присутствует, но не на той позиции, а 'б' исключается. 🅰️

Я подумал и решил, что игра алгоритмически проходима, так что используйте мой скрипт. Он сильно помогает решать эту задачу. 🤖🤖🤖
1. Скачиваем массив всех русских слов
2. Из них отбираем только те, что содержат нужные буквы
3. Из них вычищаем слова, где есть ненужные буквы
4. Фильтруем по знанию о позициях присутствующих букв
5. Оставляем только существительные

На выходе остается буквально несколько слов, из которых можно выбрать наиболее адекватное с наибольшим числом уникальных букв и отгадать слово дня. Вы великолепны!


В качестве компенсации желтому банку, подписывайтесь на канал @scitator_ai. Он ресерчит, иногда допиливает Catalyst (я туда даже контрибьютил) и вообще крутой человек из Тинькофф, его канал незаслуженно непопулярен

Маркетологи тинька, свяжитесь со мной, если вдруг хотите заплатить за интеграцию. Я не против
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5211
CrackTinkoff.ipynb
5.5 KB
Скрипт для кракеров, инструкции внутри. Осторожно, внутри аж Pymorphy2, у новоявленных LLM экспертов может случиться шок

UPD:
Да вот вам коллаб просто https://colab.research.google.com/drive/1H8K_bHMcX935PDIzISvhMcJgt1DQnBo6?usp=sharing
😁13🔥3👨‍💻1111
Рубрика "идеи для изи контрибюшнов"

Есть такой майкрософтовский фреймворк для DL: torchscale.
Фреймворк предназначен для обучения PyTorch моделей на нескольких GPU эффективно и, в общем, для использования DataParallel "из коробки". Кстати, у них есть даже собственная реализация статьи LongSeq + VIT => LongVIT.
Решил поиграться с ним, но вот у меня он отказывался запускаться даже для примеров. Оказалось, господа инженеры забыли добавить часть зависимостей в requirements.txt, вероятно, потому что на их тестовом стенде всё уже было на месте.
Угадайте, кто за ними починил?

К чести мейнтейнеров этого фреймворка: после открытия пулреквеста не прошло и двух часов, как его влили в мастер. Сегодня ставлю внезапный лайк людям, подарившим мне бесконечную любовь к Windows 95 🤍️

Мораль, как обычно: все ошибаются, и если вы что-то починили, поделитесь со всеми. Будете контрибьютором фреймворка с 3к звездочками. Ну, или хотя бы переименуйте что-нибудь в polars и разберитесь, как всё это работает. Обычно контрибьюшн гайды позволяют неплохо прокачаться в том, как нужно писать код.
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥10👍322🥴1
Начинаем год с простых радостей
🔥2033