NEW BOT Телеграм, страница

Запрети мне псевдолейблить

Постепенно возвращаюсь к Kaggle-кранчам и набросал ядро для Open-Problems Single-Cell Pertrubation
Говорят, если его немножко докрутить (в коде есть подсказка) и сблендить с текущими популярными блендами, то можно влететь в медали

Kaggle

Kfold simple NN refactored

Explore and run machine learning code with Kaggle Notebooks | Using data from Open Problems – Single-Cell Perturbations

🔥10👍1

1.88K viewsedited 07:59

Запрети мне псевдолейблить

Стало ли фармить кагл легче, чем в 2018? 🤔

Поспорил с Криптовалерием насчет того, сложнее или проще стало фармить каггл сейчас, чем годами ранее. Спор был горячий и чуть не закончился поломанными ногами, но в споре родилась истина.

Для того, чтобы решать вопрос датадривенно, был использован Google Sheets. Какая датадривенность и без экселя? 📊
Ссылка на таблицу

Я прошелся по вебархиву за разные года и перенес данные в эксель, руками подсчитав количество кгм/мастеров/экспертов и построив базовые графики. Перейдем же к ним!

На первом графике видно, что число мастеров/экспертов/кгм исчезающе медленно прирастает по сравнению с общим числом пользователей. 🔽

График второй:
График нормированных производных по годам для конкретных тайтлов. Придумал Валерий, так что expert approved
Например, в 2018 новых экспертов стало сильно больше, а вот количество контрибьюторов осталось примерно прежним. 📈

📈

Вот отсюда и можно сделать вывод: в 2018 стать экспертом было проще, чем в 2022. Потому что процентный прирост относительно прошлого года выше. С другой стороны, стать мастером из эксперта стало чуть проще. Но суммарно прорваться из новайсов в мастера стало все же сложнее, чем в 2018. Из двух графиков можно сделать вывод: каглить становится суммарно конкуретнее!

И да, в 2018 Кагл поменял политику и перебанил/даунгрейднул кучу работяг из контрибьюторов в новайсов. А еще не смотрим на 2023 год, он не полный, но крайне многообещающий.

Please open Telegram to view this post

VIEW IN TELEGRAM

Google Docs

Спорю о каггле

🔥12👍4😍3👏2❤1

1.83K views11:04

Запрети мне псевдолейблить

График первый

🔥9

2.05K views11:04

Запрети мне псевдолейблить

График второй

🔥9

2.24K views11:04

Запрети мне псевдолейблить

Через несколько часов закончится Open Problems, так что в следующую пятницу будет разбор соревы

🔥5

1.73K viewsedited 18:36

Запрети мне псевдолейблить

Если всех гусей вырежут- может и золото поднимем

UPD: первого уже вырезали, осталось 7

🔥18🙏1🆒1

1.92K viewsedited 00:13

Запрети мне псевдолейблить

Ну что ты будешь делать!

😢23😭20

1.7K views20:09

Запрети мне псевдолейблить

Коротенько расскажу про соревнование и решения на стриме у Алерона сегодня

1.48K views11:37

Запрети мне псевдолейблить

Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты

Привет, чемпионы! 🏆

📣 Завтра, 8 декабря в 17:00, проведём ещё один стрим.

Расскажем про 3 соревы:
1) Дима @dimitriy_rudenko расскажет, как участвовал в Open Porblems, про топовые находки победителей, с фокусом на том, что можно переиспользовать. Канал Димы.
2) Артём @cosheimil расскажет про 2 соревы: как взял🥉 на LWP и про идущую сореву Enefit.

🔥Тем кто пропустил стрим прошлой пятницы советуем посмотреть. Мы там в начале уже затронули Enefit.

Помните:
🧑🏻‍💻 пишите в комментах про какие соревы вам интересно послушать в следующие пятницы!
🕵🏻‍♂️ вы всегда можете поделиться обзором соревы, в которую планируете залететь или той в которой уже поучаствовали. Пишите в лс @dfeeler ⚡️

🤡2❤1👎1🔥1🤮1👀11

1.83K views11:37

Запрети мне псевдолейблить

Hello there!

😁5🍓2💋111

1.74K views12:44

Запрети мне псевдолейблить

Написал простенький кернел для UBC:
Все картинки нарисовал
Для всех картинок посчитал соотношения сторон к тамбнейлам
Отпечатал классы для каждой картинки

Например тут можно увидеть, что некоторые картиники- это снимок в двух срезах, а некоторые в трех. Планирую посмотреть вообще все картинки из трейна, мб там что-то совершенно великолепное найдется.

Наслаждайтесь

Kaggle

All Kaggle Images printed

Explore and run machine learning code with Kaggle Notebooks | Using data from UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)

🔥4🕊2👍111

1.7K viewsedited 17:09

Запрети мне псевдолейблить

überподробный writeup нашего решения для open problems:
https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/460858

В соревновании есть приз за лучшие writeup'ы: 10к для 5 команд из топ-100, выбранных судьями.

Апвоуты, апвоуты, апвоуты! Помогите мне забрать денег с каггла! 🔝

🔝

А еще если вы осилите эту стену текста и хотите покритиковать части поста, как непонятные или нашли опечатки- пишите в комменты или мне в личку обязательно. Ваш альтруизм не будет забыт!

Please open Telegram to view this post

VIEW IN TELEGRAM

Kaggle

Open Problems – Single-Cell Perturbations

Predict how small molecules change gene expression in different cell types

👍8🔥211

1.83K viewsedited 08:04

Запрети мне псевдолейблить

Forwarded from (sci)Berloga Всех Наук и Технологий

🚀 @SBERLOGACOMPETE webinar on bionformatics and data science:
👨‍🔬 Дмитрий Руденко, Александр Червов "Обзор прошедшего соревнования "Open Problems – Single-Cell Perturbations""
⌚️ Четверг 20.00 (по Москве) 14 Декабря

Добавить в Гугл календарь

В соревнование требовалось предсказать как под действием лекарств (146 разных) меняются экспрессии генов. Было только две фичи и они категорные - название клеточного типа (6 типов клеток крови) и название лекарств. Семплов мало - 600+ в трейне, 255 в тесте, но таргетов было много 18211 (все гены). Удивительно, но особого шейкапа не было, хотя СВ-ЛБ билось плохо и семплов мало. Основные решения строились на PYBOOST и нейронках (удивительно, но нейронки хорошо работают даже при таком малом числе семплов).

Наша команда (Антонина Долгорукова, Дмитрий Руденко, Дмитрий Ершов, Антон Вахрушев, Александр Червов) заняла "счастливое" 13 место - ровно на 1 ниже золота (((((

Но у нас есть шанс еще на приз от экспертов - и ваши апвоуты - нам не помешают:
"U900 team - PYBOOST is what you need"
https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/460858 описание решения и ответы на вопросы оргов. (Ваш альтруизм не будет забыт!)

В данном докладе мы напомним в чем была задача, немного расскажем о подходе на PYBOOST и перейдем к обзору решений других команд.

Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !
PS
Подписывайтесь на канал Дмитрия о дата сайнс и Каггл: https://news.1rj.ru/str/pseudolabeling

❤8🔥111

1.85K views11:23

Запрети мне псевдолейблить

Завтра выступаем на воркшопе NeurIPS 2023 как выбор организаторов!
Подключайтесь , радуйтесь с нами 😍

Время:
В Москве 1:00
В Европе 23:00

В комменты кину приведенное время и дату

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤211

2.19K viewsedited 20:24

Запрети мне псевдолейблить

Завтра выступаем на воркшопе NeurIPS 2023 как выбор организаторов! Подключайтесь, радуйтесь с нами 😍 Время: В Москве 1:00 В Европе 23:00 В комменты кину приведенное время и дату

Пароль wingfood, если вы вдруг проглядели на скрине!
Там целый зал нипсеров, можно вообще проникнуться тем, как проходят мероприятия на нипсе

2.17K viewsedited 21:48

Запрети мне псевдолейблить

Вчера закончилось соревнование CAFA5. Заняли с командой 132 место и зафармили бронзовую медальку 🥉

Разбирать эту сореву нет особого смысла: случилась она давно и только сейчас подбили лб нормально. Я даже биологический контекст не помню

Тем самым переполз с 1213 места на 1121 в глобальном рейтинге соревнований. Видимо в этом календарном году это последняя медалька 😭

Стало быть примерно за год получилось:
Вползти в Competition Expert
Выступить на Мюнхенском каггл митапе
Дать кучу разборов прошедших соревнований
Зафармить серебро 🥈и три бронзы 🥉️️️️️️ в компетишнах

И самое главное: познакомиться с кучей мотивированныих и интересных людей

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤5🔥4🏆3🕊111

1.9K viewsedited 10:40

Запрети мне псевдолейблить

Тинькофф запустил игру в слова, и я в ней не мог проиграть

Правила просты: 6 попыток, слово из 5 букв.
Нужно предложить существительное.
Игра подсветит, каких букв нет, какие есть, но не на той позиции, и угаданные буквы.

Пример: правильное слово 'канат', а вы пишете 'набат' – последние две и вторая буква угаданы, первая присутствует, но не на той позиции, а 'б' исключается. 🅰️

Я подумал и решил, что игра алгоритмически проходима, так что используйте мой скрипт. Он сильно помогает решать эту задачу. 🤖

🤖

1. Скачиваем массив всех русских слов
2. Из них отбираем только те, что содержат нужные буквы
3. Из них вычищаем слова, где есть ненужные буквы
4. Фильтруем по знанию о позициях присутствующих букв
5. Оставляем только существительные

На выходе остается буквально несколько слов, из которых можно выбрать наиболее адекватное с наибольшим числом уникальных букв и отгадать слово дня. Вы великолепны!

В качестве компенсации желтому банку, подписывайтесь на канал @scitator_ai. Он ресерчит, иногда допиливает Catalyst (я туда даже контрибьютил) и вообще крутой человек из Тинькофф, его канал незаслуженно непопулярен

Маркетологи тинька, свяжитесь со мной, если вдруг хотите заплатить за интеграцию. Я не против

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5❤211

2.2K viewsedited 10:04

Запрети мне псевдолейблить

👍521

2.39K views10:04

Запрети мне псевдолейблить

CrackTinkoff.ipynb

5.5 KB

Скрипт для кракеров, инструкции внутри. Осторожно, внутри аж Pymorphy2, у новоявленных LLM экспертов может случиться шок

UPD:
Да вот вам коллаб просто https://colab.research.google.com/drive/1H8K_bHMcX935PDIzISvhMcJgt1DQnBo6?usp=sharing

😁13🔥3👨‍💻1111

2.55K viewsedited 10:04

Запрети мне псевдолейблить

Рубрика "идеи для изи контрибюшнов"

Есть такой майкрософтовский фреймворк для DL: torchscale.
Фреймворк предназначен для обучения PyTorch моделей на нескольких GPU эффективно и, в общем, для использования DataParallel "из коробки". Кстати, у них есть даже собственная реализация статьи LongSeq + VIT => LongVIT.
Решил поиграться с ним, но вот у меня он отказывался запускаться даже для примеров. Оказалось, господа инженеры забыли добавить часть зависимостей в requirements.txt, вероятно, потому что на их тестовом стенде всё уже было на месте.

Угадайте, кто за ними починил?

К чести мейнтейнеров этого фреймворка: после открытия пулреквеста не прошло и двух часов, как его влили в мастер. Сегодня ставлю внезапный лайк людям, подарившим мне бесконечную любовь к Windows 95 🤍️

Мораль, как обычно: все ошибаются, и если вы что-то починили, поделитесь со всеми. Будете контрибьютором фреймворка с 3к звездочками. Ну, или хотя бы переименуйте что-нибудь в polars и разберитесь, как всё это работает. Обычно контрибьюшн гайды позволяют неплохо прокачаться в том, как нужно писать код.

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - microsoft/torchscale: Foundation Architecture for (M)LLMs

Foundation Architecture for (M)LLMs. Contribute to microsoft/torchscale development by creating an account on GitHub.

❤19🔥10👍322🥴1

3.2K viewsedited 14:28

Запрети мне псевдолейблить

Начинаем год с простых радостей

🔥2033

2.08K views21:11

About

Blog

Apps

Platform