9 место в NeurIPS - Ariel Data Challenge 2025
Два грандмастера, а именно Dieter и CPMP. Два чела, которые получают зп за то, что решают кагл. СPMP буквально Director competitive ML, а Dieter это текущий топ 2 на платформе и бывший топ 1.
Прерпроцессинг довольно обычный:
1. Взяли топ паблик препроцессинг, сделанный на основе кода организаторов
2. Добавили к нему фильтр на космические лучи (выборсы по сигналу сразу на нескольких частотах), тоже из паблик кернела. Кстати паблик кернела победителя этой соревы.
3. Починили баг, который допустили организаторы во время кодирования данных из 3D (высота x ширина x время) в 2D (сигнал x время)
4. Отцентрировали сигнал, откинув 'бесполезные' края транзитов экзопланет
5. У оригинального детектора, который снимал 3D данные было большое разрешение, но из-за того, что звезда всегда в центре, почти все выкидывали 'темные' пиксели, потому что в них мало информации да и организаторы в своем бейзлайне так делают. Грандмастера хитро посмотрели на распределение того, где есть светимость, а где нет, и сделали чуть более умное маскирование (схема на картинке)
Дальше уже был дата саенс:
1. Взяли детектор транзитов из паблик кернела и им разделили данные на фазы транзита
2. Для краев транзита использовали полином второй степени, чтобы предсказать тренд светимости звезды отдельно от планеты и его вычитать как offset
3. Использовали Бетмен-модельBad-Ass Transit Model cAlculatioN , чтобы с помощью нее определить размер планет и звезд
4. Ту же модель зафитили на данные только с FGS детектора
5. Ту же модель зафитили для бинаризованных на 18 частот данных
6. На бинаризованных данных зафитили еще и Gaussian Process, чтобы шум пофильтровать и дополнительно сгладить выбросы
Ну и постпроцессинг:
1. MLP, который все это дело приводил к единой размерности и стакал
2. Еще один MLP, который калибровал результаты
И все, вот оно 9 место. Судя по активности на лб, которую мы наблюдали- мужчины не особо кранчили, зашли отметились просто.
Два грандмастера, а именно Dieter и CPMP. Два чела, которые получают зп за то, что решают кагл. СPMP буквально Director competitive ML, а Dieter это текущий топ 2 на платформе и бывший топ 1.
Прерпроцессинг довольно обычный:
1. Взяли топ паблик препроцессинг, сделанный на основе кода организаторов
2. Добавили к нему фильтр на космические лучи (выборсы по сигналу сразу на нескольких частотах), тоже из паблик кернела. Кстати паблик кернела победителя этой соревы.
3. Починили баг, который допустили организаторы во время кодирования данных из 3D (высота x ширина x время) в 2D (сигнал x время)
4. Отцентрировали сигнал, откинув 'бесполезные' края транзитов экзопланет
5. У оригинального детектора, который снимал 3D данные было большое разрешение, но из-за того, что звезда всегда в центре, почти все выкидывали 'темные' пиксели, потому что в них мало информации да и организаторы в своем бейзлайне так делают. Грандмастера хитро посмотрели на распределение того, где есть светимость, а где нет, и сделали чуть более умное маскирование (схема на картинке)
Дальше уже был дата саенс:
1. Взяли детектор транзитов из паблик кернела и им разделили данные на фазы транзита
2. Для краев транзита использовали полином второй степени, чтобы предсказать тренд светимости звезды отдельно от планеты и его вычитать как offset
3. Использовали Бетмен-модель
4. Ту же модель зафитили на данные только с FGS детектора
5. Ту же модель зафитили для бинаризованных на 18 частот данных
6. На бинаризованных данных зафитили еще и Gaussian Process, чтобы шум пофильтровать и дополнительно сгладить выбросы
Ну и постпроцессинг:
1. MLP, который все это дело приводил к единой размерности и стакал
2. Еще один MLP, который калибровал результаты
И все, вот оно 9 место. Судя по активности на лб, которую мы наблюдали- мужчины не особо кранчили, зашли отметились просто.
🌭23❤10🔥4😁4🍌3🍓2👍1🤝1
Пожалуйста подпишитесь на меня, пожалуйста пожалуйста пожалуйста
(Текст не редактировать, информацию в скобках удалить. От имени своего канала опубликовать в каналах Сиолошная, Борис Опять, Денис секси айти, ОБЯЗАТЕЛЬНО ДАТА СИКРЕТС, Время Валеры. 2 подписчика будут зачислены на ваш счет в течение двух часов)
(Текст не редактировать, информацию в скобках удалить. От имени своего канала опубликовать в каналах Сиолошная, Борис Опять, Денис секси айти, ОБЯЗАТЕЛЬНО ДАТА СИКРЕТС, Время Валеры. 2 подписчика будут зачислены на ваш счет в течение двух часов)
🥴30😁6❤4🍌1
Челлендж для тру гранд-мастеров- влететь в золото с решением на COBOL
Думаю под силу только @abacabadabacaba404
Вообще пока видел золотые решения с кодом на:
Python 2/3
R
Rust
C
Кажется что-то когда-то видел на Matlab
Мб кто-то еще вспомнит экзотику?
Вообще пока видел золотые решения с кодом на:
Python 2/3
R
Rust
C
Кажется что-то когда-то видел на Matlab
Мб кто-то еще вспомнит экзотику?
❤9🔥4🍌3
Мои друзья из White Circle делают единственный в мире прибыльный стартап по AI safety и ищут инженеров.
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typenoscript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
(текст в скобках удалить, репост ваших мемов про доту и 15 рублей поступят на указанный счет)
Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие.
Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться.
Важно: нужно много работать. Зато готовы платить 80 - 150k USD.
Вакансии:
1. FullStack Engineer
Typenoscript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform
(текст в скобках удалить, репост ваших мемов про доту и 15 рублей поступят на указанный счет)
whitecircle.ai
White Circle
We keep your AI models safe, reliable, and secure.
😁27🍌8💩7❤5🤡5👍4🔥2🤮2
Дождались. Теперь нужно импортить код прямо в функциях и не волноваться о сишных кодстайлах
😭13❤2🔥2
Forwarded from Hacker News
Python Steering Council unanimously accepts "PEP 810, Explicit lazy imports" (Score: 150+ in 13 hours)
Link: https://readhacker.news/s/6ENUr
Comments: https://readhacker.news/c/6ENUr
Link: https://readhacker.news/s/6ENUr
Comments: https://readhacker.news/c/6ENUr
Discussions on Python.org
PEP 810: Explicit lazy imports
I don’t think there’s a good way to do this automatically on behalf of users, because it requires knowing whether or not their use intended to import. I maintain different internal tools at work, some where we eagerly import things, including intentionally…
❤5
Пытался вывести как-то атаку на другой лосс в каггле для соревнования, где бало мало примеров. Не хватило усидчивости к соажлению. Мб прочтение этой статьи меня вдохновит на то, как можно напасть на другие лоссы
👍4❤2🍌2
Forwarded from adapt compete evolve or die
Считаю шейкап паблик-прайват недостатком подготовки соревнования. Даже если он произошел по вине взламывателей лидербордов. Вот, например, классная статья со взломом лидерборда на kaggle с метрикой logloss: We demonstrate this attack on the first stage of a recent Kaggle competition (Intel & MobileODT Cancer Screening) and use it to achieve a log-loss of 0.00000 (and thus attain a rank of #4 out of 848 contestants), without
ever training a classifier to solve the actual task. Надо брать хорошие метрики!
Кстати, в Yandex Cup метрику пока не взломали, осталось 11 часов. Будет смешно, если в последний момент будет взрыв лидерборда, но пока к тому нет намеков.
ever training a classifier to solve the actual task. Надо брать хорошие метрики!
Кстати, в Yandex Cup метрику пока не взломали, осталось 11 часов. Будет смешно, если в последний момент будет взрыв лидерборда, но пока к тому нет намеков.
❤5🍌1
https://news.1rj.ru/str/seeallochnaya/3069
Видимо поэтому чат гпт не может загрузить мне историю чатов стабильно каждый день как раз с момента, когда просыпается Индия и до момента, когда Индия уснет. Видимо свои двадцать баксов я отдам гроку, который даже за бесплатно отвечает стабильно, хотя кажется немножко тупее
Видимо поэтому чат гпт не может загрузить мне историю чатов стабильно каждый день как раз с момента, когда просыпается Индия и до момента, когда Индия уснет. Видимо свои двадцать баксов я отдам гроку, который даже за бесплатно отвечает стабильно, хотя кажется немножко тупее
Telegram
Сиолошная
В январе мы впервые услышали, что OpenAI ставит на этот год целью достижение миллиарда пользователей ChatGPT в сутки. На момент первого упоминания у компании было «всего» 350 миллионов пользователей в неделю, то есть вырасти надо более чем в три раза, и это…
😁9❤4🤮1💯1🍌1
Forwarded from Classical Vlad
На днях решил сделать небольшую игрушку для анализа связей между телеграм каналами.
Вышло интересно. Можно таким образом найти что-то новое для себя и подписаться на интересующие темы
Интересно как форматы каналов "плывут" от одной к другому: блоги компаний, конкретных людей из ML, о количественных финансах, мемные каналы
Сама тулза, конечно, не была задумана как что-то более чем на 1 вечер, но если захотите поиграть, то вот ссылка:
https://github.com/VladKochetov007/TelegramNetwork
Вышло интересно. Можно таким образом найти что-то новое для себя и подписаться на интересующие темы
Интересно как форматы каналов "плывут" от одной к другому: блоги компаний, конкретных людей из ML, о количественных финансах, мемные каналы
Сама тулза, конечно, не была задумана как что-то более чем на 1 вечер, но если захотите поиграть, то вот ссылка:
https://github.com/VladKochetov007/TelegramNetwork
🔥12❤9🤡2👎1🌚1🍌1
https://www.kaggle.com/competitions/santa-2025
Всех желающих призываю участвовать в ежегодном челлендже по оптимизации. Я за этот год знания с прошлого санты применял аж дважды (это много)
А еще у санты традиционно нет прайвета, так что влезать на лб еще веселее
В этот раз надо запаковать блоки в квадрат наименьшей длины стороны. Т.е. для набора 'деталей' найти куб наименьшего размера и координаты каждой детали и ее угол поворота. Детали- конечно же ёлки
Всех желающих призываю участвовать в ежегодном челлендже по оптимизации. Я за этот год знания с прошлого санты применял аж дважды (это много)
А еще у санты традиционно нет прайвета, так что влезать на лб еще веселее
В этот раз надо запаковать блоки в квадрат наименьшей длины стороны. Т.е. для набора 'деталей' найти куб наименьшего размера и координаты каждой детали и ее угол поворота. Детали- конечно же ёлки
Kaggle
Santa 2025 - Christmas Tree Packing Challenge
How many Christmas trees can fit in a box? Help solve a classic optimization problem with a festive twist.
🔥16❤4🍌3👀2🤡1
Запрети мне псевдолейблить
Photo
Для всех страдающих окр:
Вот так сейчас выглядит топ паблик в санте 2025.
Уже достаточно плотно и руками уже не поправишь
https://www.kaggle.com/competitions/santa-2025
У этого паблика скор- 74
Топ лб- это 70
Окружность выше- это примерно скор в 140
Вот так сейчас выглядит топ паблик в санте 2025.
Уже достаточно плотно и руками уже не поправишь
https://www.kaggle.com/competitions/santa-2025
У этого паблика скор- 74
Топ лб- это 70
Окружность выше- это примерно скор в 140
❤16🔥8🍌4😁2🤯2👍1 1
Продолжая эксплуатировать ваш окр:
А если взять все 200 паззлов из топ сабмита и посмотреть самый эффективный по минимальному избыточному пространству в квадрате на одну ёлку, то можно найти один очень эффективный паттерн.
наверно и сабмит соберу
Считаем площадь елки, и делим площадь лучшего решения на то, сколько всего теоретически занимают елки такой конфигурации. Получаем соотношение 'избыточного места'. Оказывается оптимум лежит на пазле размером 63 и если его посмотреть глазами- там какой-то очень воспроизводимый паттерн. Думаете он скейлится на паззлы размеро больше?
А если взять все 200 паззлов из топ сабмита и посмотреть самый эффективный по минимальному избыточному пространству в квадрате на одну ёлку, то можно найти один очень эффективный паттерн.
наверно и сабмит соберу
Считаем площадь елки, и делим площадь лучшего решения на то, сколько всего теоретически занимают елки такой конфигурации. Получаем соотношение 'избыточного места'. Оказывается оптимум лежит на пазле размером 63 и если его посмотреть глазами- там какой-то очень воспроизводимый паттерн. Думаете он скейлится на паззлы размеро больше?
❤16🔥7🏆4🥱2