На днях завершилось ежегодное соревнование Lux, посвященное применению RL в комплексных средах. Мы заняли 24 место и взяли серебро. Задача была поставлена в виде стратегии в реальном времени (RTS), где агенты начинают игру в равных условиях на симметричной карте. Среда представляла из себя Partially Observable Markov Decision Process (POMDP), это когда среда настолько сложна, что из текущего observation (частичного наблюдения среды) нельзя теоретически вывести идеальный action (действие, которое ведёт к максимизации реварда). Также задача осложняется тем, что из всех observation не факт что можно вывести state (полное представление о среде, из которого теоретически можно вывести идеальный action). В таких случаях эвристики и алгоритмы на них не дают лучшего результата, потому что неясно каким образом переводить observations и туманные представления о прекрасном state в action. Но вот нейросети с механизмом внимания вполне могут уловить тонкую настройку вселенной и приблизиться к пониманию state и соответственно чаще выбирать идеальный action
Вернёмся к насущному, агент представляет из себя флот из 16 космических кораблей, которые обладают энергией, обзором, могут двигаться, стрелять и умирать, когда энергия заканчивается. На карте размером 24х24 каждая клетка обладает энергией, которая может быть положительной или отрицательной и эта энергия меняется раз в какое-то количество таймстемпов. Также на карте присутствуют дрейфующие астеройды, блокирующие передвижение, и зоны туманности, с увеличенной тратой энергии и уменьшенной видимостью. Для победы нужно набрать больше поинтов, чем агент противника, добыча поинтов осуществляется путём нахождения одного из юнитов на клетке "реварда". Стрельба реализована через энергию, стоимость выстрела в энергии фиксированна и равна урону. Юнит тратит на выстрел столько же своей энергии, сколько отнимет у противника при попадании, то есть мат ожидание выстрела отрицательное и стрелять чаще всего не выгодно. Но есть параметр сплеша, отвечающий за коэффициент распространения урона на соседние клетки
На лидерборде агенты оценивались по системе Elo, постоянно играя друг против друга. Каждая игра состояла из 5 матчей, после каждых 100 степов фиксировалось победное очко агента, набравшего большее количество поинтов в прошедшем матче, и начинался новый матч
Наше решение в конечном счёте основано на алгоритме, который принимает решение исходя из заложенных в него представлений о стратегии и тактике, по сути он оптимизирует эвристики. В условиях изменяющейся среды и ограниченной видимости написать подобный алгоритм было сложно. Мы также пытались тренировать transformer-based модель, которая в каждый момент времени принимает вектор observation, формируемый CNN энкодером на фичермапах карты, и look-up table вектор action с предыдущего таймстемпа. И две головы, одна на классификацию actions для каждого юнита на карте, другая на регрессию нормированных координат выстрела, также для каждого юнита. Данные для обучения мы парсили с топовых мест лидерборда, пытаясь реализовать imitation learning подход. Но довести до ума обучение не успели. Как выяснилось позже, у 1 места была похожая архитектура
Решение первого места хорошо расписал Сергей, почитайте его пост. О решениях 2 и 3 места были неплохие посты у Димы. Из особенно интересного, 3 место обучил UNet архитектуру с размерностью выхода 6х24х24 - вероятность 6 возможных действий для каждой клетки карты, до этого я не додумался. 1 место с ConvLSTM+transformer архитектурой удачно заменил CNN на CNN с вниманием, до этого я додумался но реализовать не успел
Огромную благодарность хочу выразить команде, было круто коммуницировать с вами. Я узнал много нового про RL, буду теперь применять знания к аудио домену
А, ну и да, я стал Kaggle competition Master, принимаю ваши поздравления :)
Вернёмся к насущному, агент представляет из себя флот из 16 космических кораблей, которые обладают энергией, обзором, могут двигаться, стрелять и умирать, когда энергия заканчивается. На карте размером 24х24 каждая клетка обладает энергией, которая может быть положительной или отрицательной и эта энергия меняется раз в какое-то количество таймстемпов. Также на карте присутствуют дрейфующие астеройды, блокирующие передвижение, и зоны туманности, с увеличенной тратой энергии и уменьшенной видимостью. Для победы нужно набрать больше поинтов, чем агент противника, добыча поинтов осуществляется путём нахождения одного из юнитов на клетке "реварда". Стрельба реализована через энергию, стоимость выстрела в энергии фиксированна и равна урону. Юнит тратит на выстрел столько же своей энергии, сколько отнимет у противника при попадании, то есть мат ожидание выстрела отрицательное и стрелять чаще всего не выгодно. Но есть параметр сплеша, отвечающий за коэффициент распространения урона на соседние клетки
На лидерборде агенты оценивались по системе Elo, постоянно играя друг против друга. Каждая игра состояла из 5 матчей, после каждых 100 степов фиксировалось победное очко агента, набравшего большее количество поинтов в прошедшем матче, и начинался новый матч
Наше решение в конечном счёте основано на алгоритме, который принимает решение исходя из заложенных в него представлений о стратегии и тактике, по сути он оптимизирует эвристики. В условиях изменяющейся среды и ограниченной видимости написать подобный алгоритм было сложно. Мы также пытались тренировать transformer-based модель, которая в каждый момент времени принимает вектор observation, формируемый CNN энкодером на фичермапах карты, и look-up table вектор action с предыдущего таймстемпа. И две головы, одна на классификацию actions для каждого юнита на карте, другая на регрессию нормированных координат выстрела, также для каждого юнита. Данные для обучения мы парсили с топовых мест лидерборда, пытаясь реализовать imitation learning подход. Но довести до ума обучение не успели. Как выяснилось позже, у 1 места была похожая архитектура
Решение первого места хорошо расписал Сергей, почитайте его пост. О решениях 2 и 3 места были неплохие посты у Димы. Из особенно интересного, 3 место обучил UNet архитектуру с размерностью выхода 6х24х24 - вероятность 6 возможных действий для каждой клетки карты, до этого я не додумался. 1 место с ConvLSTM+transformer архитектурой удачно заменил CNN на CNN с вниманием, до этого я додумался но реализовать не успел
Огромную благодарность хочу выразить команде, было круто коммуницировать с вами. Я узнал много нового про RL, буду теперь применять знания к аудио домену
А, ну и да, я стал Kaggle competition Master, принимаю ваши поздравления :)
❤38👍16 9🕊3
На выходных слетал с коллегами в страну кимчи, пластических операций, свергнутых президентов и игр в кальмара. В столицу государства на реке Хан, Сеул 🇰🇷
Южнокорейский экономический бум пришелся на 60-70-е года прошлого века, когда после войны с северным соседом в страну хлынули инвестиции из США и Японии. Стремительная индустриализация, развитие морской торговли, реформы в сфере образования и человеческий капитал за несколько десятилетий построили новую Корею. Но время идёт, темпы роста снижаются. В отличие от современных китайских мегаполисов, где смешалось всё, кони, люди, жизнь в Сеуле показалась мне куда более спокойной и комфортной. Местами город выглядит обветшалым, это проблема всех городов, переживших внезапный экономический бум. Если построить все здания в один период, придут в негодность они также вместе. Несмотря на это, ярких контрастов трущоб и небоскрёбов, как в Шанхае, замечено не было. Но это частное, в общем случае городская среда очень комфортна, чиста и красива: повсюду выделенные велодорожки, широкая сеть метро, практически отсутствие мусора, огромное количество ухоженной зелени, безбарьерная среда адаптированная для маломобильных граждан. Но помимо плюсов, влияние США также образует интересный и пугающий синтез двух культур, западный культ личностного достижения и азиатский культ трудолюбия, по моим ощущениям, они здесь возведены в абсолют. Не зря таксист на вопрос про то смотрел ли он "игру в кальмара" ответил: "конечно, это буквально наша жизнь"
но об этом позже, всем хамса хамида
Южнокорейский экономический бум пришелся на 60-70-е года прошлого века, когда после войны с северным соседом в страну хлынули инвестиции из США и Японии. Стремительная индустриализация, развитие морской торговли, реформы в сфере образования и человеческий капитал за несколько десятилетий построили новую Корею. Но время идёт, темпы роста снижаются. В отличие от современных китайских мегаполисов, где смешалось всё, кони, люди, жизнь в Сеуле показалась мне куда более спокойной и комфортной. Местами город выглядит обветшалым, это проблема всех городов, переживших внезапный экономический бум. Если построить все здания в один период, придут в негодность они также вместе. Несмотря на это, ярких контрастов трущоб и небоскрёбов, как в Шанхае, замечено не было. Но это частное, в общем случае городская среда очень комфортна, чиста и красива: повсюду выделенные велодорожки, широкая сеть метро, практически отсутствие мусора, огромное количество ухоженной зелени, безбарьерная среда адаптированная для маломобильных граждан. Но помимо плюсов, влияние США также образует интересный и пугающий синтез двух культур, западный культ личностного достижения и азиатский культ трудолюбия, по моим ощущениям, они здесь возведены в абсолют. Не зря таксист на вопрос про то смотрел ли он "игру в кальмара" ответил: "конечно, это буквально наша жизнь"
но об этом позже, всем хамса хамида
❤28✍8🕊6
знакомство с Гонконгом
Ночь с субботы на воскресенье я провёл на улицах Гонконга, специально взяв обратный рейс в Москву с ночной пересадкой
Небольшой экскурс в историю: после проигранной Китаем первой опиумной войны, Гонконг стал колонией Британской империи. Часть территории начала принадлежать Великобритании, часть была сдана на правах аренды, которая закончилась в 1997 году. Последующие переговоры состоялись между премьер-министрами КНР и Великобритании Чжао Цзыяном и Маргарет Тэтчер, Цзыян твёрдо заявил о намерениях Китая вернуть все территории Гонконга. Под влиянием превосходства КНР в регионе и стремительного роста экономических связей двух держав после падения бамбукового занавеса, Британией было принято решение уступить все территории. С тех пор Гонконг снова принадлежит материковому Китаю. Но благодаря бизнесмену Лоуренсу Кадури, который практически перестроил Гонконг после второй мировой войны, а также имел давние хорошие отношения с Китаем, на территории удалось сохранить британскую правовую и экономическую системы. Таким образом в Гонконге остались низкие налоги, своя валюта и свои законы. Географически Гонконг (или Hong Kong) - это остров, но как административная единица, Гонконг включает в себя также соседние острова и часть материка до реки Шам-Чун на севере.
Знакомство я начал в нестандартном для этого месте. В городе Коулун, по другую сторону реки Чжу-Цзянг от острова Hong Kong. Там проживает большинство местных жителей. Раньше в этом городе находился знаменитый город-крепость с плотностью населения два миллиона человек на квадратный километр, этот район снесли и перестроили, но дух остался. Ночной рынок Коулуна выглядит колоритно: грязные улицы с торговыми лавками, запахи помоев, граффити, мусор. Над улицами в небо устремляются серые многоэтажные панельные дома далеко не в лучшем состоянии (я никогда не видел 65!!! этажных панелек). Далее, сев на автобус, я поехал на остров. Намеренно пропустил несколько остановок и вышел сильно восточнее центра. Почти сразу мне встретился миленький парк, в котором я прилёг отдохнуть на лавочку. У меня не было интернета, карты, а несколько процентов зарядки я решил оставить на камеру. Тёплый ветерок, в меру ухоженные деревья, приглушенный свет фонаря, красота. Пролежав так около получаса, я вдруг услышал резкий шорох листвы. Присмотрелся - крысы, присмотрелся лучше - ещё больше крыс. Я поспешно встал и ушёл, но они так или иначе были везде куда бы я ни направился. И было их больше чем я когда либо видел в любом из городов. Ночной город был пуст, людей я практически не встречал, лишь одинаковые старые красные такси, сводящие с ума, ездили по дорогам. Постепенно я начал ненавидеть это место. Сориентировавшись по компасу я вышел в самый конец набережной Цинь Йи и отправился по направлению центра. В том месте где я вышел стояли на якоре всевозможные частные суда, на их фоне зловеще горел Нью-Коулун, сильно напоминая заглавную картинку из аркейна. Шёл я медленно, постоянно останавливаясь. По мере приближения к центру городской пейзаж улучшался, становилось меньше панельных домов, меньше крыс и мусора. Изначально моей целью было встретить рассвет на Пике Виктория, который возвышается над Гонконгом и найти там особняк Кадури. На Пик ездит трамвай. По туристическим указателям было крайне сложно найти место его отправления. Но я справился (нашел его почти случайно, указатели часто вели не туда) и с 5:30 до 6:00 ждал открытия станции. Она не открылась. А жаль, было бы символично закончить маршрут именно там, начав путь с бедных районов, дойти до места где раньше жили "короли" Гонконга. Закат я встретил лёжа на гранитном основании фонтана с вытянутым к небу чёрным торовидным объектом в его центре, который как бы лишь одной нижней точкой касался воды.
Впечатления город оставил негативные, в Китае у меня такое впервые, но я списываю это на чересчур большое количество неудачно сложившихся обстоятельств. Обязательно еще сюда вернусь, доберусь до Пика и переосмыслю свои эмоции на счет Гонконга
Ночь с субботы на воскресенье я провёл на улицах Гонконга, специально взяв обратный рейс в Москву с ночной пересадкой
Небольшой экскурс в историю: после проигранной Китаем первой опиумной войны, Гонконг стал колонией Британской империи. Часть территории начала принадлежать Великобритании, часть была сдана на правах аренды, которая закончилась в 1997 году. Последующие переговоры состоялись между премьер-министрами КНР и Великобритании Чжао Цзыяном и Маргарет Тэтчер, Цзыян твёрдо заявил о намерениях Китая вернуть все территории Гонконга. Под влиянием превосходства КНР в регионе и стремительного роста экономических связей двух держав после падения бамбукового занавеса, Британией было принято решение уступить все территории. С тех пор Гонконг снова принадлежит материковому Китаю. Но благодаря бизнесмену Лоуренсу Кадури, который практически перестроил Гонконг после второй мировой войны, а также имел давние хорошие отношения с Китаем, на территории удалось сохранить британскую правовую и экономическую системы. Таким образом в Гонконге остались низкие налоги, своя валюта и свои законы. Географически Гонконг (или Hong Kong) - это остров, но как административная единица, Гонконг включает в себя также соседние острова и часть материка до реки Шам-Чун на севере.
Знакомство я начал в нестандартном для этого месте. В городе Коулун, по другую сторону реки Чжу-Цзянг от острова Hong Kong. Там проживает большинство местных жителей. Раньше в этом городе находился знаменитый город-крепость с плотностью населения два миллиона человек на квадратный километр, этот район снесли и перестроили, но дух остался. Ночной рынок Коулуна выглядит колоритно: грязные улицы с торговыми лавками, запахи помоев, граффити, мусор. Над улицами в небо устремляются серые многоэтажные панельные дома далеко не в лучшем состоянии (я никогда не видел 65!!! этажных панелек). Далее, сев на автобус, я поехал на остров. Намеренно пропустил несколько остановок и вышел сильно восточнее центра. Почти сразу мне встретился миленький парк, в котором я прилёг отдохнуть на лавочку. У меня не было интернета, карты, а несколько процентов зарядки я решил оставить на камеру. Тёплый ветерок, в меру ухоженные деревья, приглушенный свет фонаря, красота. Пролежав так около получаса, я вдруг услышал резкий шорох листвы. Присмотрелся - крысы, присмотрелся лучше - ещё больше крыс. Я поспешно встал и ушёл, но они так или иначе были везде куда бы я ни направился. И было их больше чем я когда либо видел в любом из городов. Ночной город был пуст, людей я практически не встречал, лишь одинаковые старые красные такси, сводящие с ума, ездили по дорогам. Постепенно я начал ненавидеть это место. Сориентировавшись по компасу я вышел в самый конец набережной Цинь Йи и отправился по направлению центра. В том месте где я вышел стояли на якоре всевозможные частные суда, на их фоне зловеще горел Нью-Коулун, сильно напоминая заглавную картинку из аркейна. Шёл я медленно, постоянно останавливаясь. По мере приближения к центру городской пейзаж улучшался, становилось меньше панельных домов, меньше крыс и мусора. Изначально моей целью было встретить рассвет на Пике Виктория, который возвышается над Гонконгом и найти там особняк Кадури. На Пик ездит трамвай. По туристическим указателям было крайне сложно найти место его отправления. Но я справился (нашел его почти случайно, указатели часто вели не туда) и с 5:30 до 6:00 ждал открытия станции. Она не открылась. А жаль, было бы символично закончить маршрут именно там, начав путь с бедных районов, дойти до места где раньше жили "короли" Гонконга. Закат я встретил лёжа на гранитном основании фонтана с вытянутым к небу чёрным торовидным объектом в его центре, который как бы лишь одной нижней точкой касался воды.
Впечатления город оставил негативные, в Китае у меня такое впервые, но я списываю это на чересчур большое количество неудачно сложившихся обстоятельств. Обязательно еще сюда вернусь, доберусь до Пика и переосмыслю свои эмоции на счет Гонконга
❤21👍6🕊4
Пара интересных фактов связанных с Пиком Виктория, до которого я не добрался:
- отсюда совершались первые рыночные манипуляции. Монополистом опиумного рынка во второй половине XIX века была компания "Jardin & Matheson", которая кстати существует до сих пор, они закупали опиум в Индии и через контрабандистов распространяли по всему Китаю. Главным портом сбыта был Гонконг. Для контроля спроса и предложения была придумана схема с сигнальными огнями: с южной точки Пика запускалась ракета в тот момент, когда количество опиума на рынке уменьшалось и цена на на него вырастала. Тогда корабли, стоявшие в заливе, заходили в бухту Виктория на разгрузку. До этого, насколько мне известно, так никто не делал
- идею тех сигнальных ракет подметил Альберт Сассун. Поняв ценность информации, он вложил огромные деньги в исследования телеграфа и одним из первых людей в Азии получил доступ к линиям связи. За счет этого сразу после второй опиумной войны уже он монополизировал опиумный рынок Китая и построил свою бизнес империю
- светская иерархия в городе строилась не по уровню богатства или титулу, а по тому насколько высоко на Пике располагается твой дом. Хотя, конечно, титул коррелирует с богатством, а богатство с высотой земельного участка над уровнем моря
- отсюда совершались первые рыночные манипуляции. Монополистом опиумного рынка во второй половине XIX века была компания "Jardin & Matheson", которая кстати существует до сих пор, они закупали опиум в Индии и через контрабандистов распространяли по всему Китаю. Главным портом сбыта был Гонконг. Для контроля спроса и предложения была придумана схема с сигнальными огнями: с южной точки Пика запускалась ракета в тот момент, когда количество опиума на рынке уменьшалось и цена на на него вырастала. Тогда корабли, стоявшие в заливе, заходили в бухту Виктория на разгрузку. До этого, насколько мне известно, так никто не делал
- идею тех сигнальных ракет подметил Альберт Сассун. Поняв ценность информации, он вложил огромные деньги в исследования телеграфа и одним из первых людей в Азии получил доступ к линиям связи. За счет этого сразу после второй опиумной войны уже он монополизировал опиумный рынок Китая и построил свою бизнес империю
- светская иерархия в городе строилась не по уровню богатства или титулу, а по тому насколько высоко на Пике располагается твой дом. Хотя, конечно, титул коррелирует с богатством, а богатство с высотой земельного участка над уровнем моря
👍14❤9🕊4
Немного лет тому назад,
Там, где, сливаяся, шумят,
Обнявшись, будто две сестры,
Струи Арагвы и Куры,
Был монастырь. Из-за горы
И нынче видит пешеход
Столбы обрушенных ворот,
И башни, и церковный свод;
Но не курится уж под ним
Кадильниц благовонный дым,
Не слышно пенье в поздний час
Молящих иноков за нас.
Теперь один старик седой,
Развалин страж полуживой,
Людьми и смертию забыт,
Сметает пыль с могильных плит,
Которых надпись говорит
О славе прошлой — и о том,
Как, удручен своим венцом,
Такой-то царь, в такой-то год,
Вручал России свой народ.
И божья благодать сошла
На Грузию! Она цвела
С тех пор в тени своих садов,
Не опасаяся врагов,
3а гранью дружеских штыков.
Мцыри
М.Ю.Лермонтов
❤25🕊9👍6
Forwarded from DLStories
Полчаса назад в подмосковье стартовал первый тур отбора школьников на IOAI. Отбор будет идти три дня, каждый тур по 6 часов. В первый и второй день будут по три задачи (таблички, CV, NLP), в третий день две (CV и NLP). Задачи мы старались придумать подобные тем, что были на прошлогоднем межнаре: то есть, очень интересными, где надо подумать и сделать что-то с фичами/моделями, а не просто Kaggle-style вида "вот датасет, обучите как-нибудь, чтобы было хорошо"
И вот что: отбор сделан как открытая олимпиада Northern Eurasia OAI 2025 (NEOAI) на Kaggle, и участвовать могут все желающие. Если хотите, присоединяйтесь) Сейчас открыты три задачи текущего тура (на них остается 5.5 часа), завтра и послезавтра в 10 утра по Москве откроются второй и третий туры. Leaderboard открытый, ваши посылки и посылки школьников с отбора будут одинаково видны. А в конце олимпиады (после трех туров) будет финальный лидерборд с рейтингом по всем задачам.
Разбор задач после олимпиады тоже будет, решения будут открыты.
Ссылка на соревнование: https://www.kaggle.com/competitions/neoai-2025/overview
Приходите, мы классные задачи придумали, правда)
P.S. Откройте бейзлайн сегодняшней задачи по NLP. Мы с Егором (который делал эту задачу) получили огромное удовольствие, когда придумали легенду🤣
И вот что: отбор сделан как открытая олимпиада Northern Eurasia OAI 2025 (NEOAI) на Kaggle, и участвовать могут все желающие. Если хотите, присоединяйтесь) Сейчас открыты три задачи текущего тура (на них остается 5.5 часа), завтра и послезавтра в 10 утра по Москве откроются второй и третий туры. Leaderboard открытый, ваши посылки и посылки школьников с отбора будут одинаково видны. А в конце олимпиады (после трех туров) будет финальный лидерборд с рейтингом по всем задачам.
Разбор задач после олимпиады тоже будет, решения будут открыты.
Ссылка на соревнование: https://www.kaggle.com/competitions/neoai-2025/overview
Приходите, мы классные задачи придумали, правда)
P.S. Откройте бейзлайн сегодняшней задачи по NLP. Мы с Егором (который делал эту задачу) получили огромное удовольствие, когда придумали легенду
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12✍7👍3🕊1
Сегодня завершился отбор на межнар по ИИ, в котором я принял участие в роли организатора и автора задачи. По итогу мы отобрали 8 школьников, которые в августе полетят в Пекин представлять сборную России
Задачи межнара не похожи ни на хакатоны, ни на каггл соревнования, ни на академический ресерч. Они нацелены на нахождение неочевидных решений в сжатые сроки (2-3 часа на задачу), часто связаны с конкретной архитектурой и их решение подразумевает глубокое понимание процессов проходящих внутри нейросети. Брутфорс, файнтюн, хак метрики - не про олимпиады. Ниже дана формулировка моей задачи:
с кодом бейзлайна, полной формулировкой, а также забавной драматичной легендой, которую мы с Таней придумали накануне контеста, можно ознакомиться по ссылке
Организовывать мероприятие, готовить задачи, оценивать решения - очень тяжёлый и выматывающий процесс, огромное спасибо выражаю команде организаторов из ЦУ и в частности Александру Гущину. Мне приятно находиться у истоков развития олимпиадной культуры в сфере ИИ. Форматы и рамки задач не прошли испытание временем. Тренировочный процесс не установлен, нет методичек или учебников. А значит что у нас есть возможность применить лучшие практики и внести весомый вклад в зарождающееся движение
Задачи межнара не похожи ни на хакатоны, ни на каггл соревнования, ни на академический ресерч. Они нацелены на нахождение неочевидных решений в сжатые сроки (2-3 часа на задачу), часто связаны с конкретной архитектурой и их решение подразумевает глубокое понимание процессов проходящих внутри нейросети. Брутфорс, файнтюн, хак метрики - не про олимпиады. Ниже дана формулировка моей задачи:
Your goal is to modify the generation process of the gemma2-2b model so that generated texts belong to the distribution of fake text detector scores corresponding to humans (i.e. fake text detector thinks that generated texts are actually real), while not changing the text generated by gemma2-2b much. You are given only test set of prompts, and you can't use it for training.
с кодом бейзлайна, полной формулировкой, а также забавной драматичной легендой, которую мы с Таней придумали накануне контеста, можно ознакомиться по ссылке
Организовывать мероприятие, готовить задачи, оценивать решения - очень тяжёлый и выматывающий процесс, огромное спасибо выражаю команде организаторов из ЦУ и в частности Александру Гущину. Мне приятно находиться у истоков развития олимпиадной культуры в сфере ИИ. Форматы и рамки задач не прошли испытание временем. Тренировочный процесс не установлен, нет методичек или учебников. А значит что у нас есть возможность применить лучшие практики и внести весомый вклад в зарождающееся движение
❤30👍19 11
Aparin
Viva La Victoria! это было долго и сложно
guess who's back
back again
запущено соревнование по восстановлению распределения спектра фотонов различных длин волн из шумного сигнала кривой светимости спектрометра, наблюдающего экзопланеты в момент их транзита перед звездой. как и год назад, соревнование проводится как часть competition трека на NIPS, при прочих равных можно получить публикацию на воркшопе (в прошлом году все нейросетевые методы провалились и публикации не было). метрика, данные и контекст такие же, подробнее можете почитать в моём прошлогоднем разборе. несмотря на то чточувство долга стокгольмский синдром зовёт меня учавствовать, не уверен что в итоге решусь, уж неприлично много сил было потрачено годом ранее
back again
запущено соревнование по восстановлению распределения спектра фотонов различных длин волн из шумного сигнала кривой светимости спектрометра, наблюдающего экзопланеты в момент их транзита перед звездой. как и год назад, соревнование проводится как часть competition трека на NIPS, при прочих равных можно получить публикацию на воркшопе (в прошлом году все нейросетевые методы провалились и публикации не было). метрика, данные и контекст такие же, подробнее можете почитать в моём прошлогоднем разборе. несмотря на то что
❤20👍11 7
Завершилось геофизическое соревнование, посвященное восстановлению карты скорости распространения волны в породе из амплитуды отразившихся и вернувшихся сигналов на поверхность (рис. 2). Если объяснять подробнее, то на интересующем земляном секторе в линию расставляют считывающие волны датчики. Рядом ставят аппарат, который ударяет по земле и создаёт волну. Отразившись от различных пород, она возвращается на поверхность и её амплитуда фиксируется. Так как датчики расположены на некотором расстоянии друг от друга, переотразившаяся волна приходит к ним в разный момент времени. Наблюдения повторяют пять раз с разным положением аппарата. Таким образом получается сейсмограмма (рис. 3 справа), с размерностью [5, 70, 1000], где 5 - количество наблюдений, 70 - количество датчиков (каждый на расстоянии 10м друг от друга, всего - 700м) и 1000 - временная шкала в миллисекундах. Из этой картинки нужно восстановить карту скорости (рис. 3 слева) - таргет размерности [70, 70], где по первой оси отложено расстояние на поверхности, а по второй - глубина, в десятках метров. Проблема в том, что если из таргета с помощью диффура можно получить сейсмограмму (инпут), то решить обратную задачу аналитически нельзя (рис. 4). Эта задача и стояла перед участниками
Особенностью соревнования было огромное количество тренировочных данных (800гб) и доступный изначально тест сет. То есть файл сабмита нужно было формировать локально. Так как трейн и тест датасеты были в достаточной степени гомогенны, валидация сильно коррелировала с лидербордом и в последствии шейкапа не было. Ключом к победе были генерация синтетики и псевдолейблинг с итеративным дообучением на тесте. Новые данные генерировались с помощью Full Waveform Inversion (FWI), это тот самый диффур, с помощью которого можно из карты скорости сделать сейсмограмму (рис. 3), а карту скорости можно брать как рандом кроп + интерполяция к исходным размерам из существующих таргетов. Так участник, взявший первое место, расширил датасет в 10 раз, до ~9Тб. Ещё помогали переход к одноканальной картинке, когда из каждого замера оставляли лишь те наблюдения, что фиксировались вблизи аппарата (рис. 5) и аугментации, объединяющие существующие таргеты, с последующей генерацией сейсмограммы с помощью FWI (рис. 6)
Что касается архитектур моделей - большинство использовали UNet с сегментационной головой, но это контр-интуитивно, так как задача ставится как перевод [метр; секунда] в [метр; метр] и пиксели инпута напрямую не связаны с пикселями таргета. В наших экспериментах мы хотели придумать что-то лучше unet, я пробовал seq2seq подход, где время и глубина сопоставлены друг другу, но сдался, когда понял, что при предсказании n+1 вектора декодер предсказывает текущий, так как по L1 он близок к следующему. Впрочем решение с первого место имеет за собой ту же логику отказа от unet сегментации и переход к регрессии на vision transformer (рис. 7). Интересное решение добавить единый линейный слой для энкодера и декодера, при этом объединяя только веса, не делая резидуал соединение
В итоге мы заняли 28 место, взяли серебро, каждая идея из топа витала где-то рядом, но многое не докрутили. Соревнование, как мне кажется, вышло продуктивным и в академическом плане. Датасет OpenFWI - общепринятый, в статьях все меряются на нём. Соты побиты, новые архитектуры и методы предложены. Учёным из области остаётся собрать сливки и оформить статьи
Особенностью соревнования было огромное количество тренировочных данных (800гб) и доступный изначально тест сет. То есть файл сабмита нужно было формировать локально. Так как трейн и тест датасеты были в достаточной степени гомогенны, валидация сильно коррелировала с лидербордом и в последствии шейкапа не было. Ключом к победе были генерация синтетики и псевдолейблинг с итеративным дообучением на тесте. Новые данные генерировались с помощью Full Waveform Inversion (FWI), это тот самый диффур, с помощью которого можно из карты скорости сделать сейсмограмму (рис. 3), а карту скорости можно брать как рандом кроп + интерполяция к исходным размерам из существующих таргетов. Так участник, взявший первое место, расширил датасет в 10 раз, до ~9Тб. Ещё помогали переход к одноканальной картинке, когда из каждого замера оставляли лишь те наблюдения, что фиксировались вблизи аппарата (рис. 5) и аугментации, объединяющие существующие таргеты, с последующей генерацией сейсмограммы с помощью FWI (рис. 6)
Что касается архитектур моделей - большинство использовали UNet с сегментационной головой, но это контр-интуитивно, так как задача ставится как перевод [метр; секунда] в [метр; метр] и пиксели инпута напрямую не связаны с пикселями таргета. В наших экспериментах мы хотели придумать что-то лучше unet, я пробовал seq2seq подход, где время и глубина сопоставлены друг другу, но сдался, когда понял, что при предсказании n+1 вектора декодер предсказывает текущий, так как по L1 он близок к следующему. Впрочем решение с первого место имеет за собой ту же логику отказа от unet сегментации и переход к регрессии на vision transformer (рис. 7). Интересное решение добавить единый линейный слой для энкодера и декодера, при этом объединяя только веса, не делая резидуал соединение
В итоге мы заняли 28 место, взяли серебро, каждая идея из топа витала где-то рядом, но многое не докрутили. Соревнование, как мне кажется, вышло продуктивным и в академическом плане. Датасет OpenFWI - общепринятый, в статьях все меряются на нём. Соты побиты, новые архитектуры и методы предложены. Учёным из области остаётся собрать сливки и оформить статьи
❤28✍9👍4