causality links
Энтузиаст 🤙 дал небольшое интервью Forbes после победы в Yandex ML Prize. Если интересно послушать про то как пришел в науку, в какую сторону копаем и каких принципов придерживаемся -- включайте 👨💻
единственный комментарий
видимо про ламбу не понравилось
видимо про ламбу не понравилось
🌚10😁5🍌3❤1👍1
causality links
something’s cooking
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥21🔥5❤1
Transformers Learn Temporal Difference Methods for In-Context Reinforcement Learning
https://arxiv.org/pdf/2405.13861
https://arxiv.org/pdf/2405.13861
⚡4🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Alumni!
В Университете Иннополис есть клевое коммьюнити выпускников. Каждый год ребята собираются отметить выдающихся алюмней и просто поговорить, что происходит в университете сегодня и как дела у самих выпускников.
💖 Спустя 5 лет (жесть!) после выпуска наконец-то смог добраться до этой встречи: было оч круто оказаться в кругу знакомых лиц, с которыми связано много приятных воспоминаний и узнать как мы все дошли до жизни такой🌚
💕 В добавок ко всему, выпускники отметили меня как outstanding alumni (залутал худи) и отдельно подсветили наши потуги с @lua_b над стипендией.
В очередной раз для себя сделал пометку насколько повезло с университетом и людьми, которые собрались вокруг него. Community building круто, всем желаю такого🏡
В Университете Иннополис есть клевое коммьюнити выпускников. Каждый год ребята собираются отметить выдающихся алюмней и просто поговорить, что происходит в университете сегодня и как дела у самих выпускников.
💖 Спустя 5 лет (жесть!) после выпуска наконец-то смог добраться до этой встречи: было оч круто оказаться в кругу знакомых лиц, с которыми связано много приятных воспоминаний и узнать как мы все дошли до жизни такой
В очередной раз для себя сделал пометку насколько повезло с университетом и людьми, которые собрались вокруг него. Community building круто, всем желаю такого
Please open Telegram to view this post
VIEW IN TELEGRAM
💯18❤9🍓6😁1
Зарелизили первый публичный и огромный (100 миллиардов таплов!) датасет для In-Context Reinforcement Learning'a. Ждем ваших апвоутов ❤️
https://huggingface.co/papers/2406.08973
https://huggingface.co/papers/2406.08973
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Paper page - XLand-100B: A Large-Scale Multi-Task Dataset for In-Context
Reinforcement Learning
Reinforcement Learning
Join the discussion on this paper page
🔥31🥰1
Forwarded from ду́но
Привет! Это ду́но.
Мы группа исследователей на базе AIRI. Нас можно знать как экс-команду из Tinkoff Research, которая делала заметный движ с Reinforcement Learning: 7 статей на NeurIPS / ICML за последние три года.
Этот канал — точка сборки, где мы будем рассказывать про наши новые статьи, технологии, проекты, эвенты и возможности поработать с нами. Мы строим свою работу на нескольких принципах:
— Technology-first. Построение frontier-технологий и движение научного дискурса рука об руку. Мы не занимаемся публикациями ради публикаций, наша работа направлена на поиск и разработку новых технологий.
— No new science, no new technology. Мы понимаем, что построение новых технологий невозможно без поиска и влёта с ноги в новые (иногда неочевидные и рисковые) научные области. Мы постоянно ищем их и размышляем, за какими из них будущее.
— Deep connections. Мы взращиваем студентов, стараясь образовывать стабильные и долгосрочные связи с ними за счет активного менторства. Мы не даём 50 идей для рисерча🥴и не бросаем студентов на волю судьбы, мы занимаемся наукой и технологиями вместе.
Построить ASI не обещаем, но интересные вещи сделаем и поделимся ими здесь с вами.
Stay tuned.
- - —
Влад К., Саша Н., Никита Л., Илья З., Андрей П.
Мы группа исследователей на базе AIRI. Нас можно знать как экс-команду из Tinkoff Research, которая делала заметный движ с Reinforcement Learning: 7 статей на NeurIPS / ICML за последние три года.
Этот канал — точка сборки, где мы будем рассказывать про наши новые статьи, технологии, проекты, эвенты и возможности поработать с нами. Мы строим свою работу на нескольких принципах:
— Technology-first. Построение frontier-технологий и движение научного дискурса рука об руку. Мы не занимаемся публикациями ради публикаций, наша работа направлена на поиск и разработку новых технологий.
— No new science, no new technology. Мы понимаем, что построение новых технологий невозможно без поиска и влёта с ноги в новые (иногда неочевидные и рисковые) научные области. Мы постоянно ищем их и размышляем, за какими из них будущее.
— Deep connections. Мы взращиваем студентов, стараясь образовывать стабильные и долгосрочные связи с ними за счет активного менторства. Мы не даём 50 идей для рисерча🥴и не бросаем студентов на волю судьбы, мы занимаемся наукой и технологиями вместе.
Построить ASI не обещаем, но интересные вещи сделаем и поделимся ими здесь с вами.
Stay tuned.
- - —
Влад К., Саша Н., Никита Л., Илья З., Андрей П.
🔥17❤4👍4🥰1
https://h-frac.org/
Есть ощущение, что индекс хирша всегда был с нами, но на самом деле он был предложен только в 2005 году. Обосновывался не последним образом как число которое коррелирует ((кендалл в районе 0.3 - 0.4)) с научными наградами вроде нобелевки.
Спустя 15 лет внезапно выяснилось, что ученые заоптимизировали его в край и теперь корреляция в районе нуля (справедливо как минимум для физиков).
Решение оказалось простым — аллоцировать хирш фракционно среди соавторов. Этой прекрасной статье уже три (!!!) года, но системного перехода на эту метрику замечено не было🤭
Есть ощущение, что индекс хирша всегда был с нами, но на самом деле он был предложен только в 2005 году. Обосновывался не последним образом как число которое коррелирует ((кендалл в районе 0.3 - 0.4)) с научными наградами вроде нобелевки.
Спустя 15 лет внезапно выяснилось, что ученые заоптимизировали его в край и теперь корреляция в районе нуля (справедливо как минимум для физиков).
Решение оказалось простым — аллоцировать хирш фракционно среди соавторов. Этой прекрасной статье уже три (!!!) года, но системного перехода на эту метрику замечено не было
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🥰1😁1
Forwarded from ду́но
Мы ищем стажеров!
👩🌾
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
👩🌾
shorties — это персональная программа, в которой мы выращиваем таланты до полноценных Research Engineer’ов или Research Scientist’ов в зависимости от ваших интересов.🔭 Intern Research Scientist
Вы будете заниматься написанием статей на top-tier ИИ конференции (NeurIPS, ICLR, ICML) и участием в научном дискурсе: проведение экспериментов, проверка и генерация исследовательских идей, которые направлены на развитие научного знания.
🧪 Intern Research Engineer
Вы будете заниматься созданием новых frontier-технологий и применением Reinforcement Learning в реальных задачах.
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
🔥10👏7👍5🥰1
Клевая и простая идея, с которой дальше будет гораздо легче скейлить in-context rl.
https://news.1rj.ru/str/dunnolab/20
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ду́но
Рассказываем о нашей работе принятой на ICML 2024. В деталях.
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🔥17👍6💯6❤2🥰1
> два года назад: ура, нашу статью приняли на нипс
> сегодня: депрессия, потому что приняли только 1 статью на нипс
🫠
> сегодня: депрессия, потому что приняли только 1 статью на нипс
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯22😁9😢6🍌3🙏2🥰1
Forwarded from Does RL work yet? (Александр Никулин)
Прошла тут статейка на ICLR 2025, настрадались с ней ужас 🫠
❤10🔥10🏆4👏3🥰1
no rest for the wicked
думали взять небольшую передышку после сабмитов на ICML, но произошел нюанс
2 / 3 сабмитов на ICML с concurrent work, которые судя по абстракту делают примерно тоже самое
let the twitter war begin🔫 🔫 🔫 🔫 🔫
https://news.1rj.ru/str/rllinks/67
думали взять небольшую передышку после сабмитов на ICML, но произошел нюанс
2 / 3 сабмитов на ICML с concurrent work, которые судя по абстракту делают примерно тоже самое
let the twitter war begin
https://news.1rj.ru/str/rllinks/67
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Does RL work yet?
> ICML
> вызываешься ревьювером
> открываешь предварительный список статей, чтобы заматчится на ревью
> видишь статью подозрительно похожую на твою
> абстракт почти один в один как в твоей
> результаты тоже
лицо представили? а мне и представлять не надо.
> вызываешься ревьювером
> открываешь предварительный список статей, чтобы заматчится на ревью
> видишь статью подозрительно похожую на твою
> абстракт почти один в один как в твоей
> результаты тоже
лицо представили? а мне и представлять не надо.
🔥8🤯4👍2🥰1
https://news.1rj.ru/str/airi_research_institute/755
если вы поддерживаете благотворительные организации или хотите начать, мы сейчас в институте участвуем в MeetForCharity — благотворительном аукционе встреч с успешными успехами из разных сфер, от бизнеса и технологий до театра и кино
тоже участвую в этом году и выбрал «Дом с маяком» — хоспис, который поддерживает около 800 детей
мне кажется история очень здравая, там много интересных людей, которых просто так не вытащишь, а это отличная возможность и познакомиться и людям помочь 🙂
если вы поддерживаете благотворительные организации или хотите начать, мы сейчас в институте участвуем в MeetForCharity — благотворительном аукционе встреч с успешными успехами из разных сфер, от бизнеса и технологий до театра и кино
тоже участвую в этом году и выбрал «Дом с маяком» — хоспис, который поддерживает около 800 детей
мне кажется история очень здравая, там много интересных людей, которых просто так не вытащишь, а это отличная возможность и познакомиться и людям помочь 🙂
Telegram
Институт AIRI
AIRI х Meet For Charity
В рамках недели коллабораций ко Дню науки пять учёных AIRI примут участие в Meet For Charity — крупнейшем в России благотворительным аукционе. Слоты на аукционе — это возможность встретиться с исследователем и лично обсудить интересующие…
В рамках недели коллабораций ко Дню науки пять учёных AIRI примут участие в Meet For Charity — крупнейшем в России благотворительным аукционе. Слоты на аукционе — это возможность встретиться с исследователем и лично обсудить интересующие…
❤11🔥4🥰1
Forwarded from Does RL work yet?
Самое время подвести итоги сабмитов на ICLR 2025. Не все успели довести до фулл статей, но и воркшопы тоже хорошо!
Что-то уже есть на архиве (и еще будет обновлятся с новыми результатами), так что делюсь:
1. XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning (Main, Poster), by @howuhh and @suessmann and @zzmtsvv
2. Latent Action Learning Requires Supervision in the Presence of Distractors (Workshop, World Models), by @howuhh
3. Object-Centric Latent Action Learning (Workshop, World Models), by @cinemere
4. N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs (Workshop, SCOPE), by @suessmann
5. Yes, Q-learning Helps Offline In-Context RL (Workshop, SSI-FM), by @adagrad
Что-то уже есть на архиве (и еще будет обновлятся с новыми результатами), так что делюсь:
1. XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning (Main, Poster), by @howuhh and @suessmann and @zzmtsvv
2. Latent Action Learning Requires Supervision in the Presence of Distractors (Workshop, World Models), by @howuhh
3. Object-Centric Latent Action Learning (Workshop, World Models), by @cinemere
4. N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs (Workshop, SCOPE), by @suessmann
5. Yes, Q-learning Helps Offline In-Context RL (Workshop, SSI-FM), by @adagrad
🔥10
causality links
💥 Запустили именную стипендию для студентов Университета Иннополис! В августе вместе с @lua_b после очередных посиделок в District'e задались вопросом -- а почему нет стипендии для студентов УИ от выпускников? Решили, что нужно взять в свои руки и организовали…
совсем забыл рассказать, в этом году успешно продолжили поддерживать студентов УИ через стипендию 1519
в этот раз получилось раздать 30 стипендий (в прошлом году было 17!)
маленькая победа, ура 🙂
в этот раз получилось раздать 30 стипендий (в прошлом году было 17!)
маленькая победа, ура 🙂
1519.innopolis.university
1519 Scholarship
Scholarship by Innopolis University Alumni
❤12⚡3🥰3
в этом году буду курировать направления по Reinforcement Learning и World Models, залетайте, контент будет хороший 🙂
https://news.1rj.ru/str/airi_research_institute/825
https://news.1rj.ru/str/airi_research_institute/825
Telegram
Институт AIRI
⚡️Открываем прием заявок на Лето с AIRI 2025!
В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…
В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…
❤16🥰2