Forwarded from ду́но
Мы ищем стажеров!
👩🌾
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
👩🌾
shorties — это персональная программа, в которой мы выращиваем таланты до полноценных Research Engineer’ов или Research Scientist’ов в зависимости от ваших интересов.🔭 Intern Research Scientist
Вы будете заниматься написанием статей на top-tier ИИ конференции (NeurIPS, ICLR, ICML) и участием в научном дискурсе: проведение экспериментов, проверка и генерация исследовательских идей, которые направлены на развитие научного знания.
🧪 Intern Research Engineer
Вы будете заниматься созданием новых frontier-технологий и применением Reinforcement Learning в реальных задачах.
Тестовые задания и подробные описания позиций можно найти по ссылкам выше, дедлайн подачи заявки — 15 августа.
- - —
@dunnolab
🔥10👏7👍5🥰1
Клевая и простая идея, с которой дальше будет гораздо легче скейлить in-context rl.
https://news.1rj.ru/str/dunnolab/20
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ду́но
Рассказываем о нашей работе принятой на ICML 2024. В деталях.
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🌻Контекст🌻
In-Context RL позволяет обучать агентов способных на адаптацию к новым задачам прямо во время инференеса, то есть zero-shot. При этом не происходит обновлений весов модели или обучения…
🔥17👍6💯6❤2🥰1
> два года назад: ура, нашу статью приняли на нипс
> сегодня: депрессия, потому что приняли только 1 статью на нипс
🫠
> сегодня: депрессия, потому что приняли только 1 статью на нипс
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯22😁9😢6🍌3🙏2🥰1
Forwarded from Does RL work yet? (Александр Никулин)
Прошла тут статейка на ICLR 2025, настрадались с ней ужас 🫠
❤10🔥10🏆4👏3🥰1
no rest for the wicked
думали взять небольшую передышку после сабмитов на ICML, но произошел нюанс
2 / 3 сабмитов на ICML с concurrent work, которые судя по абстракту делают примерно тоже самое
let the twitter war begin🔫 🔫 🔫 🔫 🔫
https://news.1rj.ru/str/rllinks/67
думали взять небольшую передышку после сабмитов на ICML, но произошел нюанс
2 / 3 сабмитов на ICML с concurrent work, которые судя по абстракту делают примерно тоже самое
let the twitter war begin
https://news.1rj.ru/str/rllinks/67
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Does RL work yet?
> ICML
> вызываешься ревьювером
> открываешь предварительный список статей, чтобы заматчится на ревью
> видишь статью подозрительно похожую на твою
> абстракт почти один в один как в твоей
> результаты тоже
лицо представили? а мне и представлять не надо.
> вызываешься ревьювером
> открываешь предварительный список статей, чтобы заматчится на ревью
> видишь статью подозрительно похожую на твою
> абстракт почти один в один как в твоей
> результаты тоже
лицо представили? а мне и представлять не надо.
🔥8🤯4👍2🥰1
https://news.1rj.ru/str/airi_research_institute/755
если вы поддерживаете благотворительные организации или хотите начать, мы сейчас в институте участвуем в MeetForCharity — благотворительном аукционе встреч с успешными успехами из разных сфер, от бизнеса и технологий до театра и кино
тоже участвую в этом году и выбрал «Дом с маяком» — хоспис, который поддерживает около 800 детей
мне кажется история очень здравая, там много интересных людей, которых просто так не вытащишь, а это отличная возможность и познакомиться и людям помочь 🙂
если вы поддерживаете благотворительные организации или хотите начать, мы сейчас в институте участвуем в MeetForCharity — благотворительном аукционе встреч с успешными успехами из разных сфер, от бизнеса и технологий до театра и кино
тоже участвую в этом году и выбрал «Дом с маяком» — хоспис, который поддерживает около 800 детей
мне кажется история очень здравая, там много интересных людей, которых просто так не вытащишь, а это отличная возможность и познакомиться и людям помочь 🙂
Telegram
Институт AIRI
AIRI х Meet For Charity
В рамках недели коллабораций ко Дню науки пять учёных AIRI примут участие в Meet For Charity — крупнейшем в России благотворительным аукционе. Слоты на аукционе — это возможность встретиться с исследователем и лично обсудить интересующие…
В рамках недели коллабораций ко Дню науки пять учёных AIRI примут участие в Meet For Charity — крупнейшем в России благотворительным аукционе. Слоты на аукционе — это возможность встретиться с исследователем и лично обсудить интересующие…
❤11🔥4🥰1
Forwarded from Does RL work yet?
Самое время подвести итоги сабмитов на ICLR 2025. Не все успели довести до фулл статей, но и воркшопы тоже хорошо!
Что-то уже есть на архиве (и еще будет обновлятся с новыми результатами), так что делюсь:
1. XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning (Main, Poster), by @howuhh and @suessmann and @zzmtsvv
2. Latent Action Learning Requires Supervision in the Presence of Distractors (Workshop, World Models), by @howuhh
3. Object-Centric Latent Action Learning (Workshop, World Models), by @cinemere
4. N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs (Workshop, SCOPE), by @suessmann
5. Yes, Q-learning Helps Offline In-Context RL (Workshop, SSI-FM), by @adagrad
Что-то уже есть на архиве (и еще будет обновлятся с новыми результатами), так что делюсь:
1. XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning (Main, Poster), by @howuhh and @suessmann and @zzmtsvv
2. Latent Action Learning Requires Supervision in the Presence of Distractors (Workshop, World Models), by @howuhh
3. Object-Centric Latent Action Learning (Workshop, World Models), by @cinemere
4. N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs (Workshop, SCOPE), by @suessmann
5. Yes, Q-learning Helps Offline In-Context RL (Workshop, SSI-FM), by @adagrad
🔥10
causality links
💥 Запустили именную стипендию для студентов Университета Иннополис! В августе вместе с @lua_b после очередных посиделок в District'e задались вопросом -- а почему нет стипендии для студентов УИ от выпускников? Решили, что нужно взять в свои руки и организовали…
совсем забыл рассказать, в этом году успешно продолжили поддерживать студентов УИ через стипендию 1519
в этот раз получилось раздать 30 стипендий (в прошлом году было 17!)
маленькая победа, ура 🙂
в этот раз получилось раздать 30 стипендий (в прошлом году было 17!)
маленькая победа, ура 🙂
1519.innopolis.university
1519 Scholarship
Scholarship by Innopolis University Alumni
❤12⚡3🥰3
в этом году буду курировать направления по Reinforcement Learning и World Models, залетайте, контент будет хороший 🙂
https://news.1rj.ru/str/airi_research_institute/825
https://news.1rj.ru/str/airi_research_institute/825
Telegram
Институт AIRI
⚡️Открываем прием заявок на Лето с AIRI 2025!
В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…
В этом году мы запускаем Школу совместно с ТГУ. Программа пройдет в Томске с 30 июня по 10 июля. Это отличная возможность поработать с экспертами в области ИИ, прокачать навыки и погрузиться в исследовательскую…
❤16🥰2
чуть подробнее написали, что ожидается от рисерч пропозала
примером делился до этого в комментариях, но вдруг кто не видел, то вот
https://news.1rj.ru/str/airi_research_institute/870
примером делился до этого в комментариях, но вдруг кто не видел, то вот
https://news.1rj.ru/str/airi_research_institute/870
Telegram
Институт AIRI
Для тех, кто впервые готовит Research Proposal: рассказываем, с чего начать, зачем он нужен и как его подготовить ⤵️
Research Proposal — это способ обосновать и спланировать будущую работу: показать, что вы понимаете контекст, видите важную задачу, умеете…
Research Proposal — это способ обосновать и спланировать будущую работу: показать, что вы понимаете контекст, видите важную задачу, умеете…
❤6🥰3❤🔥2
Forwarded from Институт AIRI
Новый шаг в управлении роботами и оптимизации индустриальных процессов 🤖
Исследователи AIRI разработали Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с подкреплением. Благодаря этому Vintix самостоятельно корректирует и улучшает свои действия, получая минимальную обратную связь от пользователя.
Техническая реализация Vintix опирается на расширенный контекст трансформера. Благодаря сжатию данных — состояние-действие-награда в один токен — модель анализирует в 3 раза больше информации по сравнению с аналогами: JAT от HugginFace и GATO от Google DeepMind. При этом архитектура устойчива к шуму и частичной наблюдаемости среды — Vintix успешно справляется с задержками и неполными данными, что критически важно для промышленного применения.
Vintix может быть полезной в разных областях. Например, применяться для автоматизации задач на производственных линиях и оптимизации маршрутов складских роботов, а в сфере энергетики подобные системы способны управлять распределением нагрузки для более эффективного использования ресурсов. Научная статья будет представлена на конференции ICML в июле 2025 года.
Подробнее про исследование — в материале Forbes.
Научная статья | GitHub
Исследователи AIRI разработали Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с подкреплением. Благодаря этому Vintix самостоятельно корректирует и улучшает свои действия, получая минимальную обратную связь от пользователя.
Техническая реализация Vintix опирается на расширенный контекст трансформера. Благодаря сжатию данных — состояние-действие-награда в один токен — модель анализирует в 3 раза больше информации по сравнению с аналогами: JAT от HugginFace и GATO от Google DeepMind. При этом архитектура устойчива к шуму и частичной наблюдаемости среды — Vintix успешно справляется с задержками и неполными данными, что критически важно для промышленного применения.
Vintix может быть полезной в разных областях. Например, применяться для автоматизации задач на производственных линиях и оптимизации маршрутов складских роботов, а в сфере энергетики подобные системы способны управлять распределением нагрузки для более эффективного использования ресурсов. Научная статья будет представлена на конференции ICML в июле 2025 года.
Подробнее про исследование — в материале Forbes.
Научная статья | GitHub
🔥8❤4👏3🥴2🥰1😁1😱1
https://news.1rj.ru/str/complete_ai/684
хорошая коллаба получилась, затащили рль для реверс инжиниринга деталей, топ работа как обычно от @adagrad @suessmann и @Howuhh
хорошая коллаба получилась, затащили рль для реверс инжиниринга деталей, топ работа как обычно от @adagrad @suessmann и @Howuhh
Telegram
Complete AI
⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning
Архитектура представляет собой мультимодальную LLM, которая на вход…
Архитектура представляет собой мультимодальную LLM, которая на вход…
🔥8❤2🥰2
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ду́но
📘 Годовой отчет за период июнь 2024–июнь 2025
-> Девиз года: «Сохраняя исследовательские традиции»
В соответствии с научными традициями и вызовами времени, наша команда в 2024 году продолжила уверенное движение по вектору фундаментальных и прикладных исследований…
-> Девиз года: «Сохраняя исследовательские традиции»
В соответствии с научными традициями и вызовами времени, наша команда в 2024 году продолжила уверенное движение по вектору фундаментальных и прикладных исследований…
🔥10🥰5❤1
Forwarded from ду́но
This media is not supported in your browser
VIEW IN TELEGRAM
Сейчас суперактивно развивается сегмент бюджетной домашней робототехники на коленке — LeRobot от HuggingFace.
Можно на 3д принтере распечатать детали, за дешево купить приводы и дома на коленке собрать мини-робота.
Например, собрать SO-100 в домашних условиях стоит около 20k рублей, крутяк?
На прошлых выходных @suessmann поучаствовал в хакатоне от HuggingFace: нужно было сделать демо по использованию таких роботов. Илья в домашних условиях собрал робота и заимплементил крутейшее демо для телеоператоров с помощью телефона!
Результат на видосе, если хотите что-то такое же дома провернуть, то вот код: https://github.com/suessmann/daxie
Если вам интересно поработать с нами в направлении RL/VLA и около — скоро откроем набор тут.
А если уже горит и есть оформленные рисерч пропозалы, не ждите — пишите сразу @howuhh.
- - —
@dunnolab
Можно на 3д принтере распечатать детали, за дешево купить приводы и дома на коленке собрать мини-робота.
Например, собрать SO-100 в домашних условиях стоит около 20k рублей, крутяк?
На прошлых выходных @suessmann поучаствовал в хакатоне от HuggingFace: нужно было сделать демо по использованию таких роботов. Илья в домашних условиях собрал робота и заимплементил крутейшее демо для телеоператоров с помощью телефона!
Результат на видосе, если хотите что-то такое же дома провернуть, то вот код: https://github.com/suessmann/daxie
Если вам интересно поработать с нами в направлении RL/VLA и около — скоро откроем набор тут.
А если уже горит и есть оформленные рисерч пропозалы, не ждите — пишите сразу @howuhh.
- - —
@dunnolab
❤24🥰4👍3
Forwarded from ду́но
Открыли набор на практику по направлениям RL / VLA / IL.
У нашей группы большой опыт в области RL: имеем публикации на самых топовых конференциях [см. Наши статьи]. Если вы хотите писать научные статьи, сдвигать соты, и развиваться как исследователь в области Reinforcement Learning (RL) и вокруг — то вам к нам!
Подробное описание позиции и тестовое задание можно найти по ссылке выше, дедлайн подачи заявки — 10-го ноября.
- - —
@dunnolab
У нашей группы большой опыт в области RL: имеем публикации на самых топовых конференциях [см. Наши статьи]. Если вы хотите писать научные статьи, сдвигать соты, и развиваться как исследователь в области Reinforcement Learning (RL) и вокруг — то вам к нам!
Resident Research Scientist — RL / VLA / IL
Вы будете заниматься написанием статей на top-tier конференции (NeurIPS, ICLR, ICML), проводить эксперименты и предлагать новые исследовательские идеи.
Требования:
- Наличие исследовательских идей.
- Начитанность, знание и умение рассказать о последних заинтересовавших статьях с A* конференций.
- Cамостоятельный опыт с чем-то из RL, Imitation Learning, Vision-Language-Action models и всем вокруг.
Подробное описание позиции и тестовое задание можно найти по ссылке выше, дедлайн подачи заявки — 10-го ноября.
- - —
@dunnolab
dunnolab on Notion
Resident Research Scientist — RL / VLA / IL | Notion
Про практику
❤9
Forwarded from Неискусственный интеллект (Илья Склюев)
This media is not supported in your browser
VIEW IN TELEGRAM
Её разработали в Институте AIRI. VLA Arena позволяет запускать роботов в виртуальной среде, а также подключать реальные устройства: сейчас поддерживаются компактные манипуляторы LeRobot SO-100 и SO-101 от Hugging Face.
Если у пользователя нет робота, он может сравнивать модели в виртуальной среде, а если робот есть — подключить его и проверить, как различные модели управляют его действиями.
Так можно легко оценить, какие VLA-сборки лучше всего подходят к конкретному "железу".
Аналоги, вроде RoboArena от учёных из Беркли и Стэнфорда, оперируют роботами, стоимость которых исчисляется десятками тысяч долларов. Воспользоваться ими можно только в исследовательских лабораториях. VLA Arena же адаптирована специально для демократичных LeRobot стоимостью до 30 тысяч рублей.
Сейчас для тестов доступны открытые VLA-модели (Vision-Language-Action):
Они обладают способностью понимать и выполнять инструкции на естественном языке. Такие модели могут работать в различных сценариях, включая сложные задачи, требующие обобщения и анализа контекста.
Пользователи могут оценивать производительность моделей в различных сценариях, в том числе на русском языке. Итоговые оценки в рейтинге будут основаны на рандомизированных тестах.
Платформа также содержит чистые датасеты для LeRobot из открытых источников, размеченные и переведённые на русский язык для помощи разработчикам в обучении собственных моделей для LeRobot.
Первый запуск платформы рассчитан на срок до 3 месяцев, разработчики будут собирать обратную связь. Тестовый доступ открыли буквально только что: попробовать VLA Arena можно уже сейчас.
@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥5❤🔥3