Forwarded from Хабр
Привет, Хабр! Меня зовут Татьяна Шаврина, я — лид команды NLP в Институте AIRI. Мы исследуем большие языковые модели и развиваем методы на стыке ИИ и лингвистики. В этом посте я собрала золотые, на мой взгляд, публикации, которые рассказывают о проблемах языковых моделей.
🔹 Интересная статья про масштабирование языковых моделей и закон Мура. Нейросети требуют больших вычислительных мощностей. Что будет дальше, если отмасштабировать наш прогресс? В статье классно описаны три расхожих утверждения об ИИ. Перед прочтением рекомендую посмотреть это видео, так как по тексту автор пытается разобраться, что из сказанного там правда.
🔹 Проблемы современного машинного обучения — системное описание, позволяющее быстро понять, какие ограничения встречаются на пути разработки моделей сейчас. Для NLP можно придумать ещё много всего, зато тут масса актуального для LLM.
🔹 Подробная статья про обучение самой большой модели для русского языка — YaLM на 100 млрд параметров. Хорошо написано о том, как модель обучалась и ускорилась в два раза. Хотя, конечно, хочется увидеть бенчмарк-метрики на прикладных задачах.
С командой в прошлом году поучаствовали в создании самой большой open-source языковой модели на 176 млрд параметров и 59 языков мира, BLOOM. Как исследователи мы занимаемся оценкой и интерпретацией LLM. Именно многоязычная аналитика результатов BLOOM — наша часть в международном проекте на 400+ авторов.
Мы работаем и над тем, чтобы масштабировать языковые модели на все языки мира, ведь сейчас они обучаются, в основном, на самых популярных. На Хабре постараемся больше рассказывать о малых языках России, с которыми работаем.
🔸 Сам себя не похвалишь… Хочу тут поделиться и своей статьёй про подходы zero-shot и few-shot в генерации, а также о том, как готовить генеративные модели, чтобы без обучения решать различные прикладные задачи. В институте мы используем zero-shot- и few-shot-методы для фундаментальных исследований. Нам интересно, как сделать определённую технологию с применением этих методов для малых языков России и какие задачи вообще можно решать с их помощью.
🔸 А ещё статья — пересказ работы Франсуа Шолле: как оценивать самые разные интеллектуальные системы и почему мы всё ещё не можем адекватно измерить интеллект. Рекомендую главу о том, что ожидать от идеального теста ИИ, и про первую попытку сделать такой тест. В прошлом году проводили с коллегами воркшоп по этой же теме. Надеемся сделать ещё мероприятия, посвящённые нашим направлениям исследований, — будем держать в курсе!
В AIRI мы часто работаем с «мышлением» нейросетей: исследуем логику моделей и смотрим, противоречит ли она теоретическому представлению о языке. Наши исследования позволяют понять, как учёные структурируют понимание о мире. Скоро расскажем об этом на Хабре, а также о том, как нейросети ищут информацию и обрабатывают данные. Подписывайтесь и следите за обновлениями!
🔹 Интересная статья про масштабирование языковых моделей и закон Мура. Нейросети требуют больших вычислительных мощностей. Что будет дальше, если отмасштабировать наш прогресс? В статье классно описаны три расхожих утверждения об ИИ. Перед прочтением рекомендую посмотреть это видео, так как по тексту автор пытается разобраться, что из сказанного там правда.
🔹 Проблемы современного машинного обучения — системное описание, позволяющее быстро понять, какие ограничения встречаются на пути разработки моделей сейчас. Для NLP можно придумать ещё много всего, зато тут масса актуального для LLM.
🔹 Подробная статья про обучение самой большой модели для русского языка — YaLM на 100 млрд параметров. Хорошо написано о том, как модель обучалась и ускорилась в два раза. Хотя, конечно, хочется увидеть бенчмарк-метрики на прикладных задачах.
С командой в прошлом году поучаствовали в создании самой большой open-source языковой модели на 176 млрд параметров и 59 языков мира, BLOOM. Как исследователи мы занимаемся оценкой и интерпретацией LLM. Именно многоязычная аналитика результатов BLOOM — наша часть в международном проекте на 400+ авторов.
Мы работаем и над тем, чтобы масштабировать языковые модели на все языки мира, ведь сейчас они обучаются, в основном, на самых популярных. На Хабре постараемся больше рассказывать о малых языках России, с которыми работаем.
🔸 Сам себя не похвалишь… Хочу тут поделиться и своей статьёй про подходы zero-shot и few-shot в генерации, а также о том, как готовить генеративные модели, чтобы без обучения решать различные прикладные задачи. В институте мы используем zero-shot- и few-shot-методы для фундаментальных исследований. Нам интересно, как сделать определённую технологию с применением этих методов для малых языков России и какие задачи вообще можно решать с их помощью.
🔸 А ещё статья — пересказ работы Франсуа Шолле: как оценивать самые разные интеллектуальные системы и почему мы всё ещё не можем адекватно измерить интеллект. Рекомендую главу о том, что ожидать от идеального теста ИИ, и про первую попытку сделать такой тест. В прошлом году проводили с коллегами воркшоп по этой же теме. Надеемся сделать ещё мероприятия, посвящённые нашим направлениям исследований, — будем держать в курсе!
В AIRI мы часто работаем с «мышлением» нейросетей: исследуем логику моделей и смотрим, противоречит ли она теоретическому представлению о языке. Наши исследования позволяют понять, как учёные структурируют понимание о мире. Скоро расскажем об этом на Хабре, а также о том, как нейросети ищут информацию и обрабатывают данные. Подписывайтесь и следите за обновлениями!
❤39
Сегодня в карточках рассказываем про тех, кто у руля программы «Лето с AIRI» в этом году ⛵️
Прием заявок на 2 недели науки продолжается по ссылке до 4 июня.
Всем удачи! 🍀
Прием заявок на 2 недели науки продолжается по ссылке до 4 июня.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20
Собрали самые часто задаваемые вопросы про «Лето с AIRI» в одном посте 👇
◻️ Можно ли подать заявку без аннотации, если пока нет собственных научных исследований?
Можно, шансы пройти на Школу есть даже без научных публикаций, главное – это рассказать, почему вы хотите поехать на школу в мотивационном письме.
◻️ Как добраться до места, в котором будет проходить Школа?
Сначала добраться до Казани, а далее на бесплатном автобусе или такси до места проведения мероприятия. Подробная локация и карта придут на почту всем финалистам.
◻️ Будет ли выдаваться сертификат по окончанию Школы?
Да, сертификат об участии будет выдаваться всем, кто посещал лекции, семинары, а также защитил проект.
◻️ Можно ли подать заявку школьникам?
В этом году на Школу приглашаются только молодые ученые, студенты и аспиранты старше 18-ти лет.
◻️ Что будет на Школе помимо лекций, семинаров, практики и постеров?
Студентов ждут вечерние мероприятия, активности от партнеров, а также командный спорт.
◻️ Могут ли принять участие в Школе иностранные студенты?
Да, в этом году в Школе могут принять участие иностранные студенты. Главное написать об этом в заявке в пункте «гражданство».
◻️ Насколько загруженными будут учебные дни?
Учеба будет длиться весь день с 9 утра до 6 вечера, также предусмотрен слот на работу по проектам с 18:45 до 20:00 и перерывы в течение дня.
◻️ Планируются ли выходные?
Выходной будет в воскресенье 23 июля.
Если у вас остались вопросы, пишите нам на event@airi.net✉
Подавайте заявки по ссылке до 4 июня, увидимся на Школе🤞
Можно, шансы пройти на Школу есть даже без научных публикаций, главное – это рассказать, почему вы хотите поехать на школу в мотивационном письме.
Сначала добраться до Казани, а далее на бесплатном автобусе или такси до места проведения мероприятия. Подробная локация и карта придут на почту всем финалистам.
Да, сертификат об участии будет выдаваться всем, кто посещал лекции, семинары, а также защитил проект.
В этом году на Школу приглашаются только молодые ученые, студенты и аспиранты старше 18-ти лет.
Студентов ждут вечерние мероприятия, активности от партнеров, а также командный спорт.
Да, в этом году в Школе могут принять участие иностранные студенты. Главное написать об этом в заявке в пункте «гражданство».
Учеба будет длиться весь день с 9 утра до 6 вечера, также предусмотрен слот на работу по проектам с 18:45 до 20:00 и перерывы в течение дня.
Выходной будет в воскресенье 23 июля.
Если у вас остались вопросы, пишите нам на event@airi.net
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20
В течение суток после заполнения формы вам придет письмо с подтверждением того, что заявка получена.
Если сегодня ответ не пришел, заполните форму еще раз или напишите, пожалуйста, нам на event@airi.net
Обязательно проверим, что ваша заявка загрузилась корректно.
Увидимся на Школе!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12
Save the date: новая ИИшница пройдет 8 июня в 15:30 🍳
Исследователи расскажут про то, как методы и модели искусственного интеллекта используются при создании различных роботов.
Трансляция будет, как всегда, на YouTube-канале AIRI. Подписывайтесь, чтобы не пропустить🍿
Исследователи расскажут про то, как методы и модели искусственного интеллекта используются при создании различных роботов.
Трансляция будет, как всегда, на YouTube-канале AIRI. Подписывайтесь, чтобы не пропустить🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
❤29
Осталось чуть больше 24 часов для подачи заявки на школу по искусственному интеллекту «Лето с AIRI»⏲
Участников будут ждать две недели науки с ведущими учеными из научно-исследовательских организаций и ВУЗов: лекции, семинары, а также постеры и проекты от партнеров Школы.
Самое время запрыгнуть в последний вагон и заполнить форму по ссылке до 4 июня включительно.
До встречи! 🍀
Участников будут ждать две недели науки с ведущими учеными из научно-исследовательских организаций и ВУЗов: лекции, семинары, а также постеры и проекты от партнеров Школы.
Самое время запрыгнуть в последний вагон и заполнить форму по ссылке до 4 июня включительно.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤38
#интересное_в_понедельник: ведущий научный сотрудник AIRI, заведующий центром глубинного обучения и байесовских методов ФКН ВШЭ Дмитрий Ветров в новом выпуске программы «900 секунд» 👀
Кандидат физико-математических наук рассказал, почему нейронные сети не программируются, а обучаются, из каких слоев они состоят, что такое deepfake и система распознавания голоса, и правда ли, что человек создал нечто более совершенное, чем его собственный мозг.
Смотрите по ссылке 👀
Кандидат физико-математических наук рассказал, почему нейронные сети не программируются, а обучаются, из каких слоев они состоят, что такое deepfake и система распознавания голоса, и правда ли, что человек создал нечто более совершенное, чем его собственный мозг.
Смотрите по ссылке 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26
Делимся расписанием ИИшницы «Наука о роботах», которая пройдет в этот четверг на YouTube-канале AIRI 🍳
▪️15:30 Вступление, ведущий мероприятия – Константин Яковлев, AIRI
▪️15:35 «Трансформерные модели в планировании поведения и управлении движением роботов» – Александр Панов, AIRI
▪️16:00 "Efficient Plane SLAM on Point Clouds" – Gonzalo Ferrer, Skoltech (доклад на английском)
▪️16:25 «Useful practices for solving dynamic collision avoidance with RL» – Александр Просвирин, исследователь в области ИИ (доклад на русском)
▪️16:50 «Концепция робот-ассистированных малоинвазивных операций» – Ольга Гергет, ИПУ РАН
▪️17:15 «Гибридные архитектуры для оценки карты глубины без разметки» – Илья Макаров, AIRI
▪️17:35 "Synthetic data: Learning self-driving cars in simulation" – Андрей Кузьминых, консультант по ИИ (доклад на русском)
До встречи в четверг! 🍿
▪️15:30 Вступление, ведущий мероприятия – Константин Яковлев, AIRI
▪️15:35 «Трансформерные модели в планировании поведения и управлении движением роботов» – Александр Панов, AIRI
▪️16:00 "Efficient Plane SLAM on Point Clouds" – Gonzalo Ferrer, Skoltech (доклад на английском)
▪️16:25 «Useful practices for solving dynamic collision avoidance with RL» – Александр Просвирин, исследователь в области ИИ (доклад на русском)
▪️16:50 «Концепция робот-ассистированных малоинвазивных операций» – Ольга Гергет, ИПУ РАН
▪️17:15 «Гибридные архитектуры для оценки карты глубины без разметки» – Илья Макаров, AIRI
▪️17:35 "Synthetic data: Learning self-driving cars in simulation" – Андрей Кузьминых, консультант по ИИ (доклад на русском)
До встречи в четверг! 🍿
❤25
Сегодняшний научный семинар начнется в 17:00 на на YouTube-канале AIRI, подключайтесь! 👾
Все подробности про доклад можно посмотреть по ссылке.
Все подробности про доклад можно посмотреть по ссылке.
❤21
Институт AIRI
Делимся расписанием ИИшницы «Наука о роботах», которая пройдет в этот четверг на YouTube-канале AIRI 🍳 ▪️15:30 Вступление, ведущий мероприятия – Константин Яковлев, AIRI ▪️15:35 «Трансформерные модели в планировании поведения и управлении движением роботов»…
Начинаем через 5 минут, подключайтесь! 🍿
❤10
Осталось несколько дней для подачи доклада на конференцию «Нейроинформатика» 💡
Избранные статьи, включенные в программу конференции и представленные на английском языке, будут опубликованы в серии "Studies in Computational Intelligence" (SCI) издательства Springer, а также в журнале Optical Memory and Neural Networks (индексируется в Scopus).
Доклады подаются через сайт конференции, удачи!
#конференция
Избранные статьи, включенные в программу конференции и представленные на английском языке, будут опубликованы в серии "Studies in Computational Intelligence" (SCI) издательства Springer, а также в журнале Optical Memory and Neural Networks (индексируется в Scopus).
Доклады подаются через сайт конференции, удачи!
#конференция
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13
Делимся подборкой с последней ИИшницы «Наука о роботах» 👾
📃«Трансформерные модели в планировании поведения и управлении движением роботов» – презентацию можно найти по ссылке.
📃«Useful practices for solving dynamic collision avoidance with RL» – сразу 3 case study от докладчика: #1 про расширение контекста и social-aware reward policy, #2 про расширение контекста и обучение 3M для сценариев с множеством агентов, DiPCAN из case study #3. Презентация Александра Просвирина тут.
📃«Концепция робот-ассистированных малоинвазивных операций» – делимся файлом с полезными ссылками, а также презентацией.
📃"Efficient Plane SLAM on Point Clouds" – все публикации можно найти по ссылке, презентация тут.
📃«Гибридные архитектуры для оценки карты глубины без разметки» – ссылка на статью Core A* на конференции IEEE, про которую рассказывал Илья Макаров в докладе, а также ссылка на презентацию.
📃"Synthetic data: Learning self-driving cars in simulation" – много ссылок есть внутри презентации, также делимся open-source библиотекой – это GYM-интерфейс с RLlib для обучения беспилотных автомобилей в CARLA-симуляторе на замкнутой территории.
⬇ Папку со всеми файлами от докладчиков можно скачать по ссылке.
📃«Трансформерные модели в планировании поведения и управлении движением роботов» – презентацию можно найти по ссылке.
📃«Useful practices for solving dynamic collision avoidance with RL» – сразу 3 case study от докладчика: #1 про расширение контекста и social-aware reward policy, #2 про расширение контекста и обучение 3M для сценариев с множеством агентов, DiPCAN из case study #3. Презентация Александра Просвирина тут.
📃«Концепция робот-ассистированных малоинвазивных операций» – делимся файлом с полезными ссылками, а также презентацией.
📃"Efficient Plane SLAM on Point Clouds" – все публикации можно найти по ссылке, презентация тут.
📃«Гибридные архитектуры для оценки карты глубины без разметки» – ссылка на статью Core A* на конференции IEEE, про которую рассказывал Илья Макаров в докладе, а также ссылка на презентацию.
📃"Synthetic data: Learning self-driving cars in simulation" – много ссылок есть внутри презентации, также делимся open-source библиотекой – это GYM-интерфейс с RLlib для обучения беспилотных автомобилей в CARLA-симуляторе на замкнутой территории.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤17
Рассказываем про дискуссии на Петербургском международном экономическом форуме, в которых примут участие исследователи AIRI ✨
– 15 июня , 17:00–18:15
Семен Буденный и Иван Оселедец в дискуссии «Сингулярность наступила: ИИ VS человек – какой будет новая реальность?», посмотреть онлайн можно тут.
– 16 июня, 10:30–11:30
Иван Оселедец в дискуссии «ИИ: фундамент экономики будущего и маяк российского технологического суверенитета», трансляция по ссылке.
– 16 июня , 12:00–13:00
Евгений Бурнаев в дискуссии «ИИ в высшем образовании – прорыв или деградация?», подключайтесь к трансляции.
– 16 июня, 12:00–13:00
Иван Оселедец в дискуссии «Преодоление глобального цифрового кризиса – есть ли выход?», трансляция тут.
Завтра расскажем все подробности про дискуссию 17 июля, в которой примут участие сразу пять исследователей AIRI 🚀
– 15 июня , 17:00–18:15
Семен Буденный и Иван Оселедец в дискуссии «Сингулярность наступила: ИИ VS человек – какой будет новая реальность?», посмотреть онлайн можно тут.
– 16 июня, 10:30–11:30
Иван Оселедец в дискуссии «ИИ: фундамент экономики будущего и маяк российского технологического суверенитета», трансляция по ссылке.
– 16 июня , 12:00–13:00
Евгений Бурнаев в дискуссии «ИИ в высшем образовании – прорыв или деградация?», подключайтесь к трансляции.
– 16 июня, 12:00–13:00
Иван Оселедец в дискуссии «Преодоление глобального цифрового кризиса – есть ли выход?», трансляция тут.
Завтра расскажем все подробности про дискуссию 17 июля, в которой примут участие сразу пять исследователей AIRI 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤31
Спасибо всем, кто подал заявку на «Лето с AIRI»🔥
Конкурсный отбор завершился сегодня. Научный комитет провел оценку заявок и выбрал 80 финалистов. Письма с результатами уже отправлены на почты, которые указывались в анкете. Если вам не пришел ответ, то рекомендуем проверить папку «спам» или написать нам на event@airi.net✉
Лекции Школы будут размещены на канале AIRI. Подписывайтесь, чтобы не пропустить 🖇
Конкурсный отбор завершился сегодня. Научный комитет провел оценку заявок и выбрал 80 финалистов. Письма с результатами уже отправлены на почты, которые указывались в анкете. Если вам не пришел ответ, то рекомендуем проверить папку «спам» или написать нам на event@airi.net
Лекции Школы будут размещены на канале AIRI. Подписывайтесь, чтобы не пропустить 🖇
Please open Telegram to view this post
VIEW IN TELEGRAM
❤38
Продолжаем рассказывать про выступления исследователей AIRI на ПМЭФ 👀
На сессии «AI Journey: путешествие в мир искусственного интеллекта», которая начнется завтра в 14:00, спикеры обсудят сразу несколько актуальных вопросов:
– Какие новейшие разработки и тренды можно выделить в области AI/ML?
– Какие результаты могут быть достигнуты в направлении AGI?
– Как применяется искусственный интеллект сегодня и как он влияет на нашу жизнь?
Подключайтесь к онлайн-трансляции📼
На сессии «AI Journey: путешествие в мир искусственного интеллекта», которая начнется завтра в 14:00, спикеры обсудят сразу несколько актуальных вопросов:
– Какие новейшие разработки и тренды можно выделить в области AI/ML?
– Какие результаты могут быть достигнуты в направлении AGI?
– Как применяется искусственный интеллект сегодня и как он влияет на нашу жизнь?
Подключайтесь к онлайн-трансляции
Please open Telegram to view this post
VIEW IN TELEGRAM
❤22
Сегодня в рубрике #интересное_в_понедельник подборка недавних интервью и выступлений исследователей AIRI 👇
▪️Интервью Ольги Кардымон для Газета.ру о биоинформатике и применении ИИ для решения биологических задач.
▪️Дискуссия на канале ODS AI с Елизаветой Гончаровой о прикладном NLP, применении ChatGPT-like моделей, о перспективах генерации кода языковыми моделями и о важности данных и разметки.
▪️Колонка Дмитрия Ветрова для Forbes о страхах и регулировании технологий.
▪️Запись научного семинара «Графовые нейронные сети для поиска новых кристаллических структур», который прошел 7 июня.
▪️Выступление Татьяны Шавриной на Data Fest 2023 с темой "AI Alignment in Large Language Models".
▪️Запись трансляции ИИшницы «Наука о роботах» для тех, кто пропустил прямой эфир.
Завтра расскажем про семинар, который пройдет в среду, а в конце недели поделимся подборкой магистратур от исследователей👀
▪️Интервью Ольги Кардымон для Газета.ру о биоинформатике и применении ИИ для решения биологических задач.
▪️Дискуссия на канале ODS AI с Елизаветой Гончаровой о прикладном NLP, применении ChatGPT-like моделей, о перспективах генерации кода языковыми моделями и о важности данных и разметки.
▪️Колонка Дмитрия Ветрова для Forbes о страхах и регулировании технологий.
▪️Запись научного семинара «Графовые нейронные сети для поиска новых кристаллических структур», который прошел 7 июня.
▪️Выступление Татьяны Шавриной на Data Fest 2023 с темой "AI Alignment in Large Language Models".
▪️Запись трансляции ИИшницы «Наука о роботах» для тех, кто пропустил прямой эфир.
Завтра расскажем про семинар, который пройдет в среду, а в конце недели поделимся подборкой магистратур от исследователей
Please open Telegram to view this post
VIEW IN TELEGRAM
❤22