Forwarded from Институт AIRI
Финальная ИИшница этого года пройдет 5 и 6 декабря 🍳
Делимся подробным расписанием онлайн-митапа, где исследователи расскажут про свои статьи на NeurIPS 2024.
5 декабря: YouTube, VK Bидео
6 декабря: YouTube, VK Bидео
Ведущий ИИшницы — Артур Кадурин, AIRI.
До встречи!
Делимся подробным расписанием онлайн-митапа, где исследователи расскажут про свои статьи на NeurIPS 2024.
5 декабря: YouTube, VK Bидео
◼️ 15:35
Вводный доклад про Optimal Transport — Александр Коротин, AIRI, Сколтех◼️ 15:45
Optimal Flow Matching: Learning Straight Trajectories in Just One Step — Никита Корнилов, МФТИ, Сколтех◼️ 16:05
Adversarial Schrödinger Bridge Matching — Даниил Селиханович, Сколтех◼️ 16:25
Light Unbalanced Optimal Transport — Милена Газдиева, Сколтех◼️ 16:45
Rethinking Optimal Transport in Offline Reinforcement Learning — Арип Асадулаев, AIRI, МФТИ, ИТМО◼️ 17:05
Energy-Guided Continuous Entropic Barycenter Estimation for General Costs — Александр Колесов, Сколтех◼️ 17:25
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport — Назар Бузун, AIRI◼️ 17:45
On the Optimal Time Complexities in Decentralized Stochastic Asynchronous Optimization
Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations
Shadowheart SGD: Distributed Asynchronous SGD with Optimal Time Complexity Under Arbitrary Computation and Communication Heterogeneity
Improving the Worst-Case Bidirectional Communication Complexity for Nonconvex Distributed Optimization under Function Similarity
— Александр Тюрин, AIRI◼️ 19:05
Group and Shuffle: Efficient Structured Orthogonal Parametrization — Михаил Горбунов, EPFL
6 декабря: YouTube, VK Bидео
◼️ 15:35
∇2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials — Кузьма Храбров, AIRI◼️ 15:55
XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX — Александр Никулин, AIRI◼️ 16:15
BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack — Юрий Куратов, AIRI, МФТИ◼️ 16:35
RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation — Антон Антонов, AIRI◼️ 16:55
HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach — Максим Николаев, AIRI◼️ 17:15
EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas — Михаил Мозиков, AIRI, МИСИС
Ведущий ИИшницы — Артур Кадурин, AIRI.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍12🔥5❤3👎1
Привет, чемпионы!
👾 Почти три месяца назад я был на корпоративном хакатоне, где у меня произошло сильное потрясение от нового опыта разработки.
Что произошло?
Все было так. Хакатон начался в три часа дня. Мы с командой достаточно быстро сошлись в идее для проекта. Сели писать код. Увы, спустя 6 часов ничего не было готово, а мы уставшие сидели и тупо пялили в экран. Классическая ситуация, когда заранее не были готовы концепт и прототип.
Понимая, что идем к провалу, мы решили пойти на риск, кое-что оплатили и начали пробовать другой подход. Назовем этот подход R.
👍 Как итог, спустя время мы ошарашенные сидим и думаем, как такое возможно? Нам удалось собрать задуманное решение за 15 минут. При этом качество решения было высоким. Мы делали web приложение с интерактивными элементами и своей базой данных для хранений заранее заготовленных изображений.
И вотмы, три синьора, с суммарным опытом 21+ лет сидим и осознаем, что навыки каждого из нас просто не пригодились. Машина написала весь код сама, реализовав наши компетенции в легкую.
Утром мы презентовали решение. Честно скажу - наша задумка не выиграла хакатон, хоть мы и получили зрительскую симпатию. Однако меня это уже совсем не волновало. Меня распирало от того, что я теперь очень хотел тестировать этот R подход на других своих задумках.
В тот же вечер я собрал прототип web приложения в телеграм и выпал уже окончательно. На фриланс биржах люди берут за эту работу неплохие деньги, а я взял и собрал это сам за 20 минут. Не верю…
Я продолжил экспериментировать и думать, что еще я могу реализовать таким подходом?!
🎚️ Вам интересно, что было дальше? Накидайте реакций 🔥
Что произошло?
Все было так. Хакатон начался в три часа дня. Мы с командой достаточно быстро сошлись в идее для проекта. Сели писать код. Увы, спустя 6 часов ничего не было готово, а мы уставшие сидели и тупо пялили в экран. Классическая ситуация, когда заранее не были готовы концепт и прототип.
Понимая, что идем к провалу, мы решили пойти на риск, кое-что оплатили и начали пробовать другой подход. Назовем этот подход R.
И вот
Утром мы презентовали решение. Честно скажу - наша задумка не выиграла хакатон, хоть мы и получили зрительскую симпатию. Однако меня это уже совсем не волновало. Меня распирало от того, что я теперь очень хотел тестировать этот R подход на других своих задумках.
В тот же вечер я собрал прототип web приложения в телеграм и выпал уже окончательно. На фриланс биржах люди берут за эту работу неплохие деньги, а я взял и собрал это сам за 20 минут. Не верю…
Я продолжил экспериментировать и думать, что еще я могу реализовать таким подходом?!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥158👍17⚡8👎6❤3😁2🏆2🦄1
Про мой опыт разработки ботов и генеративный виральный маркетинг в телеграмм вы могли читать ранее.
Прокачиваясь в этой тематике, я с моим другом Стасом придумал сделать web компоненту для нашего бота с масками, т.к нам
Я обучил своему подходу Стаса, и мы начали много экспериментировать и выдумывать хитрые связки уже вместе. Мы прокачались в генерациях проектов и их публикациях во внешний мир с одного промпта.
Таких результатов нельзя было добиться через просто чатовые модели типо - ChatGPT, только LLM агентов.
Пока мы разгоняли и набивали шишки с подходом R, Стас подсел на еще один подход, назовем его «Подход C». Оказалось, что эти подходы хорошо друг друга дополняли в зависимости от сложности задачи.
Выполняя совместные проекты, мы решили записать небольшой продвинутый интенсив по тому, как можно ускорять и выводить на новый уровень разработку. По сути это продвинутое программирование с помощью генеративного AI.
🤯 Черт возьми, да мы же
Эйфория распирала, ведь это по сути оружие на миллионы рублей! Мы взяли паузу немного подумать. Спустя день мы сменили концепт и направили фокус на развитие уже не интенсива, а клуба универсальных AI программистов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1⚡143👍10👎9❤7🔥3 2🦄1
Снимали видео, систематизировали материал, готовили практику. И вот мы со Стасом запускаем свой AI интенсив в тестовом режиме. Этот курс меняет парадигму разработки!
Он будет вам сверх полезен, если Вы:
🐳 Уже умете программировать: вы научитесь кратно быстрее разрабатывать проекты и высвобождать кучу времени для творчества.
🦈 Только входите в IT и хотите значимо ускориться: вы снизите себе порог вхождения и получите умного напарника рядом.
🐠 Совсем еще не умеете программировать, но хотите создавать проекты уже сейчас будто бы у вас 8 летний опыт в IT.
Наш живой гайд будет собирать комьюнити AI энтузиастов. Вместе со студентами курса вы будете создавать безумные проекты, программирую в паре с генеративным AI.
🎁
Please open Telegram to view this post
VIEW IN TELEGRAM
1👎50👍19🔥9❤4🏆2
This media is not supported in your browser
VIEW IN TELEGRAM
0 строчек кода написано руками и при этом полная свобода фантазии при реализации.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👎44👍17🔥6❤1😁1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Ребята из Anthropic показали БУДУЩЕЕ, а заодно нагнули OpenAI — они придумали универсальный способ для нейросетей работать с информацией на любых ресурсах 😮
Знакомьтесь, MCP (Model Context Protocol) — «мостик», который позволяет ИИ работать с текстом в любом месте, в том числе править его.
Вот представьте: вы пишете код с ИИ, говорите «зайди в мой GitHub и внеси правки», а оно берет и ДЕЛАЕТ. При этом протокол открытый, интегрировать можно куда угодно, хоть в собственную локальную базу данных, хоть в Notion (но еще пока нет).
Из минусов: пока работает только с их десктопным приложением (оно такое себе).
Please open Telegram to view this post
VIEW IN TELEGRAM
1👎20👍16❤3🎃1
Просишь новую Сири написать девушке, что любишь её, новая Сири так и пишет – я люблю её
Кого её, уже пусть «кожаные» сами разбираются🥰
🎚️ @datafeeling
Кого её, уже пусть «кожаные» сами разбираются
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁47👎8❤4🔥4👍2
Исследователи из Yandex Research разработали новый подход генерации изображений и назвали Switty (Scale-wise transformer for text-to-image synthesis). Он не уступает диффузионным моделям по качеству, но при этом намного быстрее. Switti генерирует изображения всего за 0,1 секунды - буквально космическая скорость!
Для сравнения: это в 7 раз быстрее, чем у оригинального SDXL и в 2 раза быстрее, чем у ускоренных версий, таких как SDXL-Turbo и SDXL-DMD2! (Надеюсь, вы следите за разработками в сфере генеративных нейросетей и знаете, что такое SDXL-Turbo и SDXL-DMD2😅).
Хоть модель и создана на базе авторегрессионных моделей, Switti уже превосходит как предыдущие AR, так и зарубежные диффузионные модели в скорости.
Демка на huggingface
Статья на arxiv
А вот тут код
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍10❤1
Буст в мире языковых моделей: T-Pro и T-Lite от «Т-Технологий»
🐺 Группа «Т-Технологии», куда входит и Т–Банк, представила две новые открытые языковые модели на русском языке — T-Pro и обновленную T-Lite, которые по результатам индустриальных бенчмарков «ruMMLU», «Ru Arena Hard» и еще ряда превосходят существующие аналоги.
🏆 Модель T-Pro с 32 миллиардами параметров занимает первое место среди открытых моделей на русском языке, а T-Lite с 7 миллиардами параметров — лучшее решение в категории до 10 миллиардов параметров. Эти модели позволяют российским компаниям сэкономить до 90% затрат на разработку собственных решений. То есть теперь изи использовать мощные инструменты для автоматизации процессов, создания чат-ботов и ассистентов.
🦈 Фишка у T-Pro и T-Lite в высокой точности, контекстуальности и адаптивности - это позволяет легко настраивать их под специфические задачи различных доментов, от финансов до медицины. Например, T-Lite лучше улавливает контекст и выдает более точные ответы, а T-Pro позволяет дообучаться под конкретные
бизнес-задачи.
🎚 ️ Почему это круто? Появление и последующих языковых моделей не только ускорит развитие кучу бизнесов, но и даст мощный импульс для экономики в целом.
бизнес-задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24🔥14👍9👎7🎉3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37❤8👎5🔥5⚡4
This media is not supported in your browser
VIEW IN TELEGRAM
👍13🔥12🏆8👎3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥18❤8⚡7
Forwarded from AI Education (Elena Kantonistova)
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, друзья! 👋
Мы продолжаем выпускать материалы, посвященные Computer Vision и приуроченные к старту специализации по компьютерному зрению!
Уже появилась наша статья про построение HOG-дескрипторов - классический подход для получения признаков из изображений.
В современном глубинном обучении для извлечения признаков используют свертки и сверточные сети - про них мы хотим вам рассказать на открытом вебинаре, который пройдет 16 декабря в 19:30 по Мск! На вебинаре мы также упомянем тему обработки видеопотоков в реальном времени.
Ждем вас на вебинаре (ссылка появится в нашем канале накануне)! Всегда Ваш, @ai_edu🎄
Мы продолжаем выпускать материалы, посвященные Computer Vision и приуроченные к старту специализации по компьютерному зрению!
Уже появилась наша статья про построение HOG-дескрипторов - классический подход для получения признаков из изображений.
В современном глубинном обучении для извлечения признаков используют свертки и сверточные сети - про них мы хотим вам рассказать на открытом вебинаре, который пройдет 16 декабря в 19:30 по Мск! На вебинаре мы также упомянем тему обработки видеопотоков в реальном времени.
Ждем вас на вебинаре (ссылка появится в нашем канале накануне)! Всегда Ваш, @ai_edu
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍1
Я парень простой, вижу как коллеги из вышки что-то полезно запускают - делюсь!
🔥18❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe показали прикольную фичу MultiFoley — генерацию ЗВУКОВ под ваше видео.
Идея бомбезная: можно не просто генерировать соответствующие звуки, но и что-то сюрреалистичное, но воспринимаемое правдоподобно. Например, рычащего как лев кота🤬
Кроме того, модель теперь умеет принимать в качестве промта другое аудио (как референс), а также удлинять аудио (очень удобно, если где-то запороли звук).
Кода нет (это же Адобе), ждем в продуктах компании.
🎚️ @datafeeling
Идея бомбезная: можно не просто генерировать соответствующие звуки, но и что-то сюрреалистичное, но воспринимаемое правдоподобно. Например, рычащего как лев кота
Кроме того, модель теперь умеет принимать в качестве промта другое аудио (как референс), а также удлинять аудио (очень удобно, если где-то запороли звук).
Кода нет (это же Адобе), ждем в продуктах компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤22🎃6
Media is too big
VIEW IN TELEGRAM
Одну из серий полностью посвятили нейросетям. Например, рассказали, как устроен пайплайн моделей в сервисе «Нейро». Выглядит он следующим образом:
Рефразер: Преобразует вопрос в оптимальный поисковый запрос, сохраняя контекст диалога. Он может формулировать до 5 вариантов запроса.
Поисковая система: Извлекает наиболее релевантные ответы на основе уточненных запросов.
Инфоконтекст: Задействуется база данных для создания развернутых ответов.
YandexGPT: Нейросеть генерирует готовый ответ.
Еще из интересного: в «Нейро» интегрировали мультимодальные VLM (Vision-Language Models). Сервис может обрабатывать и анализировать не только тексты, но и всю визуальную информацию на фото.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥6❤5👎4
Meta решили перебить анонсы от OpenAI и выпустили LLaMa 3.3 70b.
Релиз РЕВОЛЮЦИОННЫЙ: модель среднего размера (70b) почти не отстаёт (!), а в некоторых тестах и опережает (!!) 405b модели, и даже GPT-4o (!!!) 😱
🎚️ Сама моделька здесь, но на домашнем компе не потянет.
Релиз РЕВОЛЮЦИОННЫЙ: модель среднего размера (70b) почти не отстаёт (!), а в некоторых тестах и опережает (!!) 405b модели, и даже GPT-4o (!!!) 😱
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍2
Ты: мечтаешь найти работу в ИИ.
Вакансии, на которые тебя зовут:🤣
Вторая, кстати, звучит не так плохо.
🎚️ #юмор @datafeeling
Вакансии, на которые тебя зовут:
Вторая, кстати, звучит не так плохо.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁43👍4🔥4❤1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁68😈3