📢 Inception Labs представила Mercury, первую коммерческую диффузионную LLM, которая генерирует текст параллельно, а не последовательно, как другие авторегрессионные модели.
👉 Таким образом, она делает инференс с очень высокой скоростью. Она может генерировать более 1000 токенов в секунду на GPU H100, что в 5-10 раз быстрее авторегрессионных LLM
👌 Тесты показывают, что генерирует токены очень быстро. Похоже на будущее LLM-ках
https://www.inceptionlabs.ai/
👉 Таким образом, она делает инференс с очень высокой скоростью. Она может генерировать более 1000 токенов в секунду на GPU H100, что в 5-10 раз быстрее авторегрессионных LLM
👌 Тесты показывают, что генерирует токены очень быстро. Похоже на будущее LLM-ках
https://www.inceptionlabs.ai/
www.inceptionlabs.ai
We are leveraging diffusion technology to develop a new generation of LLMs. Our dLLMs are much faster and more efficient than traditional auto-regressive LLMs. And diffusion models are more accurate, controllable, and performant on multimodal tasks.
👍4🔥1
Привет всем!
📢 Сегодня в 17ч в ТеДо состоится панельная дискуссия по LLM-Агентах. В том числе один из спикеров буду я.
👉 Присоединяйтесь по ссылке
📢 Сегодня в 17ч в ТеДо состоится панельная дискуссия по LLM-Агентах. В том числе один из спикеров буду я.
👉 Присоединяйтесь по ссылке
Telegram
Технологии Доверия
Эти спецагенты незаметны, но невероятно популярны. Вы каждый день сталкиваетесь с результатами их работы, но можете даже не знать об этом. Речь о LLM-агентах — одной из наиболее динамично развивающихся областей ИТ.
📅10 марта мы соберем экспертов по data…
📅10 марта мы соберем экспертов по data…
👍11🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
📢 В понедельник (10. марта) в Технологии Доверия (ТеДо) прошла панельная дискуссия на тему LLM-агентах.
⚡Среди спикеров, таких как Юрий Симонов, Валентин Малых, Марк Паненко и Антон Воронов, я принял участие.
👆Не много атмосфери можно увидет на видео.
👌 Большое спасибо Юрию и команде ТеДо за отличную организацию!
⚡Среди спикеров, таких как Юрий Симонов, Валентин Малых, Марк Паненко и Антон Воронов, я принял участие.
👆Не много атмосфери можно увидет на видео.
👌 Большое спасибо Юрию и команде ТеДо за отличную организацию!
🔥11👍8👏1
📢 Уже завтра в Сколково пройдет IT Purple Conf.
🥁 Я буду одним из спикеров, где буду рассказывать на тему LLMs и AI Agents.
🤝 Если вы будете на конференции завтра, буду рад встретиться!
🥁 Я буду одним из спикеров, где буду рассказывать на тему LLMs и AI Agents.
🤝 Если вы будете на конференции завтра, буду рад встретиться!
it-purple.ru
Конференция IT Purple Conf 2026: технологии, разработка, ИИ, бизнес
Присоединяйся к IT Purple Conf 2026 от МФТИ! ✨ Встреться с ведущими учеными и предпринимателями из мира ИИ, разработки, науки и бизнеса. 🚀Погрузись в мир инноваций и невероятных перспектив!
👍9🔥6
📢 Yann LeCun и его команда представили Dynamic Tanh (DyT) в качестве замены традиционных слоев нормализации в моделях глубокого обучения. Этот новый подход, основанный на функции масштабированного tanh, показывает производительность, сравнимую или превосходящую такие методы, как LayerNorm и RMSNorm. Самым захватывающим аспектом является его потенциал для снижения вычислительных затрат при сохранении эффективности модели.
🤔 DyT заменяет слои нормализации масштабированной функцией tanh (tanh(αx)), где параметр α (альфа) управляет коэффициентом масштабирования функции tanh. DyT имитирует поведение слоев нормализации, сжимая экстремальные значения, сохраняя линейный центр
Преимущества:
👉 DyT снижает затраты на обучение и инференс.
👉 Требуется только один обучаемый параметр масштабирования (α).
👉 Работает быстрее, чем RMSNorm на графических процессорах H100
🤔 DyT заменяет слои нормализации масштабированной функцией tanh (tanh(αx)), где параметр α (альфа) управляет коэффициентом масштабирования функции tanh. DyT имитирует поведение слоев нормализации, сжимая экстремальные значения, сохраняя линейный центр
Преимущества:
👉 DyT снижает затраты на обучение и инференс.
👉 Требуется только один обучаемый параметр масштабирования (α).
👉 Работает быстрее, чем RMSNorm на графических процессорах H100
arXiv.org
Transformers without Normalization
Normalization layers are ubiquitous in modern neural networks and have long been considered essential. This work demonstrates that Transformers without normalization can achieve the same or better...
👍5🆒5🔥4
📢 В субботу (15 марта) в Сколково прошла конференция IT Purple Conf. Конференция привлекла множество специалистов и студентов из разных городов России и зарубежья.
🥁 Я был спикером и выступил с докладом про LLMs и AI Agents.
👆 Немного атмосферы вы можете увидеть на фотографиях.
😊 Я был рад новым знакомством и встречи с старыми друзьями :)
🥁 Я был спикером и выступил с докладом про LLMs и AI Agents.
👆 Немного атмосферы вы можете увидеть на фотографиях.
😊 Я был рад новым знакомством и встречи с старыми друзьями :)
🔥20👍7👏2🆒1😎1
После моего выступления на открытом семинаре Sber AI Lab (6. марта) было много хороших отзывов и вопросов о записи.
👉 Запись выступления вы можете посмотреть сейчас по ссылке.
👉 Запись выступления вы можете посмотреть сейчас по ссылке.
VK Видео
From LLMs to AI Agents
Рассказ о преимуществах и недостатках больших языковых моделей. Как компаунд системы искусственного интеллекта улучшают использование больших языковых моделей. Что такое ИИ-агенты и какую роль играют большие языковые модели в агентских системах.
🔥11👍5⚡3🆒2🤝1
🥁 Майские праздники давно прошли и пришло время новых рабочих побед. Уже завтра стартует Data Fest, но в этом году впервые у меня дома в Сербии в Белграде 🥳 🇷🇸
🤝 Буду рад встрече, если вы планируете приехать на трек в Белград! Если нет, ждите фотографии атмосферы из Белграда 👌
А вы собираетесь посетить Data Fest в этом году?
🤝 Буду рад встрече, если вы планируете приехать на трек в Белград! Если нет, ждите фотографии атмосферы из Белграда 👌
А вы собираетесь посетить Data Fest в этом году?
🔥11❤6👍4🆒1
🛰️ Как и обещал, делюсь фотографиями и атмосферой с Data Fest в Яндексе в Белграде.
🏋️ Вместе с Лёшей @AleXXL1986, мы из Sber AI Lab выступали с докладомы про наши open source библиотеки и различные подходы к улучшению reasoning в LLM.
🍾 В целом, программа была очень насыщенной: среди самых интересных запомнились выступления о применении VLM в продуктах Яндекса, кейсы с умным помощником для Яндекс Лавки и очень необычный проект по обучению межславянской языковой модели. Помимо содержательных докладов, на фестивале царила по-настоящему дружеская и вдохновляющая атмосфера — яркие дискуссии, новые знакомства и море свежих идей!
🥇 Особенно выделю квиз по тематике Data Science — это было не только увлекательно, но и азартно, ведь нашей команде удалось победить!
🏋️ Вместе с Лёшей @AleXXL1986, мы из Sber AI Lab выступали с докладомы про наши open source библиотеки и различные подходы к улучшению reasoning в LLM.
🍾 В целом, программа была очень насыщенной: среди самых интересных запомнились выступления о применении VLM в продуктах Яндекса, кейсы с умным помощником для Яндекс Лавки и очень необычный проект по обучению межславянской языковой модели. Помимо содержательных докладов, на фестивале царила по-настоящему дружеская и вдохновляющая атмосфера — яркие дискуссии, новые знакомства и море свежих идей!
🥇 Особенно выделю квиз по тематике Data Science — это было не только увлекательно, но и азартно, ведь нашей команде удалось победить!
🔥22👍7👏5❤1💅1
📢 Недавно выступал на Open Source Bootcamp в Петербурге вместе с коллегой Ринчин, где мы рассказывали про ML-решения разрабатываемые нашей командой. Атмосфера на буткэмпе была крутая, чему способствовало и интересное место проведения 🎯
💫 Питер красивый город. Погода тоже была отличная, не слишком холодно, так что было приятно прогуляться.
💫 Питер красивый город. Погода тоже была отличная, не слишком холодно, так что было приятно прогуляться.
🔥17❤3👍3👏2⚡1🆒1
Forwarded from LightAutoML framework
Много мероприятий не бывает :) В этот раз фокус на научном и индустриальном ML open source, ну и куда же сегодня без агентов!
В программе:
Среди спикеров будут сотрудники нашей команды: Ринчин расскажет про наши open source библиотеки, а Миле про AutoML агентов. А также многие другие сотрудники Sber AI Lab.
Please open Telegram to view this post
VIEW IN TELEGRAM
developers.sber.ru
Sber Conf: Open Source & AI Agents
Конференция, на которой планируется объединить дата-саентистов, разработчиков, исследователей и бизнес-лидеров для обмена опытом и поиска новых возможностей по двум основным направлениям: Open Source и AI-агенты
🔥5⚡3👍2👏1
👉 Вчера мне была честь выступить на лекциях профессора Желька Текича как гест-спикер в ВШЭ. Мы с Желько из одного города в Сербии, но познакомились около 7 лет назад в Сколтехе, где Желько тогда работал и где в самые лучшие времена Сколтеха он неоднократно признавался лучшим профессором!🎖️
Спасибо Жельку и студентам за гостеприимство!😊
Спасибо Жельку и студентам за гостеприимство!😊
🔥19❤6👍3❤🔥2🆒2⚡1🐳1