Complete AI – Telegram
Complete AI
7.47K subscribers
477 photos
30 videos
10 files
262 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀

Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.

Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥24🏆7🔥53
Forwarded from GigaChat
🔥МЫ ПРЕДСТАВЛЯЕМ КРУПНЕЙШИЙ OPEN-SOURCE AI В ЕВРОПЕ 🔥

Мы стремимся не замыкаться в «закрытой» технологии, а строить открытую платформу для всей страны, поэтому мы публикуем веса наших моделей.

Что появилось в открытом доступе ↓

🔷 GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace |GitVerse

GigaAM-v3
5 моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse

🔷 GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | HuggingFace |GitVerse

🔷 Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
➡️ GitHub | GitVerse | Hugging Face | Технический репорт

🔷 K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
➡️ GitHub|Hugging Face


Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍18❤‍🔥7😁2
Forwarded from Dendi Math&AI (Денис Димитров)
🚀 Мы с командой открываем всю линейку генеративных моделей Kandinsky 5.0!

В сентябре мы выложили в open source Kandinsky 5.0 Video Lite, получили множество положительных отзывов и полезной обратной связи, большое спасибо всем!

Сегодня мы открываем всю линейку: как Video, так и Image модели. Дальше расскажу все подробности, но можно сначала сходить попробовать: модели доступны всем на открытых поверхностях ГигаЧат: Telegram, Max и giga.chat

🎬 Video Pro – мощные Text-to-Video и Image-to-Video – лучшие в мире open source модели, превосходящие по качеству Wan 2.2 A14B и работающие наравне с Veo 3 от Google по визуалу и динамике (в HD)

🖼 Image Lite – универсальные Text-to-Image и Image Editing модели c 6B параметров, которые нативно поддерживают промты на русском языке, знают культурный код и генерируют картинки с кириллическим текстом. Значительно превосходит FLUX.1 [dev] в задаче генерации изображений и работают на одном уровне с FLUX.1 Kontext [dev] в их редактировании

В открытом доступе: четыре версии Image Lite и пять версий Video Pro для разных задач (для генерации 5 сек и 10 сек видео, разрешение — SD и HD). Доступны как SFT-версии с максимальным качеством, так и Pretrain, для исследователей и дообучения

🔧 Как мы достигли этого (подробнее в нашем большом техрепорте):
🔘 Большой Pretrain-датасет 520 млн изображений и 250 млн видео-сцен
🔘 Фокус на SFT: художники и дизайнеры тщательно выбирали материалы с безупречной композицией, стилем и визуальным качеством
🔘 Разработали метод NABLA для стабильной 10-секундной генерации в HD-разрешении
🔘 Использовали архитектуру Kandinsky-DiT с flow matching

🚀 Доступность и информация:
🔘 Лицензия поддерживает коммерческое использование (MIT)
🔘 Все материалы можно найти на GitHub, HuggingFace и GitVerse
🔘 Техрепорт, кстати, уже сейчас #1 в Daily Papers, но ваша поддержка поможет укрепить эту позицию :)

@dendi_math_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥33👍126🆒2👀1
Forwarded from Connect WIT
❗️Ассистент инженера-конструктора в машиностроении
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской работы в машиностроении.
Новый ассистент инженера-конструктора на базе модели Cadrille преобразует различные типы данных в готовые цифровые 3D-модели в профессиональной системе автоматизированного проектирования (САПР). Модель конвертирует облака точек, изображения и текстовые описания деталей в сложные инженерные модели. Подробнее на сайте
🔥14❤‍🔥74
Forwarded from Институт AIRI
В финальный научный день AIJ Институт AIRI представил GigaEvo — платформу для автоматизации научных экспериментов по ИИ 🔖

В отличие от существующих решений, GigaEvo использует эволюционный поиск стратегий обучения, что позволяет системе самостоятельно находить и улучшать лучшие подходы без постоянного участия специалистов.

Платформа автоматизирует подбор архитектур, оптимизацию гиперпараметров и тестирование моделей, сокращая время исследований и повышая качество результатов. GigaEvo интегрируется с AutoML и MLOps, поддерживает облачные и корпоративные среды, а также обеспечивает полный контроль над экспериментами в реальном времени.

Тесты показали, что GigaEvo успешно воспроизводит сложные математические задачи и масштабирует исследовательские процессы, которые раньше требовали дорогой инфраструктуры. В перспективе платформа поможет ускорить научные и прикладные разработки в разных сферах — от Data Science до промышленности и финансов.

Интерфейс | GitHub | ТАСС
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥20🔥106🏆2
Я стал соавтором отчёта научно-исследовательского проекта «Горизонты искусственного интеллекта: какими будут технологии ИИ через 10 лет». В проекте приняли участие 270+ ведущих учёных в области ИИ из 36 стран, было проведено 32 глубинных интервью и 21 форсайт-сессия. В составе организаторов сессий была команда моего коллеги Андрея Незнамова из Центра человекоцентричного искусственного интеллекта и стратегическое агентство САПФИР 💪

В исследовании 10 тематических направлений — от алгоритмов машинного обучения до общества в эпоху ИИ. Я отвечал за четвертое направление «Фундаментальные генеративные модели».

Ознакомиться с отчётом можно тут.
4🔥5016❤‍🔥3🏆2👍1😁1
«Смотрели AIJ, мужики? Конечно, круто сделали ребята. Давайте думать, как в следующем году туда попасть хотя бы на стенды…»
😁122🔥116😎3🙊1
Довольно интересную тему поднял Андрей Карпаты в соц сети о различии форм интеллекта: животного и LLM-like.
Перевод, кстати, есть у ребят в @data_secrets.

А я, прочитав, вспомнил, как в этом году дискутировали с коллегой в рамках дня науки на тему эмоций у ИИ. И речь шла примерно в таком же ключе: у человека развитие базируется на выживании в любой ситуации, а ИИ решает задачи так, как ближе к тому, на чём он учился - это ни что иное как имитация (вспоминается фильм 5й элемент, когда Лилу через гигантские объёмы видеоконтента изучала мировую историю).

Эмоции человек «проявляет» по принципу соблюдения заданных в течение жизни шаблонов: родители, друзья, окружение. В процессе жизни только гормоны, необходимость «выжить» в социальном и физическом смысле вносят коррективу в проявление эмоций и формируют отличие homo sapiens от ИИ. Если отключить эти факторы, то будет ли разница между человеком и ИИ?🤔
🔥9🤔8😁2😱2
🔥Ну вот и долгожданный тех репорт о GigaEvo подоспел

https://arxiv.org/abs/2511.17592

GitHub: https://github.com/FusionBrainLab/gigaevo-core

Всем приятного изучения, чуть позже доделаем Хабр💪

Чуть выше делился новостью о релизе фреймворка👆

UPD: ссылка из тех репорта заработала — https://github.com/AIRI-Institute/gigaevo-core
1🔥20🏆8🎉5
10 декабря Сбер проводит «Салют, Гига!» — мероприятие для тех, кто делает AI на практике.

Доклады про последние релизы GigaChat, Kandinsky и GigaData, постерная сессия с командами, воркшопы и карьерная зона.

Если работаете с ML, данными или инфраструктурой — присоединяйтесь!

Участие бесплатное, нужна регистрация.
❤‍🔥10👏51
GigaChat в космосе 🚀

С космодрома Байконур стартовала ракета-носитель «Союз-2.1а» с пилотируемым кораблем «Союз МС-28» и тремя членами экипажа 74-й долговременной экспедиции. Вместе с экипажем в космос отправился GigaChat — он будет формировать отчеты и работать с базами данных, облегчая рутинные задачи экипажа.

На изображениях логотип GigaChat и рисунки детей с онкозаболеваниями. Дети наблюдали за запуском своими глазами!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥39👍16🤓63🦄2
А вот я не в космосе был, а на ивенте индустрии недвижимости Domclick Digital Forum. Участвовал в дискуссии «Главные тренды в ИИ: что ждёт рынок и бизнес завтра?» 🦾

Затронули важную для меня тему ИИ в строительстве: какие технологии сейчас используются, можно ли им полностью доверять, с чем ИИ уже справляется, а где без человека не обойтись. Также обсудили ускорение бизнес-процессов, вызовы, сложности при внедрении технологий, обменялись примерами удачных и неудачных кейсов.

Спасибо коллегам за крутой ивент!
❤‍🔥16🔥7👍5🏆21
Forwarded from Институт AIRI
Приглашаем на следующий #AIRI_Seminars, который пройдёт 3 декабря в 17:00 ⤵️

Тема: «Фреймворк Каппа для управления датасетами и бенчмаркинга моделей».

Докладчик: Евгений Павловский, кандидат физико-математических наук, ведущий научный сотрудник Центра ИИ НГУ, заведующий лабораторией аналитики потоковых данных и машинного обучения ММФ НГУ

Оппонент: Андрей Кузнецов, кандидат технических наук, директор лаборатории FusionBrain Института AIRI

Подробное описание и регистрация на офлайн-формат на сайте.

YouTube | VK Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
212🔥5🏆3👀1
В эти выходные прошёл финал международной олимпиады по искусственному интеллекту и анализу данных AIDAO от Яндекс Образования и ФКН НИУ ВШЭ. В ней принял участие с командой мой сотрудник Матвей Скрипкин из группы Multimodality, Александр Югай из МФТИ и Даниил Окунев из ИТМО.

Задача ребят была обучить модель строить карту статических препятствий по четырём изображениям — по сути аналог упрощённого BEV-представления, используемого в автономной навигации.

Они экспериментировали с разными способами кодирования мультикамерного входа, перебрали разные архитектуры для кодирования изображений (классические сверточные модели, Swin Transformer, SigLip2, а также фичи из SAM2), сравнивали их качество и устойчивость, тестировали разные лоссы, использовали LSS для учёта параметров камер, а после получения сильных моделей применили blending. Качество оценивалось по средней IoU. Считался IoU для класса 0 (свободная область, по которой можно ехать) и класса 1 (занятая область, препятствия), после чего брали среднее значение.

Финальная модель на приватном тесте показала значение IoU 0.5609, а у первого места отрыв в третьем знаке — 0.5640.

Ребята, поздравляю! 💪💪💪
126🏆107❤‍🔥3🦄1