Complete AI – Telegram
Complete AI
7.94K subscribers
490 photos
34 videos
10 files
267 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
🔥GigaChat Lite ➡️ Open Source

Велкам тестировать💪
👉Детали на Хабре
❤‍🔥20🔥10👍4😱3
Один из мастодонтов искусственного интеллекта, Александр Николаевич Горбань, сейчас выступает на AIJ

Рекомендую послушать классика💪
❤‍🔥28🔥13🤝6👍32
Сейчас на AIJ выступает мой коллега — Александр Панов, рассказывает об актуальных задачах в робототехнике

Самый крутой кейс для фундаментальных моделей — применение в реальных задачах реальной жизни. У меня в лаборатории есть отдельная команда, занимающаяся развитием мультимодальных моделей для планирования и манипуляции в робототехнике — FusionBrain.Robotics. С командой Александра мы тесно сотрудничаем в исследовательских задачах по поиску новых архитектур и решений для развития технологий роботов общего назначения.
👍216🔥5🙏1
Forwarded from Институт AIRI
Конференция AI Journey 2024 завершилась😁

Записи докладов исследователей AIRI уже можно посмотреть по ссылке.

До встречи в следующем году! #AIRIзация
Please open Telegram to view this post
VIEW IN TELEGRAM
230🔥18👍10
Фанаты Вайбера, добро пожаловать в телеграм😅

Да здравствуют гифки со стразами и букетами красных роз🙈
😁49🎉12🙊4🤔1🌚1👀1😎1
Complete AI
🔥GigaChat Lite ➡️ Open Source Велкам тестировать💪 👉Детали на Хабре
А теперь подробнее о новинках от команды GigaTeam. Помимо выхода в Open Source GigaChat Lite, разработчики также поделились моделями GigaEmbeddings и GigaAMv2.

Решил выделить ключевые моменты:

🔹 GigaChat Lite — первая по-настоящему российская open-source модель. Это не просто локализованное решение: в отличие от «натюненных» моделей из других стран. Она надежна, стабильна и не зависит от внешних ограничений. Компактная и при этом невероятно эффективная, GigaChat Lite обеспечивает тот самый баланс между производительностью и затратами по времени. Иными словами — одно из лучших решений для тех, кто ценит скорость и точность.

🔹 GigaEmbeddings — модель эмбеддингов для RAG, классификации и других задач. По производительности она заметно превосходит аналоги, такие как E5. На тестах RAG демонстрирует прирост до 15% в абсолютном качестве.

🔹 GigaAMv2 — новая версия модели распознавания речи, признанная лучшей в России. Эта технология представляет собой революцию в работе с аудиоданными, обеспечивая высочайшую точность. Кроме того, поддерживается дообучение и использование современных видеокарт, что значительно ускоряет обработку запросов.

Потрогать каждую из них можно по ссылке. 😉

@complete_ai
114🔥9🏆3🌚2
⚡️⚡️⚡️Несколько часов назад Qwen анонсировали QvQ-72B-Preview — первую open source мультимодальную модель с ризонингом (умеет итеративно «размышлять/рассуждать» и двигаться в сторону правильного ответа)

Сами авторы говорят, что модель в стадии preview и может «тупить», но так или иначе метрики очень крутые. Ключевые проблемы:
📍Модель может миксовать языки при ответах
📍Модель может зацикливаться в рассуждениях, не приближаясь к правильному выводу
📍Требуется дополнительный уровень безопасности и “любимого” alignment
📍В ходе рассуждений модель может утратить внимание на входную картинку и начать галлюцинировать

Ещё детали и примеры в блоге👇
https://qwenlm.github.io/blog/qvq-72b-preview/

P.S. Так или иначе — we made a new step to AGI💪

@complete_ai
1🔥2831🏆1🦄1
Forwarded from Институт AIRI
Интерактивная сегментация, то есть автоматическое определение границ объектов на изображении, нужна и в медицине, и в индустрии развлечений. Для корректной оценки метода интерактивной сегментации разработчикам нужно собирать информацию о взаимодействии реальных людей с ним в процессе разметки изображений.

Исследователи AIRI объединили несколько классических датасетов для оценки этих методов и собрали для них в общей сложности 475 000 пользовательских кликов и тапов через специальный веб-интерфейс. Датасет получил название RClicks и был использован, чтобы протестировать популярные сегодня методы интерактивной сегментации. Статья с результатами этой работы была представлена на NeurIPS 2024.

📎Инженер–исследователь группы «ИИ для роботов» лаборатории FusionBrain AIRI Антон Антонов поделился подробностями исследования на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥128👍2
127👍8🔥8🏆4👏1🎉1
Дорогие подписчики!

Поздравляю вас с наступающим Новым годом ⭐️

Хочу от всей души пожелать вам благополучия, добра, спокойствия и тихого счастья. Пусть все ваши задуманные планы осуществляются всегда и не зависят от даты на календаре 🍪

Отдельно хочу пожелать процветания российской науке! Благодаря сильным людям, вам, она тоже становится сильнее на мировой арене.

Спасибо вам за активность, за комментарии. Буду радовать вас интересным контентом и новыми релизами команды!

С Новым годом 😱
Please open Telegram to view this post
VIEW IN TELEGRAM
53👍208🦄3
Математические этюды @EtudesRu рассчитали особенность числа 2025🎉
Подробнее тут

С Новым годом🎄
20🔥11👍6❤‍🔥2
Мои коллеги из SberDevices приоткрыли завесу тайны и представляют Malvina — функциональное расширение GigaChat для редактирования изображений через текстовый промпт. Только промпт! Больше никаких масок, точек и танцев с бубнами😃

Проект пока в закрытой альфе, но на конференции AIJ был представлен демо-стенд и выступал с рассказом Сергей Марков. Архитектура использует сильные стороны LLM-ассистентов и генеративных моделей, фокусируясь на гибкости и качестве данных. Сейчас за генерацию изображения отвечает диффузионка, но коллеги ищут и авторегрессионные решения.

Мальвина умеет работать и со сгенерированными, и с реальными изображениями.

Ждите релиз в GigaChat! Подробнее о технологии на канале команды компьютерного зрения Layer в SberDevices.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47🦄6😱3😁2🌚2🆒2👍1
Forwarded from AbstractDL
ChatGPT меня загазлайтила

Как вы уже видели, у OpenAI появилась возможность отложенных задач. Я решил проверить лимиты дозволенного и попросил ChatGPT уйти играть в шахматы с самим собой, делая только случайные ходы, и не возвращаться с ответом, пока не доиграет. Ну, она и ушла играть в шахматы на... ДВА ДНЯ! При этом я регулярно спрашивал, как там дела, и получал ответ: «Партия ещё идёт». Терпение у меня лопнуло. Я стал в каждом сообщении спрашивать, сколько сейчас фигур осталось в игре, и, о чудо, с каждым моим вопросом их становилось чуть-чуть меньше. За одну минуту игра закончилась. Я получил набор ходов и отрисовал их в артефактах Claude (см. видео).

Какая мораль? Ассистент прокрастинировал два дня и ничего не делал, пока я не заставил показывать промежуточный результат. "Джун" level of AGI has been achieved internally.

Ссылка на диалог
😁93🔥84👍4😱2💯1🙊1
Подготовил мини-колонку про ИИ-агентов для нового новостного проекта @anti_agi от команды канала @antidigital, который читают многие decisionmakers IT-отрасли. Ребята создали форк, посвященный исключительно искусственному интеллекту, а так как они на медиарынке уже 20 с лишним лет – стараются отличить важное от сиюминутного. Радует, что научная составляющая ИИ-повестки интересует все больше людей.
10❤‍🔥4👍4🦄1
А вот скажите, есть ли среди вас кто-то, кто рубит в low-level-ML? Руками под CUDA писать, оптимизировать потоки данных, кэши, вот это всё? Если да, то черкните мне в личку (@oulenspiegel), возможно у меня для вас будет прямо хорошее предложение
🎉7👍2
Китайцы перед своим Новым годом, конечно, обеспечили всех пищей для размышлений на пару недель празднества💪

А меж тем Janus Pro 1B (any-to-any новая мультимодальная модель от DeepSeek) уже раскатали в режиме локального использования в браузере на WebGPU

Почитать тред на Reddit тут
Попробовать тут
❤‍🔥11👍7🔥5🦄5😁1
ICT.Moscow собрал 80 крутых инструментов для разработчиков ИИ 🔥

Все они в открытом доступе и подходят для решения абсолютно разных задач. В подборку вошли библиотеки, фреймворки, датасеты, архитектуры и многое другое.

В подборке также есть решение от нашей лаборатории — фреймворк LLM Microscope для визуализации и анализа характеристик языковых моделей. Он позволяет исследовать свойства трансформерных архитектур. Статья о LLM Microscope была недавно принята на международную конференцию NAACL 2025.

Полную версию подборки ICT.Moscow можно посмотреть тут 🔜 ссылка

Также есть удобная инфографика для быстрого поиска нужных решений в PDF.
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥5❤‍🔥3👍2🏆2😁1🦄1
Секретная новость от создателя DeepSeek — в основе модели код, написанный советскими учеными в 1985 году💪

Инфа сотка
😁79🔥15👏5🙊41😱1🦄1
Complete AI
Секретная новость от создателя DeepSeek — в основе модели код, написанный советскими учеными в 1985 году💪 Инфа сотка
На самом деле, это конечно же фейковая новость, которая довольно быстро распространилась за последние дни и дошла даже до федеральных телеканалов.

Какой можно сделать вывод: какой бы источник информации вы не читали/смотрели/слушали, всегда надо сохранять место здоровой критике и уделить 1-2 минуты факт-чекингу или проверке достоверности сообщения. Как правило, большинство таких «громких» или кликбейтных заголовков раскручивается на раз-два🧐

Будьте бдительны и проверяйте всё, что читаете)
🔥20🏆12💯4🦄1
Как известно, в лаборатории FusionBrain есть несколько научных групп. Одна из них занимается механистической интерпретируемостью (Architectural insights) и руководит ею Антон Разжигаев (автор канала AbstractDL). На днях он выпустил отличную статью на Хабре про нашумевшую модель DeepSeek-R1, где подробно изложил все тонкости процесса обучения.

Несмотря на то, что называется она "DeepSeek-R1 для чайников", внутри много технических деталей (мы вчера уже пошутили, что это какие-то очень навороченные чайники с кучей сенсоров и умных программ). Не пугайтесь, вы в них не утоните😉

Рекомендую всем почувствовать себя каким-то "чайником" и получить ответы на вопросы, которые могли еще остаться без ответа) Желаю приятного чтения! Приходите с вопросами, будем рады помочь разобраться💪

👉Хабр
❤‍🔥27🔥10👍9👏32