Fashion future: нейросеть на подиуме 💅
Рассказываю, что было:
В ЦДМ на Лубянке представили коллекцию одежды, созданную в коллаборации с AI🛍
Нейросеть Kandinsky в творческом тандеме с продюсерским центром «Грани» сгенерировала образы, а также разработала сценографию🎶
В результате получился первый в России модный показ, где AI выступил не просто инструментом, а полноправным соавтором🤝
Рассказываю, что было:
В ЦДМ на Лубянке представили коллекцию одежды, созданную в коллаборации с AI
Нейросеть Kandinsky в творческом тандеме с продюсерским центром «Грани» сгенерировала образы, а также разработала сценографию
В результате получился первый в России модный показ, где AI выступил не просто инструментом, а полноправным соавтором
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍6
Не смогла пройти мимо. Сегодня у коллег из AIRI праздник❤️
За 4 года ребята опубликовали 600+ статей, выступили на 400 конференциях и провели почти 200 мероприятий на тему искусственного интеллекта
Желаю коллегам ещё больше вдохновения для новых исследований и прорывных открытий. С днём рождения!🎉
🥰 Аж захотелось пересмотреть выступление Ивана Оселедца на AI Journey 2024
За 4 года ребята опубликовали 600+ статей, выступили на 400 конференциях и провели почти 200 мероприятий на тему искусственного интеллекта
Желаю коллегам ещё больше вдохновения для новых исследований и прорывных открытий. С днём рождения!
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Институт AIRI
4 года назад появился Институт AIRI ❤️
За это время мы объединили сильнейших исследователей в области искусственного интеллекта, опубликовали сотни научных статей и провели десятки семинаров. По традиции делимся карточками с итогами работы Института за 4…
За это время мы объединили сильнейших исследователей в области искусственного интеллекта, опубликовали сотни научных статей и провели десятки семинаров. По традиции делимся карточками с итогами работы Института за 4…
❤7
Наконец-то выпустили альфу новой модели, но есть нюансы. Доступ всё так же по подписке от $10.
Что нового:
📸 подтянули реалистичность: люди и предметы почти как фото
Отдельно выделю персонализацию:
И режим для набросков Draft Mode:
🎙 можно использовать голосовой ввод — просто описывай концепт и получай картинку
Минусы:
Разработчики обещают частые апдейты в ближайшие 2 месяца. Ждём
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥4❤1
Представили целую коллекцию опенсорс-моделей: Scout, Maverick и Behemoth из линейки Llama 4.
Что нового:
1️⃣ Scout — модель с 17B активных параметров и 16 экспертами (всего 109B параметров), умеет обрабатывать огромные документы (до 10 млн токенов — примерно 5 000 страниц текста) и отлично справляется с суммаризацией текстов и анализом больших кодовых баз
2️⃣ Maverick — модель для рутинных задач с 17B активных параметров и 128 экспертами — в общей сложности 400B параметров. Превосходит GPT-4o в написании текстов и Gemini 2.0 в кодинге и мультиязычных задачах. Правда, до GPT-4.5 и Gemini 2.5 Pro пока не дотягивает
3️⃣ Behemoth — модель с 288B активных параметров, 16 экспертами и почти 2T общих параметров. Протестировать её пока нельзя, но по внутренним бенчмаркам она уже лучше GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro в STEM-задачах, например в математике
Что интересного:
Meta* заявляет, что новые модели стали «менее чувствительны» и теперь реже отказываются отвечать на запросы — модель не даст ответа меньше, чем в 1% случаев. Осталось это проверить
* экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4🤔3❤2
🕵️♂️ Copilot Search от Microsoft посоревнуется с AI-поисковиками
Bing, поисковая система от Microsoft, занимает менее 4% от рынка. Но в компании не оставляют надежд привлечь пользователей, поэтому внедрили AI-поиск. Copilot Search объединяет преимущества традиционного поиска и генеративного поиска на основе искусственного интеллекта.
📌 Особенности:
➡️ находит информацию из нескольких источников и даёт на них ссылки
➡️ поиск в стиле разговора — сервис способен вести диалог, как чат-бот
➡️ за ответом Copilot cледует обычная поисковая выдача
Избирательность AI в выборе ссылок, по мнению Microsoft, должна подтолкнуть авторов создавать достоверный и качественный контент.
Компания не раскрыла подробностей о том, как работает эта функция. Так как Copilot раньше использовал модели от OpenAI, возможно, «под капотом» нового поисковика скрывается собственная модель.
👀 Оценить работу поисковика можно по видео, а попробовать бесплатно — здесь (нужен VPN)
Bing, поисковая система от Microsoft, занимает менее 4% от рынка. Но в компании не оставляют надежд привлечь пользователей, поэтому внедрили AI-поиск. Copilot Search объединяет преимущества традиционного поиска и генеративного поиска на основе искусственного интеллекта.
📌 Особенности:
➡️ находит информацию из нескольких источников и даёт на них ссылки
➡️ поиск в стиле разговора — сервис способен вести диалог, как чат-бот
➡️ за ответом Copilot cледует обычная поисковая выдача
Избирательность AI в выборе ссылок, по мнению Microsoft, должна подтолкнуть авторов создавать достоверный и качественный контент.
Компания не раскрыла подробностей о том, как работает эта функция. Так как Copilot раньше использовал модели от OpenAI, возможно, «под капотом» нового поисковика скрывается собственная модель.
👀 Оценить работу поисковика можно по видео, а попробовать бесплатно — здесь (нужен VPN)
👍6🔥4❤3
🧠🎮 Quake II вернулся благодаря AI
Ты можешь бегать, прыгать, стрелять и даже находить секретки — только вот ты играешь не в сам Quake II, а в его симуляцию внутри нейросети🤯
🔄 Microsoft выложила демо своей модели WHAMM (World and Human Action MaskGIT Model). Она создана на базе Muse — семейства моделей от Microsoft, которые обучаются симулировать поведение игрового мира, исходя из действий геймера
⚡️ Новая версия куда шустрее предшественницы: 10 кадров в секунду против одного и удвоенное разрешение (640×360 вместо 300×180). Дело в архитектуре. WHAMM генерирует токены не последовательно, а параллельно, что позволяет взаимодействовать с ней в реальном времени
🧑💻 На обучение ушла неделя игры профи-тестеров. Прошлой версии на это потребовалось аж семь лет геймплея. Зато всё как в настоящем Quake II, но с нюансами. Враги порой размыты, здоровье хаотично, а если долго смотреть в небо, то можно телепортироваться. Есть и забавные глюки: в этой симуляции ты можешь буквально закрыть глаза, отвернуться — и враг исчезнет (хотели бы такое в реальной жизни?). Причина — в узком контекстном окне в 0,9 секунд (9 кадров по 10fps), модель просто забывает, что было секунду назад. Поиграть можно тут
🤖 Возможно, на наших глазах зарождается новый жанр самосоздающихся игр, где будут сталкиваться реальные и AI-игроки
Ты можешь бегать, прыгать, стрелять и даже находить секретки — только вот ты играешь не в сам Quake II, а в его симуляцию внутри нейросети
🤖 Возможно, на наших глазах зарождается новый жанр самосоздающихся игр, где будут сталкиваться реальные и AI-игроки
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤🔥3
AI рвется в будущее🔜
Собрала для вас главные достижения AI, которые привлекли мое внимание за прошедшую неделю⚠️
Видео и графика:
1️⃣ Вышло обновление для Runway Gen-4. Нейросеть точно воссоздаёт сцены и персонажей из изображений и промптов, редко галлюцинирует, а видео по качеству не уступает киносъёмке 👀 Запоминает стили, объекты и героев для повторного использования. Есть редактирование по сценам 🚀
2️⃣ Спустя год зарелизили Midjourney V7 — детализация сумасшедшая, но не всё так гладко, как хотелось бы. Этой обнове я посвятила отдельный пост ⚠️
3️⃣ ChatGPT теперь умеет редактировать и создавать изображения высокого качества. Надписи читабельны, артефактов нет, руки с нужным количеством пальцев и, конечно же, прогремевшая на весь интернет стилизация под мультики студии Ghibli 👏
Ассистенты и мультимодальные решения:
4️⃣ С китайской нейросетью Qwen теперь можно общаться в формате голосового и видеочата. Она понимает текст, картинки, звук и видео, запоминает фразы и ведёт диалог на достойном уровне. Правда, пока только на китайском и английском 🆒
5️⃣ Microsoft апгрейднула Copilot до полноценного AI-агента. Теперь пользоваться им можно на всех платформах — Windows, Android, iOS и в браузере 😮 Copilot научился бронировать отели, писать письма и искать товары по лучшим ценам. Про внедрение Copilot Search в поисковик Bing рассказала в посте
6️⃣ Anthropic выпустила Claude for Education на базе версии 3.7 — новую версию чат-бота для образовательных учреждений. Ассистент не даёт готовые ответы, а подталкивает студентов искать решение через диалог. Сейчас его тестируют в нескольких зарубежных университетах ✏️
Языковые модели:
7️⃣ Обновился Deep Research от Google — теперь на базе Gemini 2.5 Pro. Модель обходит ChatGPT в аналитике: копает глубже, аргументирует точнее, формулирует лучше. Последняя версия доступна бесплатно в AI Studio 🆓
8️⃣ Meta* представила LLaMa 4. У Scout, самой маленькой модели в линейке, память на 10 млн токенов. Это как если бы AI держал в голове сразу несколько толстенных энциклопедий 🔥 У флагмана Mavrick — 1 млн, но он мощнее. Младшие модели уже обгоняют GPT-4o в тестах
9️⃣ Grok — AI от Илона Маска — теперь в Telegram, модель доступна премиум-пользователям. Сам Маск утверждает, что она умнее конкурентов. Но есть нюанс: в мессенджере урезан функционал, нет поиска в интернете и бот иногда подлагивает ⚡️
Изображение Recraft
*экстремистская организация, деятельность которой запрещена на территории РФ
Собрала для вас главные достижения AI, которые привлекли мое внимание за прошедшую неделю⚠️
Видео и графика:
1️⃣ Вышло обновление для Runway Gen-4. Нейросеть точно воссоздаёт сцены и персонажей из изображений и промптов, редко галлюцинирует, а видео по качеству не уступает киносъёмке 👀 Запоминает стили, объекты и героев для повторного использования. Есть редактирование по сценам 🚀
2️⃣ Спустя год зарелизили Midjourney V7 — детализация сумасшедшая, но не всё так гладко, как хотелось бы. Этой обнове я посвятила отдельный пост ⚠️
3️⃣ ChatGPT теперь умеет редактировать и создавать изображения высокого качества. Надписи читабельны, артефактов нет, руки с нужным количеством пальцев и, конечно же, прогремевшая на весь интернет стилизация под мультики студии Ghibli 👏
Ассистенты и мультимодальные решения:
4️⃣ С китайской нейросетью Qwen теперь можно общаться в формате голосового и видеочата. Она понимает текст, картинки, звук и видео, запоминает фразы и ведёт диалог на достойном уровне. Правда, пока только на китайском и английском 🆒
5️⃣ Microsoft апгрейднула Copilot до полноценного AI-агента. Теперь пользоваться им можно на всех платформах — Windows, Android, iOS и в браузере 😮 Copilot научился бронировать отели, писать письма и искать товары по лучшим ценам. Про внедрение Copilot Search в поисковик Bing рассказала в посте
6️⃣ Anthropic выпустила Claude for Education на базе версии 3.7 — новую версию чат-бота для образовательных учреждений. Ассистент не даёт готовые ответы, а подталкивает студентов искать решение через диалог. Сейчас его тестируют в нескольких зарубежных университетах ✏️
Языковые модели:
7️⃣ Обновился Deep Research от Google — теперь на базе Gemini 2.5 Pro. Модель обходит ChatGPT в аналитике: копает глубже, аргументирует точнее, формулирует лучше. Последняя версия доступна бесплатно в AI Studio 🆓
8️⃣ Meta* представила LLaMa 4. У Scout, самой маленькой модели в линейке, память на 10 млн токенов. Это как если бы AI держал в голове сразу несколько толстенных энциклопедий 🔥 У флагмана Mavrick — 1 млн, но он мощнее. Младшие модели уже обгоняют GPT-4o в тестах
9️⃣ Grok — AI от Илона Маска — теперь в Telegram, модель доступна премиум-пользователям. Сам Маск утверждает, что она умнее конкурентов. Но есть нюанс: в мессенджере урезан функционал, нет поиска в интернете и бот иногда подлагивает ⚡️
Изображение Recraft
*экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤4🔥1
GigaChat обновляется — версия 2.0 🔔
Sber выпустил новую версию GigaChat 2.0 — нейросеть доступна бесплатно в веб-версии по входу через Сбер ID, в новом мессенджере MAX от VK и в Telegram-боте
Что добавили:
🧑💻 актуальная информация: ответы со ссылками на источники
🆗 анализ ссылок: читает веб-страницы, изучает PDF-документы и изображения
🎶 анализ аудиофайлов и аудиосообщений: отвечает на вопросы по содержанию, промпты теперь можно отправлять голосом
🆒 подтянули обработку документов: можно загружать сразу несколько файлов, поддерживает до 200 страниц A4, лучше понимает контекст
✏️ улучшена работа с изображениями: даёт более точные ответы по содержанию, считывает текст и формулы
➕ GigaChat 2.0 теперь интегрирован в колонки от Sber — система стала умнее, понимает в 10 раз больше контекста и отвечает естественнее
💬 Звучит впечатляюще! Пробуем свежие фичи в деле 👀
Изображение GigaChat 2.0
Sber выпустил новую версию GigaChat 2.0 — нейросеть доступна бесплатно в веб-версии по входу через Сбер ID, в новом мессенджере MAX от VK и в Telegram-боте
Что добавили:
Изображение GigaChat 2.0
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8😁2
AI 2027: эволюция ускоряется ⚡️
Эксперты из ведущих AI-компаний опубликовали AI 2027 — подробный сценарий развития нейросетей на ближайшие 2 года. И это один из наиболее реалистичных прогнозов, которые я читала за последнее время⚠️
Что нравится:
⚙️ сценарий основывается не на фантазиях, а на инженерной логике (как растут датасеты, модели, дата-центры)
🔥 повествование построено на развитии существующих трендов: FLOPS, агенты, гонка чипов и R&D
📉 прогнозы без технофобных спекуляций, приведены наглядные метрики и ссылки на научные статьи
Какие нас ждут этапы:
⚫️ 2025: разработчики делают ставку на использование AI для ускорения AI-исследований. Появляются первые агенты, способные работать с кодом как настоящие сотрудники. Компании начинают встраивать их в рабочие процессы
⚫️ 2026: выходит условный Agent-1 — AI, ускоряющий обучение нейросетей на 50%
⚫️ 2027: появляется Agent-3, который быстрее всех в мире выполняет задачи по R&D. Затем Agent-4 — полноценный автономный AI-исследователь, ускоряющий генерацию и обучение новых моделей в 50 раз
Далее формируется агентская экономика: автоматизация большинства рутинных офисных задач, рост производительности, взрывной спрос на специалистов по внедрению и управлению AI-системами (который мы уже наблюдаем👀 )
💡 Рекомендую ознакомиться всем, кому важно видеть суть развития AI без общественных страхов и завышенных ожиданий
✏️ Здесь перевод статьи на русский язык
Изображение AI-2027
Эксперты из ведущих AI-компаний опубликовали AI 2027 — подробный сценарий развития нейросетей на ближайшие 2 года. И это один из наиболее реалистичных прогнозов, которые я читала за последнее время
Что нравится:
Какие нас ждут этапы:
Далее формируется агентская экономика: автоматизация большинства рутинных офисных задач, рост производительности, взрывной спрос на специалистов по внедрению и управлению AI-системами (который мы уже наблюдаем
Изображение AI-2027
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥2💔2
Пока все ждут GPT-5, OpenAI представила обновлённую мультимодальную модель GPT-4.1, которая, по заявлению компании, превосходит прошлую версию практически во всём
Что нового:
Изображение OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤3👍3
🧬 Стартовало соревнование по NLP в биомедицине
AIRI, МГУ и SberAI проводят соревнование BioNNE-L. Участникам предлагают решить проблему нормализации сущностей в биомедицинском NLP. Это нужно для разработки методов нормализации упоминания болезней, лекарств и органов в зависимости от контекста. В чём же сама проблема?
В процессе сущностного линкинга при работе с русским языком возникают трудности:
❗️ Недостаток полноценных словарей.
❗️ Множество синонимов, которые могут быть неполно охвачены в базах данных.
Например, «белок» может означать как животное, так и биомолекулу.
Как участвовать?
✍️ Зарегистрироваться в воркшопе BioASQ
💻 Вступить в соревнование на платформе Codalab
📂 Посетить репозиторий BioNNE-L или страницу HuggingFace, где можно скачать данные и узнать подробности о задаче.
Сроки:
👉 25 апреля станет доступен неразмеченный тест-сет соревнования, чтобы отправлять предсказания (tsv-файлы, обёрнутые в zip-архив) в Codalab.
👉 6 мая заканчивается приём предсказаний.
👉 до 31 мая включительно нужно прислать описание проведённых в рамках соревнования экспериментов, созданных систем и методов.
Придётся много работать с вложенными сущностями, когда одно слово входит в более развёрнутое устойчивое выражение. Задача не из лёгких, но решить её важно для улучшения медицинских технологий. Вы можете в этом помочь!
Кстати, тема практически неизведанная и поэтому может лечь в основу научной статьи 📝
Читайте подробности также в статье организаторов на Хабре.
AIRI, МГУ и SberAI проводят соревнование BioNNE-L. Участникам предлагают решить проблему нормализации сущностей в биомедицинском NLP. Это нужно для разработки методов нормализации упоминания болезней, лекарств и органов в зависимости от контекста. В чём же сама проблема?
В процессе сущностного линкинга при работе с русским языком возникают трудности:
❗️ Недостаток полноценных словарей.
❗️ Множество синонимов, которые могут быть неполно охвачены в базах данных.
Например, «белок» может означать как животное, так и биомолекулу.
Как участвовать?
✍️ Зарегистрироваться в воркшопе BioASQ
💻 Вступить в соревнование на платформе Codalab
📂 Посетить репозиторий BioNNE-L или страницу HuggingFace, где можно скачать данные и узнать подробности о задаче.
Сроки:
👉 25 апреля станет доступен неразмеченный тест-сет соревнования, чтобы отправлять предсказания (tsv-файлы, обёрнутые в zip-архив) в Codalab.
👉 6 мая заканчивается приём предсказаний.
👉 до 31 мая включительно нужно прислать описание проведённых в рамках соревнования экспериментов, созданных систем и методов.
Придётся много работать с вложенными сущностями, когда одно слово входит в более развёрнутое устойчивое выражение. Задача не из лёгких, но решить её важно для улучшения медицинских технологий. Вы можете в этом помочь!
Кстати, тема практически неизведанная и поэтому может лечь в основу научной статьи 📝
Читайте подробности также в статье организаторов на Хабре.
👍8👏1
Сбер открыл приём заявок на ежегодную научную премию. Награда присуждается учёным, работающим в России, за выдающиеся достижения последних 10 лет и вклад в развитие отечественной науки.
Победители получат аж по 20 млн рублей! 🏆
Также предусмотрены спецноминации для молодых учёных, совершивших яркий научный прорыв в AI за последние пять лет. Приз — 4,5 млн рублей на команду + 1 млн на облачные вычисления 💸
Обожаю такие инициативы😍 Буду следить и ждать имена победителей 👀
Победители получат аж по 20 млн рублей! 🏆
Также предусмотрены спецноминации для молодых учёных, совершивших яркий научный прорыв в AI за последние пять лет. Приз — 4,5 млн рублей на команду + 1 млн на облачные вычисления 💸
Обожаю такие инициативы😍 Буду следить и ждать имена победителей 👀
Telegram
GigaChat
Открыт приём заявок на Научную премию Сбера 2025 🔥
Ищем крутых учёных, которые двигают российскую науку вперёд! Призовой фонд в этом году — 76,5 миллионов рублей
За что можно получить премию? Есть три основные номинации:
🔭 Физический мир (физика, химия…
Ищем крутых учёных, которые двигают российскую науку вперёд! Призовой фонд в этом году — 76,5 миллионов рублей
За что можно получить премию? Есть три основные номинации:
🔭 Физический мир (физика, химия…
❤3👍2🔥1
Генеративные AI: четыре горячих апдейта 🎬
1️⃣ CapCut выпустила нейросеть Dreamina — генератор реалистичного видео по фото и аудио. Основана на модели OmniHuman-1, обученной на 19 000 часов контента.
Что умеет:
⚫️ Точная синхронизация мимики с текстом + знает русский
⚫️ Генерация естественных движений в сложных сценах
⚫️ Поддержка комбинированных промптов (фото+аудио)
⚠️ Сервис бесплатный, но доступен только с американским IP
2️⃣ Вышел Kling 2.0 — нейросеть на базе MVL. Новая версия предлагает улучшенные возможности редактирования, включая добавление и изменение элементов по промптам.
Что умеет:
⚫️ Превращает текст в видео с реалистичными движениями
⚫️ Объединяет до четырёх изображений в единый ролик
⚫️ Есть интеграция с DeepSeek для помощи в генерации
⚠️ Цены выросли в 3 раза: теперь 5 секунд видео стоят 100 кредитов (против 35 в версии 1.6)
3️⃣ Runway выпустила Gen-4 — новую модель для генерации видео, способную сохранять облик персонажей и объектов на протяжении всего ролика.
Что умеет:
⚫️ Плавная анимация, реалистичная динамика
⚫️ Сохранение внешности персонажей от сцены к сцене
⚫️ Генерация за 30 секунд в режиме Turbo
⚠️ Доступна платным подписчикам
4️⃣ Google открыла доступ к своей продвинутой видеомодели Veo 2. Пользователи смогут создавать клипы и загружать их в YouTube и другие сервисы.
Что умеет:
⚫️ Генерация видео 720p по тексту и референсам
⚫️ Поддержка стилей: от анимации до фотореализма
⚫️ Клип маркируется как AI-контент (SynthID)
⚠️ Только по подписке Gemini Advanced
Видео Dreamina, Kling 2.0, Runway Gen-4, Veo 2
Что умеет:
Что умеет:
Что умеет:
Что умеет:
Видео Dreamina, Kling 2.0, Runway Gen-4, Veo 2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🏆5❤2