Sber AI – Telegram
Sber AI
41.3K subscribers
2.41K photos
616 videos
1 file
2.04K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Fashion future: нейросеть на подиуме 💅

Рассказываю, что было:

В ЦДМ на Лубянке представили коллекцию одежды, созданную в коллаборации с AI 🛍

Нейросеть Kandinsky в творческом тандеме с продюсерским центром «Грани» сгенерировала образы, а также разработала сценографию 🎶

В результате получился первый в России модный показ, где AI выступил не просто инструментом, а полноправным соавтором 🤝
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍6
Не смогла пройти мимо. Сегодня у коллег из AIRI праздник❤️

За 4 года ребята опубликовали 600+ статей, выступили на 400 конференциях и провели почти 200 мероприятий на тему искусственного интеллекта

Желаю коллегам ещё больше вдохновения для новых исследований и прорывных открытий. С днём рождения! 🎉

🥰 Аж захотелось пересмотреть выступление Ивана Оселедца на AI Journey 2024
Please open Telegram to view this post
VIEW IN TELEGRAM
7
‼️ Midjourney V7: апгрейд спустя год ожидания

Наконец-то выпустили альфу новой модели, но есть нюансы. Доступ всё так же по подписке от $10.

Что нового:
😎 круче текстуры и детализация
📸 подтянули реалистичность: люди и предметы почти как фото

Отдельно выделю персонализацию:
🧑‍💻 есть возможность пройти визуальный опрос, где ты выбираешь, какие из ~200 изображений тебе нравятся, а модель подстраивает генерации под твой вкус. Фичу можно отключить в любой момент

И режим для набросков Draft Mode:

😮 генерация в 10 раз быстрее, а стоит в 2 раза дешевле
🎙 можно использовать голосовой ввод — просто описывай концепт и получай картинку

Минусы:
💬 не умеет редактировать фото или писать текст, как ChatGPT
📈 прорыва по сравнению с V6 нет, но эстетика — топ. Особенно плёночка и ретро
💥 сейчас сервис перегружен — генерации могут занимать до 15 минут, а иногда просто вылетает ошибка

Разработчики обещают частые апдейты в ближайшие 2 месяца. Ждём 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥41
❗️ Meta* возвращается в AI-гонку

Представили целую коллекцию опенсорс-моделей: Scout, Maverick и Behemoth из линейки Llama 4.

Что нового:
1️⃣ Scout — модель с 17B активных параметров и 16 экспертами (всего 109B параметров), умеет обрабатывать огромные документы (до 10 млн токенов — примерно 5 000 страниц текста) и отлично справляется с суммаризацией текстов и анализом больших кодовых баз
2️⃣ Maverick — модель для рутинных задач с 17B активных параметров и 128 экспертами — в общей сложности 400B параметров. Превосходит GPT-4o в написании текстов и Gemini 2.0 в кодинге и мультиязычных задачах. Правда, до GPT-4.5 и Gemini 2.5 Pro пока не дотягивает
3️⃣ Behemoth — модель с 288B активных параметров, 16 экспертами и почти 2T общих параметров. Протестировать её пока нельзя, но по внутренним бенчмаркам она уже лучше GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro в STEM-задачах, например в математике

Что интересного:
😲 все модели основаны на архитектуре MoE — Mixture of Experts (коллектив экспертов), для обработки каждого токена активируется лишь часть параметров модели, что экономит вычислительные ресурсы и ускоряет работу. Scout и Maverick уже можно попробовать на сайте или Hugging Face, а точной даты релиза Behemoth пока нет

Meta* заявляет, что новые модели стали «менее чувствительны» и теперь реже отказываются отвечать на запросы — модель не даст ответа меньше, чем в 1% случаев. Осталось это проверить 👀

* экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4🤔32
🕵️‍♂️ Copilot Search от Microsoft посоревнуется с AI-поисковиками

Bing, поисковая система от Microsoft, занимает менее 4% от рынка. Но в компании не оставляют надежд привлечь пользователей, поэтому внедрили AI-поиск. Copilot Search объединяет преимущества традиционного поиска и генеративного поиска на основе искусственного интеллекта.

📌 Особенности:

➡️ находит информацию из нескольких источников и даёт на них ссылки
➡️ поиск в стиле разговора — сервис способен вести диалог, как чат-бот
➡️ за ответом Copilot cледует обычная поисковая выдача

Избирательность AI в выборе ссылок, по мнению Microsoft, должна подтолкнуть авторов создавать достоверный и качественный контент.

Компания не раскрыла подробностей о том, как работает эта функция. Так как Copilot раньше использовал модели от OpenAI, возможно, «под капотом» нового поисковика скрывается собственная модель.

👀 Оценить работу поисковика можно по видео, а попробовать бесплатно — здесь (нужен VPN)
👍6🔥43
🧠🎮 Quake II вернулся благодаря AI

Ты можешь бегать, прыгать, стрелять и даже находить секретки — только вот ты играешь не в сам Quake II, а в его симуляцию внутри нейросети 🤯

🔄 Microsoft выложила демо своей модели WHAMM (World and Human Action MaskGIT Model). Она создана на базе Muse — семейства моделей от Microsoft, которые обучаются симулировать поведение игрового мира, исходя из действий геймера

⚡️ Новая версия куда шустрее предшественницы: 10 кадров в секунду против одного и удвоенное разрешение (640×360 вместо 300×180). Дело в архитектуре. WHAMM генерирует токены не последовательно, а параллельно, что позволяет взаимодействовать с ней в реальном времени

🧑‍💻 На обучение ушла неделя игры профи-тестеров. Прошлой версии на это потребовалось аж семь лет геймплея. Зато всё как в настоящем Quake II, но с нюансами. Враги порой размыты, здоровье хаотично, а если долго смотреть в небо, то можно телепортироваться. Есть и забавные глюки: в этой симуляции ты можешь буквально закрыть глаза, отвернуться — и враг исчезнет (хотели бы такое в реальной жизни?). Причина — в узком контекстном окне в 0,9 секунд (9 кадров по 10fps), модель просто забывает, что было секунду назад. Поиграть можно тут

🤖 Возможно, на наших глазах зарождается новый жанр самосоздающихся игр, где будут сталкиваться реальные и AI-игроки
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤‍🔥3
AI рвется в будущее🔜

Собрала для вас главные достижения AI, которые привлекли мое внимание за прошедшую неделю⚠️

Видео и графика:
1️⃣ Вышло обновление для Runway Gen-4. Нейросеть точно воссоздаёт сцены и персонажей из изображений и промптов, редко галлюцинирует, а видео по качеству не уступает киносъёмке 👀 Запоминает стили, объекты и героев для повторного использования. Есть редактирование по сценам 🚀

2️⃣ Спустя год зарелизили Midjourney V7 — детализация сумасшедшая, но не всё так гладко, как хотелось бы. Этой обнове я посвятила отдельный пост ⚠️

3️⃣ ChatGPT теперь умеет редактировать и создавать изображения высокого качества. Надписи читабельны, артефактов нет, руки с нужным количеством пальцев и, конечно же, прогремевшая на весь интернет стилизация под мультики студии Ghibli 👏

Ассистенты и мультимодальные решения:
4️⃣ С китайской нейросетью Qwen теперь можно общаться в формате голосового и видеочата. Она понимает текст, картинки, звук и видео, запоминает фразы и ведёт диалог на достойном уровне. Правда, пока только на китайском и английском 🆒

5️⃣ Microsoft апгрейднула Copilot до полноценного AI-агента. Теперь пользоваться им можно на всех платформах — Windows, Android, iOS и в браузере 😮 Copilot научился бронировать отели, писать письма и искать товары по лучшим ценам. Про внедрение Copilot Search в поисковик Bing рассказала в посте

6️⃣ Anthropic выпустила Claude for Education на базе версии 3.7 — новую версию чат-бота для образовательных учреждений. Ассистент не даёт готовые ответы, а подталкивает студентов искать решение через диалог. Сейчас его тестируют в нескольких зарубежных университетах ✏️

Языковые модели:
7️⃣ Обновился Deep Research от Google — теперь на базе Gemini 2.5 Pro. Модель обходит ChatGPT в аналитике: копает глубже, аргументирует точнее, формулирует лучше. Последняя версия доступна бесплатно в AI Studio 🆓

8️⃣ Meta* представила LLaMa 4. У Scout, самой маленькой модели в линейке, память на 10 млн токенов. Это как если бы AI держал в голове сразу несколько толстенных энциклопедий 🔥 У флагмана Mavrick — 1 млн, но он мощнее. Младшие модели уже обгоняют GPT-4o в тестах

9️⃣ Grok — AI от Илона Маска — теперь в Telegram, модель доступна премиум-пользователям. Сам Маск утверждает, что она умнее конкурентов. Но есть нюанс: в мессенджере урезан функционал, нет поиска в интернете и бот иногда подлагивает ⚡️

Изображение Recraft

*экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍104🔥1
GigaChat обновляется — версия 2.0 🔔

Sber выпустил новую версию GigaChat 2.0 — нейросеть доступна бесплатно в веб-версии по входу через Сбер ID, в новом мессенджере MAX от VK и в Telegram-боте

Что добавили:

🧑‍💻 актуальная информация: ответы со ссылками на источники
🆗 анализ ссылок: читает веб-страницы, изучает PDF-документы и изображения
🎶 анализ аудиофайлов и аудиосообщений: отвечает на вопросы по содержанию, промпты теперь можно отправлять голосом
🆒 подтянули обработку документов: можно загружать сразу несколько файлов, поддерживает до 200 страниц A4, лучше понимает контекст
✏️ улучшена работа с изображениями: даёт более точные ответы по содержанию, считывает текст и формулы
GigaChat 2.0 теперь интегрирован в колонки от Sber — система стала умнее, понимает в 10 раз больше контекста и отвечает естественнее

💬 Звучит впечатляюще! Пробуем свежие фичи в деле 👀

Изображение GigaChat 2.0
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8😁2
AI 2027: эволюция ускоряется ⚡️

Эксперты из ведущих AI-компаний опубликовали AI 2027 — подробный сценарий развития нейросетей на ближайшие 2 года. И это один из наиболее реалистичных прогнозов, которые я читала за последнее время ⚠️

Что нравится:

⚙️ сценарий основывается не на фантазиях, а на инженерной логике (как растут датасеты, модели, дата-центры)
🔥 повествование построено на развитии существующих трендов: FLOPS, агенты, гонка чипов и R&D
📉 прогнозы без технофобных спекуляций, приведены наглядные метрики и ссылки на научные статьи

Какие нас ждут этапы:

⚫️ 2025: разработчики делают ставку на использование AI для ускорения AI-исследований. Появляются первые агенты, способные работать с кодом как настоящие сотрудники. Компании начинают встраивать их в рабочие процессы
⚫️ 2026: выходит условный Agent-1 — AI, ускоряющий обучение нейросетей на 50%
⚫️ 2027: появляется Agent-3, который быстрее всех в мире выполняет задачи по R&D. Затем Agent-4 — полноценный автономный AI-исследователь, ускоряющий генерацию и обучение новых моделей в 50 раз

Далее формируется агентская экономика: автоматизация большинства рутинных офисных задач, рост производительности, взрывной спрос на специалистов по внедрению и управлению AI-системами (который мы уже наблюдаем 👀)

💡 Рекомендую ознакомиться всем, кому важно видеть суть развития AI без общественных страхов и завышенных ожиданий

✏️ Здесь перевод статьи на русский язык

Изображение AI-2027
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥2💔2
☄️ OpenAI выпустила GPT-4.1: фокус на разработчиков

Пока все ждут GPT-5, OpenAI представила обновлённую мультимодальную модель GPT-4.1, которая, по заявлению компании, превосходит прошлую версию практически во всём

Что нового:

1️⃣ GPT‑4.1 уже доступен для разработчиков вместе с двумя младшими моделями — Mini и Nano. Теперь они лучше справляются со сложными задачами и следованием инструкциям при разработке ПО
2️⃣ Все три модели могут обрабатывать до 1 млн токенов, что на 800 000 токенов больше, чем у GPT-4
3️⃣ GPT-4.1 на 26% дешевле прошлой версии. Похоже, что гонка за снижением стоимости обострилась после выхода DeepSeek
4️⃣ OpenAI планирует отказаться от GPT‑4, а также от демо GPT‑4.5 в API — новая версия предлагает лучшую производительность с меньшими затратами

🔴 Задержку GPT-5 в OpenAI объясняют тем, что интегрировать модель оказалось сложнее. Зато уверяют, что скоро выйдут полные версии reasoning-моделей: o3 и o4 mini 😮

Изображение OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83👍3
🧬 Стартовало соревнование по NLP в биомедицине

AIRI, МГУ и SberAI проводят соревнование BioNNE-L. Участникам предлагают решить проблему нормализации сущностей в биомедицинском NLP. Это нужно для разработки методов нормализации упоминания болезней, лекарств и органов в зависимости от контекста. В чём же сама проблема?

В процессе сущностного линкинга при работе с русским языком возникают трудности:
❗️ Недостаток полноценных словарей.
❗️ Множество синонимов, которые могут быть неполно охвачены в базах данных.
Например, «белок» может означать как животное, так и биомолекулу.

Как участвовать?

✍️ Зарегистрироваться в воркшопе BioASQ
💻 Вступить в соревнование на платформе Codalab
📂 Посетить репозиторий BioNNE-L или страницу HuggingFace, где можно скачать данные и узнать подробности о задаче.

Сроки:

👉 25 апреля станет доступен неразмеченный тест-сет соревнования, чтобы отправлять предсказания (tsv-файлы, обёрнутые в zip-архив) в Codalab.
👉 6 мая заканчивается приём предсказаний.
👉 до 31 мая включительно нужно прислать описание проведённых в рамках соревнования экспериментов, созданных систем и методов.

Придётся много работать с вложенными сущностями, когда одно слово входит в более развёрнутое устойчивое выражение. Задача не из лёгких, но решить её важно для улучшения медицинских технологий. Вы можете в этом помочь!

Кстати, тема практически неизведанная и поэтому может лечь в основу научной статьи 📝
Читайте подробности также в статье организаторов на Хабре.
👍8👏1
Сбер открыл приём заявок на ежегодную научную премию. Награда присуждается учёным, работающим в России, за выдающиеся достижения последних 10 лет и вклад в развитие отечественной науки.

Победители получат аж по 20 млн рублей! 🏆

Также предусмотрены спецноминации для молодых учёных, совершивших яркий научный прорыв в AI за последние пять лет. Приз — 4,5 млн рублей на команду + 1 млн на облачные вычисления 💸

Обожаю такие инициативы😍 Буду следить и ждать имена победителей 👀
3👍2🔥1
Генеративные AI: четыре горячих апдейта 🎬

1️⃣ CapCut выпустила нейросеть Dreamina — генератор реалистичного видео по фото и аудио. Основана на модели OmniHuman-1, обученной на 19 000 часов контента.

Что умеет:

⚫️ Точная синхронизация мимики с текстом + знает русский
⚫️ Генерация естественных движений в сложных сценах
⚫️ Поддержка комбинированных промптов (фото+аудио)
⚠️ Сервис бесплатный, но доступен только с американским IP

2️⃣ Вышел Kling 2.0 — нейросеть на базе MVL. Новая версия предлагает улучшенные возможности редактирования, включая добавление и изменение элементов по промптам.

Что умеет:


⚫️ Превращает текст в видео с реалистичными движениями
⚫️ Объединяет до четырёх изображений в единый ролик
⚫️ Есть интеграция с DeepSeek для помощи в генерации
⚠️ Цены выросли в 3 раза: теперь 5 секунд видео стоят 100 кредитов (против 35 в версии 1.6)

3️⃣ Runway выпустила Gen-4 — новую модель для генерации видео, способную сохранять облик персонажей и объектов на протяжении всего ролика.

Что умеет:

⚫️ Плавная анимация, реалистичная динамика
⚫️ Сохранение внешности персонажей от сцены к сцене
⚫️ Генерация за 30 секунд в режиме Turbo
⚠️ Доступна платным подписчикам

4️⃣ Google открыла доступ к своей продвинутой видеомодели Veo 2. Пользователи смогут создавать клипы и загружать их в YouTube и другие сервисы.

Что умеет:

⚫️ Генерация видео 720p по тексту и референсам
⚫️ Поддержка стилей: от анимации до фотореализма
⚫️ Клип маркируется как AI-контент (SynthID)
⚠️ Только по подписке Gemini Advanced

Видео Dreamina, Kling 2.0, Runway Gen-4, Veo 2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🏆52