Sber AI – Telegram
Sber AI
38.7K subscribers
2.43K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
🔥 Step-Video-T2V: суперсжатие, два языка и длинные ролики

У открытой модельки 30 млрд параметров, а продолжительность генерации до 204 кадров.

Ещё про характеристики и успехи:
🥳 Video-VAE сжимает ролик в 16 раз по пространству и в 8 раз по времени, при этом сохраняя качество
📕 текстовые запросы обрабатывают два двуязычных кодировщика, поддерживающих английский и китайский
👨‍💻 модель использует DiT с 3D-вниманием и обучается с помощью Flow Matching для преобразования шума в кадры
⭐️ Video-DPO улучшает качество видео и уменьшает артефакты

Тестим на новом бенчмарке Step-Video-T2V-Eval. Результаты отличные 😍

Модель и бенчмарк забираем тут. Генерим здесь 🤌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
Стартапы, апгрейды, космос и медицина

Чего хотят люди и что нужно для AI?

1️⃣ Бывшая CTO OpenAI Мира Мурати наконец определилась и запустила свой стартап Thinking Machines, который будет делать AI доступным каждому ❤️ Хочет устранить разрыв между разработками и их применением.

2️⃣ Новый CEO Vimeo Филип Мойер позиционирует продукт как AI-видеоплатформу 😎 Что это значит и как будет развиваться конкурент YouTube, читаем в интервью Филипа тут.

3️⃣ С ЦОД надо что-то решать. Для питания дата-центров нужно много энергии, а она добывается из нефти и угля. Из-за вредных выбросов растёт число заболеваний, таких как астма. Исследование показало, что затраты на здравоохранение, связанные с этим, составили $5,4 млрд долларов за 5 лет 🤦‍♂️

4️⃣ Китайцы задумались о том, как слетать к границам Солнечной системы, и поняли, что без AI никак. Неизвестная среда, масса научных приборов, огромные расстояния! 👽 Для контроля нужны умные системы, принимающие решения. Миссия предусматривает отправку пары зондов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔5👍3
Секрет успеха на собеседовании: нейросети в помощь 🧑‍💻

Недавний опрос показал, что каждый десятый россиянин уже вовсю юзает AI для подготовки к встрече с работодателем.

Что ещё выяснили:
🤘 лидируют ChatGPT и GigaChat, помогающие оформлять резюме и писать сопроводительные письма
🤔 для тренировки перед самим интервью AI используют реже
✔️ большинство (60%) уверено, что нейросети реально помогают
🤩 есть и те, кто опасается, что они могут завышать реальные навыки

Ну и, конечно, нашлись скептики, считающие, что AI скорее навредит, чем поможет в поисках работы 😵‍💫

Изображение UltraPixel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
Media is too big
VIEW IN TELEGRAM
Helix: распаковка 🔥

Какие великолепные 😍

В роботах FigureAI объединили зрение, понимание речи и контроль движений:
🕺 полностью управляют верхней частью корпуса: руками, туловищем, головой и пальцами 
🤝 работают в команде: двое решают задачу вместе
🤘 поднимают с пола всё подряд: по просьбе могут выбирать любые мелочи, даже те, что видят впервые
📊 одна нейросеть без всяких настроек под конкретные задачи

Helix функционирует прямо на встроенном процессоре, так что его можно использовать сразу в реальных условиях 💖
4👍3🤔1
🆕 Wan2.1: планка видеоконтента ещё выше

Новый китайский генератор работает на диффузионных трансформерах 🤖 Суперэффективный 3D-VAE, продвинутые методы предобучения и огромный обучающий датасет позволяют ему генерить просто нереально крутые видосы 💥

Как это устроено:
3D-VAE разработали для видео, добавили идеи для сжатия, экономии памяти и последовательности. Ролики генерятся без зависания с помощью хитрого кэша
Flow Matching и обработка текста на разных языках через T5 Encoder
😓 пара слоёв для работы со временем и прогнозированием параметров
👨‍💻 FSDP и параллельное выполнение задач

Доступна в чате — бегом генерить ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Собираем AI: ловите мануал 👨‍💻

Hugging Face выпустили бесплатную инструкцию для начинающих гениев по тренировке нейросеток ⚡️

6 месяцев работы и год на GPU. И вот результат:
✍️ 100 страниц про обучение моделей на GPU-кластерах — в документе есть всё, что нужно для успешного тренинга
👑 авторы провели более 4 000 экспериментов и изложили в гайде самые важные уроки, которые они извлекли

В Ultra-Scale Playbook много интересного:
🎓 про 5D-параллелизм и технологии ZeRO
☝️ разбор конкретных кейсов вроде таких: как DeepSeek натренировал свою модель всего за $5 млн или почему Mistral выбрал архитектуру MoE
📈 интерактивные графики и виджеты для наглядности. Плюс сразу две базы кода: одна для новичков — Picotron, другая для серьёзных дел — Nanotron

Пока OpenAI держит всё при себе, Hugging Face учат людей делать мощные модели своими руками 🙌

Изображение Ideogram
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👏2
Civilization 7: почему AI не дружит с картой?

Недавно же вышла новая Цива, и игроки ринулись обсуждать апгрейд AI.

Вот, к примеру, претензия: в Civilization 7 AI удивляет странными идеями при постройке городов 🏰 Периодически лепит поселения в неадекватных местах. Цивилизация развивается медленнее, да ещё и конфликты начинаются 😡

Пользователи на Reddit пишут, что AI ставит города на неудобных клочках земли, хотя рядом полно нормальных участков с ресурсами. Зачем город между тремя другими, когда вокруг есть свободные территории? К тому же с этим сложно бороться — тратить время на разрушение и получать за это штрафы 👎

А ведь технологию в Civ6 критиковали за примитивность. Хотели сложностей? Получили 😠

Теперь просят вернуть систему лояльности, чтобы ограничить такое строительство. Но разрабы Firaxis клятвенно обещают докрутить AI 🫡

Изображение Reddit
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1😁1
AI на Reddit: новый вызов для комьюнити 🤬

Модераторы популярной площадки пытаются справиться с лавиной AI-контента 🤬

Reddit оказался для AI лакомым куском и крепким орешком одновременно. Прецеденты недовольства со стороны сайта уже были. И вот опять.

Почему там банят AI-посты? Отдельные комьюнити блокируют такой контент, считая его некачественным или несоответствующим целям. Например, модераторы r/AskHistorians боятся, что AI испортит достоверность информации и их репутацию 🆘

Подходы там сейчас разные:
🙅 где-то ввели жёсткий запрет
👌 где-то разрешают посты, если есть человеческий вклад или всё сделано на уровне

А тут ещё в 2024 году Reddit начал продавать датасеты из контента пользователей для обучения LLM, что тоже подлило масла в огонь.

В общем, модерам тяжко разбираться с наплывом. Ждут от Reddit инструментов, которые упростят задачу 😱


Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4🏆2👍1
☄️ GPT-4.5: умнее, креативнее, чувствительнее

Новость так новость! OpenAI выпустили долгожданную версию своей языковой модели. По сравнению с GPT-4 и GPT-4o — самая мощная и довольно интересная 🔥

Основное:
✔️ много эмоций и креатива. GPT-4.5 общается более естественно, творчески подходит к задачам, лучше понимает намерения пользователя и меньше галлюцинирует
✔️ планирует и решает намного круче — справляется с многоходовочками и автоматизацией
✔️ мультимодальная — GPT-4.5 отлично работает с текстом и картинками, а в будущем обещают ещё поддержку аудио и видео

Где взять?
🔔 открыта для подписчиков ChatGPT Pro и скоро появится для Plus, Team, Enterprise и на Edu
🔔 для разрабов доступна через API — это Chat Completions API, Assistants API и Batch API

Чего пока нет и что нельзя делать?
GPT-4.5 не дружит с голосом и видео, совместного использования экрана придётся подождать
ещё одна важная деталь: модель требует больше ресурсов и стоит дороже

Перед запуском провели кучу тестов на безопасность, так что всё чисто 🛡

Изображение OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2🤔2
🆕 Российские учёные улучшили работу банков с помощью AI

Спецы из Сбера и Сколтеха придумали, как сделать умнее нейросети для важной финансовой отрасли. Теперь они точнее на 20%!

Разработали классный метод, позволяющий алгоритмам обрабатывать сразу два уровня данных: общие вещи и внутреннюю информацию. Так можно быстрее анализировать операции и сделать сервисы безопаснее 🤫

Задачи поделили на три типа:
1️⃣ глобальные
2️⃣ локальные
3️⃣ динамические

Проверили разные подходы и создали уникальную методику. С её помощью учитываются данные не только конкретного клиента, но и похожих на него по конкретным признакам.

Технология гибкая и универсальная, но её планируют развивать дальше, чтобы нейросети могли лучше распознавать нестандартные ситуации и защищаться от ошибок 🧑‍🎓

Результаты исследования, поддержанного грантом Российского научного фонда (РНФ), опубликованы в международном журнале International Journal of Information Management Data Insights.

Изображение Sber AI Lab, Skoltech
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5🥰1😁1🤔1
AI в почте: письма становятся короче, посты — креативнее 💌

В сервисах Mail нейросетями пользуются уже 5 млн человек. Ресурс популярный, поэтому можно по предпочтениям и общие выводы сделать 🧐

Вы можете попросить нейронку:
🤓 вкратце рассказать, кто и о чём вам написал
🔤 пересказать текст
🖥 написать новый с нуля
🦋 подкинуть идеи
🧾 сочинить пост для соцсеток
🥳 нагенерить поздравление

Самый популярный запрос — саммари писем. Это удобно: система делает выжимку входящих, остаётся только прочитать самое важное. Почти 90% всех заявок связаны именно с этим 💌

Ещё народ любит генерить тексты в Заметках и поздравления через Календарь 1️⃣

Стало интересно, чего вы хотите от AI в почте:
❤️ саммари вполне хватит
👍 пусть ещё и отвечает сам
🔥 спам достаёт — нужна помощь
💯 другие идеи

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
SkyReels V1: реализм на уровне кино ⭐️

Показываю открытую видеомодель, заточенную под генерацию людей.

HunyuanVideo прокачали на десятках миллионов фрагментов из топовых фильмов и сериалов:
👍 генерит на уровне крутых закрытых моделей, а среди конкурентов с открытым кодом в плане превращения текста в видео тягается даже с монстрами Kling и Minimax
🫤 делает реалистичную анимацию: SkyReels V1 показывает 33 разных выражения лица и 400 естественных движений
😎 даёт киноэстетику: кадры прямо как в Голливуде — чёткая композиция, грамотное расположение актёров и шикарные ракурсы

Для разработки создали свой конвейер обработки данных и добавили функции анализа эмоций, движений, понимания сцен.

Есть версии для роликов из текста и картинок, а ещё для “живых” портретов 😜
👍8🤔1
Stial Steven пришёл, чтобы всё заблестело

Китайцы Stial Technologies представили супергибкого робота-гуманоида, специализирующегося на полировке всяких сложных штуковин.

Что может этот малыш:
😶‍🌫️ двигаться почти как человек
🤹 работать с мелкими деталями и замысловатыми поверхностями
😑 в отличие от обычных промышленных роботов, быстро адаптируется
🚶‍♂️ регулирует силу нажатия, углы и траекторию прямо на ходу
⚡️ использует AI и 6D умные датчики силы

Stial Steven действует точно и быстро, особенно в узких местах. Ещё один помощник среди роботов на производстве 💯

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
👍7🔥1🤔1
Большой мозг, маленькая плата: Nvidia и компания творят чудеса с памятью 🧑‍💻

Компания разрабатывает новый стандарт памяти вместе с SK Hynix, Samsung и Micron. Называется SOCAMM (System On Chip Advanced Memory Module) и заточен под AI-компьютеры.

Главное — модуль маленький, но мощный. Следующий уровень после LPCAMM и обычной DRAM-памяти.

Что в нём полезного в целом:
❗️ компактнее DRAM — размером примерно с палец взрослого человека
💥 экономит энергию, потому что память типа LPDDR5X встроена прямо в плату
📥 больше портов для ввода-вывода — целых 694. У LPCAMM их было 644, а у обычной DRAM — вообще 260

Ещё один плюс — SOCAMM легко модернизируется. Его можно снимать и заменять. А это значит, что апгрейд системы станет элементарным 🔄

Массовое производство наметили уже в этом году. Ждём новых мощных компов 💻

Изображение Nvidia
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62👏1🤩1
ProgCo против логической путаницы 🤔

Разработка от ребят из Alibaba для хорошей самокоррекции LLM.

Модели часто не могут адекватно исправлять ошибки, особенно когда дело касается сложных задач на логику. Всему виной их чрезмерная уверенность и проблемы с пониманием хитрых логических цепочек 🥳

ProgCo решает всё двумя модулями:
😓 ProgVe вместо промптов запускает самогенерирующиеся pseudo-verification программы. Так точнее отражается логическая структура
🆘 ProgRe за счёт обратной связи от ProgVe корректирует работу всей модели. Действует в обе стороны: правит и модель, и себя

На разных математических бенчах вроде IFEval, GSM8K и MATH результаты были положительными. GPT-3.5 и GPT-4 показали прирост в среднем на 8% в сложных математических задачах 🏋️‍♂️

Изображение Taobao & Tmall Group of Alibaba
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤔1
А голову ты дома не забыл? GHOST 2.0 и новая эра фотомонтажа 🫤

Это модель для замены на фото головы, а не просто лица, как мы привыкли видеть. Сохраняется всё: волосы, уши и прочее. Плюс естественная мимика и идеальное сочетание с фоном 🕺

Что вообще делается? Берётся голова с одного изображения и вставляется в другое с учётом нюансов: движений, эмоций, антуража 😍

Какие технологии задействованы:
😑 Aligner Model как бы рендерит голову, её ракурсы и позы, даже если она повёрнута на 180 градусов
🪞 Blender Module уже соединяет результат с картинкой, чтобы кожа выглядела натурально, а переходы были незаметными
🙄 не проблема даже странные причёски и формы

Где можно применять? Киношники любят такие штуки для спецэффектов, рекламщики — для вставки знаменитостей, в онлайн-примерке, распознавании фейков.

Ну и селфи доработать никто не откажется 😄

Изображение Sber AI, AIRI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5😁2