Sber AI – Telegram
Sber AI
40.8K subscribers
2.42K photos
616 videos
1 file
2.04K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Два Ernie против одной DeepSeek

И немножко против GPT 4.5 😉

💬 Во-первых, Baidu показали нового Ernie X1, способного объяснять свои решения. Говорят, что он хорош в повседневных разговорах, сложных расчётах и логике.

🔄 Во-вторых, обновили базового Ernie до версии 4.5, превосходящей такую же GPT в работе с текстом 🔤

✔️ До кучи сделали все уровни сервиса (включая X1) бесплатными для юзеров. Раньше запланированного срока 🚀

Очень хотят не ударить в грязь лицом, очень 😃 Всё-таки Baidu — первые китайцы, выпустившие аналог ChatGPT, и им надо оправдывать доверие сообщества. Объявили даже, что с 30 июня полностью откроют Ernie 👀

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
Скейтеры будущего: роботы становятся экстремалами 🏄‍♂️

Показываю, как умело робопёс управляет скейтом (и даже помогает себе лапками 👋)

Методика DHAL учит роботов рулить в режиме реального времени:
👨‍🎓 используют принципы гибридных автоматов
🚗 двигаются ученики плавно, даже если имеют сложную конструкцию с четырьмя ногами
🚘 эти задачи решались заданными шаблонами или ML-методами, но оба подхода имеют недостатки
🚗 тут применяют специальную политику поведения и систему оценок, чтобы робот сам понимал, когда и как менять движение по ситуации

И вот наш четвероногий друг уже покоряет горки, доказывая, что тоже умеет ловить вайб 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
👏7🔥3👍2🤔1
UP-VLA: понимание и прогноз в одном алгоритме 👐

Китайскую vision-language-action модель учили одновременно ориентироваться в текущем состоянии (Understanding) и предсказывать будущие (Prediction).

Современные VLM нужны в робототехнике, но при этом часто страдают от неспособности детально анализировать пространство 😕

Объединение стратегий обучения и решает эту проблему:
🤝 semantic comprehension сочетают с низкоуровневым spatial recognition
🤡 когда модель управляет физическим агентом (embodied tasks), её действия становятся более эффективными

Тренировка проходила за счёт обучения авторегрессионной модели с использованием attention mask. На Calvin ABC-D перформанс улучшился на 33% в сравнении с SOTA 🤘

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔2
Сырный челлендж: Perplexity vs Google в борьбе за идеальную пиццу 🍕лидерство

Видели, как Perplexity потроллила конкурентов? Выпустили рекламу, где Ли Джон Джэ из “Игры в кальмара” пытается выбраться из ловушки с помощью веб-поиска. И некая система Poogle 😄 его не спасает, зато Perplexity на высоте!

Одна из загадок касается к тому же недавнего фейла AI Google. Помните его совет сделать пиццу с клеем вместо сыра? Perplexity предлагает моцареллу, при этом прямым текстом не рекомендует клей.

Вот тебе и “Google в помощь!” 😉 Насладитесь подробностями.

Изображение Perplexity
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10
Пробовала общаться с AI-пареньком, созданным с помощью операционки Conversational Video Interface (CVI) от Tavus. Мило 😇 Сразу же уточнила, знает ли он русский, и спросила именно по-русски. Ответ был:  “О, ты говоришь на русском!”🔥То есть язык он распознал, но пока на этом всё 🆗

Систему предлагают для реалистичного и эмоционального общения. Используются технологии Raven-0 и Sparrow-0.

Raven-0:
😊 слышит и видит
🫤 следит за жестами, выражением лица, взглядом
😐 считывает эмоции и реагирует

Sparrow-0
🤓 чувствует ритм речи и точно выбирает момент для ответа
🤫 на паузе не торопит, ждёт
🤾‍♂️ отвечает за доли секунды

Есть демопомощник Charlie:
💬 реально вовлекается в разговор
🖥 ищет инфу в интернете, смотрит на экран, генерит картинки прямо во время разговора
📣 помогает решать задачи, советует

Через API можно встроить фишки в приложения.

Заходим и общаемся тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🤔3
Быт, научные прорывы и перестройка реальности

AI уже меняет наши привычки, становится доступнее и учится думать как человек 😶

1️⃣ Встречаем ещё одну умную нейросеть — EXAONE Deep от LG. Разбирается в математике, науке и кодинге 🤖 Версия 32B сравнялась с огромной DeepSeek-R1 (671B) в экзамене на логику AIME 2025.

2️⃣ На конфе GTC 2025, проходящей прямо сейчас в Калифорнии, Nvidia показала свои новенькие мини-суперкомпы — маленький DGX Spark и побольше DGX Station. Работают на Grace Blackwell и могут качать мощные модели. Оба девайса летом будут в продаже ☀️

3️⃣ Microsoft вместе со швейцарским стартапом разрабатывает мозгоподобный AI для роботов 🤪 Идея в том, чтобы научить его думать по-настоящему, а не просто воспроизводить закономерности.

4️⃣ Благодаря AI трафик в онлайн-магазинах взлетел на 1 200%! Люди уже активно юзают технологии для шопинга, планирования поездок, подбора подарков и других целей 🎁 С AI покупатели также дольше сидят на сайтах и просматривают больше страниц. Полное исследование Adobe Analytics смотрим тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6👏1
This media is not supported in your browser
VIEW IN TELEGRAM
GR00T N1 делает андроидов универсальными 🏋️

Nvidia создали модель для роботов, которая может всё и в любой среде.

Обучение и архитектура:
🧑‍💻 натренирована на реальных данных роботов, плюс синтетика и много видосов из сети
🧑‍🎓 совмещены обработка картинок и текста, добавлен диффузионный трансформер для сглаживания движений

Как использовать:
🤬 готовим демо данных (видео, состояние, действие)
👌 приводим в совместимый формат LeRobot
👨‍💻 настраиваем параметры под своего робота
✍️ дообучаем GR00T N1 на собственной инфе
🏄‍♂️ интегрируем с контроллером, и в путь!

Что нужно для запуска?
*️⃣ ОС: Ubuntu 20.04/22.04
*️⃣ GPU: H100, L40, A4090, A6000 (для тренировки), 4090, A6000 (для вывода)
*️⃣ Питон: 3.10, CUDA: 12.4
*️⃣ библиотеки: ffmpeg, libsm6, libxext6

Для всех желающих на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
Драма на сервере: AI-боты играют в “Мафию” 🌚

Энтузиаст разработал сайт, где разные AI-модели рубятся в популярную игру 🪞

Наблюдать за ними весело, потому что некоторые явно не шарят в правилах. Один, например, случайно слил, что он мафиози, и тут же вылетел из игры 🫣 Зато Claude 3.7 Sonnet показал свои лучшие скиллы и у всех выиграл 😎

Скоро разработчик выложит код на GitHub, чтобы другие могли адаптировать его для новых игр 🧑‍🎓

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👏121😁1🤔1
Razer выкатил AI-платформу для геймдевелоперов 🧑‍💻

Главным козырем на Wyvrn стал AI QA Copilot:
🆘 помогает тестировать игры и автоматом находит баги
😵‍💫 интегрируется с популярными движками Unreal Engine и Unity
🤓 находит до 25% больше ошибок по сравнению с ручными проверками
сокращает затраты времени и ресурсов на 50%

Для самих же игроков готовят к релизу ассистента AI Gamer Copilot (раньше это был Project Ava). Помощник разберёт тактику в мультиплеере или в реальном времени подскажет, как проходить сложные моменты в одиночных играх 👩‍💻

Изображение Wyvrn
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Tencent HunYuan выложили в открытый доступ 5 нейронок для 3D-моделей. Сразу потестила

Детали:
🚗 работают на базе HunYuan3D-2.0 и делают всё быстро (30 секунд)
😓 движок от Tencent поддерживает разные платформы
🚗 HunYuan3D-2-MV использует сразу несколько ракурсов на инпуте
🆒 облегчённая версия запускается даже на слабеньких девайсах вроде Apple M1 Pro

Мои опыты:
😇 кидаем картинку и погнали (первый слайд)
💩 можно выбрать режим формы или сразу с текстурой (второй слайд)
😵‍💫 генерится на раз-два (третий слайд)
🌙 после крутим-вертим (четвёртый слайд)
↗️ и даже вид снизу (пятый слайд)

Пробуем тут. Используем для разного контента, производства товаров, разработки игр 👨‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🏆2
Камеры в AirPods: что скрывается за новым функционалом 😎

Из музыкального девайса Apple превращает эйрподсы в AI-помощника по визуалу. “Уши” смогут "видеть" окружающий мир и помогут ориентироваться, даже не доставая смартфон из кармана 😲

Как это будет:
можно спросить Siri про то, что видишь, повернув голову в нужную сторону
🎶 насладиться объёмным звуком, который адаптируется под положение в пространстве
🤹 интеграция с Visual Intelligence и системой Vision Pro

Правда, ждать эту новинку придётся долго — примерно до 2027 года. Скорее всего, она появится только в AirPods Pro 4 🙂

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
7 задач, которые можно доверить AI 😶

Держите гайд по всему спектру возможностей AI. Поможет делать крутые проекты проще и быстрее 🚀

1️⃣ Генерация контента. Создаёт тексты, картинки, видео или звук на основе ваших запросов. Творчество выходит на новый уровень ✍️

2️⃣ Классификация. Сортирует данные по категориям, делая управление ими удобнее. Забудьте про бесконечный поиск нужных файлов! 📊

3️⃣ Автоматизация. Выполняет рутину за вас. Меньше ручной работы, больше скорости и точности ✈️

4️⃣ Прогнозирование. Анализ данных для предсказания будущего — суперполезно в планировании и стратегиях 🗓

5️⃣ Обнаружение аномалий. Находит отклонения в работе систем, помогая предотвратить проблемы и держать всё под контролем 🗿

6️⃣ Интерпретация смысла. AI понимает, что кроется за цифрами и фактами, анализирует информацию для глубокого осмысления 🧐

7️⃣ Гиперперсонализация. Индивидуальные профили, адаптация предложений и услуг под конкретные нужды, персонализированные рекомендации😑

Разрабам — для системности, бизнесменам — для грамотной интеграции в процессы, маркетологам — для взаимодействия с клиентами, стартапам — для привлечения инвестиций 🥰

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔42👍1
Не знаю, получилось ли у вас потестить недавний Wan2.1 через чат, у меня пока нет 🫠 Но я зашла в YesChat AI, где новичкам дают пробную бесплатную неделю генераций.

Держите результаты 🤘 Можно хотя бы сделать выводы, а при желании сравнить с другими нейронками.

Вот промпты:
❤️ Барышня:
Renaissance soft painting comes to life, XVI painting style of a woman, with her hair half up in a bun, is swinging on a swing in the middle of a garden, under her pink and blue dress with small flowers, a pair of Jordan sneakers, in the style of classical academic painting, historical fiction, bibliopunk

👍 Исследовательский центр:
Create a high-quality AI-generated video of an industrial research unit transforming over time. Start with a static image of the facility, then gradually animate various elements: researchers working, machines operating, data being analyzed on digital screens, and robotic arms assembling components. Include dynamic lighting effects, realistic textures, and smooth transitions to depict technological advancements. The atmosphere should feel futuristic yet practical, showcasing innovation in industrial research. The final sequence should highlight AI-driven automation, with intelligent systems optimizing processes in real time
👍4🔥3🤔1
Почти как своя: роборука, которая чувствует и управляет 👋

В Университете Джонса Хопкинса создали крутую роботизированную руку! Хватает и держит самые разные предметы — от плюшевых мишек 🕺 до бутылок с водой — как будто настоящая.

Как работает устройство:
🤝 сочетает жёсткость и мягкость
🤌 оснащено сенсорами
🥰 управляется мышцами, а внутри действуют умные алгоритмы, превращающие сигналы от датчиков в ощущение прикосновения

В тестах показала результативность почти 100%, ловко удерживая даже хрупкие вещи вроде пластикового стаканчика 🦾

Изображение Johns Hopkins University
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6👍2
NeoBert: архитектурные фишки и рекордные результаты 😇

Авторегрессионные модели вроде DeepSeek сейчас в тренде. Они учатся в контексте и решают сложные задачки. А вот bidirectional LLM-энкодеры как-то отставали, хотя тоже важны.

NeoBert — это улучшенная версия:
🧁 пересмотрели depth-to-width ratio: теперь у нас 28 слоёв вместо 16 при фиксированном количестве hidden dimensions — 768
⭐️ стандартные компоненты сети поменяли на RoPE, RMSNorm и SwiGLU

В общем, сделали всё по последнему слову техники 🤖

Предобучили в два этапа на датасете RefinedWeb в 600 млрд токенов:
💌 гоняли на текстах до 1024 токенов для создания прочных short-to-medium репрезентаций без вычислительных затрат
🙂 плавно растягивали контекст, сохраняя перформанс. Удалось увеличить длину до 4096 токенов

NeoBert показал SoTA на GLUE и MTEB. На текстах до 4096 токенов выдал прирост на 4,5%, да ещё и ускорил инференс на 46,7% ⚡️

Изображение Chandar Research Lab, Mila – Quebec AI Institute, Polytechnique Montréal, Royal Military College of Canada, Canada CIFAR AI Chai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Claude врывается в интернет

Anthropic обновила чат-бота, добавив суперспособность — поиск в сети. Теперь он находит инфу онлайн. Фича доступна для платных американских пользователей, но скоро доберётся и до остальных 🎈

Как работает:
📥 включаем в настройках профиля
🔗 ответы основаны на актуальных источниках, проверяем по ссылкам
😓 поддерживает пока только Claude 3.7 Sonnet

Говорят, что помощник иногда сбоит. Но если находит, то уж находит. Вытаскивает данные даже из соцсетей, не говоря уж про NPR и Reuters 📞 Цену на подписку в связи с апгрейдом вроде повышать не собираются 😵‍💫
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9