Sber AI – Telegram
Sber AI
38.4K subscribers
2.44K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
OREO улучшает многошаговые рассуждения LLM

Главная беда RL-методов типа DPO — в использовании пар с человеческими предпочтениями. Затратно и неэффективно, когда надо научить модель думать на несколько ходов вперёд 🤪

Как OREO решает проблему:
💻 используется метод maximum entropy reinforcement learning
soft Bellman equation одновременно улучшает две вещи: policy model (какие действия выгоднее в конкретный момент 🎉) и value function (как оценить текущее положение и будущее развитие событий ).

Так снижается зависимость от парных наборов предпочтений 😘

На стандартных тестах типа GSM8K и MATH OREO круче традиционных методов offline learning. Например, на MATH выдаёт результат 52.5% 🛍

Изображение UC San Diego, Tsinghua University, Salesforce Research, Northwestern University
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Погнали в космос: учёные разглядели метеорит с помощью AR-технологий 💫

В Уральском геологическом музее разработали приложение для изучения челябинского метеорита.

Как работали:
⭐️ использовали сотни фоток обломков небесного тела с разных сторон
⭐️ сделали 3D-модель его кусочков
➡️ загнали модельку в приложение, созданное на платформе разработки компьютерных игр

Технология помогла увидеть мельчайшие детали поверхности. Теперь эти модели можно посмотреть в книге музея, и любой желающий может изучить их поближе 🔭

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
3👏3
В лабиринте слов: 12 LLM против больших объёмов ✍️

Разрабы всё удлиняют и удлиняют контекст, а как в нём работается моделям?

LLM вроде GPT-4o и других топовых моделей, как выяснилось, нормально связывают информацию и делают выводы из длинных материалов только с подсказками в виде повторяющихся слов ✌️

Как это поняли исследователи Мюнхенского университета и компании Adobe:
🎓 разработали тест NOLIMA
убрали одинаковые слова в тексте и запросах
😇 проверили 12 лидирующих LLM
💬 чем длиннее повествование, тем быстрее теряют нить даже продвинутые
💬 особенно проседают с длиной от 2 000 до 8 000 токенов

У GPT-4o был самый большой диапазон — около 8 тысяч 📱, ещё неплохо показала себя LLaMA-3.3-70B* при использовании CoT.

Что делать? Улучшать механизм внимания, разработать новые подходы к обучению, использовать специализированные модели, развивать Chain-of-Thought Prompting 🧑‍💻

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
👍6🔥4🤔3
Учёба с мемчиками: AI знает, как привлечь внимание детей 🕺

Российские разработчики придумали умную систему для школы. Этот AI думает, как ребёнок, поэтому успешно поможет ему учиться.

Что (или даже кого 🫡) включили в платформу “Препод”? 500 уникальных AI-ассистентов (психологи, методисты и прочие профильные спецы). Они умеют подбирать подходящий материал для каждого ученика с учётом возраста, интересов и уровня подготовки 🤓

Что ещё пригодится?
😶 огромный запас знаний: от книг и учебников до компьютерных игр. AI легко находит общий язык с детьми и объясняет сложные вещи простыми словами
👨‍💻 работает на Python и других продвинутых штуках, позволяющих обрабатывать большие объёмы данных
✉️ умеет фильтровать информацию

Учитывая, что в датасете были даже мемы, интересно, что скажут собственно дети — стрём или норм? 😄

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81
Arm меняет приоритеты: новейший чип уже в пути ✈️

Известные дизайнеры процессорных компонентов решили не мелочиться и запустить уже своё производство цельного серверного продукта 💪

Что в перспективе:
💥 проект — часть общего плана по развитию AI-инфраструктуры (напомню про Stargate, на который SoftBank и OpenAI тратят $500 млрд)
🫡 чип Arm, предназначенный для серверов в крупных ЦОД, который будет подстраиваться под нужды клиентов
🛞 первыми в заказчики собралась Meta*

Говорят даже, что на чип рассчитывает и сэр Джони Айв, создающий тот самый AI-гаджет нового типа.

Ну что же, Qualcomm и Nvidia! Приготовиться к конкуренции 🤘

* экстремистская организация, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью
Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👏3🤔1
Civilization 7: почему AI не дружит с картой?

Недавно же вышла новая Цива, и игроки ринулись обсуждать апгрейд AI.

Вот, к примеру, претензия: в Civilization 7 AI удивляет странными идеями при постройке городов 🏰 Периодически лепит поселения в неадекватных местах. Цивилизация развивается медленнее, да ещё и конфликты начинаются 😡

Пользователи на Reddit пишут, что AI ставит города на неудобных клочках земли, хотя рядом полно нормальных участков с ресурсами. Зачем город между тремя другими, когда вокруг есть свободные территории? К тому же с этим сложно бороться — тратить время на разрушение и получать за это штрафы 👎

А ведь технологию в Civ6 критиковали за примитивность. Хотели сложностей? Получили 😠

Теперь просят вернуть систему лояльности, чтобы ограничить такое строительство. Но разрабы Firaxis клятвенно обещают докрутить AI 🫡

Изображение Reddit
👍5😁5
От поиска до отчёта в науке: Agent Laboratory в деле 🥰

Фреймворк AMD и Университета Джонса Хопкинса использует LLM как научных ассистентов. AI сам может искать нужную инфу, ставить эксперименты и отписываться о результатах.

Подробнее:
📊 это система нейросетей, каждая из которых обучена под разные этапы работы
💞 причём проверяли несколько моделей: o1-preview, o1-mini и GPT-4o. Больше всех нравится пользователям o1-preview, зато mini лучше справляется с экспериментами
может работать сам по себе, но эффективнее в режиме co-pilot, когда учёные немного помогают — делают правки на каждом этапе. Хотя пока статьи всё равно чуть хуже, чем нужно для топовых конференций типа NeurIPS ⤵️

По деньгам выходит выгодно: Agent Laboratory на 84% дешевле других методов.

А ещё он отлично проходит тесты на MLE-Bench, создавая качественный ML-код и обгоняя OpenHands, MLAB и AIDE 😓

Изображение AMD, Johns Hopkins University
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Apple усиливает Vision Pro: новые AI-фичи и пространство для гостей 😎

VR-шлем прокачивают с помощью Apple Intelligence.

Компания решилась, наконец, добавить AI куда-то ещё, кроме iPhone, iPad и Mac:
😇 будет всё лучшее и любимое вроде Writing Tools, Genmojis и Image Playground
👨‍💻 шлем обработает всё на устройстве (спасибо M2 и 16 ГБ оперативки)
✈️ стартует после апгрейда visionOS 2.4 в апреле
🧐 разрабам уже доступен

Вполне актуально, так как у Google уже есть Android XR с Gemini.

А ещё обновили гостевой режим. Владелец шлема сможет делиться им с друзьями и семьёй, управляя через iPhone 🙃
👍4🤔1
DeepSeek делится секретами 🤫

На этой неделе стартап решил открыть исходники пяти своих проектов 🤩 Показывают, что готовы к сотрудничеству и прозрачной работе. Но тут же всплывают вопросы безопасности.

Вместе с успехом к DeepSeek пришли и проблемы. Компанию стали подозревать в неправильной обработке пользовательских данных и даже в том, что группа, связанная с DeepSeek, могла взломать системы OpenAI 😠

Снятие грифа 🤫 выглядит как попытка всех успокоить. Но многие сомневаются, насколько честно стартап собирается расщедриться и какие у него настоящие мотивы 🙂

А никто и не говорил, что будет легко балансировать между развитием инноваций и этическими аспектами ⚖️

Изображение Leonardo
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3😁1🤔1
🆕 Claude 3.7 Sonnet и Claude Code: умная парочка от Anthropic

Вышли обновлённая reasoning-версия флагмана и мощный кодер бонусом.

Прокачанный Claude 3.7 Sonnet “думает” под запрос: предлагает пошаговые решения или моментально выдаёт ответы. Такого ещё не было 🔥

Claude Code помогает программистам прямо из терминала. Пишет, тестит, находит ошибки.

Разные плюсы:
💬 адаптируется под ситуацию: быстрый ответ или на “подумать”
😓 можно контролировать, сколько ресурсов тратить на вычисления, ограничивая токены
🔡 используется на всех платных тарифах, причём режим углублённого мышления тоже включён
🪙 цены остались такими же: $3 за 1 млн символов ввода и $15 за 1 млн вывода

А что насчёт тестов?
На SWE-bench Verified и TAU-bench — топовые результаты. И лучше o1 😎

Общий свободный доступ, как всегда, в чате 👋

Изображение Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤔2
🔥 Step-Video-T2V: суперсжатие, два языка и длинные ролики

У открытой модельки 30 млрд параметров, а продолжительность генерации до 204 кадров.

Ещё про характеристики и успехи:
🥳 Video-VAE сжимает ролик в 16 раз по пространству и в 8 раз по времени, при этом сохраняя качество
📕 текстовые запросы обрабатывают два двуязычных кодировщика, поддерживающих английский и китайский
👨‍💻 модель использует DiT с 3D-вниманием и обучается с помощью Flow Matching для преобразования шума в кадры
⭐️ Video-DPO улучшает качество видео и уменьшает артефакты

Тестим на новом бенчмарке Step-Video-T2V-Eval. Результаты отличные 😍

Модель и бенчмарк забираем тут. Генерим здесь 🤌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
Стартапы, апгрейды, космос и медицина

Чего хотят люди и что нужно для AI?

1️⃣ Бывшая CTO OpenAI Мира Мурати наконец определилась и запустила свой стартап Thinking Machines, который будет делать AI доступным каждому ❤️ Хочет устранить разрыв между разработками и их применением.

2️⃣ Новый CEO Vimeo Филип Мойер позиционирует продукт как AI-видеоплатформу 😎 Что это значит и как будет развиваться конкурент YouTube, читаем в интервью Филипа тут.

3️⃣ С ЦОД надо что-то решать. Для питания дата-центров нужно много энергии, а она добывается из нефти и угля. Из-за вредных выбросов растёт число заболеваний, таких как астма. Исследование показало, что затраты на здравоохранение, связанные с этим, составили $5,4 млрд долларов за 5 лет 🤦‍♂️

4️⃣ Китайцы задумались о том, как слетать к границам Солнечной системы, и поняли, что без AI никак. Неизвестная среда, масса научных приборов, огромные расстояния! 👽 Для контроля нужны умные системы, принимающие решения. Миссия предусматривает отправку пары зондов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔5👍3
Секрет успеха на собеседовании: нейросети в помощь 🧑‍💻

Недавний опрос показал, что каждый десятый россиянин уже вовсю юзает AI для подготовки к встрече с работодателем.

Что ещё выяснили:
🤘 лидируют ChatGPT и GigaChat, помогающие оформлять резюме и писать сопроводительные письма
🤔 для тренировки перед самим интервью AI используют реже
✔️ большинство (60%) уверено, что нейросети реально помогают
🤩 есть и те, кто опасается, что они могут завышать реальные навыки

Ну и, конечно, нашлись скептики, считающие, что AI скорее навредит, чем поможет в поисках работы 😵‍💫

Изображение UltraPixel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
Media is too big
VIEW IN TELEGRAM
Helix: распаковка 🔥

Какие великолепные 😍

В роботах FigureAI объединили зрение, понимание речи и контроль движений:
🕺 полностью управляют верхней частью корпуса: руками, туловищем, головой и пальцами 
🤝 работают в команде: двое решают задачу вместе
🤘 поднимают с пола всё подряд: по просьбе могут выбирать любые мелочи, даже те, что видят впервые
📊 одна нейросеть без всяких настроек под конкретные задачи

Helix функционирует прямо на встроенном процессоре, так что его можно использовать сразу в реальных условиях 💖
4👍3🤔1
🆕 Wan2.1: планка видеоконтента ещё выше

Новый китайский генератор работает на диффузионных трансформерах 🤖 Суперэффективный 3D-VAE, продвинутые методы предобучения и огромный обучающий датасет позволяют ему генерить просто нереально крутые видосы 💥

Как это устроено:
3D-VAE разработали для видео, добавили идеи для сжатия, экономии памяти и последовательности. Ролики генерятся без зависания с помощью хитрого кэша
Flow Matching и обработка текста на разных языках через T5 Encoder
😓 пара слоёв для работы со временем и прогнозированием параметров
👨‍💻 FSDP и параллельное выполнение задач

Доступна в чате — бегом генерить ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1