NEW BOT Телеграм, страница - 905911662

Sber AI

38.4K subscribers

2.44K photos

620 videos

1 file

2.05K links

AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!

Download Telegram

About

Blog

Apps

Platform

38.4K subscribers

OREO улучшает многошаговые рассуждения LLM

Главная беда RL-методов типа DPO — в использовании пар с человеческими предпочтениями. Затратно и неэффективно, когда надо научить модель думать на несколько ходов вперёд 🤪

Как OREO решает проблему:
💻 используется метод maximum entropy reinforcement learning
⛏ soft Bellman equation одновременно улучшает две вещи: policy model (какие действия выгоднее в конкретный момент 🎉) и value function (как оценить текущее положение и будущее развитие событий ❓).

Так снижается зависимость от парных наборов предпочтений 😘

На стандартных тестах типа GSM8K и MATH OREO круче традиционных методов offline learning. Например, на MATH выдаёт результат 52.5% 🛍

Изображение UC San Diego, Tsinghua University, Salesforce Research, Northwestern University

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

804 views05:09

Погнали в космос: учёные разглядели метеорит с помощью AR-технологий

💫

В Уральском геологическом музее разработали приложение для изучения челябинского метеорита.

Как работали:
⭐️ использовали сотни фоток обломков небесного тела с разных сторон
⭐️ сделали 3D-модель его кусочков
➡️ загнали модельку в приложение, созданное на платформе разработки компьютерных игр

Технология помогла увидеть мельчайшие детали поверхности. Теперь эти модели можно посмотреть в книге музея, и любой желающий может изучить их поближе 🔭

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👏3

758 views17:50

В лабиринте слов: 12 LLM против больших объёмов ✍️

Разрабы всё удлиняют и удлиняют контекст, а как в нём работается моделям?

LLM вроде GPT-4o и других топовых моделей, как выяснилось, нормально связывают информацию и делают выводы из длинных материалов только с подсказками в виде повторяющихся слов ✌️

Как это поняли исследователи Мюнхенского университета и компании Adobe:
🎓 разработали тест NOLIMA
✋ убрали одинаковые слова в тексте и запросах
😇 проверили 12 лидирующих LLM
💬 чем длиннее повествование, тем быстрее теряют нить даже продвинутые
💬 особенно проседают с длиной от 2 000 до 8 000 токенов

У GPT-4o был самый большой диапазон — около 8 тысяч 📱, ещё неплохо показала себя LLaMA-3.3-70B* при использовании CoT.

Что делать? Улучшать механизм внимания, разработать новые подходы к обучению, использовать специализированные модели, развивать Chain-of-Thought Prompting 🧑‍💻

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

👍6🔥4🤔3

791 views04:52

Учёба с мемчиками: AI знает, как привлечь внимание детей

🕺

Российские разработчики придумали умную систему для школы. Этот AI думает, как ребёнок, поэтому успешно поможет ему учиться.

Что (или даже кого 🫡) включили в платформу “Препод”? 500 уникальных AI-ассистентов (психологи, методисты и прочие профильные спецы). Они умеют подбирать подходящий материал для каждого ученика с учётом возраста, интересов и уровня подготовки 🤓

Что ещё пригодится?
😶 огромный запас знаний: от книг и учебников до компьютерных игр. AI легко находит общий язык с детьми и объясняет сложные вещи простыми словами
👨‍💻 работает на Python и других продвинутых штуках, позволяющих обрабатывать большие объёмы данных
✉️ умеет фильтровать информацию

Учитывая, что в датасете были даже мемы, интересно, что скажут собственно дети — стрём или норм? 😄

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1

849 views13:53

Arm меняет приоритеты: новейший чип уже в пути

✈️

Известные дизайнеры процессорных компонентов решили не мелочиться и запустить уже своё производство цельного серверного продукта 💪

Что в перспективе:
💥 проект — часть общего плана по развитию AI-инфраструктуры (напомню про Stargate, на который SoftBank и OpenAI тратят $500 млрд)
🫡 чип Arm, предназначенный для серверов в крупных ЦОД, который будет подстраиваться под нужды клиентов
🛞 первыми в заказчики собралась Meta*

Говорят даже, что на чип рассчитывает и сэр Джони Айв, создающий тот самый AI-гаджет нового типа.

Ну что же, Qualcomm и Nvidia! Приготовиться к конкуренции 🤘

* экстремистская организация, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4👏3🤔1

804 views04:56

Civilization 7: почему AI не дружит с картой?

Недавно же вышла новая Цива, и игроки ринулись обсуждать апгрейд AI.

Вот, к примеру, претензия: в Civilization 7 AI удивляет странными идеями при постройке городов 🏰 Периодически лепит поселения в неадекватных местах. Цивилизация развивается медленнее, да ещё и конфликты начинаются 😡

Пользователи на Reddit пишут, что AI ставит города на неудобных клочках земли, хотя рядом полно нормальных участков с ресурсами. Зачем город между тремя другими, когда вокруг есть свободные территории? ❓ К тому же с этим сложно бороться — тратить время на разрушение и получать за это штрафы 👎

А ведь технологию в Civ6 критиковали за примитивность. Хотели сложностей? Получили 😠

Теперь просят вернуть систему лояльности, чтобы ограничить такое строительство. Но разрабы Firaxis клятвенно обещают докрутить AI 🫡

Изображение Reddit

👍5😁5

833 views10:32

От поиска до отчёта в науке: Agent Laboratory в деле

🥰

Фреймворк AMD и Университета Джонса Хопкинса использует LLM как научных ассистентов. AI сам может искать нужную инфу, ставить эксперименты и отписываться о результатах.

Подробнее:
📊 это система нейросетей, каждая из которых обучена под разные этапы работы
💞 причём проверяли несколько моделей: o1-preview, o1-mini и GPT-4o. Больше всех нравится пользователям o1-preview, зато mini лучше справляется с экспериментами
⛏ может работать сам по себе, но эффективнее в режиме co-pilot, когда учёные немного помогают — делают правки на каждом этапе. Хотя пока статьи всё равно чуть хуже, чем нужно для топовых конференций типа NeurIPS ⤵️

По деньгам выходит выгодно: Agent Laboratory на 84% дешевле других методов.

А ещё он отлично проходит тесты на MLE-Bench, создавая качественный ML-код и обгоняя OpenHands, MLAB и AIDE 😓

Изображение AMD, Johns Hopkins University

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥1🤔1

819 views14:34

This media is not supported in your browser

VIEW IN TELEGRAM

Apple усиливает Vision Pro: новые AI-фичи и пространство для гостей 😎

VR-шлем прокачивают с помощью Apple Intelligence.

Компания решилась, наконец, добавить AI куда-то ещё, кроме iPhone, iPad и Mac:
😇 будет всё лучшее и любимое вроде Writing Tools, Genmojis и Image Playground
👨‍💻 шлем обработает всё на устройстве (спасибо M2 и 16 ГБ оперативки)
✈️ стартует после апгрейда visionOS 2.4 в апреле
🧐 разрабам уже доступен

Вполне актуально, так как у Google уже есть Android XR с Gemini.

А ещё обновили гостевой режим. Владелец шлема сможет делиться им с друзьями и семьёй, управляя через iPhone 🙃

👍4🤔1

832 views05:04

DeepSeek делится секретами

🤫

На этой неделе стартап решил открыть исходники пяти своих проектов 🤩 Показывают, что готовы к сотрудничеству и прозрачной работе. Но тут же всплывают вопросы безопасности.

Вместе с успехом к DeepSeek пришли и проблемы. Компанию стали подозревать в неправильной обработке пользовательских данных и даже в том, что группа, связанная с DeepSeek, могла взломать системы OpenAI 😠

Снятие грифа 🤫 выглядит как попытка всех успокоить. Но многие сомневаются, насколько честно стартап собирается расщедриться и какие у него настоящие мотивы 🙂

А никто и не говорил, что будет легко балансировать между развитием инноваций и этическими аспектами ⚖️

Изображение Leonardo

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3😁1🤔1

809 views10:39

🆕

Claude 3.7 Sonnet и Claude Code: умная парочка от Anthropic

Вышли обновлённая reasoning-версия флагмана и мощный кодер бонусом.

Прокачанный Claude 3.7 Sonnet “думает” под запрос: предлагает пошаговые решения или моментально выдаёт ответы. Такого ещё не было 🔥

Claude Code помогает программистам прямо из терминала. Пишет, тестит, находит ошибки.

Разные плюсы:
💬 адаптируется под ситуацию: быстрый ответ или на “подумать”
😓 можно контролировать, сколько ресурсов тратить на вычисления, ограничивая токены
🔡 используется на всех платных тарифах, причём режим углублённого мышления тоже включён
🪙 цены остались такими же: $3 за 1 млн символов ввода и $15 за 1 млн вывода

А что насчёт тестов?
На SWE-bench Verified и TAU-bench — топовые результаты. И лучше o1 😎

Общий свободный доступ, как всегда, в чате

👋

Изображение Anthropic

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🤔2

839 views14:52

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

🔥

Step-Video-T2V: суперсжатие, два языка и длинные ролики

У открытой модельки 30 млрд параметров, а продолжительность генерации до 204 кадров.

Ещё про характеристики и успехи:
🥳 Video-VAE сжимает ролик в 16 раз по пространству и в 8 раз по времени, при этом сохраняя качество
📕 текстовые запросы обрабатывают два двуязычных кодировщика, поддерживающих английский и китайский
👨‍💻 модель использует DiT с 3D-вниманием и обучается с помощью Flow Matching для преобразования шума в кадры
⭐️ Video-DPO улучшает качество видео и уменьшает артефакты

Тестим на новом бенчмарке Step-Video-T2V-Eval. Результаты отличные 😍

Модель и бенчмарк забираем тут. Генерим здесь

🤌

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥3

908 views05:04

Стартапы, апгрейды, космос и медицина

Чего хотят люди и что нужно для AI?

1️⃣ Бывшая CTO OpenAI Мира Мурати наконец определилась и запустила свой стартап Thinking Machines, который будет делать AI доступным каждому ❤️ Хочет устранить разрыв между разработками и их применением.

2️⃣ Новый CEO Vimeo Филип Мойер позиционирует продукт как AI-видеоплатформу 😎 Что это значит и как будет развиваться конкурент YouTube, читаем в интервью Филипа тут.

3️⃣ С ЦОД надо что-то решать. Для питания дата-центров нужно много энергии, а она добывается из нефти и угля. Из-за вредных выбросов растёт число заболеваний, таких как астма. Исследование показало, что затраты на здравоохранение, связанные с этим, составили $5,4 млрд долларов за 5 лет 🤦‍♂️

4️⃣ Китайцы задумались о том, как слетать к границам Солнечной системы, и поняли, что без AI никак. Неизвестная среда, масса научных приборов, огромные расстояния! 👽 Для контроля нужны умные системы, принимающие решения. Миссия предусматривает отправку пары зондов.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔5👍3

779 views10:47

Секрет успеха на собеседовании: нейросети в помощь

🧑‍💻

Недавний опрос показал, что каждый десятый россиянин уже вовсю юзает AI для подготовки к встрече с работодателем.

Что ещё выяснили:
🤘 лидируют ChatGPT и GigaChat, помогающие оформлять резюме и писать сопроводительные письма
🤔 для тренировки перед самим интервью AI используют реже
✔️ большинство (60%) уверено, что нейросети реально помогают
🤩 есть и те, кто опасается, что они могут завышать реальные навыки

Ну и, конечно, нашлись скептики, считающие, что AI скорее навредит, чем поможет в поисках работы 😵‍💫

Изображение UltraPixel

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🤔1

817 views14:58

Media is too big

VIEW IN TELEGRAM

Helix: распаковка 🔥

Какие великолепные 😍

В роботах FigureAI объединили зрение, понимание речи и контроль движений:
🕺 полностью управляют верхней частью корпуса: руками, туловищем, головой и пальцами
🤝 работают в команде: двое решают задачу вместе
🤘 поднимают с пола всё подряд: по просьбе могут выбирать любые мелочи, даже те, что видят впервые
📊 одна нейросеть без всяких настроек под конкретные задачи

Helix функционирует прямо на встроенном процессоре, так что его можно использовать сразу в реальных условиях 💖

❤4👍3🤔1

905 views04:43

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

🆕

Wan2.1: планка видеоконтента ещё выше

Новый китайский генератор работает на диффузионных трансформерах 🤖 Суперэффективный 3D-VAE, продвинутые методы предобучения и огромный обучающий датасет позволяют ему генерить просто нереально крутые видосы 💥

Как это устроено:
⚡ 3D-VAE разработали для видео, добавили идеи для сжатия, экономии памяти и последовательности. Ролики генерятся без зависания с помощью хитрого кэша
⏳ Flow Matching и обработка текста на разных языках через T5 Encoder
😓 пара слоёв для работы со временем и прогнозированием параметров
👨‍💻 FSDP и параллельное выполнение задач

Доступна в чате — бегом генерить ⚡️

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥1

1.05K views11:11