Sber AI – Telegram
Sber AI
38.1K subscribers
2.44K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Как научить нейросеть не ошибаться в математике 👨‍💻

Действительно, почему у современных моделей типа ChatGPT есть проблемы с задачами выше школьного уровня?

Учёные подготовили качественный обзор успехов AI в подобных вычислениях:
😲 трудности у LLM возникают из-за того, что они не опираются на строгие доказательства
⚡️ важно переходить к формальному символьному мышлению
👍 системы надо обучать на опыте существующих proof assistants (Lean, Coq, Isabelle)
⛔️ это поможет не только в математике, но и снизит вероятность того, что модель будет выдавать галлюцинации вместо точных ответов

Да, есть прогресс — взять хотя бы AlphaProof и AlphaGeometry, но всё равно остаются вопросы

Например, пока мало хороших датасетов и бенчей, чтобы точно оценить, насколько эффективно эти методы работают.

Изображение Meta*, Stanford University, UC Berkeley, University of Edinburgh, UT Austin
* экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
iPhone в Китае: что на борту?

Когда мы говорили “китайский айфон”, мы не это имели в виду 😁 Но теперь всё именно так! В Apple действительно подумывают внедрить модель Qwen от Alibaba в свой легендарный смартфон. Вместо GPT, между прочим 🙃

Это поможет компании лучше вписаться в специфику рынка Поднебесной и прокачать продажи 💰

Переговоры уже идут вовсю:
😮 Qwen круто себя показала на Hugging Face, так что выбор понятен. Модели на её основе занимают топовые места среди аналогичных инструментов
😙 партнёрство с Alibaba встраивает Apple в строгие китайские стандарты, касающиеся иностранных технологий
😵‍💫 для местных разрабов iOS это отличная новость: можно создавать приложения с продвинутыми функциями обработки текста и плотно интегрировать их в родные сервисы
📈 акции обеих компаний взлетели после новостей

Анонс будет на конференции Apple в Шанхае 25 марта 🗓

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
5👏2🔥1
Тестила в PixVerse прикольную функцию LipSync, которая пытается подстроить движение губ под аудиоозвучку 💋

Предупреждаю: на 60 бесплатных кредитов в день особо не разбежишься, при условии, что один ролик забирает 30 😕 

1️⃣ первый блин комом не получился, так как, по моим догадкам, нейронка озвучивает только людей (но вы пробуйте ❗️). У меня кот петь не захотел 🐱
2️⃣ со второй попытки всё сложилось 🐰
3️⃣ видео сгенерил MiniMax — исходник прилагаю, чтобы была заметна разница ➡️

Песню написала Suno. А так процесс элементарный: грузим видео и аудио. Но помните, что чем длиннее трек, тем больше кредитов на него уйдёт 🎵
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4
LearnLM отвечает на вопросы по всем канонам педагогики! 🤓

Нейросетка Google для образования работает на основе Gemini. Для этого её тренировали следовать педагогическим гайдлайнам и дополнительно файнтюнили на учебных данных, включая разговоры экспертов с AI.

Как готовили:
💬 через supervised fine-tuning (SFT) LearnLM осваивала учительские инструкции. Диалог начинался с детального описания, чтобы она подстраивалась под промпты и варьировала стили преподавания
✍️ RLHF подключали для донастройки. Тут уже настоящие педагоги размечали ответы в многоэтапных диалогах
наконец, её совместно обучили с Gemini, чтобы добавить к преподавательским скиллам LearnLM её базовые AI-умения

Получилась крутая штука, которую эксперты признали лучше GPT-4o, Claude 3.5 и Gemini 1.5 Pro. Для использования AI в образовании это большой шаг вперёд 🙂

Изображение Google
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2🤔1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Deep Research от Perplexity: когда нужно быстро стать экспертом 🤓

В системе запустили фичу, которая берёт на себя работу по исследованиям и продвинутому анализу данных.

Вот как всё происходит:

🥸 Deep Research ищет документы, читает их и решает, что дальше, разбираясь и умнея по ходу процесса   
🎉 когда всё собрано, формируется понятный и полный отчёт
🏌️ сохраняем в PDF или доком, а дальше делимся с кем надо

Что может? Да многое: от планирования путешествия до финансового анализа 🤑 А ещё проходит тесты уровня Humanity's Last Exam.

Бесплатная версия у всех, у Pro-подписчиков безлимит по запросам. Доступно на вебе, скоро будет на iOS, Android и macOS ⛔️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
AugmentOS: AI как ваше продолжение 🔠🔠

Речь про операционку для умных очков, выпущенную Vuzix и Mentra 😎

Где работает и что умеет:
🤝 совместима с моделями Even Realities G1, Vuzix Z100 и Mentra Mach1
📞 функционирует через смартфон
⛔️ пока что поддерживается только на устройствах с Android, на iOS дадут в феврале
🧑‍💻 скиллы на основе нейросетей
🆘 поддержка разработки приложений с субтитрами, переводом, проактивной помощью и другими фичами

* в видео упоминается продукт экстремистской организации, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
🔝 Grok-3 знает ответы на все вопросы

Даже на те, что вы не задавали. Маск не обманул и выкатил чат-бота xAI на новом уровне.

Фишки:
🚩 DeepSearch: шарит весь интернет, чтобы найти точный ответ (до 20 источников и посты в X 😍)
🚩 рассуждения включаются кнопкой Think
🚩 Big Brain под математику и кодинг
🚩 генерация игр: может замутить игру на ходу, как на стриме, где он смешал "Тетрис" и "Три в ряд"
🚩 обучение: модель прокачали на мощном компе с 200 000 чипов Nvidia H100

Показывает крутые результаты в математике, физике, биологии и химии.

Сейчас Grok-3 в стадии бета-тестирования. Голосовой режим пока отложили из-за багов, но обещают запустить через неделю 😉

Изображения Х
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥43
Проверь себя: как чаще всего модель выбирает правильный ответ из нескольких вариантов?
Anonymous Poll
66%
оценивает, какой ответ точно отражает контекст вопроса
29%
сравнивает ответы между собой
19%
случайным образом
Бенчмарки: не всё так сложно, как кажется (но иногда сложнее!)

Отвечаю на вопрос о способе выбора моделью верного ответа (опрос см. выше 🤘). Обычно в тестах на понимание языка модели сталкиваются с множественным выбором в вопросах. Алгоритмы скорят каждый ответ, опираясь только на контекст вопроса ⁉️

Но это противоречит элементарной логике ☹️ Модель не учитывает другие доступные опции, в то время как люди всегда сравнивают варианты ответов между собой, чтобы найти подходящий 🧑‍💻

Snowflake AI решили проверить, насколько реально сложны популярные бенчмарки. Так и выяснилось, что сложность тестов не в самих заданиях, а в подходах к скорингу.

Исследование показало: если дать модели все варианты ответов сразу, перформанс заметно улучшается. Например, LLaMA 3.1 70B* повышает показатели с 64% до 93% 💪

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение Snowflake AI Research
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔3
Тайная печать Google: когда AI становится видимым 👻

Компания внедряет водяные знаки SynthID для фоток, отредактированных Magic Editor.

Опция нужна, чтобы пользователи могли знать о манипуляциях reimagine с картинкой. Про SynthID я рассказывала, она работает с генерациями Google Imagen

Но есть нюансы:
🙅‍♂️ SynthID может не распознать небольшие правки
🥢 для обнаружения вотермарки нужен AI-детектор из About this image

Так что пока это полумера, а разоблачение цифрового следа может и не состояться

Изображение DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2
🆕 Majorana 1: Microsoft на пути к миллиону кубитов!

Разработчики компании презентовали (https://news.microsoft.com/source/features/ai/microsofts-majorana-1-chip-carves-new-path-for-quantum-computing/) чип нового поколения для квантовых вычислений.

Всё дело в уникальном материале — топопроводнике, помогающем управлять частицами и создающем супернадёжные кубиты. Это буквально как изобретение полупроводников, только теперь для квантовой эры ☄️

Главные детали:
#️⃣ топологический материал: ребята из Microsoft сотворили новое состояние вещества, где частицы ведут себя совсем иначе. Оно позволяет создать более стабильный кубит
😓 уникальные способности: материал одновременно надёжный и легко управляемый, что сильно упрощает работу с квантовыми системами
💻 невероятный масштаб: с помощью архитектуры Majorana 1 можно будет реализовать квантовый компьютер с миллионом кубитов
🥳 практические кейсы: 1 000 000 — та самая нужная цифра, чтобы решать реально важные задачи вроде расщепления микропластика или разработки умных материалов

Короче говоря, масштабируемые и мощные квантовые компьютеры — это уже не фантастика, а вполне реальная перспектив
🔥6🤔3😁21
Вклады в AI, рост и провалы

Кто на волне, а кому надо подумать, как развиваться дальше 😕

1️⃣ $10 млрд долларов, 10 тысяч новых рабочих мест и 3 ГВт. Южная Корея собирается строить самый мощный в мире ЦОД для AI. Крутой проект должен быть готов к 2028 году.

2️⃣ Резонное решение, если посмотреть на успех индустрии полупроводников благодаря вложениям в ЦОД. Тут спрос растёт из-за популярности AI 🤑 Продажи микросхем подскочили на 29%, а траты на разработку памяти взлетели аж на 53%!

3️⃣ AI Pin приказал долго жить перестанет выпускаться ☠️ Высокие ожидания наложились на критику продукта. Humane приняла решение свернуть проект AI Pin и продать свои активы HP. Таков уж AI-рынок: нужно быть гибким и адаптироваться к изменениям в условиях развивающихся инноваций.

4️⃣ Тем временем российский чат-бот Neuromed AI стал ординатором по кардиологии и онкологии 🧐 Нейронка Сеченовского университета прошла госаттестацию и справилась со всем, кроме проверки практики (по понятным причинам 😀).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🤩2
Французский шарм и американские технологии

Кажется, AI Action Summit в Париже не прошёл даром. AMD и Комиссариат по атомной энергии Франции (CEA) взялись за масштабный проект — создание нового поколения AI-систем. Теперь они партнёры🤝

Что будут делать:
💼 совместно разрабатывать энергоэффективные технологии и архитектуры для самых ресурсоёмких AI-задач
🤓 в 2025 году проведут симпозиум, где соберутся лучшие умы мира для обсуждения будущего вычислений
👋 представят стартапы, суперкомпьютеры и стратегии, чтобы ускорить развитие технологий

Идея неплохая, так как AI нужны альтернативные источники энергии, а это требует и новой вычислительной архитектуры 🫡

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
👍4🤔2
Чёрный ящик: если модель не открывает секреты, поможет QueRE

Алгоритм разработан учёными из Университета Карнеги-Меллона. QueRE помогает предсказывать перформанс в black-box сеттинге, когда нет полного доступа к внутренним репрезентациям (например, если используешь модель через API) 🔒

Как это работает?
🧐 по промптам модель проверяет, насколько правильно отвечала раньше
🆗 полученный вектор с вероятностями корректности ответов дают на инпут линейной модели. Так тестируют, верны ли оценки
🤩 оказалось, что даже простые модели, обученные на “самооценках”, точнее, чем алгоритмы с опорой на внутренние состояния

На SQuAD и BoolQ, например, в прогнозах перформанса QueRE эффективнее других методов.

Сейчас многие делают модели проприетарными. Пользователи не могут видеть, как они работают 🙈 Поэтому такие непрямые способы оценки становятся всё нужнее 🫴

Изображение Carnegie Mellon University
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
EnigmaEval: тест на смекалку для AI 🎓

Новый бенчмарк для LLM проверяет их умение решать головоломки. Он основан на заданиях, где нужно использовать разные типы знаний и уметь думать нестандартно 🤪

В отличие от обычных тестов типа MATH, MMLU и GPQA, тут всё сложнее:
🤔 есть тексты, картинки, схемы и другие штуки, которые надо собрать вместе, чтобы найти правильный ответ
🔝 всего в наборе больше тысячи загадок из восьми источников различного уровня
😛 запредельно трудные требуют пяти и более шагов решения с минимальными подсказками и скрытыми промежуточными ответами

Даже самые современные модели пока не очень хорошо справляются с такими заданиями, особенно когда дело доходит до крайне запутанных.

Данные датасета закрыты, чтобы сохранить их ценность. Но это не точно можно подать заявку, чтобы получить доступ ✍️

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3
OREO улучшает многошаговые рассуждения LLM

Главная беда RL-методов типа DPO — в использовании пар с человеческими предпочтениями. Затратно и неэффективно, когда надо научить модель думать на несколько ходов вперёд 🤪

Как OREO решает проблему:
💻 используется метод maximum entropy reinforcement learning
soft Bellman equation одновременно улучшает две вещи: policy model (какие действия выгоднее в конкретный момент 🎉) и value function (как оценить текущее положение и будущее развитие событий ).

Так снижается зависимость от парных наборов предпочтений 😘

На стандартных тестах типа GSM8K и MATH OREO круче традиционных методов offline learning. Например, на MATH выдаёт результат 52.5% 🛍

Изображение UC San Diego, Tsinghua University, Salesforce Research, Northwestern University
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Погнали в космос: учёные разглядели метеорит с помощью AR-технологий 💫

В Уральском геологическом музее разработали приложение для изучения челябинского метеорита.

Как работали:
⭐️ использовали сотни фоток обломков небесного тела с разных сторон
⭐️ сделали 3D-модель его кусочков
➡️ загнали модельку в приложение, созданное на платформе разработки компьютерных игр

Технология помогла увидеть мельчайшие детали поверхности. Теперь эти модели можно посмотреть в книге музея, и любой желающий может изучить их поближе 🔭

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
3👏3
В лабиринте слов: 12 LLM против больших объёмов ✍️

Разрабы всё удлиняют и удлиняют контекст, а как в нём работается моделям?

LLM вроде GPT-4o и других топовых моделей, как выяснилось, нормально связывают информацию и делают выводы из длинных материалов только с подсказками в виде повторяющихся слов ✌️

Как это поняли исследователи Мюнхенского университета и компании Adobe:
🎓 разработали тест NOLIMA
убрали одинаковые слова в тексте и запросах
😇 проверили 12 лидирующих LLM
💬 чем длиннее повествование, тем быстрее теряют нить даже продвинутые
💬 особенно проседают с длиной от 2 000 до 8 000 токенов

У GPT-4o был самый большой диапазон — около 8 тысяч 📱, ещё неплохо показала себя LLaMA-3.3-70B* при использовании CoT.

Что делать? Улучшать механизм внимания, разработать новые подходы к обучению, использовать специализированные модели, развивать Chain-of-Thought Prompting 🧑‍💻

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
👍6🔥4🤔3
Учёба с мемчиками: AI знает, как привлечь внимание детей 🕺

Российские разработчики придумали умную систему для школы. Этот AI думает, как ребёнок, поэтому успешно поможет ему учиться.

Что (или даже кого 🫡) включили в платформу “Препод”? 500 уникальных AI-ассистентов (психологи, методисты и прочие профильные спецы). Они умеют подбирать подходящий материал для каждого ученика с учётом возраста, интересов и уровня подготовки 🤓

Что ещё пригодится?
😶 огромный запас знаний: от книг и учебников до компьютерных игр. AI легко находит общий язык с детьми и объясняет сложные вещи простыми словами
👨‍💻 работает на Python и других продвинутых штуках, позволяющих обрабатывать большие объёмы данных
✉️ умеет фильтровать информацию

Учитывая, что в датасете были даже мемы, интересно, что скажут собственно дети — стрём или норм? 😄

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81