Sber AI – Telegram
Sber AI
37.9K subscribers
2.44K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Смотрите, что нашла у AIRI 🧩

День святого Валентина — это же не просто повод обменяться сердечками и шоколадками.

Это также отличный момент, чтобы выразить свои чувства для тех, кто влюблён в науку и учёных ❤️ Они ведь каждый день совершают открытия и двигают человечество вперёд!

Всё с учётом темы и очень милое 🥰 Вы знаете, кому это отправить ❤️ Разбирайте!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5👏3😁1
Grok 3 vs все остальные 🔜

Маск объявил, что Grok 3 почти готов к запуску и уже через неделю-две выйдет в свет 👍

В заявлении Илона на Всемирном правительственном саммите в Дубае было сказано:
Grok 3 находится на завершающей стадии
🏋️ новая версия круто справляется с задачами и показывает результаты лучше всех существующих аналогов
🤑 намерение OpenAI полностью перейти на коммерческие рельсы — явный перебор

Маск не был бы Маском, если бы в очередной раз не прошёлся по конкурентам. Но раз уж Grok 3 рвётся в бой, остаётся только ждать развязки 😉

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5💯3🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Goku ставит рекорды

На пике популярности видео ByteDance выдали серию моделей Goku, использующих продвинутые трансформеры для одновременной генерации картинок и видео. Причём на уровне индустрии 📤

Детально проработали каждую мелочь:
😵‍💫 сбор данных: система фильтрует видео и фото по качеству, анализирует содержание с помощью OCR и проводит субъективные оценки
🧑‍💻 дизайн: модели Goku доступны в версиях 2B и 8B
💪 rectified flow (RF) сжимает входные данные в единое пространство, это помогает лучше обучаться и генерить
🤘 для масштабирования — настройка инфраструктуры с параллельными вычислениями и защитой от сбоев

Результаты Goku: по картинкам — 0.76 на GenEval и 83.65 на DPG-Bench, по видео — 84.85 на VBench 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
AI-звукооператор: Elgato улучшает качество голоса в новом Wave Link 2.0 🎤

Разработчики ПО для видеоконтента апгрейдили свой популярный инструмент.

Голосом теперь там рулит AI:
🎙 фичу Voice Focus придумали вместе с AIcoustics
звук микрофона очищается от посторонних шумов для идеальной записи
🏠 анализируются характеристики помещения, чтобы внести необходимые корректировки для устранения эха и других эффектов

Качаем тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Pikadditions: реально нереально 🤌

Не пропустите новое решение от Pika Labs — возможность вставить в ролик любой объект или персонажа 🗿

Что есть:
📸 бесшовная интеграция: добавляем что угодно и кого угодно с учётом реальных условий съёмки
🚀 различные варианты для идеального результата: можно адаптировать элементы под ракурсы камеры и движения
🎈 реалистичная анимация: тени и динамика

Процесс работы: загрузка оригинала видео, выбор объекта, промпт 😎

Доступна на Pika 1.5, 2.0, 2.1 и Turbo. 150 кредитов в месяц на 15 роликов 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4🤔1
Рассказываю про AI-апгрейды в Google Workspace: :

💌 вставляем ответы Gemini сразу в черновик письма в Gmail. Если хочешь в деловую переписку добавить инфу из предыдущих сообщений, не надо искать фрагменты вручную

быстрые команды в Google Chat — без использования команд со слешем. При частых запросах (проверка статуса проекта, напоминалки) можно мгновенно запускать эти действия, не вводя длинную команду ручками

💃 генерим людей с помощью Imagen 3 во всех сервисах пространства — Google Docs, Sheets, Drive, Slides и снова Gmail. Допустим, если надо презентацию запилить

Упрощаем повседневность, повышаем эффективность 😉

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
3👏2
Как научить нейросеть не ошибаться в математике 👨‍💻

Действительно, почему у современных моделей типа ChatGPT есть проблемы с задачами выше школьного уровня?

Учёные подготовили качественный обзор успехов AI в подобных вычислениях:
😲 трудности у LLM возникают из-за того, что они не опираются на строгие доказательства
⚡️ важно переходить к формальному символьному мышлению
👍 системы надо обучать на опыте существующих proof assistants (Lean, Coq, Isabelle)
⛔️ это поможет не только в математике, но и снизит вероятность того, что модель будет выдавать галлюцинации вместо точных ответов

Да, есть прогресс — взять хотя бы AlphaProof и AlphaGeometry, но всё равно остаются вопросы

Например, пока мало хороших датасетов и бенчей, чтобы точно оценить, насколько эффективно эти методы работают.

Изображение Meta*, Stanford University, UC Berkeley, University of Edinburgh, UT Austin
* экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
iPhone в Китае: что на борту?

Когда мы говорили “китайский айфон”, мы не это имели в виду 😁 Но теперь всё именно так! В Apple действительно подумывают внедрить модель Qwen от Alibaba в свой легендарный смартфон. Вместо GPT, между прочим 🙃

Это поможет компании лучше вписаться в специфику рынка Поднебесной и прокачать продажи 💰

Переговоры уже идут вовсю:
😮 Qwen круто себя показала на Hugging Face, так что выбор понятен. Модели на её основе занимают топовые места среди аналогичных инструментов
😙 партнёрство с Alibaba встраивает Apple в строгие китайские стандарты, касающиеся иностранных технологий
😵‍💫 для местных разрабов iOS это отличная новость: можно создавать приложения с продвинутыми функциями обработки текста и плотно интегрировать их в родные сервисы
📈 акции обеих компаний взлетели после новостей

Анонс будет на конференции Apple в Шанхае 25 марта 🗓

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
5👏2🔥1
Тестила в PixVerse прикольную функцию LipSync, которая пытается подстроить движение губ под аудиоозвучку 💋

Предупреждаю: на 60 бесплатных кредитов в день особо не разбежишься, при условии, что один ролик забирает 30 😕 

1️⃣ первый блин комом не получился, так как, по моим догадкам, нейронка озвучивает только людей (но вы пробуйте ❗️). У меня кот петь не захотел 🐱
2️⃣ со второй попытки всё сложилось 🐰
3️⃣ видео сгенерил MiniMax — исходник прилагаю, чтобы была заметна разница ➡️

Песню написала Suno. А так процесс элементарный: грузим видео и аудио. Но помните, что чем длиннее трек, тем больше кредитов на него уйдёт 🎵
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4
LearnLM отвечает на вопросы по всем канонам педагогики! 🤓

Нейросетка Google для образования работает на основе Gemini. Для этого её тренировали следовать педагогическим гайдлайнам и дополнительно файнтюнили на учебных данных, включая разговоры экспертов с AI.

Как готовили:
💬 через supervised fine-tuning (SFT) LearnLM осваивала учительские инструкции. Диалог начинался с детального описания, чтобы она подстраивалась под промпты и варьировала стили преподавания
✍️ RLHF подключали для донастройки. Тут уже настоящие педагоги размечали ответы в многоэтапных диалогах
наконец, её совместно обучили с Gemini, чтобы добавить к преподавательским скиллам LearnLM её базовые AI-умения

Получилась крутая штука, которую эксперты признали лучше GPT-4o, Claude 3.5 и Gemini 1.5 Pro. Для использования AI в образовании это большой шаг вперёд 🙂

Изображение Google
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2🤔1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Deep Research от Perplexity: когда нужно быстро стать экспертом 🤓

В системе запустили фичу, которая берёт на себя работу по исследованиям и продвинутому анализу данных.

Вот как всё происходит:

🥸 Deep Research ищет документы, читает их и решает, что дальше, разбираясь и умнея по ходу процесса   
🎉 когда всё собрано, формируется понятный и полный отчёт
🏌️ сохраняем в PDF или доком, а дальше делимся с кем надо

Что может? Да многое: от планирования путешествия до финансового анализа 🤑 А ещё проходит тесты уровня Humanity's Last Exam.

Бесплатная версия у всех, у Pro-подписчиков безлимит по запросам. Доступно на вебе, скоро будет на iOS, Android и macOS ⛔️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
AugmentOS: AI как ваше продолжение 🔠🔠

Речь про операционку для умных очков, выпущенную Vuzix и Mentra 😎

Где работает и что умеет:
🤝 совместима с моделями Even Realities G1, Vuzix Z100 и Mentra Mach1
📞 функционирует через смартфон
⛔️ пока что поддерживается только на устройствах с Android, на iOS дадут в феврале
🧑‍💻 скиллы на основе нейросетей
🆘 поддержка разработки приложений с субтитрами, переводом, проактивной помощью и другими фичами

* в видео упоминается продукт экстремистской организации, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
🔝 Grok-3 знает ответы на все вопросы

Даже на те, что вы не задавали. Маск не обманул и выкатил чат-бота xAI на новом уровне.

Фишки:
🚩 DeepSearch: шарит весь интернет, чтобы найти точный ответ (до 20 источников и посты в X 😍)
🚩 рассуждения включаются кнопкой Think
🚩 Big Brain под математику и кодинг
🚩 генерация игр: может замутить игру на ходу, как на стриме, где он смешал "Тетрис" и "Три в ряд"
🚩 обучение: модель прокачали на мощном компе с 200 000 чипов Nvidia H100

Показывает крутые результаты в математике, физике, биологии и химии.

Сейчас Grok-3 в стадии бета-тестирования. Голосовой режим пока отложили из-за багов, но обещают запустить через неделю 😉

Изображения Х
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥43
Проверь себя: как чаще всего модель выбирает правильный ответ из нескольких вариантов?
Anonymous Poll
66%
оценивает, какой ответ точно отражает контекст вопроса
29%
сравнивает ответы между собой
19%
случайным образом
Бенчмарки: не всё так сложно, как кажется (но иногда сложнее!)

Отвечаю на вопрос о способе выбора моделью верного ответа (опрос см. выше 🤘). Обычно в тестах на понимание языка модели сталкиваются с множественным выбором в вопросах. Алгоритмы скорят каждый ответ, опираясь только на контекст вопроса ⁉️

Но это противоречит элементарной логике ☹️ Модель не учитывает другие доступные опции, в то время как люди всегда сравнивают варианты ответов между собой, чтобы найти подходящий 🧑‍💻

Snowflake AI решили проверить, насколько реально сложны популярные бенчмарки. Так и выяснилось, что сложность тестов не в самих заданиях, а в подходах к скорингу.

Исследование показало: если дать модели все варианты ответов сразу, перформанс заметно улучшается. Например, LLaMA 3.1 70B* повышает показатели с 64% до 93% 💪

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение Snowflake AI Research
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔3
Тайная печать Google: когда AI становится видимым 👻

Компания внедряет водяные знаки SynthID для фоток, отредактированных Magic Editor.

Опция нужна, чтобы пользователи могли знать о манипуляциях reimagine с картинкой. Про SynthID я рассказывала, она работает с генерациями Google Imagen

Но есть нюансы:
🙅‍♂️ SynthID может не распознать небольшие правки
🥢 для обнаружения вотермарки нужен AI-детектор из About this image

Так что пока это полумера, а разоблачение цифрового следа может и не состояться

Изображение DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2