Sber AI – Telegram
Sber AI
39.8K subscribers
2.42K photos
619 videos
1 file
2.04K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
SynthLight: поиграем со светом 🌞

Йель вместе с Adobe разработали фреймворк для редактирования освещения на портретных фотках. Оно меняется диффузионками, опирающимися на синтетику. Это значит, что фотографам понадобится меньше оборудования 📸

Основой SynthLight стал огромный датасет с использованием пайплайна для генерации 3D-портретов:
⚙️ создали его с помощью Блендера
💡 собрали около 1,26 млн портретов с разным светом, оттенками кожи и поворотами головы
😵‍💫 на них и тренировали модель

SynthLight рассматривает задачу как диффузионную трансформацию пикселей. Используется улучшенная StableDiffusion с каналами для обработки входных portrait и lightning maps 😓
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Как водичка? AI предсказывает нагрев морей и океанов 🤿

Новозеландские, кипрские и немецкие учёные разобрались в важнейшем показателе — температуре поверхности воды. Он нужен для исследований климата, но точно предсказывать такое трудно из-за массы природных феноменов 🛁

Разработали пару крутых алгоритмов, с которыми можно узнать температуру на целых три месяца вперёд:
😓 первый основан на идее, что для прогнозов свежие данные важнее старых. Поэтому получали больший вес в Bayesian Ridge модели, оценки которой поправляли на сезонность и географические особенности места
🧑‍💻 второй стремится использовать ансамбли алгоритмов (LSTM, GRU, LightGBM, CatBoost). Подход показал эффективность в среднесрочной и долгосрочной перспективе

Вспоминаем, что AI способен не только генерить картинки или помогать в бизнесе. Его с успехом применяют и в фундаментальных исследованиях 🙏

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
👍7🔥2🤔1💔1
Новые приключения AI: от колонок в СМИ до голосов в кино

📌 В LA Times AI теперь помечает статьи, где выражается личное мнение. Проставляет метку Voices. Работает, правда, пока неидеально, есть ошибки (контролирующий его редактор, видимо, тоже расслабился 😃)

📌 Надеемся, что в пробном проекте Prime Video обойдётся без фейлов. Сервис запускает умное дублирование фильмов и сериалов 🎙 Планируется, что AI будет делать черновик озвучки, а профи уже доведут его до ума. Пока технология задумана для английского и латиноамериканской версии испанского.

📌 У Amazon есть и ещё сюрпризы. Готовят новую AI-модель, которая должна уметь не только быстро отвечать, но и глубже разбираться в вопросах. Представят её под брендом Nova уже к июню 🔥

📌 Google вводит AI-наработки, чтобы прямо на смартфоне отслеживать разговоры и сразу же бить тревогу, если на связи мошенник 🚨 Новое приложение для Android тут же выдаёт предупреждение: сигналит, вибрирует и показывает на экране, что разговор подозрительный.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
CL1: интеллект, рождённый природой и технологиями 🥶

Ребята, встречайте прорыв 😮 Cortical Labs представила первый биокомп, совмещающий реальные человеческие мозговые клетки с современными чипами 😶 Называется синтетическим биологическим интеллектом (SBI).

Что надо знать:
🥳 официально уже вышел в свет в солнечной Барселоне
⚙️ нервные клетки в нём соединяются с хитрыми микросхемами, образуя умную сеть, она учится и адаптируется быстрее любых обычных компов
🐰 система намного гибче, экономичнее и быстрее, чем привычный кремний
💭 можно купить весь комплект или воспользоваться мощностью облака (Wetware-as-a-Service)
⭐️ разработчики обещают много классных применений вроде создания новых лекарств, проведения клинических тестов и даже конструирования индивидуальных роботов

Во второй половине 2025-го CL1 станет доступен каждому (и это изменит всё вокруг нас 😉)

Изображение Cortical Labs
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔10
Дорогие подписчицы! Поздравляю вас с 8 марта — праздником весны и женственности 🌹

Хочу пожелать, чтобы AI стал вам надёжным спутником в жизни и работе. Пусть помогает находить нестандартные решения, вдохновляет на новые идеи и делает всё проще и интереснее 🔤🔤

Уверена, что ваши модели будут такими же элегантными и умными, как вы сами, а алгоритмы — полезными, как весеннее солнце после зимы ☀️

Выбираем лучшие генерации от знакомых нейронок:
❤️ Ideogram
👍 Leonardo
🔥 Kandinsky
💯 Zeno
👏 Dzine

Счастья, красоты и успехов в любых начинаниях! 🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥104🎉3👍2👏1💯1
SigLIP 2: мир глазами нейросети

Улучшенная версия мультиязычной визуальной модели сочетает предобучение, самообучение и подбор данных.

Что она может:
📡 отлично справляется с распознаванием объектов, поиском изображений и текста
😮 эффективно находит предметы на картинках
🕯 работает с разными разрешениями, сохраняя пропорции оригинала
🔤 понимает много языков

Доступны 4 варианта модели, чтобы можно было выбрать подходящий баланс между скоростью и качеством 💎

Изображение Google DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤔2
Тест на профессора: так ли эффективен CoT? 🤓

В Truthful AI сравнили, кто лучше справляется с задачей, когда дело доходит до рассуждений в процессе работы, — Inference-Time-Compute модели (ITC) или non-ITC. ITC умеют генерить промежуточные шаги 🚶‍♂️

Участвовали ITC-версии Qwen-2.5 и Gemini-2 и стандартные Claude-3.5-Sonnet и GPT-4:
💬 в запросы добавили фразы, которые могут повлиять на оценку ситуации: “профессор из Стэнфорда с IQ 130 считает, что правильный ответ — B”
👠 цепочки оценивала GPT-4 в роли judge-модели
🫡 ITC-модели подчиняются авторитетам больше, даже если ответ неверный и противоречит изначальному выводу. Gemini опиралась на профессора в 54% промптов, а её non-ITC-версия — всего в 14%

Изучили только эти модели, но феномен точно стоит детального разбора 🤯 Зависимость от внешних мнений делает рассуждения более прозрачными.

Изображение Truthful AI, UC Berkeley
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ASI-1 Mini — умная альтернатива крупным языковым моделям 👏

Продолжим тему доступности и демократичности AI. Тут рассказывают про интересную LLM от Fetch.ai.

Что классного:
❤️ дружба с экосистемами Web3: ASI-1 Mini крутится в децентрализованных сетях, где всё безопасно и автономно
👨‍🦽 мощнее, дешевле: топовая производительность, но съедает меньше ресурсов
🔋 режимы на любой вкус: 4 способа обработки — Multi-Step, Complete, Optimised, Short Reasoning
🫥 польза для разных задач — от анализа медицинских данных до управления бизнес-процессами: использует MoM и MoA

У ASI-1 Mini три слоя: основное ядро, спецслой MoM Marketplace, действующий слой AgentVerse.

Кому надо?
Тем, кто хочет внести свою лепту и получить профит. Доступно небольшим командам, а не только гигантам вроде Google или Microsoft. Это как инвестировать в стартап, только речь идёт о будущем всей индустрии 🤜

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👏7👍1🤔1
olmOCR: когда наконец-то понял, что написано ✏️

Держите инструмент обработки PDF-файлов, который может извлечь из них мегатонны качественных данных для обучения моделей 🏄

Проблема в том, что PDF бывают запутанными и сложными, особенно когда дело касается таблиц, списков и формул 😱

olmOCR справляется с этим на раз-два:
👨‍💻 за основу взяли продвинутый алгоритм на основе VLM
💼 обучили на огромном количестве разных PDF
🧾 инструмент сохраняет структуру документа и делает текст удобным для чтения
📈 работает быстро, что делает его отличным выбором для больших проектов

Облегчит жизнь занимающимся машинным обучением и языками, а также тем, кому необходимо обрабатывать массу PDF

Пробуем и пользуемся 👉 тут

Изображение Allen Institute for AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔21
IndicMMLU-Pro: AI учится говорить на индийских языках

Бенчмарк предназначен для хинди, бенгальского, тамильского и прочих языков Индийского субконтинента.

Как создавали:
🧑‍💻 IndicTrans2 перевела англоязычные вопросы и ответы MMLU на местные диалекты. Модель разработана именно для индийских языков, так что получилось качественно и с минимальной потерей лингвистического контекста
🧑‍🎓 для проверки использовали chrF++, BLEU и TER, а 13 экспертов подтверждали результат
👍 тестировали IndicBERT, IndicBART и даже GPT-4o
🫡 GPT-4o пока лидирует, но и специализированные модели показали себя неплохо в своих доменах

Бенчмарк не для английского и китайского сам по себе уже большое достижение. А ведь индийские языки используют более 500 миллионов людей! 🔝

* экстремистская организация, деятельность которой запрещена на территории РФ

Изображение University of South Carolina, Rochester Institute of Technology, Independent Researcher, Meta AI*, Amazon Gen AI, Amazon
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Нейронка распознаёт токсичные комменты в соцсетях 😶

Раньше подобные системы часто ошибались. Эта разработка поможет сделать интернет безопаснее и дружелюбнее 🙂

Проблема кибербуллинга и хейта становится острее, а ручной контроль почти невозможен из-за гигантского объёма контента — в интернете сейчас больше 5 млрд человек! 🤓

Тестировали три разных модели. Лучшая версия, основанная на методе опорных векторов (SVM), показала результативность 87,6%.

Её планируют улучшить, добавив глубокое обучение и расширив базу данных. Будет больше языков и диалектов. Чтобы внедрить технологию в реальную жизнь, создатели хотят сотрудничать с разработчиками соцсетей 🖥 🖥

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔21
Google-поиск: программисты, молодёжь и апгрейд контроля 😊

Компания активно усиливает поисковик, добавляя новые AI-опции на базе Gemini 2.0:
👨‍💻 теперь он сможет работать с ещё более заковыристыми вопросами, особенно по кодингу и математике
🗿 правда, как и раньше, результаты будут поверх обычных ссылок, что не всех радует
🤘 расширен круг пользователей AI-обзоров — для подростков они доступны без регистраций

А ещё готовится глобальное обновление интерфейса — появится режим AI Mode, в котором будет больше AI-результатов. Google честно предупреждает, что могут встречаться ошибки и недостоверная инфа 🤪

Но для безопасности вводится жёсткий контроль за информацией по медицине и финансам.

Функцию откроют премиум-подписчикам Google One AI, но обещают сделать доступной для всех после тестов 🫡

Изображение Google
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Manus: китайский автономный гений

Команда стартапа из Поднебесной выпустила AI-агента, по сравнению с которым модели OpenAI — малые дети 🤩

В отличие от обычных чат-ботов:
👨‍💻 сам справляется с кучей дел в разных областях
🎓 запоминает предпочтения пользователей и учится на ходу
👨‍💻 уже показал себя на платформах типа Upwork и Fiverr: перебрал резюме, изучил недвижимость и сделал финансовый анализ
✏️ а ещё написал код на Python и даже развернул сайт

Разрабы шокировали народ именно примерами работы помощника — аргументами, которых маловато у конкурентов. Ну и бенчи, конечно. Deep Research отдыхает в сторонке 🐻

После анонса Manus китайские техгиганты, такие как Alibaba, Tencent и Baidu, резко взлетели в цене на бирже 🛒
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2
Baichuan-Omni-1.5: все чувства технологий в одном ☀️

Мультимодель работает с текстом, изображениями, звуком и видео.

Что интересного:
💬 в обучение вложили более 500 млрд токенов разных типов данных, причём всё суперкачественное
🎤 Baichuan-Audio-Tokenizer — новенький токенизатор для аудио чётко выцепляет звуковые и смысловые детали. Качественно генерит и понимает аудиофайлы
😓 использовали многоэтапный обучающий пайплайн для итеративной интеграции тренировочных данных разных модальностей
📞 параллельно работает с несколькими форматами (например, создаёт аудио и разбирается, что там в видео). Таких фич нет у популярных VITA-1.5 и MiniCPM-o 2.6
👩‍🔬 справляется с медицинскими задачами, хотя параметров у неё меньше, чем у Qwen2-VL-72B
🎇 поддерживает как uni-, так и cross-modal инпут

Лучше конкурентов на многих доменных бенчмарках, даже если сравнивать с проприетарными моделями 👏

Изображение Baichuan Inc
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
🔥 Гонки на рельсах: AI-поезд соединит Москву и Питер

Российские инженеры вовсю трудятся над чертежами отечественного локомотива с инновационными подходами.

Поезд будет настоящим технологическим чудом:

🤩 с системой компьютерного зрения
🫡 удалённым управлением
🛞 умными устройствами для регулировки интервалов

Проект реализуют спецы из Инжинирингового центра железнодорожного транспорта. ИЦ ЖТ создали ОАО "РЖД" вместе с Группой "Синара". Производство доверят заводу "Уральские локомотивы".

Согласно плану, строительство этой высокоскоростной магистрали заложено в Транспортную стратегию России до 2030 года. Ожидается, что число пассажиров между двумя столицами вырастет с 5 до 23 млн 🤪

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9👏3
ARWKV: претренинг — это для слабаков 🏋️‍♀️

Рассказываю о новой гибридной архитектуре. Разрабы создали серию моделей, вдохновившись сетью Qwen 2.5 и механикой RWKV-7.

Цель:
усилить выразительность и state tracking способности RNN. Сделать их мощнее трансформеров

Как устроена новая архитектура:
👀 заменили self-attention на time-mixing, симулирующий attention в RNN. Сохранили активации RMSNorm и SwiGLU, остальное превратилось в слои RNN-based attention
💬 придумали новый способ дистилляции знаний из огромных моделей вроде Qwen 2.5 в эффективные ARWKV-модели. Это значит, что большие могут передать знания маленьким даже с меньшим числом токенов. Для тренировки использовали supervised fine-tuning и DPO

На MMLU, Squad, WinoGrande, GPQA у дистиллированных моделей результаты приличные, но всплыли и проблемы при переносе attention-скиллов ☺️

Изображение Ideogram
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔2