NEW BOT Телеграм, страница - 55210760

Sber AI

39.7K subscribers

2.42K photos

619 videos

1 file

2.04K links

AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!

Download Telegram

About

Blog

Apps

Platform

39.7K subscribers

☄️

GPT-4.5: умнее, креативнее, чувствительнее

Новость так новость! OpenAI выпустили долгожданную версию своей языковой модели. По сравнению с GPT-4 и GPT-4o — самая мощная и довольно интересная 🔥

Основное:
✔️ много эмоций и креатива. GPT-4.5 общается более естественно, творчески подходит к задачам, лучше понимает намерения пользователя и меньше галлюцинирует
✔️ планирует и решает намного круче — справляется с многоходовочками и автоматизацией
✔️ мультимодальная — GPT-4.5 отлично работает с текстом и картинками, а в будущем обещают ещё поддержку аудио и видео

Где взять?
🔔 открыта для подписчиков ChatGPT Pro и скоро появится для Plus, Team, Enterprise и на Edu
🔔 для разрабов доступна через API — это Chat Completions API, Assistants API и Batch API

Чего пока нет и что нельзя делать?
❌ GPT-4.5 не дружит с голосом и видео, совместного использования экрана придётся подождать
❌ ещё одна важная деталь: модель требует больше ресурсов и стоит дороже

Перед запуском провели кучу тестов на безопасность, так что всё чисто 🛡

Изображение OpenAI

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2🤔2

886 views11:29

🆕

Российские учёные улучшили работу банков с помощью AI

Спецы из Сбера и Сколтеха придумали, как сделать умнее нейросети для важной финансовой отрасли. Теперь они точнее на 20%!

Разработали классный метод, позволяющий алгоритмам обрабатывать сразу два уровня данных: общие вещи и внутреннюю информацию. Так можно быстрее анализировать операции и сделать сервисы безопаснее 🤫

Задачи поделили на три типа:
1️⃣ глобальные
2️⃣ локальные
3️⃣ динамические

Проверили разные подходы и создали уникальную методику. С её помощью учитываются данные не только конкретного клиента, но и похожих на него по конкретным признакам.

Технология гибкая и универсальная, но её планируют развивать дальше, чтобы нейросети могли лучше распознавать нестандартные ситуации и защищаться от ошибок 🧑‍🎓

Результаты исследования, поддержанного грантом Российского научного фонда (РНФ), опубликованы в международном журнале International Journal of Information Management Data Insights.

Изображение Sber AI Lab, Skoltech

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥5🥰1😁1🤔1

937 views15:17

AI в почте: письма становятся короче, посты — креативнее

💌

В сервисах Mail нейросетями пользуются уже 5 млн человек. Ресурс популярный, поэтому можно по предпочтениям и общие выводы сделать 🧐

Вы можете попросить нейронку:
🤓 вкратце рассказать, кто и о чём вам написал
🔤 пересказать текст
🖥 написать новый с нуля
🦋 подкинуть идеи
🧾 сочинить пост для соцсеток
🥳 нагенерить поздравление

Самый популярный запрос — саммари писем. Это удобно: система делает выжимку входящих, остаётся только прочитать самое важное. Почти 90% всех заявок связаны именно с этим 💌

Ещё народ любит генерить тексты в Заметках и поздравления через Календарь 1️⃣

Стало интересно, чего вы хотите от AI в почте:
❤️ саммари вполне хватит
👍 пусть ещё и отвечает сам
🔥 спам достаёт — нужна помощь
💯 другие идеи

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2🔥2😁2

907 views06:49

This media is not supported in your browser

VIEW IN TELEGRAM

SkyReels V1: реализм на уровне кино ⭐️

Показываю открытую видеомодель, заточенную под генерацию людей.

HunyuanVideo прокачали на десятках миллионов фрагментов из топовых фильмов и сериалов:
👍 генерит на уровне крутых закрытых моделей, а среди конкурентов с открытым кодом в плане превращения текста в видео тягается даже с монстрами Kling и Minimax
🫤 делает реалистичную анимацию: SkyReels V1 показывает 33 разных выражения лица и 400 естественных движений
😎 даёт киноэстетику: кадры прямо как в Голливуде — чёткая композиция, грамотное расположение актёров и шикарные ракурсы

Для разработки создали свой конвейер обработки данных и добавили функции анализа эмоций, движений, понимания сцен.

Есть версии для роликов из текста и картинок, а ещё для “живых” портретов 😜

👍8🤔1

869 views13:52

Stial Steven пришёл, чтобы всё заблестело ✨

Китайцы Stial Technologies представили супергибкого робота-гуманоида, специализирующегося на полировке всяких сложных штуковин.

Что может этот малыш:
😶‍🌫️ двигаться почти как человек
🤹 работать с мелкими деталями и замысловатыми поверхностями
😑 в отличие от обычных промышленных роботов, быстро адаптируется
🚶‍♂️ регулирует силу нажатия, углы и траекторию прямо на ходу
⚡️ использует AI и 6D умные датчики силы

Stial Steven действует точно и быстро, особенно в узких местах. Ещё один помощник среди роботов на производстве 💯

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

👍7🔥1🤔1

857 views04:57

Большой мозг, маленькая плата: Nvidia и компания творят чудеса с памятью

🧑‍💻

Компания разрабатывает новый стандарт памяти вместе с SK Hynix, Samsung и Micron. Называется SOCAMM (System On Chip Advanced Memory Module) и заточен под AI-компьютеры.

Главное — модуль маленький, но мощный. Следующий уровень после LPCAMM и обычной DRAM-памяти.

Что в нём полезного в целом:
❗️ компактнее DRAM — размером примерно с палец взрослого человека
💥 экономит энергию, потому что память типа LPDDR5X встроена прямо в плату
📥 больше портов для ввода-вывода — целых 694. У LPCAMM их было 644, а у обычной DRAM — вообще 260

Ещё один плюс — SOCAMM легко модернизируется. Его можно снимать и заменять. А это значит, что апгрейд системы станет элементарным 🔄

Массовое производство наметили уже в этом году. Ждём новых мощных компов 💻

Изображение Nvidia

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👏1🤩1

950 views13:52

ProgCo против логической путаницы

🤔

Разработка от ребят из Alibaba для хорошей самокоррекции LLM.

Модели часто не могут адекватно исправлять ошибки, особенно когда дело касается сложных задач на логику. Всему виной их чрезмерная уверенность и проблемы с пониманием хитрых логических цепочек 🥳

ProgCo решает всё двумя модулями:
😓 ProgVe вместо промптов запускает самогенерирующиеся pseudo-verification программы. Так точнее отражается логическая структура
🆘 ProgRe за счёт обратной связи от ProgVe корректирует работу всей модели. Действует в обе стороны: правит и модель, и себя

На разных математических бенчах вроде IFEval, GSM8K и MATH результаты были положительными. GPT-3.5 и GPT-4 показали прирост в среднем на 8% в сложных математических задачах 🏋️‍♂️

Изображение Taobao & Tmall Group of Alibaba

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🤔1

861 views04:58

А голову ты дома не забыл? GHOST 2.0 и новая эра фотомонтажа

🫤

Это модель для замены на фото головы, а не просто лица, как мы привыкли видеть. Сохраняется всё: волосы, уши и прочее. Плюс естественная мимика и идеальное сочетание с фоном 🕺

Что вообще делается? Берётся голова с одного изображения и вставляется в другое с учётом нюансов: движений, эмоций, антуража 😍

Какие технологии задействованы:
😑 Aligner Model как бы рендерит голову, её ракурсы и позы, даже если она повёрнута на 180 градусов
🪞 Blender Module уже соединяет результат с картинкой, чтобы кожа выглядела натурально, а переходы были незаметными
🙄 не проблема даже странные причёски и формы

Где можно применять? Киношники любят такие штуки для спецэффектов, рекламщики — для вставки знаменитостей, в онлайн-примерке, распознавании фейков.

Ну и селфи доработать никто не откажется 😄

Изображение Sber AI, AIRI

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5😁2

871 views10:31

📊

ARI: новый взгляд на бизнес-инсайты

You.com запустили помощника для предпринимателей, умеющего молниеносно переваривать массу инфы и выдавать готовые аналитические отчёты.

Экономит время и деньги:
🥇 осиливает сразу сотни источников данных, тогда как конкуренты редко тянут больше пары десятков
👀 система помогает с анализом и наглядной подачей — понятно даже новичкам
🤑 пригодится там, где важна оперативность и точность: финансы, медучреждения, СМИ

В бизнесе можно перейти от разовых ресурсоёмких проектов к непрерывному потоку 🚘

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

817 views14:43

Cisco и Nvidia объединяются ради суперумных сетей 🤪

Компании объявили о партнёрстве, чтобы быстрее внедрять AI в бизнес-сектор.

Что хотят сделать:
🧑‍💻 создать общую платформу с технологиями Cisco Silicon One и Nvidia Spectrum-X
🧑‍🎓 подготовить сети ЦОД к работе с AI
🆒 дать компаниям больше свободы выбора и гибкости при вложениях в AI-инфраструктуру

Проект упростит управление разными сетевыми системами в одной архитектуре. Использовать инструменты для настройки инфраструктуры будет удобнее.

Больше не будет технических сложностей и рисков при запуске AI-решений 🙏

Изображение Ideogram

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

818 views05:17

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

☄️

Mercury мчит быстрее интернета

Диффузионная LLM генерит до 10 раз быстрее и дешевле всех 🔝

Чеклист:
🚀 обрабатывает больше 1 000 токенов в секунду на Nvidia H100, что раньше было возможно только на кастомных чипах
🤬 версия Mercury Coder в 5-10 раз быстрее текущих моделей и уже доступна для тестирования через интерфейс. Для компаний — через API и установку на свои сервера

Диффузия же используется для генерации картинок, видео и звука, а к тексту и коду начали применять не так давно. Нормальную производительность получали только на спецоборудовании (Groq, Cerebras и SambaNova). Но с dLLM прирост скорости есть даже на стандартных вычислительных устройствах 👨‍💻

По результатам Mercury Coder Mini на стандартных бенчмарках превосходит GPT-4o Mini, Gemini-1.5-Flash, Claude 3.5 Haiku и даже GPT-4o, работая примерно в 4 раза быстрее 🔥

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥7👍7

863 views11:18

This media is not supported in your browser

VIEW IN TELEGRAM

LAVCap: звук, картинка, волшебство

Фреймворк, объединяющий LLM и теорию оптимального транспорта, разработали в KAIST и Университете Ватерлоо. Он генерит описания к сценам на основе видео и аудио 💬

Как?
😓 алгоритм alignment loss сглаживает различия аудио и изображения при обучении
➕ отдельный модуль optimal transport attention объединяет информацию из обоих источников
🕺 Fused representations преобразуются в скрытое пространство модели через линейную проекцию

В чём фишки:
👍 подход не требует больших датасетов или post-processing. Дело в грамотной оптимизации моделей
👨‍💻 алгоритмы обучали генерации, а LoRA-адаптацию добавили для качества

Что получилось: LAVCap обошла SOTA-модели на бенчмарке AudioCaps сразу по нескольким метрикам. Реально круто, ведь обычно такие успехи требуют гигантских объёмов данных, а тут обошлись без этого!

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4👏3

788 views14:47

This media is not supported in your browser

VIEW IN TELEGRAM

LLM + MCTS: как языковые модели оживили старый добрый алгоритм

Алгоритм Монте-Карло для поиска в дереве - древний способ, который действительно популярен у моделей (к примеру, AlphaGo является имплементацией MCTS). Так вот исследователи из Сингапура решили прокачать его с помощью LLM 🤔

Варианты:
⏳ LLM для задания исходных heuristic functions. Позволяют отказаться от seed функций, на генерацию которых уходит время
🍀 оптимизация паттернов обхода дерева
🌎 динамическое расширение. Модель увеличивает охват с ростом накопленных знаний на предыдущих шагах

Результат для классических NP-проблем? Тестирование показало, что синергия превосходит обычные LLM-based методы 📊

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🤔2

801 viewsedited 05:34

4 новых AI-ассистента, облегчающих жизнь

📱 В Opera встроили Browser Operator для всякой рутины прямо на девайсе. Никто не получит доступ ни к логинам, ни к кукам, ни к истории просмотров 👀 Operator заходит куда надо, минуя лишние шаги, и работает со скрытыми элементами вроде всплывающих окон.

📱 Ассистент от Microsoft Dragon Copilot для медицины помогает врачам записывать консультации, вести документацию и справляться с массой разной бюрократии. Снижает риск выгорания у докторов и улучшает впечатление от лечения у пациентов 😇

🏋️ Amazon прокачал наконец старушку Alexa, выпустив версию Alexa+. Она уже больше похожа на ChatGPT и Google Gemini. Учитывает личные предпочтения и лучше понимает контекст вопросов 🤬

😎 AI-помощником Tecno Ella в очках от Tecno AI Glasses и AI Glasses Pro можно управлять голосом и прикосновениями к дужке. Узнаёт предметы вокруг, пишет саммари текста, переводит на разные языки 👋

Изображение Zeno

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤2🔥2

741 views12:07

Проверь себя: как часто алгоритм Монте-Карло для поиска в дереве задействован в моделях и фреймворках?

Anonymous Poll

редко, используется только в узкоспециализированных приложениях и не имеет широкого применения

постоянно, является центральным для большого числа AI-инструментов

не задействован, заменён современными методами и сейчас практически не используется

68 voters751 views13:22

Media is too big

VIEW IN TELEGRAM

Hi Robot: интуиция, рассудок и исполнительность

🤡

Показываю, как при новом подходе умные роботы не просто выполняют команды, а реально соображают, что от них требуется ✌️

Hi Robot основан на двухуровневой модели принятия решений:
✔️ System 1 — это как чутьё, быстрая и автоматическая реакция
✔️ System 2 — осознанное, медленное и рассудительное мышление

Как это работает в роботах:
👠 высокоуровневые модели интерпретируют сложные команды и разбивают их на понятные шаги
⛏ низкоуровневые модели на их основе выполняют конкретные действия

На практике роботы учитывают контекст и корректируют себя по обратной связи в реальном времени. Меняют план, если пользователь указывает на ошибку или предлагает другой вариант 🧠

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍4

757 views15:32

Злаки 2.0: AI научил рис производить CoQ10 🌾

Китайские учёные создали новый вид крупы, который сам генерит важный антиоксидант. Для анализа эволюции и вариаций фермента, участвующего в синтезе, использовали ML.

Полезное питание будет более доступным, ведь раньше CoQ10 получали в основном через добавки 🍽

Так-то организм сам вырабатывает CoQ10, но постепенно снижает количество. Злаки, включая рис и пшеницу, обычно содержат CoQ9 😔

AI помог определить ключевые аминокислоты, отвечающие за разницу между ними, а специалисты изменили гены так, чтобы рис производил именно CoQ10. При этом количество вещества в зерне достигает 5 мкг/г, что довольно много 😇

Плюс CoQ10 сохраняется даже при готовке 🥢 Работают над тем, чтобы внедрить особенность в разные сорта. Можно и в другие культуры — ту же пшеницу 🌱

Изображение CAS, Shanghai Jiao Tong University, Guangdong Pharmaceutical University et al.

🔥12❤2👍1

890 views05:06

Supermicro строит мегакампус в Кремниевой долине

🏠

Решили расширить там своё присутствие:
🏠 площадь нового центра составит целых 3 млн ft² (больше 200 гектаров)
🥳 сотни рабочих мест
👨‍💻 технологии для AI и высокопроизводительных вычислений
🆒 экологичные решения с жидкостным охлаждением
🤯 эффективные серверы и экономия электроэнергии

Строительство начнётся уже в 2025 году.

Изображение Supermicro

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🤔1

805 views10:42

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

SynthLight: поиграем со светом

🌞

Йель вместе с Adobe разработали фреймворк для редактирования освещения на портретных фотках. Оно меняется диффузионками, опирающимися на синтетику. Это значит, что фотографам понадобится меньше оборудования 📸

Основой SynthLight стал огромный датасет с использованием пайплайна для генерации 3D-портретов:
⚙️ создали его с помощью Блендера
💡 собрали около 1,26 млн портретов с разным светом, оттенками кожи и поворотами головы
😵‍💫 на них и тренировали модель

SynthLight рассматривает задачу как диффузионную трансформацию пикселей. Используется улучшенная StableDiffusion с каналами для обработки входных portrait и lightning maps 😓

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍2

880 views14:53