Новость так новость! OpenAI выпустили долгожданную версию своей языковой модели. По сравнению с GPT-4 и GPT-4o — самая мощная и довольно интересная
Основное:
Где взять?
Чего пока нет и что нельзя делать?
Перед запуском провели кучу тестов на безопасность, так что всё чисто
Изображение OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2🤔2
Спецы из Сбера и Сколтеха придумали, как сделать умнее нейросети для важной финансовой отрасли. Теперь они точнее на 20%!
Разработали классный метод, позволяющий алгоритмам обрабатывать сразу два уровня данных: общие вещи и внутреннюю информацию. Так можно быстрее анализировать операции и сделать сервисы безопаснее
Задачи поделили на три типа:
Проверили разные подходы и создали уникальную методику. С её помощью учитываются данные не только конкретного клиента, но и похожих на него по конкретным признакам.
Технология гибкая и универсальная, но её планируют развивать дальше, чтобы нейросети могли лучше распознавать нестандартные ситуации и защищаться от ошибок
Результаты исследования, поддержанного грантом Российского научного фонда (РНФ), опубликованы в международном журнале International Journal of Information Management Data Insights.
Изображение Sber AI Lab, Skoltech
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5🥰1😁1🤔1
AI в почте: письма становятся короче, посты — креативнее 💌
В сервисах Mail нейросетями пользуются уже 5 млн человек. Ресурс популярный, поэтому можно по предпочтениям и общие выводы сделать🧐
Вы можете попросить нейронку:
🤓 вкратце рассказать, кто и о чём вам написал
🔤 пересказать текст
🖥 написать новый с нуля
🦋 подкинуть идеи
🧾 сочинить пост для соцсеток
🥳 нагенерить поздравление
Самый популярный запрос — саммари писем. Это удобно: система делает выжимку входящих, остаётся только прочитать самое важное. Почти 90% всех заявок связаны именно с этим💌
Ещё народ любит генерить тексты в Заметках и поздравления через Календарь1️⃣
Стало интересно, чего вы хотите от AI в почте:
❤️ саммари вполне хватит
👍 пусть ещё и отвечает сам
🔥 спам достаёт — нужна помощь
💯 другие идеи
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
В сервисах Mail нейросетями пользуются уже 5 млн человек. Ресурс популярный, поэтому можно по предпочтениям и общие выводы сделать
Вы можете попросить нейронку:
Самый популярный запрос — саммари писем. Это удобно: система делает выжимку входящих, остаётся только прочитать самое важное. Почти 90% всех заявок связаны именно с этим
Ещё народ любит генерить тексты в Заметках и поздравления через Календарь
Стало интересно, чего вы хотите от AI в почте:
❤️ саммари вполне хватит
👍 пусть ещё и отвечает сам
🔥 спам достаёт — нужна помощь
💯 другие идеи
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
SkyReels V1: реализм на уровне кино ⭐️
Показываю открытую видеомодель, заточенную под генерацию людей.
HunyuanVideo прокачали на десятках миллионов фрагментов из топовых фильмов и сериалов:
👍 генерит на уровне крутых закрытых моделей, а среди конкурентов с открытым кодом в плане превращения текста в видео тягается даже с монстрами Kling и Minimax
🫤 делает реалистичную анимацию: SkyReels V1 показывает 33 разных выражения лица и 400 естественных движений
😎 даёт киноэстетику: кадры прямо как в Голливуде — чёткая композиция, грамотное расположение актёров и шикарные ракурсы
Для разработки создали свой конвейер обработки данных и добавили функции анализа эмоций, движений, понимания сцен.
Есть версии для роликов из текста и картинок, а ещё для “живых” портретов 😜
Показываю открытую видеомодель, заточенную под генерацию людей.
HunyuanVideo прокачали на десятках миллионов фрагментов из топовых фильмов и сериалов:
👍 генерит на уровне крутых закрытых моделей, а среди конкурентов с открытым кодом в плане превращения текста в видео тягается даже с монстрами Kling и Minimax
🫤 делает реалистичную анимацию: SkyReels V1 показывает 33 разных выражения лица и 400 естественных движений
😎 даёт киноэстетику: кадры прямо как в Голливуде — чёткая композиция, грамотное расположение актёров и шикарные ракурсы
Для разработки создали свой конвейер обработки данных и добавили функции анализа эмоций, движений, понимания сцен.
Есть версии для роликов из текста и картинок, а ещё для “живых” портретов 😜
👍8🤔1
Stial Steven пришёл, чтобы всё заблестело ✨
Китайцы Stial Technologies представили супергибкого робота-гуманоида, специализирующегося на полировке всяких сложных штуковин.
Что может этот малыш:
😶🌫️ двигаться почти как человек
🤹 работать с мелкими деталями и замысловатыми поверхностями
😑 в отличие от обычных промышленных роботов, быстро адаптируется
🚶♂️ регулирует силу нажатия, углы и траекторию прямо на ходу
⚡️ использует AI и 6D умные датчики силы
Stial Steven действует точно и быстро, особенно в узких местах. Ещё один помощник среди роботов на производстве 💯
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Китайцы Stial Technologies представили супергибкого робота-гуманоида, специализирующегося на полировке всяких сложных штуковин.
Что может этот малыш:
😶🌫️ двигаться почти как человек
🤹 работать с мелкими деталями и замысловатыми поверхностями
😑 в отличие от обычных промышленных роботов, быстро адаптируется
🚶♂️ регулирует силу нажатия, углы и траекторию прямо на ходу
⚡️ использует AI и 6D умные датчики силы
Stial Steven действует точно и быстро, особенно в узких местах. Ещё один помощник среди роботов на производстве 💯
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
👍7🔥1🤔1
Большой мозг, маленькая плата: Nvidia и компания творят чудеса с памятью 🧑💻
Компания разрабатывает новый стандарт памяти вместе с SK Hynix, Samsung и Micron. Называется SOCAMM (System On Chip Advanced Memory Module) и заточен под AI-компьютеры.
Главное — модуль маленький, но мощный. Следующий уровень после LPCAMM и обычной DRAM-памяти.
Что в нём полезного в целом:
❗️ компактнее DRAM — размером примерно с палец взрослого человека
💥 экономит энергию, потому что память типа LPDDR5X встроена прямо в плату
📥 больше портов для ввода-вывода — целых 694. У LPCAMM их было 644, а у обычной DRAM — вообще 260
Ещё один плюс — SOCAMM легко модернизируется. Его можно снимать и заменять. А это значит, что апгрейд системы станет элементарным🔄
Массовое производство наметили уже в этом году. Ждём новых мощных компов💻
Изображение Nvidia
Компания разрабатывает новый стандарт памяти вместе с SK Hynix, Samsung и Micron. Называется SOCAMM (System On Chip Advanced Memory Module) и заточен под AI-компьютеры.
Главное — модуль маленький, но мощный. Следующий уровень после LPCAMM и обычной DRAM-памяти.
Что в нём полезного в целом:
Ещё один плюс — SOCAMM легко модернизируется. Его можно снимать и заменять. А это значит, что апгрейд системы станет элементарным
Массовое производство наметили уже в этом году. Ждём новых мощных компов
Изображение Nvidia
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2👏1🤩1
ProgCo против логической путаницы 🤔
Разработка от ребят из Alibaba для хорошей самокоррекции LLM.
Модели часто не могут адекватно исправлять ошибки, особенно когда дело касается сложных задач на логику. Всему виной их чрезмерная уверенность и проблемы с пониманием хитрых логических цепочек🥳
ProgCo решает всё двумя модулями:
😓 ProgVe вместо промптов запускает самогенерирующиеся pseudo-verification программы. Так точнее отражается логическая структура
🆘 ProgRe за счёт обратной связи от ProgVe корректирует работу всей модели. Действует в обе стороны: правит и модель, и себя
На разных математических бенчах вроде IFEval, GSM8K и MATH результаты были положительными. GPT-3.5 и GPT-4 показали прирост в среднем на 8% в сложных математических задачах🏋️♂️
Изображение Taobao & Tmall Group of Alibaba
Разработка от ребят из Alibaba для хорошей самокоррекции LLM.
Модели часто не могут адекватно исправлять ошибки, особенно когда дело касается сложных задач на логику. Всему виной их чрезмерная уверенность и проблемы с пониманием хитрых логических цепочек
ProgCo решает всё двумя модулями:
На разных математических бенчах вроде IFEval, GSM8K и MATH результаты были положительными. GPT-3.5 и GPT-4 показали прирост в среднем на 8% в сложных математических задачах
Изображение Taobao & Tmall Group of Alibaba
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤔1
А голову ты дома не забыл? GHOST 2.0 и новая эра фотомонтажа 🫤
Это модель для замены на фото головы, а не просто лица, как мы привыкли видеть. Сохраняется всё: волосы, уши и прочее. Плюс естественная мимика и идеальное сочетание с фоном🕺
Что вообще делается? Берётся голова с одного изображения и вставляется в другое с учётом нюансов: движений, эмоций, антуража😍
Какие технологии задействованы:
😑 Aligner Model как бы рендерит голову, её ракурсы и позы, даже если она повёрнута на 180 градусов
🪞 Blender Module уже соединяет результат с картинкой, чтобы кожа выглядела натурально, а переходы были незаметными
🙄 не проблема даже странные причёски и формы
Где можно применять? Киношники любят такие штуки для спецэффектов, рекламщики — для вставки знаменитостей, в онлайн-примерке, распознавании фейков.
Ну и селфи доработать никто не откажется😄
Изображение Sber AI, AIRI
Это модель для замены на фото головы, а не просто лица, как мы привыкли видеть. Сохраняется всё: волосы, уши и прочее. Плюс естественная мимика и идеальное сочетание с фоном
Что вообще делается? Берётся голова с одного изображения и вставляется в другое с учётом нюансов: движений, эмоций, антуража
Какие технологии задействованы:
Где можно применять? Киношники любят такие штуки для спецэффектов, рекламщики — для вставки знаменитостей, в онлайн-примерке, распознавании фейков.
Ну и селфи доработать никто не откажется
Изображение Sber AI, AIRI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5😁2
You.com запустили помощника для предпринимателей, умеющего молниеносно переваривать массу инфы и выдавать готовые аналитические отчёты.
Экономит время и деньги:
В бизнесе можно перейти от разовых ресурсоёмких проектов к непрерывному потоку
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Cisco и Nvidia объединяются ради суперумных сетей 🤪
Компании объявили о партнёрстве, чтобы быстрее внедрять AI в бизнес-сектор.
Что хотят сделать:
🧑💻 создать общую платформу с технологиями Cisco Silicon One и Nvidia Spectrum-X
🧑🎓 подготовить сети ЦОД к работе с AI
🆒 дать компаниям больше свободы выбора и гибкости при вложениях в AI-инфраструктуру
Проект упростит управление разными сетевыми системами в одной архитектуре. Использовать инструменты для настройки инфраструктуры будет удобнее.
Больше не будет технических сложностей и рисков при запуске AI-решений🙏
Изображение Ideogram
Компании объявили о партнёрстве, чтобы быстрее внедрять AI в бизнес-сектор.
Что хотят сделать:
Проект упростит управление разными сетевыми системами в одной архитектуре. Использовать инструменты для настройки инфраструктуры будет удобнее.
Больше не будет технических сложностей и рисков при запуске AI-решений
Изображение Ideogram
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Диффузионная LLM генерит до 10 раз быстрее и дешевле всех
Чеклист:
Диффузия же используется для генерации картинок, видео и звука, а к тексту и коду начали применять не так давно. Нормальную производительность получали только на спецоборудовании (Groq, Cerebras и SambaNova). Но с dLLM прирост скорости есть даже на стандартных вычислительных устройствах
По результатам Mercury Coder Mini на стандартных бенчмарках превосходит GPT-4o Mini, Gemini-1.5-Flash, Claude 3.5 Haiku и даже GPT-4o, работая примерно в 4 раза быстрее
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥7👍7
This media is not supported in your browser
VIEW IN TELEGRAM
LAVCap: звук, картинка, волшебство
Фреймворк, объединяющий LLM и теорию оптимального транспорта, разработали в KAIST и Университете Ватерлоо. Он генерит описания к сценам на основе видео и аудио💬
Как?
😓 алгоритм alignment loss сглаживает различия аудио и изображения при обучении
➕ отдельный модуль optimal transport attention объединяет информацию из обоих источников
🕺 Fused representations преобразуются в скрытое пространство модели через линейную проекцию
В чём фишки:
👍 подход не требует больших датасетов или post-processing. Дело в грамотной оптимизации моделей
👨💻 алгоритмы обучали генерации, а LoRA-адаптацию добавили для качества
Что получилось: LAVCap обошла SOTA-модели на бенчмарке AudioCaps сразу по нескольким метрикам. Реально круто, ведь обычно такие успехи требуют гигантских объёмов данных, а тут обошлись без этого!
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Фреймворк, объединяющий LLM и теорию оптимального транспорта, разработали в KAIST и Университете Ватерлоо. Он генерит описания к сценам на основе видео и аудио
Как?
В чём фишки:
Что получилось: LAVCap обошла SOTA-модели на бенчмарке AudioCaps сразу по нескольким метрикам. Реально круто, ведь обычно такие успехи требуют гигантских объёмов данных, а тут обошлись без этого!
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👏3
This media is not supported in your browser
VIEW IN TELEGRAM
LLM + MCTS: как языковые модели оживили старый добрый алгоритм
Алгоритм Монте-Карло для поиска в дереве - древний способ, который действительно популярен у моделей (к примеру, AlphaGo является имплементацией MCTS). Так вот исследователи из Сингапура решили прокачать его с помощью LLM🤔
Варианты:
⏳ LLM для задания исходных heuristic functions. Позволяют отказаться от seed функций, на генерацию которых уходит время
🍀 оптимизация паттернов обхода дерева
🌎 динамическое расширение. Модель увеличивает охват с ростом накопленных знаний на предыдущих шагах
Результат для классических NP-проблем? Тестирование показало, что синергия превосходит обычные LLM-based методы📊
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Алгоритм Монте-Карло для поиска в дереве - древний способ, который действительно популярен у моделей (к примеру, AlphaGo является имплементацией MCTS). Так вот исследователи из Сингапура решили прокачать его с помощью LLM
Варианты:
Результат для классических NP-проблем? Тестирование показало, что синергия превосходит обычные LLM-based методы
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤔2
4 новых AI-ассистента, облегчающих жизнь
📱 В Opera встроили Browser Operator для всякой рутины прямо на девайсе. Никто не получит доступ ни к логинам, ни к кукам, ни к истории просмотров 👀 Operator заходит куда надо, минуя лишние шаги, и работает со скрытыми элементами вроде всплывающих окон.
📱 Ассистент от Microsoft Dragon Copilot для медицины помогает врачам записывать консультации, вести документацию и справляться с массой разной бюрократии. Снижает риск выгорания у докторов и улучшает впечатление от лечения у пациентов 😇
🏋️ Amazon прокачал наконец старушку Alexa, выпустив версию Alexa+. Она уже больше похожа на ChatGPT и Google Gemini. Учитывает личные предпочтения и лучше понимает контекст вопросов 🤬
😎 AI-помощником Tecno Ella в очках от Tecno AI Glasses и AI Glasses Pro можно управлять голосом и прикосновениями к дужке. Узнаёт предметы вокруг, пишет саммари текста, переводит на разные языки 👋
Изображение Zeno
Изображение Zeno
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2
Проверь себя: как часто алгоритм Монте-Карло для поиска в дереве задействован в моделях и фреймворках?
Anonymous Poll
18%
редко, используется только в узкоспециализированных приложениях и не имеет широкого применения
46%
постоянно, является центральным для большого числа AI-инструментов
40%
не задействован, заменён современными методами и сейчас практически не используется
Media is too big
VIEW IN TELEGRAM
Hi Robot: интуиция, рассудок и исполнительность 🤡
Показываю, как при новом подходе умные роботы не просто выполняют команды, а реально соображают, что от них требуется✌️
Hi Robot основан на двухуровневой модели принятия решений:
✔️ System 1 — это как чутьё, быстрая и автоматическая реакция
✔️ System 2 — осознанное, медленное и рассудительное мышление
Как это работает в роботах:
👠 высокоуровневые модели интерпретируют сложные команды и разбивают их на понятные шаги
⛏ низкоуровневые модели на их основе выполняют конкретные действия
На практике роботы учитывают контекст и корректируют себя по обратной связи в реальном времени. Меняют план, если пользователь указывает на ошибку или предлагает другой вариант🧠
Показываю, как при новом подходе умные роботы не просто выполняют команды, а реально соображают, что от них требуется
Hi Robot основан на двухуровневой модели принятия решений:
Как это работает в роботах:
На практике роботы учитывают контекст и корректируют себя по обратной связи в реальном времени. Меняют план, если пользователь указывает на ошибку или предлагает другой вариант
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍4
Злаки 2.0: AI научил рис производить CoQ10 🌾
Китайские учёные создали новый вид крупы, который сам генерит важный антиоксидант. Для анализа эволюции и вариаций фермента, участвующего в синтезе, использовали ML.
Полезное питание будет более доступным, ведь раньше CoQ10 получали в основном через добавки 🍽
Так-то организм сам вырабатывает CoQ10, но постепенно снижает количество. Злаки, включая рис и пшеницу, обычно содержат CoQ9 😔
AI помог определить ключевые аминокислоты, отвечающие за разницу между ними, а специалисты изменили гены так, чтобы рис производил именно CoQ10. При этом количество вещества в зерне достигает 5 мкг/г, что довольно много 😇
Плюс CoQ10 сохраняется даже при готовке 🥢 Работают над тем, чтобы внедрить особенность в разные сорта. Можно и в другие культуры — ту же пшеницу 🌱
Изображение CAS, Shanghai Jiao Tong University, Guangdong Pharmaceutical University et al.
Китайские учёные создали новый вид крупы, который сам генерит важный антиоксидант. Для анализа эволюции и вариаций фермента, участвующего в синтезе, использовали ML.
Полезное питание будет более доступным, ведь раньше CoQ10 получали в основном через добавки 🍽
Так-то организм сам вырабатывает CoQ10, но постепенно снижает количество. Злаки, включая рис и пшеницу, обычно содержат CoQ9 😔
AI помог определить ключевые аминокислоты, отвечающие за разницу между ними, а специалисты изменили гены так, чтобы рис производил именно CoQ10. При этом количество вещества в зерне достигает 5 мкг/г, что довольно много 😇
Плюс CoQ10 сохраняется даже при готовке 🥢 Работают над тем, чтобы внедрить особенность в разные сорта. Можно и в другие культуры — ту же пшеницу 🌱
Изображение CAS, Shanghai Jiao Tong University, Guangdong Pharmaceutical University et al.
🔥12❤2👍1
Supermicro строит мегакампус в Кремниевой долине 🏠
Решили расширить там своё присутствие:
🏠 площадь нового центра составит целых 3 млн ft² (больше 200 гектаров)
🥳 сотни рабочих мест
👨💻 технологии для AI и высокопроизводительных вычислений
🆒 экологичные решения с жидкостным охлаждением
🤯 эффективные серверы и экономия электроэнергии
Строительство начнётся уже в 2025 году.
Изображение Supermicro
Решили расширить там своё присутствие:
Строительство начнётся уже в 2025 году.
Изображение Supermicro
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1
SynthLight: поиграем со светом 🌞
Йель вместе с Adobe разработали фреймворк для редактирования освещения на портретных фотках. Оно меняется диффузионками, опирающимися на синтетику. Это значит, что фотографам понадобится меньше оборудования📸
Основой SynthLight стал огромный датасет с использованием пайплайна для генерации 3D-портретов:
⚙️ создали его с помощью Блендера
💡 собрали около 1,26 млн портретов с разным светом, оттенками кожи и поворотами головы
😵💫 на них и тренировали модель
SynthLight рассматривает задачу как диффузионную трансформацию пикселей. Используется улучшенная StableDiffusion с каналами для обработки входных portrait и lightning maps😓
Йель вместе с Adobe разработали фреймворк для редактирования освещения на портретных фотках. Оно меняется диффузионками, опирающимися на синтетику. Это значит, что фотографам понадобится меньше оборудования
Основой SynthLight стал огромный датасет с использованием пайплайна для генерации 3D-портретов:
SynthLight рассматривает задачу как диффузионную трансформацию пикселей. Используется улучшенная StableDiffusion с каналами для обработки входных portrait и lightning maps
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2