This media is not supported in your browser
VIEW IN TELEGRAM
На троих с Соннет 4.5 и Суно 5 получилась Киберосень.
Опыт в итоге следующий:
Суно лучше всего пишет именно структуру песни.
Т.е. прям в ней нужно генерить.
Она делает правильную структуру заготовки.
Дальше отдаем в Соннет с задачей - тут все плохо, вот цель - переделай.
Получается исправленная рифма и более качественная структура текста.
Дальше ручками правим стих.
Финалим.
Возвращаемся в Суно - 20 генераций спустя понимаем нужную комбинацию описания инструментов и исполнителей, убираем опечатки и расставляем ударения.
В следующем году, видимо, все эти лишние движения будут уже не нужны.
О том и песня.
#Киберосень #музыка #Suno
———
@tsingular
Опыт в итоге следующий:
Суно лучше всего пишет именно структуру песни.
Т.е. прям в ней нужно генерить.
Она делает правильную структуру заготовки.
Дальше отдаем в Соннет с задачей - тут все плохо, вот цель - переделай.
Получается исправленная рифма и более качественная структура текста.
Дальше ручками правим стих.
Финалим.
Возвращаемся в Суно - 20 генераций спустя понимаем нужную комбинацию описания инструментов и исполнителей, убираем опечатки и расставляем ударения.
В следующем году, видимо, все эти лишние движения будут уже не нужны.
О том и песня.
#Киберосень #музыка #Suno
———
@tsingular
2👍16❤🔥4❤3⚡2🔥2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
Эпоха вайбкодинга прекрасна.
Нашел какие-то формулы в Х
Sonnet их тут же оживил
Код в комментарии
#Sonnet #vibecoding #squid
———
@tsingular
Нашел какие-то формулы в Х
a=(y,d=mag(k=(y<11?6+sin(y^8)*6:y/5+cos(y/2))*cos(i-t/4),e=y/7-13)+sin(e/4+t)/2)=>point((q=y*k/d*(3+sin(d*2+y/2-t*4)))+60*cos(c=d/2+1-t/2)+200,q*sin(c)+d*29-170)
t=0,draw=$=>{t||createCanvas(w=400,w);background(9).stroke(w,96);for(t+=PI/120,i=1e4;i--;)a(i/345)}
Sonnet их тут же оживил
Код в комментарии
#Sonnet #vibecoding #squid
———
@tsingular
🔥26❤1
Aiday - открытая панельная дискуссиия началась.
Смотреть на сайте.
http://aiday.sk.ru/
#сколково #aiday
------
@tsingular
Смотреть на сайте.
http://aiday.sk.ru/
#сколково #aiday
------
@tsingular
👍7❤4
- то, что Россия в клубе разработчиков фундаментальных ИИ моделей,- круто!
- возможно в какой-то момент разработку регламентов работы ИИ придётся поручить ИИ.
- я тоже использую модели ИИ.
- ИИ пока не способен предсказывать политические события.люди справляются лучше.
- мы должны как страна в области ИИ достичь больших успехов.
- пока мы способны контролировать ИИ, но только пока.
#aiday #Сколково #Медведев
------
@tsingular
- возможно в какой-то момент разработку регламентов работы ИИ придётся поручить ИИ.
- я тоже использую модели ИИ.
- ИИ пока не способен предсказывать политические события.люди справляются лучше.
- мы должны как страна в области ИИ достичь больших успехов.
- пока мы способны контролировать ИИ, но только пока.
#aiday #Сколково #Медведев
------
@tsingular
⚡8✍8🔥3💯1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI запускает покупки прямо в ChatGPT через Instant Checkout
ChatGPT теперь позволяет покупать товары без выхода из чата.
Пользователи в США могут покупать у продавцов Etsy, скоро подключатся миллион магазинов Shopify включая Glossier, SKIMS, Spanx.
Основа системы — Agentic Commerce Protocol, разработанный с Stripe. Протокол открытый, что позволяет другим разработчикам создавать интеграции.
Ранжирование товаров остается органическим, но среди одинаковых продуктов учитывается поддержка Instant Checkout.
Данные пользователей передаются минимально, только для завершения заказа. Платежи проходят через существующие системы продавцов.
Комиссия с продавцов составляет около 2% против 15% у Amazon плюс затраты на рекламу.
Теперь ИИ не только найдет товар, но и купит его за вас.
Интересно когда GigaChat к Сбермаркету прикрутят?
Засекаем :) время пошло.
#ChatGPT #Stripe #Commerce
------
@tsingular
ChatGPT теперь позволяет покупать товары без выхода из чата.
Пользователи в США могут покупать у продавцов Etsy, скоро подключатся миллион магазинов Shopify включая Glossier, SKIMS, Spanx.
Основа системы — Agentic Commerce Protocol, разработанный с Stripe. Протокол открытый, что позволяет другим разработчикам создавать интеграции.
Ранжирование товаров остается органическим, но среди одинаковых продуктов учитывается поддержка Instant Checkout.
Данные пользователей передаются минимально, только для завершения заказа. Платежи проходят через существующие системы продавцов.
Комиссия с продавцов составляет около 2% против 15% у Amazon плюс затраты на рекламу.
Теперь ИИ не только найдет товар, но и купит его за вас.
Интересно когда GigaChat к Сбермаркету прикрутят?
Засекаем :) время пошло.
#ChatGPT #Stripe #Commerce
------
@tsingular
🔥16⚡5
По следам конферениции, как обещал делюсь презентацией.
ИИ для бизнеса
#презентация #Сколково
———
@tsingular
ИИ для бизнеса
#презентация #Сколково
———
@tsingular
✍8🔥4🙏2
Forwarded from Сиолошная
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
TLDR с сайта:
— все утечки подтвердились, будет отдельное приложение / социальная сеть с лентой рекомендаций
— можно «загрузить» свой образ для использования вами и друзьями, и использовать чужие образы. Это главная фича, за счёт которой достигается интерес и социализация
— также есть система приглашений, можно позвать 4 людей с собой
— сейчас есть приложение только для iOS (ссылка), доступно сначала в США и Канаде, но обещают быстро добавлять новые страны
— доступно БЕСПЛАТНО с щедрыми лимитами (сколько точно не уточняется, но вот у Codex Cloud, где тоже написано «щедрые лимиты», я ни разу в них не упирался вообще)
— Pro-пользователи получают доступ к веб-версии на сайте sora.com , плюс, у них есть отдельная модель Sora 2 Pro, пока не вижу сравнений по качеству
— для подростков время скролла ленты ограничено по умолчанию, чтобы дети не зависали в приложении навсегда
— в модели сделали существенный упор на реалистичность физики (см. приложенные видео)
— API запустится скоро
— отмечаем похороны Snapchat😀
— все утечки подтвердились, будет отдельное приложение / социальная сеть с лентой рекомендаций
— можно «загрузить» свой образ для использования вами и друзьями, и использовать чужие образы. Это главная фича, за счёт которой достигается интерес и социализация
— также есть система приглашений, можно позвать 4 людей с собой
— сейчас есть приложение только для iOS (ссылка), доступно сначала в США и Канаде, но обещают быстро добавлять новые страны
— доступно БЕСПЛАТНО с щедрыми лимитами (сколько точно не уточняется, но вот у Codex Cloud, где тоже написано «щедрые лимиты», я ни разу в них не упирался вообще)
— Pro-пользователи получают доступ к веб-версии на сайте sora.com , плюс, у них есть отдельная модель Sora 2 Pro, пока не вижу сравнений по качеству
— для подростков время скролла ленты ограничено по умолчанию, чтобы дети не зависали в приложении навсегда
— в модели сделали существенный упор на реалистичность физики (см. приложенные видео)
— API запустится скоро
— отмечаем похороны Snapchat
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥4❤3
В 2025м сдалась музыка, к новому году рилсы
в 2026м фильмы.
в 2027м сериалы.
в 2028м стримы.
#future
———
@tsingular
в 2026м фильмы.
в 2027м сериалы.
в 2028м стримы.
#future
———
@tsingular
👍6⚡5
Forwarded from Dendi Math&AI (Денис Димитров)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Kandinsky 5.0 Video Lite — новая open source модель генерации видео 🎬
Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky-5. Модель работает в разрешении 768×512 и при небольшом размере всего в 2B параметров демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых open source решений
Генерация видео до сих пор остаётся одной из самых сложных инженерных задач в Generative AI. Причём и как с точки зрения подготовки данных для обучения и распределённого обучения моделей, а затем масштабирования, так и с точки зрения инференса такого рода архитектур. Если картинки уже можно делать фотореалистичными даже на «бытовом» железе, то качественные видео в высоких разрешениях до сих пор можно сгенерировать только большими моделями, которые запускаются на топовых GPU
Мы решили это изменить и при разработке сделать ключевой акцент на эффективности: модель Lite компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до инженерных оптимизаций pre-train и сбора качественных данных для SFT. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости
⚡️В открытый доступ мы выкладываем следующие чекпоинты (для генерации 5 сек и 10 сек видео):
💡 SFT: максимальное качество (она же основная Kandinsky 5.0 Video Lite)
💡 CFG-distilled: x2 быстрее
💡 Diffusion-distilled: x6 быстрее при минимальной потере качества
💡 Pretrain: для исследований и дообучения
⚡️Некоторые технические детали:
💡Архитектура основана на Diffusion Transformer (DiT) с flow matching (подробнее см. Хабр)
💡Pre-train модели осуществлялся примерно на 520 млн изображений и 125 млн видео-сцен
💡Делали упор на Alignment (в частности, SFT) на качественных визуальных данных, предварительно отобранных большой командой профессиональных художников и дизайнеров. Этот этап дал самый большой прирост по визуальному качеству
💡Для 10-секундной генерации используется разработанный нами метод разреженного внимания NABLA
⚡️По внутренним замерам SFT версия (5 сек) превосходит по общему качеству (которое включает в себя оценку качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. При этом генерации 10 сек версий также демонстрируют высокое качество и стабильность
⚡️Где и как можно потестить:
💡Моделями можно воспользоваться, записавшись в вайтлист бота (к сожалению, только для ограниченного количества пользователей)
💡Все материалы есть на HuggingFace, GitHub и GitVerse, также есть ComfyUI
💡Модели распространяются по открытой лицензии с поддержкой коммерческого использования
И ещё раз все полезные ссылки в одном месте:
👉 Хабр (технические подробности)
👉 Project Page (демо)
👉 Github (код)
👉 Hugging Face (чекпоинты)
👉 GitVerse (код)
👉 NABLA (paper)
👉 Бот для записи в вайтлист
Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky-5. Модель работает в разрешении 768×512 и при небольшом размере всего в 2B параметров демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых open source решений
Генерация видео до сих пор остаётся одной из самых сложных инженерных задач в Generative AI. Причём и как с точки зрения подготовки данных для обучения и распределённого обучения моделей, а затем масштабирования, так и с точки зрения инференса такого рода архитектур. Если картинки уже можно делать фотореалистичными даже на «бытовом» железе, то качественные видео в высоких разрешениях до сих пор можно сгенерировать только большими моделями, которые запускаются на топовых GPU
Мы решили это изменить и при разработке сделать ключевой акцент на эффективности: модель Lite компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до инженерных оптимизаций pre-train и сбора качественных данных для SFT. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости
⚡️В открытый доступ мы выкладываем следующие чекпоинты (для генерации 5 сек и 10 сек видео):
💡 SFT: максимальное качество (она же основная Kandinsky 5.0 Video Lite)
💡 CFG-distilled: x2 быстрее
💡 Diffusion-distilled: x6 быстрее при минимальной потере качества
💡 Pretrain: для исследований и дообучения
⚡️Некоторые технические детали:
💡Архитектура основана на Diffusion Transformer (DiT) с flow matching (подробнее см. Хабр)
💡Pre-train модели осуществлялся примерно на 520 млн изображений и 125 млн видео-сцен
💡Делали упор на Alignment (в частности, SFT) на качественных визуальных данных, предварительно отобранных большой командой профессиональных художников и дизайнеров. Этот этап дал самый большой прирост по визуальному качеству
💡Для 10-секундной генерации используется разработанный нами метод разреженного внимания NABLA
⚡️По внутренним замерам SFT версия (5 сек) превосходит по общему качеству (которое включает в себя оценку качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. При этом генерации 10 сек версий также демонстрируют высокое качество и стабильность
⚡️Где и как можно потестить:
💡Моделями можно воспользоваться, записавшись в вайтлист бота (к сожалению, только для ограниченного количества пользователей)
💡Все материалы есть на HuggingFace, GitHub и GitVerse, также есть ComfyUI
💡Модели распространяются по открытой лицензии с поддержкой коммерческого использования
И ещё раз все полезные ссылки в одном месте:
👉 Хабр (технические подробности)
👉 Project Page (демо)
👉 Github (код)
👉 Hugging Face (чекпоинты)
👉 GitVerse (код)
👉 NABLA (paper)
👉 Бот для записи в вайтлист
🔥15❤4⚡2🆒1