Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
Tracking Everything Everywhere All at Once
Сейчас прямо идёт волна улучшений взрении вижене. Давеча мой коллега Алекс Кириллов прокачал сегментацию до нереальных результатов. Теперь парни из Гугла и Беркли завезли чертовски качественный попиксельный трекинг объектов на видео.
Для человека задача трекинга и нахождения соответствия между пикселями движущегося объекта кажется довольно простой. Но вот до сих пор как-то не было стабильных алгоритмов, которые бы могли плотно трекать объекты длительное время.
Конечно, проблему трекинга ещё не до конца решили. Этот метод довольно медленно работает (далеко не реал-тайм), и все ещё страдает от очень быстрых и неригидных трансформаций объектов. Но несмотря на это, мы имеем серьезный скачок в качестве.
Кода, к сожалению, пока нет. Но надеюсь, скоро появится.
Читать на Arxiv. Либо смотреть картинки на сайте проекта.
@ai_newz
Сейчас прямо идёт волна улучшений в
Для человека задача трекинга и нахождения соответствия между пикселями движущегося объекта кажется довольно простой. Но вот до сих пор как-то не было стабильных алгоритмов, которые бы могли плотно трекать объекты длительное время.
Конечно, проблему трекинга ещё не до конца решили. Этот метод довольно медленно работает (далеко не реал-тайм), и все ещё страдает от очень быстрых и неригидных трансформаций объектов. Но несмотря на это, мы имеем серьезный скачок в качестве.
Кода, к сожалению, пока нет. Но надеюсь, скоро появится.
Читать на Arxiv. Либо смотреть картинки на сайте проекта.
@ai_newz
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Линза Snapchat
сами придумайте зачем вам это
сами придумайте зачем вам это
😁10
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется качественный алгоритм text-to-music наконец-то появился, спасибо Meta, я еще не игрался но демкой впечатлен:
Колаб | Еще примеры | Исходный код
Модель тоже доступна, правда с лицензией не для коммерческих проектов
Колаб | Еще примеры | Исходный код
Модель тоже доступна, правда с лицензией не для коммерческих проектов
👍3
Forwarded from Технологии | Нейросети | Боты
Voicemod — генерировать песню из текста
Инструмент на основе ИИ, позволяющий преобразовать любой текст в песню. Причем нейросеть сама определяет, какая мелодия наиболее удачна для промта, а пользователь может сам выбрать подходящего «исполнителя».
Заложено множество вариантов стилей — рок, классика, джаз, поп и так далее. Судя по отзывам, часто получается вполне приемлемый результат. Точно зайдет тем, кто никогда не занимался написанием музыки, но хочет попробовать.
😃 MidJourney Telegram Bot
Инструмент на основе ИИ, позволяющий преобразовать любой текст в песню. Причем нейросеть сама определяет, какая мелодия наиболее удачна для промта, а пользователь может сам выбрать подходящего «исполнителя».
Заложено множество вариантов стилей — рок, классика, джаз, поп и так далее. Судя по отзывам, часто получается вполне приемлемый результат. Точно зайдет тем, кто никогда не занимался написанием музыки, но хочет попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ютубер показывает что Chatgpt не может заменить программистов потому что не выдаёт корректные регулярные выражения.
В ответ Chatgpt его зарикроллил
В ответ Chatgpt его зарикроллил
😁14
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Вот держите плагин для After Effects, которые генерит картинки ВНУТРИ After Effects на ВАШЕМ GPU.
Судя по демо, там ванильный Stable Diffusion.
Никаких подробностей о настройках, кастомных моделях и даже сроках выхода плагина в свет нет.
Есть только видео.
И это НЕ Адобченко.
https://aenoscripts.com/helium/
Судя по демо, там ванильный Stable Diffusion.
Никаких подробностей о настройках, кастомных моделях и даже сроках выхода плагина в свет нет.
Есть только видео.
И это НЕ Адобченко.
https://aenoscripts.com/helium/
❤3
Forwarded from Технологии | Нейросети | Боты
This media is not supported in your browser
VIEW IN TELEGRAM
Парень создает AR-головоломку с жидкостью
Недавно он добавил в игру порталы, посмотрите, как круто это выглядит.
😃 MidJourney Telegram Bot
Недавно он добавил в игру порталы, посмотрите, как круто это выглядит.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19
Forwarded from ▲Ⱡ▲ Andrey Lev-Ari
Я заметил, что напилили уже несколько плагинов Стейбла для Афтера 😎
Видимо, этот самый толковый
(но у меня пока не получается дотянуть его до результатов дефорума):
https://aenoscripts.com/diffusae/
Есть еще:
https://aenoscripts.com/local-diffusion/
А этот, видимо, на основе СтайлГАН:
https://aenoscripts.com/i-ate-mushrooms/
Видимо, этот самый толковый
(но у меня пока не получается дотянуть его до результатов дефорума):
https://aenoscripts.com/diffusae/
Есть еще:
https://aenoscripts.com/local-diffusion/
А этот, видимо, на основе СтайлГАН:
https://aenoscripts.com/i-ate-mushrooms/
Aenoscripts
Diffusae 2
Explore and interact directly with generative AI in your favorite application! New: Temporal consistency model for stability between frames. Available for Windows and Mac.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Video-LLaMA
Мультимодальная система, понимает и может описать содержимое видео, в том числе и аудио. Криво написал, да? Но надеюсь, все поняли)
Код
Демо
Модель
#audio2text #video2text #LLM
Мультимодальная система, понимает и может описать содержимое видео, в том числе и аудио. Криво написал, да? Но надеюсь, все поняли)
Код
Демо
Модель
#audio2text #video2text #LLM
🔥8
Нейронавт | Нейросети в творчестве
Video-LLaMA Мультимодальная система, понимает и может описать содержимое видео, в том числе и аудио. Криво написал, да? Но надеюсь, все поняли) Код Демо Модель #audio2text #video2text #LLM
Много галлюцинирует и сочиняет. Я ему скормил кусочек рикролла, там были и кадры с девушкой. А он ее прогнорил, только парня заметил.