Ну и Stable Video Diffusion (SVD) тоже прекрасно устанавливается локально в Pinokio. Открываете Pinokio, заходите в Discover, и оно там.
Вот, наваял
#image2video #neuronaut_art
Вот, наваял
#image2video #neuronaut_art
🔥3
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
В помощь тиктокерам любителям кринж-танцев. Ну и нам на что-нибудь сгодится. Фреймворк для анимации персонажа. На вход нужно одно изображение персонажа и анимированная поза. Обратите внимание на одежду и вообще на все. Круто же, да?
Код будет тут
#image2video #humananimation #characteranimation #pose2video
В помощь тиктокерам любителям кринж-танцев. Ну и нам на что-нибудь сгодится. Фреймворк для анимации персонажа. На вход нужно одно изображение персонажа и анимированная поза. Обратите внимание на одежду и вообще на все. Круто же, да?
Код будет тут
#image2video #humananimation #characteranimation #pose2video
🔥13❤2
SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction
Генератор видео из картинки + текста, заточенный на создание переходов от одной картинки к другой и длинные видео
На демонстрационном видео переходы в красных рамках, длинные видео - в синих
Код
Демо
#image2video
Генератор видео из картинки + текста, заточенный на создание переходов от одной картинки к другой и длинные видео
На демонстрационном видео переходы в красных рамках, длинные видео - в синих
Код
Демо
#image2video
👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Вы могли заметить что последнее время я ставлю на видео вотермарки. Привет большим каналам. А еще на андроидах такие видео не открывались. Проблема частично решена благодаря помощи @graphnull.
А дело в том что бот, добавляющий вотермарки я написал целиком под диктовку Deepseek coder. Я знаю что есть готовые боты, но мы не ищем легких путей, мы ищем интересных. Некоторых нюансов работы с видео Deepseek coder не знает и порой при исправлении ошибок ходит по кругу. Приходилось немного погуглить и даже перепоручить одну ошибку ChatGPT.
Сейчас инструмент еще сырой, вотермарк в будущем станет аккуратнее. Если будут траблы с просмотром видео, пишите в чат.
А дело в том что бот, добавляющий вотермарки я написал целиком под диктовку Deepseek coder. Я знаю что есть готовые боты, но мы не ищем легких путей, мы ищем интересных. Некоторых нюансов работы с видео Deepseek coder не знает и порой при исправлении ошибок ходит по кругу. Приходилось немного погуглить и даже перепоручить одну ошибку ChatGPT.
Сейчас инструмент еще сырой, вотермарк в будущем станет аккуратнее. Если будут траблы с просмотром видео, пишите в чат.
🔥11❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models
Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.
Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант
#text2image #text2illusion #text2puzzle
Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.
Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант
#text2image #text2illusion #text2puzzle
❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Seamless Communication
Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:
SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо
SeamlessExpressive - модель с акцентом на выразительность речи.
Демо
SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо
Гитхаб
#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:
SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо
SeamlessExpressive - модель с акцентом на выразительность речи.
Демо
SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо
Гитхаб
#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
👍2
Rask.ai
выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.
Зацените El Risitas
Попробовать
#lipsync #dubbing #speech2speech #translation
выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.
Зацените El Risitas
Попробовать
#lipsync #dubbing #speech2speech #translation
😁11👍4
AntiFake
Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.
Код
#voicecloning #tools #security
Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.
Код
#voicecloning #tools #security
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models
Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.
- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке
Код обещают выложить
#video2video #text2video
Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.
- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке
Код обещают выложить
#video2video #text2video
👍6❤1
LEDITS++: Limitless Image Editing using Text-to-Image Models
Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS
- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры
Код
Демо
#image2image #text2image #inpainting #imageediting
Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS
- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры
Код
Демо
#image2image #text2image #inpainting #imageediting
👍3
Что-то на сингулярном. GPT4 дает более развернутые ответы если если ему пообещать чаевые
твиттер
#яниначтоненамекаю
твиттер
#яниначтоненамекаю
😁16🤔4❤1
VideoBooth: Diffusion-based Video Generation with Image Prompts
Генератор видео по тексту с объектом из референсной картинки
Код обещают в конце декабря
#text2video #image2video
Генератор видео по тексту с объектом из референсной картинки
Код обещают в конце декабря
#text2video #image2video
🔥1