Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Ну и Stable Video Diffusion (SVD) тоже прекрасно устанавливается локально в Pinokio. Открываете Pinokio, заходите в Discover, и оно там.

Вот, наваял

#image2video #neuronaut_art
🔥3
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

В помощь тиктокерам любителям кринж-танцев. Ну и нам на что-нибудь сгодится. Фреймворк для анимации персонажа. На вход нужно одно изображение персонажа и анимированная поза. Обратите внимание на одежду и вообще на все. Круто же, да?

Код будет тут

#image2video #humananimation #characteranimation #pose2video
🔥132
SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Генератор видео из картинки + текста, заточенный на создание переходов от одной картинки к другой и длинные видео

На демонстрационном видео переходы в красных рамках, длинные видео - в синих

Код
Демо

#image2video
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Вы могли заметить что последнее время я ставлю на видео вотермарки. Привет большим каналам. А еще на андроидах такие видео не открывались. Проблема частично решена благодаря помощи @graphnull.

А дело в том что бот, добавляющий вотермарки я написал целиком под диктовку Deepseek coder. Я знаю что есть готовые боты, но мы не ищем легких путей, мы ищем интересных. Некоторых нюансов работы с видео Deepseek coder не знает и порой при исправлении ошибок ходит по кругу. Приходилось немного погуглить и даже перепоручить одну ошибку ChatGPT.

Сейчас инструмент еще сырой, вотермарк в будущем станет аккуратнее. Если будут траблы с просмотром видео, пишите в чат.
🔥111
This media is not supported in your browser
VIEW IN TELEGRAM
Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models

Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.

Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант

#text2image #text2illusion #text2puzzle
6
This media is not supported in your browser
VIEW IN TELEGRAM
Seamless Communication

Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:

SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо

SeamlessExpressive - модель с акцентом на выразительность речи.
Демо

SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо

Гитхаб

#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
👍2
Rask.ai

выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.

Зацените El Risitas

Попробовать

#lipsync #dubbing #speech2speech #translation
😁11👍4
AntiFake

Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.

Код

#voicecloning #tools #security
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models

Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.

- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке

Код обещают выложить

#video2video #text2video
👍61
LEDITS++: Limitless Image Editing using Text-to-Image Models

Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS

- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры

Код
Демо

#image2image #text2image #inpainting #imageediting
👍3
Что-то на сингулярном. GPT4 дает более развернутые ответы если если ему пообещать чаевые

твиттер

#яниначтоненамекаю
😁16🤔41