Авторы AudioLDM 2 выложили чекпойнт для генерации звука 48 КГц. До сих пор был доступен только 16КГц
Гитхаб
#text2music #text2audio #text2speech #TTS
Гитхаб
#text2music #text2audio #text2speech #TTS
Telegram
Нейронавт | Нейросети в творчестве
AudioLDM 2: A General Framework for Audio, Music, and Speech Generation
Следующее поколение генератора звуков AudioLDM
Умеет по тексту или изображению генерировать музыку, речь и прочее.
Код обещают выложить
Демо будет
Твиттер
#text2music #text2audio…
Следующее поколение генератора звуков AudioLDM
Умеет по тексту или изображению генерировать музыку, речь и прочее.
Код обещают выложить
Демо будет
Твиттер
#text2music #text2audio…
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
WavJourney: Compositional Audio Creation withLarge Language Models
Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.
Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.
На видео генерация по запросу
Демо
#text2audio
Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.
Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.
На видео генерация по запросу
Марсианские новости о запуске зонда к Альфа Центавра
КодДемо
#text2audio
👍6
NRHints: Relighting Neural Radiance Fields with Shadow and Highlight Hints
Релайтинг (изменение освещения) #nerf'ов
Выступление на SIGGRAPH23
Код
#relighting
Релайтинг (изменение освещения) #nerf'ов
Выступление на SIGGRAPH23
Код
#relighting
👍3
Forwarded from Код Дурова
This media is not supported in your browser
VIEW IN TELEGRAM
⛵️ Живой шедевр //
Яндекс запустил возможность генерировать короткие видео с помощью ИИ в Шедевруме. За генерацию отвечает фирменная нейросеть на основе каскадной диффузии.
Для генерации достаточно ввести текстовый запрос, затем выбрать первый кадр видео из предложенных вариантов. Нейросеть возьмёт за основу изображение и делает из него 4-х секундное видео по заданному шаблону. Сейчас их 7 — зум, таймлапс, полёт, панорама, вращение, подъём и морфинг.
@d_code
Яндекс запустил возможность генерировать короткие видео с помощью ИИ в Шедевруме. За генерацию отвечает фирменная нейросеть на основе каскадной диффузии.
Для генерации достаточно ввести текстовый запрос, затем выбрать первый кадр видео из предложенных вариантов. Нейросеть возьмёт за основу изображение и делает из него 4-х секундное видео по заданному шаблону. Сейчас их 7 — зум, таймлапс, полёт, панорама, вращение, подъём и морфинг.
@d_code
👍6🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Vispunk
Новый ИИ-редактор изображений.
Под капотом, видимо, Stable Diffusion.
Есть онлайн версия, только мне не удалось получить от нее результата. Генерит не то что пишешь а то что и было чуть в другой вариации
Онлайн-редактор
Код обещают выложить
Сабреддит проекта, там пачка туториалов
#text2image #image2image #tools
Новый ИИ-редактор изображений.
Под капотом, видимо, Stable Diffusion.
Есть онлайн версия, только мне не удалось получить от нее результата. Генерит не то что пишешь а то что и было чуть в другой вариации
Онлайн-редактор
Код обещают выложить
Сабреддит проекта, там пачка туториалов
#text2image #image2image #tools
This media is not supported in your browser
VIEW IN TELEGRAM
VALL-E X: Multilingual Text-to-Speech Synthesis and Voice Cloning
Мультиязычный генератор речи по тексту и клонировщик голоса. Английский, Японский, Китайский. Для клонирования голоса достаточно 3-7 секунд образца. Контроль акцента, эмоций, акустики.
Примеры
Код
Демо
Колаб
#text2speech #tts #voicecloning
Мультиязычный генератор речи по тексту и клонировщик голоса. Английский, Японский, Китайский. Для клонирования голоса достаточно 3-7 секунд образца. Контроль акцента, эмоций, акустики.
Примеры
Код
Демо
Колаб
#text2speech #tts #voicecloning
This media is not supported in your browser
VIEW IN TELEGRAM
MagicEdit:High-Fidelity Temporally Coherent Video Editing
Редактирование видео: стилизация, локальное редактирование, смешивание разных видео, аутпейнтинг
Код будет позже
#video2video
Редактирование видео: стилизация, локальное редактирование, смешивание разных видео, аутпейнтинг
Код будет позже
#video2video
🔥6
AI Text-To-Image Prompt Generating Software
Генератор промптов для генераторов картинок.
Gradio, javanoscript.
Туповат, вырвиглазный дизайн. Но довольно удобный и быстрый
#tools #text2text
Генератор промптов для генераторов картинок.
Gradio, javanoscript.
Туповат, вырвиглазный дизайн. Но довольно удобный и быстрый
#tools #text2text
👍1
Dysen-VDM:Empowering Dynamics-aware Text-to-VideoDiffusion with Large Language Models
Новый генератор видео по тексту. Авторы утверждают, что превосходит аналоги, особенно на сценах со сложным действием
Код (пока нету)
Демо (пока нету)
#text2video
Новый генератор видео по тексту. Авторы утверждают, что превосходит аналоги, особенно на сценах со сложным действием
Код (пока нету)
Демо (пока нету)
#text2video
❤1
Forwarded from тоже моушн
друзья разрабатывают сервис OHMYSYNT и хотят получить фидбек. 3 дня триала: обучение внешности 5 персонажей + современные плюшки типа инпейнтинга в AI-редакторе с удобным интерфейсом. ну что, поможем парням нагрузить сервера?
Telegram
Synthetic Friday
Персонализированный AI-контент для брендов
Все уже пробовали генерить красивые концепты в Midjorney или Stable Diffusion, но брендам нужны конкретные люди, продукты или стили. Здесь на помощь приходит OHMYSYNT, где можно обучать своих кастомных AI-SYNTs…
Все уже пробовали генерить красивые концепты в Midjorney или Stable Diffusion, но брендам нужны конкретные люди, продукты или стили. Здесь на помощь приходит OHMYSYNT, где можно обучать своих кастомных AI-SYNTs…
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
Runway добавили в GEN-2 слайдер для контроля количества движения в кадре. Можно задать величину от 0 до 10.
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Отличная новость.
CoTracker теперь можно погонять на huggingface
Только посмотртите, он пытается отследить даже руку, уходящую за кадр
Демо
#tracking #opticalflow
CoTracker теперь можно погонять на huggingface
Только посмотртите, он пытается отследить даже руку, уходящую за кадр
Демо
#tracking #opticalflow
🔥8
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
ИИ-комиксы подвезли на новом уровне.
Работает, почему-то, быстро и бесплатно, без инфоцыганщины.
Шрифт пока не дает выбрать, но все равно пишет тарабарщину, которую, впрочем, вы все равно потом замените на вариант от chatGPT.
Консистентность персонажа на уровне!
Го срочно комиксовать, пока остальные подписчики не положили сервера.
https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory
Я нагенерил пару панелей с промптом
little girl fighting with monsters (японский, американский и 3Д-рендер(похож на пиксар))
А вот тут варианты от сообщества.
https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory/discussions
И там огненно.
Работает, почему-то, быстро и бесплатно, без инфоцыганщины.
Шрифт пока не дает выбрать, но все равно пишет тарабарщину, которую, впрочем, вы все равно потом замените на вариант от chatGPT.
Консистентность персонажа на уровне!
Го срочно комиксовать, пока остальные подписчики не положили сервера.
https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory
Я нагенерил пару панелей с промптом
little girl fighting with monsters (японский, американский и 3Д-рендер(похож на пиксар))
А вот тут варианты от сообщества.
https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory/discussions
И там огненно.
🔥5👍1