Forwarded from Machinelearning
🏌️ GlOttal-flow LPC Filter (GOLF)
A DDSP-based neural vocoder.
Новый метод синтеза поющего голоса (SVS), использующий физические характеристики человеческого голоса с помощью дифференцируемой цифровой обработки сигнала
🖥 Github: https://github.com/yoyololicon/golf
📕 Paper: https://arxiv.org/abs/2306.17252v1
🔗 Demo: https://yoyololicon.github.io/golf-demo/
ai_machinelearning_big_data
A DDSP-based neural vocoder.
Новый метод синтеза поющего голоса (SVS), использующий физические характеристики человеческого голоса с помощью дифференцируемой цифровой обработки сигнала
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Webapp Factory
Генератор веб-приложений на NodeJS по текстовому запросу.
Под капотом языковая модель WizardCoder-15B.
Тупит, конечно. Простым запросом практически ничего невозможно добиться. Более подробным описанием удается добиться частично работающей аппки. Полагаю, очень подробным описанием можно получить рабочую аппку. Правда из демо ее никуда не сохранить.
Блог с описанием и кодом
Демо
#text2app #coding #text2code
Генератор веб-приложений на NodeJS по текстовому запросу.
Под капотом языковая модель WizardCoder-15B.
Тупит, конечно. Простым запросом практически ничего невозможно добиться. Более подробным описанием удается добиться частично работающей аппки. Полагаю, очень подробным описанием можно получить рабочую аппку. Правда из демо ее никуда не сохранить.
Блог с описанием и кодом
Демо
#text2app #coding #text2code
👍1
Forwarded from тоже моушн
This media is not supported in your browser
VIEW IN TELEGRAM
Михаил, автор канала NeuroAE пилит отличный плагин, который позволяет лихо управлять генерацией в Stable Diffusion прямо из афтера - даже при отсутствии мощного железа! маст хэв для уверенных пользователей афтера
а уроки и гайды о том как пользоватья своим детищем Михаил постит в ютубе
скачать плагин - в канале NeuroAE
гайды и уроки на ютуб
на днях еще кое что про связку AE и стейбла будет, не отключайтесь
@тоже_моушн
а уроки и гайды о том как пользоватья своим детищем Михаил постит в ютубе
скачать плагин - в канале NeuroAE
гайды и уроки на ютуб
❤1
Control-A-Video
Другое название Video-ControlNet. На вход подаем видео, но авторы пишут что это #text2video модель, генерирующая видео по тексту. А видео управляет генерацией, из него извекаются карта глубины, Canny и HED, уже знакомые нам по ControlNet.
Качество так себе, хуже чем ZeroScope. Но если вы готовы поковыряться в коде, авторы пишут что чекпойнт можно заменить на любой другой на основе SD v1.5
На втором видео мой эксперимент - Дарт Вейдер танцует с маракасами
Код
Демо выдает максимум 16 кадров, 8fps
#video2video
Другое название Video-ControlNet. На вход подаем видео, но авторы пишут что это #text2video модель, генерирующая видео по тексту. А видео управляет генерацией, из него извекаются карта глубины, Canny и HED, уже знакомые нам по ControlNet.
Качество так себе, хуже чем ZeroScope. Но если вы готовы поковыряться в коде, авторы пишут что чекпойнт можно заменить на любой другой на основе SD v1.5
На втором видео мой эксперимент - Дарт Вейдер танцует с маракасами
Код
Демо выдает максимум 16 кадров, 8fps
#video2video
This media is not supported in your browser
VIEW IN TELEGRAM
В Нью-Йорке аппарат с ИИ делает предсказания. Вводите дату рождения, выбираете вопрос и делаете снимок — устройство распечатает предсказание
❤2
Ну и в редактировании картинок тоже все еще продолжают что-то изобретать.
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Авторы называют этот метод легковесным рилтаймовым. Правда, в их демке никакого рилтайма нет. Но все же работает довольно быстро. Демка позволяет удалить/добавить объекты, стили, лица или что-то кастомное (сам не знаю что). А я как раз давно никуда не добавлял Бендера
Код
Демо
#image2image #text2image
LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Авторы называют этот метод легковесным рилтаймовым. Правда, в их демке никакого рилтайма нет. Но все же работает довольно быстро. Демка позволяет удалить/добавить объекты, стили, лица или что-то кастомное (сам не знаю что). А я как раз давно никуда не добавлял Бендера
Код
Демо
#image2image #text2image
👍1
Vectorizer.ai
Делает из растровой картинки векторную. Да, трассировщики-векторизаторы у нас уже есть лет 20-30, так что это не то чтобы фича которую мы ждали. Но сюда завезли ИИ, и здесь есть подгонка целых геометрических фигур, очистка углов, сопоставление касательных, обтекание кривых и многое другое. А еще есть API, и у разработчиков все еще много планов на дальнейшее развитие. И количество настроек при скачивании радует.
Вектризовать фотки неинтресно, а вот посмотрите что он делает со старыми мультиками. Ну а Мунк как будто изначально был векторным 😱
Ах да, чуть не забыл. Если вы генерите логотипы в SD или MJ, то эта штука для вас
#image2vector
Делает из растровой картинки векторную. Да, трассировщики-векторизаторы у нас уже есть лет 20-30, так что это не то чтобы фича которую мы ждали. Но сюда завезли ИИ, и здесь есть подгонка целых геометрических фигур, очистка углов, сопоставление касательных, обтекание кривых и многое другое. А еще есть API, и у разработчиков все еще много планов на дальнейшее развитие. И количество настроек при скачивании радует.
Вектризовать фотки неинтресно, а вот посмотрите что он делает со старыми мультиками. Ну а Мунк как будто изначально был векторным 😱
Ах да, чуть не забыл. Если вы генерите логотипы в SD или MJ, то эта штука для вас
#image2vector
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Segment Anything Meets Point Tracking
Сегментация видео с управляющими точками на базе SAM
Авторы скрестили SAM с классической идеей трекинга точек.
Код
#segmentation #image2mask #video2mask
Сегментация видео с управляющими точками на базе SAM
Авторы скрестили SAM с классической идеей трекинга точек.
Код
#segmentation #image2mask #video2mask
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
MAGVIT:Masked Generative Video Transformer
генератор/редактор видео от Google. Первую публикацию я видел еще в декабре 2022, а сейчас они разродились кодом. С тех пор мы видели уже много интересного на эту тему. Может потому кодом и поделились что устарело. Тем не менее, MAGVIT умеет то чего не умеют ни Gen-2, ни Zeroscope. Список фич:
- предсказание кадров
- интерполяция кадров
- видео инпейнтинг
- видео аутпейнтинг
За счет этого может выполнять разные интересные задачи, см на сайте
Код
Колаб
#text2video #video2video
генератор/редактор видео от Google. Первую публикацию я видел еще в декабре 2022, а сейчас они разродились кодом. С тех пор мы видели уже много интересного на эту тему. Может потому кодом и поделились что устарело. Тем не менее, MAGVIT умеет то чего не умеют ни Gen-2, ни Zeroscope. Список фич:
- предсказание кадров
- интерполяция кадров
- видео инпейнтинг
- видео аутпейнтинг
За счет этого может выполнять разные интересные задачи, см на сайте
Код
Колаб
#text2video #video2video
❤3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Меня как раз недавно спрашивали, можно ли через depth мапу получить сносную геометрию, чтобы использовать в играх.
Вот тут показан процесс на 6 минут пайплайна через карту глубины. Заспойлерю, можно китбашить, прототипировать что-то быстрое, но это в продакшн не годится пока.
Лицо из метахьюманов.
Смотреть пайплайн
Вот тут показан процесс на 6 минут пайплайна через карту глубины. Заспойлерю, можно китбашить, прототипировать что-то быстрое, но это в продакшн не годится пока.
Лицо из метахьюманов.
Смотреть пайплайн
👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
DragonDiffusion: Enabling Drag-style Manipulation on Diffusion Models
Диффузионный конкурент DragGAN. Надеюсь, этот сможет редактировать без превращения картинки в кашу. Но пока нет ни сайта, ни кода. Есть пейпер и страничка на гитхабе.
Гитхаб
Пейпер
[UPDATE]
Код здесь
#image2image
Диффузионный конкурент DragGAN. Надеюсь, этот сможет редактировать без превращения картинки в кашу. Но пока нет ни сайта, ни кода. Есть пейпер и страничка на гитхабе.
Гитхаб
Пейпер
[UPDATE]
Код здесь
#image2image
SDXL09.torrent
918.8 KB
В сеть утекли веса #SDXL 0.9. Энтузистам уже удалось запустить их в ComfyUI с pytorch 2 и без xformers. У меня к посту нечаянно прикрепился торрент файл. Не знаю откуда он взялся и как его удалить. Помните, если там будет .ckpt файл, не запускайте его. Безопасно использовать только . safetensors
Кстати, веса можно вполне официально получить отправив заявку в Stability AI.
Впрочем, можно запустить по официальной инструкции со странички на гитхабе
Код
Кстати, веса можно вполне официально получить отправив заявку в Stability AI.
Впрочем, можно запустить по официальной инструкции со странички на гитхабе
Код
❤7😁2
Forwarded from ЭйАйЛера
Media is too big
VIEW IN TELEGRAM
Фотокамеры, работающие на ИИ-стимуляторах начали появляться тут и там
И вот еще одна версия «снимающая на Midjourney». У нее сразу есть пресеты! Камера фиксирует картинку, посылает команду discribe, а дальше генерирует как мы привыкли.
В отличие от прошлых известных экземпляров у этой есть большой дисплей и переключатель режима с заранее введёнными частями промта. Так можно сразу«снимать» генерировать картинку в нужном стиле.
Пока игрушка выглядит просто очаровательной, но думаю, скоро подобные приложения займут почетное место в наших телефонах, а пайплайн — в серьёзных кейсах. Потому то хорошее следование референсу и стиль часто все, что необходимо для работы. Пайплайн можно посмотреть по ссылке на Medium и попробовать сделать такую самому!
И вот еще одна версия «снимающая на Midjourney». У нее сразу есть пресеты! Камера фиксирует картинку, посылает команду discribe, а дальше генерирует как мы привыкли.
В отличие от прошлых известных экземпляров у этой есть большой дисплей и переключатель режима с заранее введёнными частями промта. Так можно сразу
Пока игрушка выглядит просто очаровательной, но думаю, скоро подобные приложения займут почетное место в наших телефонах, а пайплайн — в серьёзных кейсах. Потому то хорошее следование референсу и стиль часто все, что необходимо для работы. Пайплайн можно посмотреть по ссылке на Medium и попробовать сделать такую самому!
👏4
Нейронавт | Нейросети в творчестве
SDXL09.torrent
А вот и колаб #SDXL уже запилили. Для использования понадобится гугл-аккаунт и API токен Huggingface. Ничего сложного
Видеоинструкция
Колаб
[UPDATE] колаб сейчас не работает. Видимо, поп причине удаления весов с huggingface
Видеоинструкция
Колаб
[UPDATE] колаб сейчас не работает. Видимо, поп причине удаления весов с huggingface
YouTube
How To Use Stable Diffusion X-Large (SDXL) On Google Colab For Free
#SDXL is currently in beta and in this video I will show you how to use it on Google Colab for free. Hopefully how to use on PC and RunPod tutorials are coming as well.
Source GitHub Readme File ⤵️
https://github.com/FurkanGozukara/Stable-Diffusion/blo…
Source GitHub Readme File ⤵️
https://github.com/FurkanGozukara/Stable-Diffusion/blo…
👍2🔥2
Нас тут уже больше тысячи, и меня иногда просят порекламировать какой-нибудь канал. До сих пор я не соглашался. Но задумался, видите ли вы в подвале канала нативную рекламу Телеграм. Я-то ее, понятно, у себя не вижу и не знаю, показывает ли вам Телегерам на моем канале что-то постороннее. Прошу проголосовать