Please open Telegram to view this post
VIEW IN TELEGRAM
👍6👎2
HelloMeme: Integrating Spatial Knitting Attentions to Embed High-Level and Fidelity-Rich Conditions in Diffusion Models
Это не генератор мемов, как можно заключить по названию, а очередной опенсорсный инструмент для переноса портретной анимации.
Работает ли оно только на SD1.5 (с лорами, кстати) или с более новыми генераторами картинок тоже - непонятно
Обратите внимание на заявленное превосходство над Liveportrait
Код
#pose2video #facialanimation #portrait2video #personalization
Это не генератор мемов, как можно заключить по названию, а очередной опенсорсный инструмент для переноса портретной анимации.
Работает ли оно только на SD1.5 (с лорами, кстати) или с более новыми генераторами картинок тоже - непонятно
Обратите внимание на заявленное превосходство над Liveportrait
Код
#pose2video #facialanimation #portrait2video #personalization
👍5🤔1
У меня есть скромное мнение что люди которые работают по выходным и выдают контент так же как и по будням - психи.
А может, я просто завидую.
Вот, успел набрюзжать до того как санитары на прогулку забрали
#оффтоп
А может, я просто завидую.
Вот, успел набрюзжать до того как санитары на прогулку забрали
#оффтоп
💯15😁11🥴1
OneTrainer
В утилите для дообучения генераторов картинок важное обновление для владельцев слабого железа
- Обучение Flux LoRa на 6 ГБ VRAM (с разрешением 512 пикселей)
- Дообучение Flux на 16 ГБ VRAM (или даже меньше) + 64 ГБ оперативной памяти
- Дообучение SD3.5-M на 4 ГБ VRAM (с разрешением 1024 пикселя)
Lля параметра "Gradient checkpointing" устанавливаем значение CPU_OFFLOADED, затем для параметра "Layer offload fraction" - значение от 0 до 1. При более высоких значениях будет использоваться больше системной оперативной памяти вместо видеопамяти.
Использование VRAM неоптимально при обучении Flux или SD3.5-M и Layer offload fraction близком к 0,5
#finetuning #SD35 #flux #tools
В утилите для дообучения генераторов картинок важное обновление для владельцев слабого железа
- Обучение Flux LoRa на 6 ГБ VRAM (с разрешением 512 пикселей)
- Дообучение Flux на 16 ГБ VRAM (или даже меньше) + 64 ГБ оперативной памяти
- Дообучение SD3.5-M на 4 ГБ VRAM (с разрешением 1024 пикселя)
Lля параметра "Gradient checkpointing" устанавливаем значение CPU_OFFLOADED, затем для параметра "Layer offload fraction" - значение от 0 до 1. При более высоких значениях будет использоваться больше системной оперативной памяти вместо видеопамяти.
Использование VRAM неоптимально при обучении Flux или SD3.5-M и Layer offload fraction близком к 0,5
#finetuning #SD35 #flux #tools
GitHub
GitHub - Nerogar/OneTrainer: OneTrainer is a one-stop solution for all your stable diffusion training needs.
OneTrainer is a one-stop solution for all your stable diffusion training needs. - Nerogar/OneTrainer
👍16❤1
MotionCLR: Motion Generation and Training-free Editing via Understanding Attention Mechanisms
Итеративная ИИ-анимация персонажей по тексту на основе механизма внимания.
Примеры:
Код
Демо
Блог
#humananimation #characteranimation
Итеративная ИИ-анимация персонажей по тексту на основе механизма внимания.
Примеры:
Подчёркивание или ослабление движения. Если вы сначала создаёте движение с подсказкой «человек прыгает» и считаете, что высота прыжка выше, чем вам нужно, вы можете уменьшить вес «прыжка», чтобы удовлетворить свой запрос.
Генерация движения на примере. В цикле интерактивной генерации движения вы можете сгенерировать движение «удар ногой». Вы также можете сгенерировать множество движений, похожих на это (с той же текстурой движения). Например, исходное движение может быть ударом левой ногой, а новое движение может включать удар правой ногой.
Замена движения на месте. Предположим, вы хотите создать несколько движений, содержащих разные действия, выполняемые в одном и том же часовом поясе. Сначала вы можете синтезировать одно движение и редактировать текст, изменяя слова напрямую.
Код
Демо
Блог
#humananimation #characteranimation
👍5
InstantIR: Blind Image Restoration with Instant Generative Reference
Семейство моделей для реставрации изображений "с высочайшим качеством и реалистичностью деталей". А для пущего эффекта можно еще и использовать текстовые промпты, вплоть до редактирования содержимого
Код
Веса
Демо ждем
#imagerestoration #BIR #imageediting #image2image #upscale
Семейство моделей для реставрации изображений "с высочайшим качеством и реалистичностью деталей". А для пущего эффекта можно еще и использовать текстовые промпты, вплоть до редактирования содержимого
Код
Веса
Демо ждем
#imagerestoration #BIR #imageediting #image2image #upscale
👍8🔥3🤔1
Нейронавт | Нейросети в творчестве
JEN-1 Новая мощная музыкальная модель. Возможности: - генерация музыки по тексту - инпейнтинг (замена заданного фрагмента) - продолжение заданного фрагмента Хорошо справляется с попаданием в заданный темп, инструмент, настроение, эру (70-е, 80-е, 90-е)…
This media is not supported in your browser
VIEW IN TELEGRAM
jenmusic.ai
Оказывается, у генератора/редактора музыки JEN-1 уже есть онлайн сервис
На старте дают 300 кредитов, по 3 кредита на генерацию. В генерации два варианта 45-секундного трека. Трек потом можно продлить
Этакий конкурент Suno/Udio на минималках... Хотя почему на минималках. Тут есть убойные фичи:
Сделать трек из вашего аудио. И Превратить ваше аудио в определенный музыкальный инструмент.
Го тестить!
Ссылка на трек из видео
#text2music #online #audio2music #audio2instrument
Оказывается, у генератора/редактора музыки JEN-1 уже есть онлайн сервис
На старте дают 300 кредитов, по 3 кредита на генерацию. В генерации два варианта 45-секундного трека. Трек потом можно продлить
Этакий конкурент Suno/Udio на минималках... Хотя почему на минималках. Тут есть убойные фичи:
Сделать трек из вашего аудио. И Превратить ваше аудио в определенный музыкальный инструмент.
Го тестить!
Ссылка на трек из видео
#text2music #online #audio2music #audio2instrument
🔥8🥴1
OS-ATLAS: A Foundation Action Model For Generalist GUI Agents
У нас вырисовывается новая гонка - гонка моделей для захвата власти над вашим локальным устройством.
OS-ATLAS - базовая модель агентов для взаимодействия с пользоветльским интерсфейсом. Иначе говоря, для выполнения действий на компе вместо вас, подобно Jarvis, OmniParser, Computer Use
Код
Веса
#assistant #agent #GUIagent
У нас вырисовывается новая гонка - гонка моделей для захвата власти над вашим локальным устройством.
OS-ATLAS - базовая модель агентов для взаимодействия с пользоветльским интерсфейсом. Иначе говоря, для выполнения действий на компе вместо вас, подобно Jarvis, OmniParser, Computer Use
Код
Веса
#assistant #agent #GUIagent
👍3🔥1
ConsiStory: Training-Free Consistent Text-to-Image Generation
Генерация консистентных изображений без дообучения от Nvidia. Модель тизернули еще летом, код опубликовали вчера.
скорость - 10 секунд на 1 генерацию (какого разрешения?) на H100
Работает на SDXL, в будущем добавят поддержку Flux
Код
Демо
#personalization #text2image
Генерация консистентных изображений без дообучения от Nvidia. Модель тизернули еще летом, код опубликовали вчера.
скорость - 10 секунд на 1 генерацию (какого разрешения?) на H100
Работает на SDXL, в будущем добавят поддержку Flux
Код
Демо
#personalization #text2image
🔥11
URAvatar: Universal Relightable Gaussian Codec Avatars
Портретный аватар на гауссианах. На вход достаточно подать "телефонный скан" - что это? фотограмметрия? скан с лидара? видео с разных ракурсов?
Ну и дальше в реальном времени можно управлять анимацией и освещением
Кода нет
#humanavatar #gaussian #facialanimation #headanimation #talkinghead
Портретный аватар на гауссианах. На вход достаточно подать "телефонный скан" - что это? фотограмметрия? скан с лидара? видео с разных ракурсов?
Ну и дальше в реальном времени можно управлять анимацией и освещением
Кода нет
#humanavatar #gaussian #facialanimation #headanimation #talkinghead
🔥7