Я тут на днях поиграл с Qwen-Image-Edit на быстром железе
столкнулся с проблемой которую упоминали в чате - при попытке целиком изобразить персонажа по бюстовому или поясному портрету редакторы, в том числе и QIE рисуют карликов
Я всячески пытался промптом накрутить нормальные пропорции тела, в том числе и пытался посадить, но это не сильно помогает. Склонность к карликам трудно побороть без контролнета. Но контролнетом не пользовался
Для девушки с жемчужной сережкой писал так
И в негатив:
И то - руки длинноваты.
Один раз писать «tall» не помогает. В связи с чем у меня вопрос. А есть в современных генераторах контроль веса слова в промпте как было в SD?
И может, прочие ништяки типа смешивания или чередования на разных шагах концепций
Американская готика получилась норм по пропорциям, но не соответствует стиль.
А вы как боретесь с карликовостью?
#neuronaut_art
столкнулся с проблемой которую упоминали в чате - при попытке целиком изобразить персонажа по бюстовому или поясному портрету редакторы, в том числе и QIE рисуют карликов
Я всячески пытался промптом накрутить нормальные пропорции тела, в том числе и пытался посадить, но это не сильно помогает. Склонность к карликам трудно побороть без контролнета. Но контролнетом не пользовался
Для девушки с жемчужной сережкой писал так
full-body view of the girl as a tall tall tall tall tall tall fashion model standing on the floor, fit body, proportional body, fashion model body, with long legs, wearing renaissance dress, distant view. Keep the person's identity, perfect beauty body proportions, thin female hands, small head, 20 years old
И в негатив:
two images stitched, collage, drawing, unrealistic, bad anatomy, unproportional body, canvas, brush, painter, short legs, midget, short body, large head, short legs, large hands
И то - руки длинноваты.
Один раз писать «tall» не помогает. В связи с чем у меня вопрос. А есть в современных генераторах контроль веса слова в промпте как было в SD?
tall:7И может, прочие ништяки типа смешивания или чередования на разных шагах концепций
[green | blue]Американская готика получилась норм по пропорциям, но не соответствует стиль.
А вы как боретесь с карликовостью?
#neuronaut_art
😁9❤4👍1
Нейронавт | Нейросети в творчестве
Я тут на днях поиграл с Qwen-Image-Edit на быстром железе столкнулся с проблемой которую упоминали в чате - при попытке целиком изобразить персонажа по бюстовому или поясному портрету редакторы, в том числе и QIE рисуют карликов Я всячески пытался промптом…
Бонус. Wan не знает лунную походку
🌚4😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Mozart AI
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
1🔥9👍4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
👍7🤔2🔥1
HDM (Home made Diffusion Model)
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
👍12❤2🔥2