NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Я тут на днях поиграл с Qwen-Image-Edit на быстром железе

столкнулся с проблемой которую упоминали в чате - при попытке целиком изобразить персонажа по бюстовому или поясному портрету редакторы, в том числе и QIE рисуют карликов

Я всячески пытался промптом накрутить нормальные пропорции тела, в том числе и пытался посадить, но это не сильно помогает. Склонность к карликам трудно побороть без контролнета. Но контролнетом не пользовался

Для девушки с жемчужной сережкой писал так

full-body view of the girl as a tall tall tall tall tall tall fashion model standing on the floor, fit body, proportional body, fashion model body, with long legs, wearing renaissance dress, distant view. Keep the person's identity, perfect beauty body proportions, thin female hands, small head, 20 years old

И в негатив:

two images stitched, collage, drawing, unrealistic, bad anatomy, unproportional body, canvas, brush, painter, short legs, midget, short body, large head, short legs, large hands

И то - руки длинноваты.

Один раз писать «tall» не помогает. В связи с чем у меня вопрос. А есть в современных генераторах контроль веса слова в промпте как было в SD?

tall:7

И может, прочие ништяки типа смешивания или чередования на разных шагах концепций

[green | blue]

Американская готика получилась норм по пропорциям, но не соответствует стиль.

А вы как боретесь с карликовостью?

#neuronaut_art

😁9❤4👍1

1.9K views17:22

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Бонус. Wan не знает лунную походку

🌚4😁3👍1

1.81K views08:16

Нейронавт | Нейросети в творчестве

#humor

😁32😭5👍1😐1

1.81K views17:20

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

со звуком

#humor #robot

😁35👎3😱2❤1👍1

2.37K views18:21

Нейронавт | Нейросети в творчестве

1:39

This media is not supported in your browser

VIEW IN TELEGRAM

Mozart AI

Новый сервис для генерации/редактирования музыки.

Создает песни по текстовому промпту, референсу, кусочку трека

В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха

При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen

Может создавать отдельные партии
Импровизирует на выделенном участке трека

Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров

Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?

На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!

Видео напомнило рекламу Songsmith, но сервис норм

В комментариях его тейк на Рика Эстли

Youtube канал с туториалами
Галерея

#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi

1🔥9👍4❤3

9.48K viewsedited 06:12

Нейронавт | Нейросети в творчестве

1:23

This media is not supported in your browser

VIEW IN TELEGRAM

Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.

Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок

Код

Видео от двухминутного доктора

#gaussian #research

👍7🤔2🔥1

1.75K viewsedited 07:11

Нейронавт | Нейросети в творчестве

HDM (Home made Diffusion Model)

Минималистичный генератор изображений по тексту от автора Lycoris.

Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB

Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров

Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.

Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.

Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.

Гитхаб
ComfyUI

#text2image #optimization #anime

👍12❤2🔥2

1.65K views08:11

About

Blog

Apps

Platform