Нейронавт | Нейросети в творчестве
Я тут на днях поиграл с Qwen-Image-Edit на быстром железе столкнулся с проблемой которую упоминали в чате - при попытке целиком изобразить персонажа по бюстовому или поясному портрету редакторы, в том числе и QIE рисуют карликов Я всячески пытался промптом…
Бонус. Wan не знает лунную походку
🌚4😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Mozart AI
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
1🔥9👍4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
👍7🤔2🔥1
HDM (Home made Diffusion Model)
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
👍12❤2🔥2
Awesome-Nano-Banana🍌-images
репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются
#prompting #imageediting
репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются
#prompting #imageediting
👍14🔥3
MobileLLM-R1
Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.
Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.
— Модель решает математические задачи.
— Помогает писать код.
— Справляется с научными задачами.
— Показывает хорошие результаты в тестах.
— Лучше некоторых больших моделей, хотя сама меньше по размеру.
— Её можно дообучать и использовать для исследований.
#assistant #mobile
Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.
Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.
— Модель решает математические задачи.
— Помогает писать код.
— Справляется с научными задачами.
— Показывает хорошие результаты в тестах.
— Лучше некоторых больших моделей, хотя сама меньше по размеру.
— Её можно дообучать и использовать для исследований.
#assistant #mobile
👍5😁1👨💻1
UFC: Universal Few-Shot Spatial Control for Diffusion Models
Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST
В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете
#controlnet
Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST
В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете
#controlnet
🔥8