This media is not supported in your browser
VIEW IN TELEGRAM
Mozart AI
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
Новый сервис для генерации/редактирования музыки.
Создает песни по текстовому промпту, референсу, кусочку трека
В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха
При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen
Может создавать отдельные партии
Импровизирует на выделенном участке трека
Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров
Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?
На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!
Видео напомнило рекламу Songsmith, но сервис норм
В комментариях его тейк на Рика Эстли
Youtube канал с туториалами
Галерея
#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
1🔥9👍4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.
Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок
Код
Видео от двухминутного доктора
#gaussian #research
👍7🤔2🔥1
HDM (Home made Diffusion Model)
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
Минималистичный генератор изображений по тексту от автора Lycoris.
Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB
Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров
Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.
Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.
Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.
Гитхаб
ComfyUI
#text2image #optimization #anime
👍12❤2🔥2
Awesome-Nano-Banana🍌-images
репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются
#prompting #imageediting
репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются
#prompting #imageediting
👍14🔥3
MobileLLM-R1
Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.
Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.
— Модель решает математические задачи.
— Помогает писать код.
— Справляется с научными задачами.
— Показывает хорошие результаты в тестах.
— Лучше некоторых больших моделей, хотя сама меньше по размеру.
— Её можно дообучать и использовать для исследований.
#assistant #mobile
Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.
Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.
— Модель решает математические задачи.
— Помогает писать код.
— Справляется с научными задачами.
— Показывает хорошие результаты в тестах.
— Лучше некоторых больших моделей, хотя сама меньше по размеру.
— Её можно дообучать и использовать для исследований.
#assistant #mobile
👍5😁1👨💻1
UFC: Universal Few-Shot Spatial Control for Diffusion Models
Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST
В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете
#controlnet
Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST
В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете
#controlnet
🔥8
Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)
Нравится картинка
Промпт:
Демо
#text2image #fluxc
Нравится картинка
Промпт:
real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview
Демо
#text2image #fluxc
👍9❤1