Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Mozart AI

Новый сервис для генерации/редактирования музыки.

Создает песни по текстовому промпту, референсу, кусочку трека

В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха

При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen

Может создавать отдельные партии
Импровизирует на выделенном участке трека

Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров

Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?

На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!

Видео напомнило рекламу Songsmith, но сервис норм

В комментариях его тейк на Рика Эстли

Youtube канал с туториалами
Галерея

#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
1🔥9👍43
This media is not supported in your browser
VIEW IN TELEGRAM
Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.

Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок

Код

Видео от двухминутного доктора

#gaussian #research
👍7🤔2🔥1
HDM (Home made Diffusion Model)

Минималистичный генератор изображений по тексту от автора Lycoris.

Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB

Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров

Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.

Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.

Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.

Гитхаб
ComfyUI

#text2image #optimization #anime
👍122🔥2
Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting
👍14🔥3
MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile
👍5😁1👨‍💻1
UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet
🔥8