Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Mozart AI

Новый сервис для генерации/редактирования музыки.

Создает песни по текстовому промпту, референсу, кусочку трека

В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха

При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen

Может создавать отдельные партии
Импровизирует на выделенном участке трека

Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров

Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?

На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!

Видео напомнило рекламу Songsmith, но сервис норм

В комментариях его тейк на Рика Эстли

Youtube канал с туториалами
Галерея

#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi
1🔥9👍43
This media is not supported in your browser
VIEW IN TELEGRAM
Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.

Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок

Код

Видео от двухминутного доктора

#gaussian #research
👍7🤔2🔥1
HDM (Home made Diffusion Model)

Минималистичный генератор изображений по тексту от автора Lycoris.

Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB

Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров

Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.

Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.

Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.

Гитхаб
ComfyUI

#text2image #optimization #anime
👍122🔥2
Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting
👍14🔥3
MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile
👍5😁1👨‍💻1
UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet
🔥8
Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)

Нравится картинка
Промпт:
real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview


Демо

#text2image #fluxc
👍91