NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

#humor

😁32😭5👍1😐1

1.81K views17:20

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

со звуком

#humor #robot

😁35👎3😱2❤1👍1

2.37K views18:21

Нейронавт | Нейросети в творчестве

1:39

This media is not supported in your browser

VIEW IN TELEGRAM

Mozart AI

Новый сервис для генерации/редактирования музыки.

Создает песни по текстовому промпту, референсу, кусочку трека

В качестве референса можно указывать определенного исполнителя и даже определенную песню! Ждем исков. А может и нет. Референс-то указать можно, но при указании RHCP всегда генерится пустой трек. Указывайте Баха

При генерации по тексту есть выбор провайдера между Elevenlabs и SongGen

Может создавать отдельные партии
Импровизирует на выделенном участке трека

Есть библиотека сэмплов
Есть простецкая DAW с мультитреком и набором фильтров

Экспорт в WAV / MIDI. Экспорт стэмов ждем. 16 бит, 24 бит, 32 бит - где вы еще такое видели?

На старте дают миллион кредитов. После генерации нескольких треков все равно остался миллион. Короче, бесплатново!

Видео напомнило рекламу Songsmith, но сервис норм

В комментариях его тейк на Рика Эстли

Youtube канал с туториалами
Галерея

#text2music #text2audio #music2music #audio2music #sfx #musicediting #midi #text2midi #audio2midi

1🔥9👍4❤3

9.48K viewsedited 06:12

Нейронавт | Нейросети в творчестве

1:23

This media is not supported in your browser

VIEW IN TELEGRAM

Image-GS: Content-Adaptive Image Representation via 2D Gaussians
В Intel придумали способ представления изображений с помощью двухмерных гауссиан (до сих пор их применяли для 3D сцен), позволяющий кодировать изображения с объемом файла jpeg'ов, но при этом без потерь.

Image-GS строит иерархию уровней детализации с помощью прогрессивной оптимизации, ориентированной на минимизацию ошибок

Код

Видео от двухминутного доктора

#gaussian #research

👍7🤔2🔥1

1.75K viewsedited 07:11

Нейронавт | Нейросети в творчестве

HDM (Home made Diffusion Model)

Минималистичный генератор изображений по тексту от автора Lycoris.

Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB

Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров

Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.

Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.

Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.

Гитхаб
ComfyUI

#text2image #optimization #anime

👍12❤2🔥2

1.65K views08:11

Нейронавт | Нейросети в творчестве

Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting

👍14🔥3

1.93K views09:12

Нейронавт | Нейросети в творчестве

MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile

👍5😁1👨‍💻1

3.43K views10:13

Нейронавт | Нейросети в творчестве

UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet

🔥8

2.03K views11:14

Нейронавт | Нейросети в творчестве

Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)

Нравится картинка
Промпт:

real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview

Демо

#text2image #fluxc

👍9❤1

1.96K views12:16

About

Blog

Apps

Platform