Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Кажется в мемах про ИИ какой-то ограниченный набор тем

- ИИ такой тупой!
- ИИ умнее людей
- восстание машин

Накидывайте еще

#humor
😁8👍2
Media is too big
VIEW IN TELEGRAM
Оdyssey

Публичная демка видеогенератора миров в реальном времени в браузере.

Я специально крутился, ходил и оборачивался чтобы убедиться что он помнит что находится за спиной. Это-то он помнит но посмотрите как ни с того ни с сего корежит дверь на 1:08

Чем дальше уходишь от начальной точки, тем с большей неохотой движок позволяет тебе идти. Как будто резина натянута.

И еще. Набор миров один и тот же. Я несколько раз заходил, перещелкивал и миры и попадал на одни и те же несколько раз. Есть большие сомнения что миры сочинены на ходу. Сделаем скидку на то что это демо, ждем чего-то понятного и практичного

#realtime #scene #world
👍11😱1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.

Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям

Код
Демо
Веса - в том числе пачка лор

#personalization #styletrasfer #stylization #lora #plugin
🔥52
Topaz Bloom

Новый апскейлер изображений от Topaz Labs.

Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.

5 режимов креативности от Subtle до Max, 4 вариации за раз.

сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл

Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений

#upscale
6👍2👎2😭1
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Новый апскейлер картинок от KAIST AI. Неплохо?

Принцип работы такой:

CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.

На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.

Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.

Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU

Код
Демо

Спасибо @asleephidden

#upscale
👍103🔥2🤔2
Sora бесплатно

Но только в мобильном приложении Bing

Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.

Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд

IOS / Android

#mobile #iOS #android #text2video
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
PlayDiffusion

Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...

Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.

Принимает на вход аудио до 50 секунд, файл до 50Мб


Попробовать на офсайте
Демо на HF
Веса
Код

Еще из новинок сервиса: липсинк


#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
👍81