NEW BOT Телеграм, страница - 698879958

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.47K photos

3.73K videos

41 files

4.77K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation

Генератор глубины разрешением до 4К для видео. Но не для любого, нужны данные с лидара. У потребительских лидаров, таких как в айфоне, например, очень кислое разрешение, что-то вроде 256x192. Эти данные плюс RGB видео используются как промпт для генерации высококачественной карты глубины

Код
Демо
Код неофициальный
Пример результата на rerun.io покрутить

#rgbd #video2depth

❤8

1.61K views14:19

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency

Ну-ка, ну-ка
Еще один апскейлер для видео от китайцев, хвалится консистентностью, на черрипиках хорош

Препринт (Ссылка на сайте не работает)
Код ждем

#upscale #upscalevideo #enhance

👍6🔥1

1.62K views14:49

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview

👍4🔥1

1.66K views15:19

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Open Deep Research

Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований

Экономим $200 на подписке

#assistant #agent

👍9😁4🤔1

2K views15:52

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Qwen Video

Я писал про генерацию видео в Qwen2.5-1M, но она была недоступна. А на днях ее таки подключили видимо для всех

Если еще не пробовали, даю отмашку

#text2video #image2video

👍6🎃2

1.84K views16:36

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Срочные (нет) новости (нет)

Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом 1 апреля 2017 года

#оффтоп #humor

😁27🔥6🤡2👍1

2.08K views19:16

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Leapfusion Hunyuan Image-to-Video V2

Обновка опенсорсного генератора видео по картинке, разрешение 544p

воркфлоу

#image2video #ComfyUI

🔥9👍5🤔1

2.26K views11:24

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Dialog 1.0

Новая голосовая диалоговая модель от Play AI (aka PlayHT)
"Ультраэмоциональная"
Рилтайм, задержка 303 мс
30+ языков, русский есть
до 48КГц

Возможности:
- клонирование голоса
- ИИ подкасты из PDF, картинок, текстов
- голосовые агенты
- API
- рилтайм среда - диктор или диалог 2 голоса

Попробовать

#voicecloning #text2speech #tts #agent #podcast

👍11👎1

1.9K viewsedited 12:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

BEN2: Background Erase Network

Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы

Демо
Код
Веса
Попробовать на офсайте

#bg #bgremoval #image2matte #video2matte

🔥11👍5🤔2💯2

1.95K views12:49

Нейронавт | Нейросети в творчестве

Сравнение опенсорсных видеогенераторов от подписчика Mr. D

Сделано запросом к DeepResearch

высокие цифры = лучшие для пользователя

Hunyuan на диаграмме: 🤘

#comparison

👍7💩5😁2🤔1

1.61K views13:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Diffusion-Eraser

Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай

#inpainting

👀6👌1

1.6K views13:48

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting

👍6

1.83K views14:25

Нейронавт | Нейросети в творчестве

LightDiffusion-Next

Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI

Функционал пока скупой
Ладно, запомним на будущее

Гитхаб
Демо
Обсуждение на реддит

#text2image #tools #gui

👍9❤1

1.56K views14:49