Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Open Deep Research

Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований

Экономим $200 на подписке

#assistant #agent
👍9😁4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Срочные (нет) новости (нет)

Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом 1 апреля 2017 года

#оффтоп #humor
😁27🔥6🤡2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Dialog 1.0

Новая голосовая диалоговая модель от Play AI (aka PlayHT)
"Ультраэмоциональная"
Рилтайм, задержка 303 мс
30+ языков, русский есть
до 48КГц

Возможности:
- клонирование голоса
- ИИ подкасты из PDF, картинок, текстов
- голосовые агенты
- API
- рилтайм среда - диктор или диалог 2 голоса

Попробовать

#voicecloning #text2speech #tts #agent #podcast
👍11👎1
This media is not supported in your browser
VIEW IN TELEGRAM
BEN2: Background Erase Network

Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы

Демо
Код
Веса
Попробовать на офсайте

#bg #bgremoval #image2matte #video2matte
🔥11👍5🤔2💯2
Сравнение опенсорсных видеогенераторов от подписчика Mr. D

Сделано запросом к DeepResearch

высокие цифры = лучшие для пользователя

Hunyuan на диаграмме: 🤘

#comparison
👍7💩5😁2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Diffusion-Eraser

Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай

#inpainting
👀6👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting
👍6
LightDiffusion-Next

Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI

Функционал пока скупой
Ладно, запомним на будущее

Гитхаб
Демо
Обсуждение на реддит

#text2image #tools #gui
👍91
Replit: Idea to app, fast

Отличный заход от replit, который когда-то просто был для меня сайтом для упражнений на питоне.

Предлагают юзерам смартфонов без опыта в программировании создавать приложения по текстовому запросу

AppStore
GooglePlay

#iOS #coding #assistant #android
👍9🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
SWE Arena: An Open Evaluation Platform for Vibe Coding

А вот и арена вайб-кодинга (заходим с чужеземного IP)

vibe coding - термин Андрея Карпаты. Если кратко, это когда вы вообще не программируете сами, а просто полностью доверяетесь ИИ.

Вы полностью отдаетесь вибрациям и забываете, что код вообще существует. Я пользуюсь голосовым вводом, поэтому практически не касаюсь клавиатуры.


#arena #coding #vibecoding
👍9😁2🥴1