Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
BEN2: Background Erase Network

Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы

Демо
Код
Веса
Попробовать на офсайте

#bg #bgremoval #image2matte #video2matte
🔥11👍5🤔2💯2
Сравнение опенсорсных видеогенераторов от подписчика Mr. D

Сделано запросом к DeepResearch

высокие цифры = лучшие для пользователя

Hunyuan на диаграмме: 🤘

#comparison
👍7💩5😁2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Diffusion-Eraser

Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай

#inpainting
👀6👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting
👍6
LightDiffusion-Next

Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI

Функционал пока скупой
Ладно, запомним на будущее

Гитхаб
Демо
Обсуждение на реддит

#text2image #tools #gui
👍91
Replit: Idea to app, fast

Отличный заход от replit, который когда-то просто был для меня сайтом для упражнений на питоне.

Предлагают юзерам смартфонов без опыта в программировании создавать приложения по текстовому запросу

AppStore
GooglePlay

#iOS #coding #assistant #android
👍9🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
SWE Arena: An Open Evaluation Platform for Vibe Coding

А вот и арена вайб-кодинга (заходим с чужеземного IP)

vibe coding - термин Андрея Карпаты. Если кратко, это когда вы вообще не программируете сами, а просто полностью доверяетесь ИИ.

Вы полностью отдаетесь вибрациям и забываете, что код вообще существует. Я пользуюсь голосовым вводом, поэтому практически не касаюсь клавиатуры.


#arena #coding #vibecoding
👍9😁2🥴1
DeepSeek-VL2-small

DeepSeek решил заспамить нас моделями

DeepSeek-VL2-small - средняя визуально-языковая модель на 2.8B параметров из семейства DeepSeek-VL2, наследника DeepSeek-VL

Построена на базе DeepSeekMoE-16B

Демо

#VLM #assistant #image2text
👏53🔥2
AI AppStore

HuggingFace чуть подкрасили фасад Spaces и назвали это громким словом AI AppStore с 400К+ ИИ-приложений.

Прикрутили ИИ-поиск, есть категории

Справедливости ради, демоспейсы вроде можно устанавливать через браузер как PWA приложения.
Но это неточно, у меня ни в одном браузере значок установки не появляется

А еще вы знаете что большинство демоспейсов умирают спустя месяц после релиза. Так сколько там из этих 400К+ функционирующих?

#news
😁10👍2
Ну а GPT Search сделали доступным для всех, даже анонимов.
Даже аккаунт не нужен

Но дискриминация по цвету штанов остается, не забудьте находиться в правильной стране

#news #search
👍7👎2😁2
Визуалку от DeepSeek Janus-Pro-7B можно потестить в Шедевруме на #iOS и #Android до конца марта

#news #text2image
🔥6
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling

Редактор изображений от Alibaba по текстовым указаниям.
Есть персонализация, инпейнтинг

Модельки довольно легковесные

Код
Демо

#personalization #imageediting #inpainting
👍141🔥1