Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Proxy Lite

Convergence опубликовали в общий доступ младшую версию своего браузерного агента

3B параметров
На основе Qwen2.5-VL-3B-Instruct

Код/Веса

#agent #browser #vlm
🔥71
This media is not supported in your browser
VIEW IN TELEGRAM
Keyframe Control Lora

Лора ключевых кадров для HunyuanVideo T2V (T2V, генератор по тексту - так в репозитории написано)

Задаем два кадра и количество кадров - получаем видео, начинающееся с первого, оканчивающееся вторым

#lora #text2video #image2video
👍131
This media is not supported in your browser
VIEW IN TELEGRAM
Видеогенератор Wan2.1 поддерживается в #ComfyUI нативно
Судя по тому что по инструкции надо скачать fp8_e4m3fn модель, не удивлюсь если всю работу взяли у Kijai

У людей t2i (она может оказывается и просто картинки генерить) заводится даже на RTX2060!
Для видео на 1.3B модели заготовьте 15ГБ VRAM, а для 14B - 40ГБ VRAM

Блог

#text2video #image2video
👍82
This media is not supported in your browser
VIEW IN TELEGRAM
Prompt-to-Leaderboard (P2L)

Теперь на lmarena.ai можете создавать свои лидерборды написав промпт во вкладке Chat.
Этим занимаются специально обученные модели, начинающиеся с 'p2l-'

Впрочем, можете организовать и свою арену с блекджеком и ботами, ведь есть веса и код

Гитхаб
Веса

#prompt2leaderboard #p2l #text2leaderboard
👍41
MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors

Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090

Код

#video2scene #rendering #videoto3D
👍19🤯6🔥2
GHOST 2.0: Generative High-fidelity One Shot Transfer of Heads

Перенос головы с фото на фото от Sber AI.
Не лица, а головы. Все кто имел дело с заменой лиц, понимают о чем речь.

Пишут что единственный аналог - HeSer, по метрикам его побили

Код
Демо
Хабр

#headswap #faceswap
💩17🔥7👎4🥴32
GPT-4.5

Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus

#news #assistant #reasoning
👍41
This media is not supported in your browser
VIEW IN TELEGRAM
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion

Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд

Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX

Код
Демо (еще не работает)

#PBR #textto3d
🔥4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Motion Prediction

Wonder Dynamics выпустили модель для точной реконструкции движений актера, даже там где он перекрыт другими объектами в кадре

#video2pose
🔥9🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ImageTo3D

Создает 3D локацию из любой картинки
Сделано в Claude 3.7
Бесполезно, но вы ведь уже знаете что с этим делать

Твит автора

#imageto3d
😁14👍2🤷‍♂1
DreamEngine

Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями

Сайта нет
Код ждем

#text2image #vlm #personalization
👍6👎1
LuminaBrush

Экспериментальный проект lllyasviel, похожий на IC-Light
Эффект освещения задаем цветными мазками кисти и текстовым промптом, на выходе получаем наш картинку, где персонаж помещен в другие условия освещения.

Обработка происходит в два этапа. На первом этапе объект приводят к равномерному освещению. Из этого этапа автор сделал отдельную фичу, см второе демо.

Гитхаб - там кода нет, только описание и примеры, так обычно оформляют сайт проекта
Демо
Демо2 равномерное освещение

#relighting
🔥93
This media is not supported in your browser
VIEW IN TELEGRAM
GaussianCity

Генератор неограниченных городов на гауссианах

Код
Демо

#gaussian
👍3🥴3🤷‍♂1🔥1