Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
PCM: Phased Consistency Model

Развитие идеи LCM для быстрой генерации картинок и видео. Разумпеется, с лучшим чем у LCM качеством. Для SD1.5 и SDXL

Код
Веса
Демо
Civitai LoRA

#text2image #text2video #optimization
👍5🔥2
Huggingface Spaces взломан

Деактивируем токены, меняем пароль

#news
😱10👍2🌭1
Media is too big
VIEW IN TELEGRAM
Kling

Китайский конкурент Sora - генератор видео по тексту
Хронометраж до 2 минут в Full HD и 30 fps.
До Sora недотягивает, но выглядит получше всего остального что я видел.

- имитирует физику реального мира
- умеет сочетать разные концепции
- кинематографичность
- умеет в разное соотношение сторон
- бонусом умеет делать из картинки тиктоковые танцы. Если я ничего не путаю. Своими глазами вижу это в самом низу сайта

Говорят, доступ дадут обычным землянам

#humananimation #text2video #image2video
🔥14👍6👎1
Нейронавт | Нейросети в творчестве
DreamMat: High-quality PBR Material Generationwith Geometry- and Light-aware Diffusion Models Это вам не просто генератор текстур. Это генератор PBR материалов, детка! Код #text2material #material #3D2material
light-geo-controlnet

И самое интересное что его оформили в виде контролнета!

Он использует карты нормалей и глубины объекта в качестве геометрических условий и шесть заготовок материалов с заданным освещением окружающей среды в качестве условий освещения. Далее генерирует изображения, которые соответствуют заданной геометрии и освещенности окружающей среды.

Есть и ложка говна: он для SD 2.1

#controlnet #text2material #material
7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA RTX Remix в опенсорсе

NVIDIA выпустили в опенсорс инструмент для ремастеринга игр RTX Remix - Open Source Creator Toolkit.

Приятно, что есть интеграция с Comfy UI.

Скачать бету
Туториалы

#tools #upscale #remaster
👍9🔥3
Media is too big
VIEW IN TELEGRAM
ChronoDepth: Learning Temporally Consistent Video Depth from Video Diffusion Priors

Генератор консистентной карты глубины для видео.
Как я посмотрю, консистентность у них скачкообразная, но вроде есть какие-то рульки которые можно крутить. И таких проектов мало, так что ждем код и не ноем

Код ждем

#depth #depth2video #video2depth
🔥7
Stable Audio Open

Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.

Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.

В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.

Код/веса
Демо

#text2audio #music2music #text2music
7👍4
Dimba: Transformer-Mamba Diffusion Models

Новая модель генерации картинок на гибридной архитектуре. Большинство из генераторов, которыми вы пользуетесь, работают на трансформерах, в том числе и SD. Не спрашивайте что это такое. На смену им придумали более продвинутую Mamba, которую я недавно упоминал.

Так вот, тут мы имеем некий Transformer-Mamba гибрид, прочащий диффузной генерации картинок светлое будущее.

Из плюсов: тюнинг качества, адаптация разрешения, семантический контроль. Картинки с сайта мне нравятся

Код
Веса
Демо (вход через WeChat🤬)

#text2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2