NEW BOT Телеграм, страница - 830232839

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.45K photos

3.71K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

Forwarded from Derp Learning

Обнаружена серьезная проблема в VAE StableDiffusion 1.x, 2.x и других, использовавших его латентное пространство.

Суть такова: в идеале, латентное представление должно быть пространственно связано с кодируемой картинкой. То есть пиксели в углу картинки влияют только на тот же угловой кусок латентного вектора.
Но из-за ошибки при обучении KL-F8 VAE, информация обо всей картинке протекает через некоторые локальные пиксели.
То есть если вы измените пару латентных "пикселей" в том самом неудачном месте, вся картинка изменится - например, станет ярче или менее контрастнее. (рис.1) При этом если вы захотите привести картинку по яркости и контрасту к исходной, получите те самые артефакты VAE с "прожогами".
Поэтому уже сама диффузионная модель при обучении в латентном пространстве бракованного VAE учится обходить эту проблему, что приводит этим самым прожогам, и, вероятно, к менее эффективному использованию параметров.

SDXL этой проблеме не подвержен, так как там VAE учили уже нормально, а вот DALLE3, опенсорснутый VAE которого совместим с SD 1.x, страдает теми же прожогами.
Так что если будете учить свою foundation model, учите с нуля вместе с VAE, либо берите SDXL :D

подробнее

@derplearning

👍3

1.21K views05:53

Нейронавт | Нейросети в творчестве

Forwarded from Арсен_аск

Всем привет, я сейчас собираю табличку со всеми графическими нейросетями, которые генерируют и обрабатывают картинки. Только картинки. Можете поделиться своим опытом и дать коментарии по тому какие нейросети лучше всего и какими вы пользуетесь в работе. Я в замен после того как все структурирую поделюсь общим файликом. Пишите лучше в личку потому что я на многих пабликах оставляю это предложение

👍22😁1

1.31K views14:14

Нейронавт | Нейросети в творчестве

Наш подписчик каталогизирует генераторы картинок. Если хотите ему помочь пишите в ему в личку

https://news.1rj.ru/str/Ability_2112

🔥8👍2

1.35K views14:14

Нейронавт | Нейросети в творчестве

Пришел доступ к к GigaCode.
Если вы оставляли заявку, пора проверить почту

💩2

1.24K views07:29

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Говорят, в Bard подключили Gemini Pro (конкурент GPT-4) и генератор картинок Imagen.

Теперь поддерживается русский язык среди 40 других. Но доступ для России так и не дали, дав его почти всем остальным.

#text2image #assistant #VLM

👍2

1.33K views07:51

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Опубликован код контроллера движения MotionDirector

Код
Демо
Демо2
Колаб

#video2video #video2motion #motion2video

🔥7

1.38K views08:04

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

One-shot Talking Face Generation from Single-speaker Audio-Visual Correlation Learning

Генератор говорящей головы из картинки и аудиофайла

Код
Демо
Колаб

#talkinghead

👍7

1.46K views06:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

На некоммерческом GPU-кластере от camenduru в качестве альфа-теста временно доступен видеогенератор SVD. Рядом такой же бесплатный SD с тремя анимешными чекпойнитами. Пользуйтесь

Сгенерировать изображение в SD
Сгенерировать видео в SVD

#text2image #image2video

👍4

1.36K views07:02

Нейронавт | Нейросети в творчестве

Find Your Twins

Здесь можете залить свое фото и поискать своего двойника в датасете Face Aging Dataset

#image2image #twin

👎6👍2

1.44K views07:10

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Video Diffusion 1.1
Модель уже можно скачать

#image2video

🔥14

3.1K views07:32

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

AnimateLCM: Accelerating the Animation of Personalized Diffusion Models and Adapters with Decoupled Consistency Learning

Ускорение генерации видео, вдохновлённое LCM, за счет сокращения количества шагов

Гитхаб
Модель
Civitai
Демо
Демо2
Колаб

#text2video #image2video

🔥2

1.4K viewsedited 07:44

Нейронавт | Нейросети в творчестве

RPG-DiffusionMaster Extension for Stable Diffusion WebUI

Расширение RPG-DiffusionMaster для A1111.
Го тестить

#text2image #extension

👍4

1.36K views08:32

Нейронавт | Нейросети в творчестве

Auto 1111 SDK: Stable Diffusion Python library

Легкая библиотека на Python для запуска SD.
Может быть полезно тем, у кого нет своей приличной видеокарты. Потому что есть колаб ноутбук. Он без web-ui, поэтому нет опасений что гугл его забанит.

Ноутбук быстрый, первые результаты вы можете получить уже через несколько минут после запуска

В колабе реализовано
- Оригинальные режимы txt2img и img2img
- апскейл
- Outpainting
- Inpainting

Разработчики планируют добавлять поддержку Lora, SDXL, Controlnet и т д

Гитхаб
Колаб

#text2image #image2image #inpainting #outpainting #upscale #stablediffusion

GitHub - Auto1111SDK/Auto1111SDK: An SDK/Python library for Automatic 1111 to run state-of-the-art diffusion models

An SDK/Python library for Automatic 1111 to run state-of-the-art diffusion models - Auto1111SDK/Auto1111SDK

👍7❤1

1.51K viewsedited 08:52

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

Houdini + Stable Diffusion

Принес годноты для CG-взрослых.

Симуляция в Гудини, нейрорендер в Stable Diffusion (Комфи+КонтролНет).
В Гудини генерятся частицы, маска и глубина, потом все это забирается в Stable Diffusion и кормится в ControlNet и Animatediff.

Вот такой нейрорендер нам нужен!
Более того, держите:

Подробный тутор, где все это расписано.

Канал этого удивительного чувака, который скрещивает 3Д и нейрорендеринг.

И клондайк из разных полезных постов для тех, кто в кино и VFX.

Enjoy CG-Bros.

P.S. Представьте, лукдев теперь это текстовый промпт и выбор чекпойнта (утрирую, конечно).

❤21👍7

1.06K views14:15

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Dashtoon Studio

Онлайн студия для генерации комиксов по эксизам с консистентностью персонажей.

Есть туториалы и галерея комиксов. Платных тарифов не вижу, картинки генерятся.

#text2image #sketch2image

🔥15❤1

1.8K views16:44

Нейронавт | Нейросети в творчестве

Stable Diffusion WebUI Forge

Облегченный и ускоренный StableDiffusion для слабого железа от автора ControlNet.
Попробую на 1060 6GB

[update] отлично работает, 12 секунд на картинку 512*512, 20 шагов

Гитхаб
cборка для установки в один клик

#tools #stablediffusion

👍22👀2❤1

3.71K viewsedited 07:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MGIE: Guiding Instruction-based Image Editing via Multimodal Large Language Models

Что? нет. Или да.
Фоткаем, просим LLM что-нибудь поменять на фото.
Все это на айфоне.
Apple поделились кодом. Объясните кто-нибудь, какой толк на айфоне от кода на питоне?

Код
Демо

#MLLM #VLM #mobile #image2image #inpainting

😁3👍1

1.43K viewsedited 08:40

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MetaVoice-1B

Обновлен высококачественный клонировщик голоса

- 1.2B параметров
- Обучен на 100 тысячах часов речи-текста
- Синтез коротких и длинных разговоров
- Генерация эмоциональной речи на английском
- клонирование голоса по 30-секундному образцу
- файнтюнинг под другие языки
- Лицензия Apache 2.0

Гитхаб
Демо

#text2speech #speech2text

👌5🔥3👍1

1.8K views09:35

Нейронавт | Нейросети в творчестве

BRIA-RMBG-1.4

Новый лидер в удалении фона с картинок от bria.ai

Код
Демо

#image2image #backgroundremoval

👍8👎2

1.62K views15:01

Нейронавт | Нейросети в творчестве

SegMoE: Segmind Mixture of Diffusion Experts

"Совет экспертов" для генерации картинок. По принципу совета экспертов в LLM. На ютубе есть пояснительное видео для тех, кто, как и я, не понял как оно работает.

Код
ComfyUI

#text2image

👍5🔥3❤1

1.34K views16:01