Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Derp Learning
Обнаружена серьезная проблема в VAE StableDiffusion 1.x, 2.x и других, использовавших его латентное пространство.

Суть такова: в идеале, латентное представление должно быть пространственно связано с кодируемой картинкой. То есть пиксели в углу картинки влияют только на тот же угловой кусок латентного вектора.
Но из-за ошибки при обучении KL-F8 VAE, информация обо всей картинке протекает через некоторые локальные пиксели.
То есть если вы измените пару латентных "пикселей" в том самом неудачном месте, вся картинка изменится - например, станет ярче или менее контрастнее. (рис.1) При этом если вы захотите привести картинку по яркости и контрасту к исходной, получите те самые артефакты VAE с "прожогами".
Поэтому уже сама диффузионная модель при обучении в латентном пространстве бракованного VAE учится обходить эту проблему, что приводит этим самым прожогам, и, вероятно, к менее эффективному использованию параметров.

SDXL этой проблеме не подвержен, так как там VAE учили уже нормально, а вот DALLE3, опенсорснутый VAE которого совместим с SD 1.x, страдает теми же прожогами.
Так что если будете учить свою foundation model, учите с нуля вместе с VAE, либо берите SDXL :D

подробнее

@derplearning
👍3
Forwarded from Арсен_аск
Всем привет, я сейчас собираю табличку со всеми графическими нейросетями, которые генерируют и обрабатывают картинки. Только картинки. Можете поделиться своим опытом и дать коментарии по тому какие нейросети лучше всего и какими вы пользуетесь в работе. Я в замен после того как все структурирую поделюсь общим файликом. Пишите лучше в личку потому что я на многих пабликах оставляю это предложение
👍22😁1
Наш подписчик каталогизирует генераторы картинок. Если хотите ему помочь пишите в ему в личку
🔥8👍2
Пришел доступ к к GigaCode.
Если вы оставляли заявку, пора проверить почту
💩2
This media is not supported in your browser
VIEW IN TELEGRAM
Говорят, в Bard подключили Gemini Pro (конкурент GPT-4) и генератор картинок Imagen.

Теперь поддерживается русский язык среди 40 других. Но доступ для России так и не дали, дав его почти всем остальным.

#text2image #assistant #VLM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
На некоммерческом GPU-кластере от camenduru в качестве альфа-теста временно доступен видеогенератор SVD. Рядом такой же бесплатный SD с тремя анимешными чекпойнитами. Пользуйтесь

Сгенерировать изображение в SD
Сгенерировать видео в SVD

#text2image #image2video
👍4
Find Your Twins

Здесь можете залить свое фото и поискать своего двойника в датасете Face Aging Dataset

#image2image #twin
👎6👍2
Auto 1111 SDK: Stable Diffusion Python library

Легкая библиотека на Python для запуска SD.
Может быть полезно тем, у кого нет своей приличной видеокарты. Потому что есть колаб ноутбук. Он без web-ui, поэтому нет опасений что гугл его забанит.

Ноутбук быстрый, первые результаты вы можете получить уже через несколько минут после запуска

В колабе реализовано
- Оригинальные режимы txt2img и img2img
- апскейл
- Outpainting
- Inpainting

Разработчики планируют добавлять поддержку Lora, SDXL, Controlnet и т д

Гитхаб
Колаб

#text2image #image2image #inpainting #outpainting #upscale #stablediffusion
👍71
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Houdini + Stable Diffusion

Принес годноты для CG-взрослых.

Симуляция в Гудини, нейрорендер в Stable Diffusion (Комфи+КонтролНет).
В Гудини генерятся частицы, маска и глубина, потом все это забирается в Stable Diffusion и кормится в ControlNet и Animatediff.

Вот такой нейрорендер нам нужен!
Более того, держите:

Подробный тутор, где все это расписано.

Канал этого удивительного чувака, который скрещивает 3Д и нейрорендеринг.

И клондайк из разных полезных постов для тех, кто в кино и VFX.

Enjoy CG-Bros.

P.S. Представьте, лукдев теперь это текстовый промпт и выбор чекпойнта (утрирую, конечно).
21👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Dashtoon Studio

Онлайн студия для генерации комиксов по эксизам с консистентностью персонажей.

Есть туториалы и галерея комиксов. Платных тарифов не вижу, картинки генерятся.

#text2image #sketch2image
🔥151
Stable Diffusion WebUI Forge

Облегченный и ускоренный StableDiffusion для слабого железа от автора ControlNet.
Попробую на 1060 6GB

[update] отлично работает, 12 секунд на картинку 512*512, 20 шагов

Гитхаб
cборка для установки в один клик

#tools #stablediffusion
👍22👀21
This media is not supported in your browser
VIEW IN TELEGRAM
MGIE: Guiding Instruction-based Image Editing via Multimodal Large Language Models

Что? нет. Или да.
Фоткаем, просим LLM что-нибудь поменять на фото.
Все это на айфоне.
Apple поделились кодом. Объясните кто-нибудь, какой толк на айфоне от кода на питоне?

Код
Демо

#MLLM #VLM #mobile #image2image #inpainting
😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MetaVoice-1B

Обновлен высококачественный клонировщик голоса

- 1.2B параметров
- Обучен на 100 тысячах часов речи-текста
- Синтез коротких и длинных разговоров
- Генерация эмоциональной речи на английском
- клонирование голоса по 30-секундному образцу
- файнтюнинг под другие языки
- Лицензия Apache 2.0

Гитхаб
Демо

#text2speech #speech2text
👌5🔥3👍1
BRIA-RMBG-1.4

Новый лидер в удалении фона с картинок от bria.ai

Код
Демо

#image2image #backgroundremoval
👍8👎2
SegMoE: Segmind Mixture of Diffusion Experts

"Совет экспертов" для генерации картинок. По принципу совета экспертов в LLM. На ютубе есть пояснительное видео для тех, кто, как и я, не понял как оно работает.

Код
ComfyUI

#text2image
👍5🔥31