Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Stable Diffusion 3 API

Архитектура SD3 еще сырая, и саму модель выкладывать пока не собираются.
Но.
Stability AI открыли зарегистрированным пользователям API доступ к Stable Diffusion 3.
Там каждое телодвижение стоит кредитов. У меня с момента регистрации валяются 25 кредитов. Предполагаю, что и у вас они могут быть. Так что, для тех кто не боится кода - можно попробовать.

Документация
Цены и колаб-ноутбуки

#news #text2image #image2image
2
Опубликован код и демо генератора картинок PIXART-Σ
Го тестить!

Код
Демо

#text2image
🔥5👍1
Animatable Gaussians: Learning Pose-dependent Gaussian Mapsfor High-fidelity Human Avatar Modeling

Анимируемые аватары человеков на гауссианах по исходному видео с нескольких ракурсов.
Из входного обучающего видео вытаскивает параметрические заготовки для вида спереди и со спины. Далее для динамического моделирования поз прикручен StyleGAN. Модель подстраивается под одежду, все дела.

И, конечно же,
Эксперименты показывают, что наш метод превосходит другие современные подходы



Код

#humanavatar #gaussian #videoto3D #video2avatar #poseto3D
🔥10🤯2
Уже пробовали Нейро?

#humor
😁42
OneDiff v1.0.0

Обновка ускорителя SD и SVD OneDiff
Ускорение генерации одной строчкой кода

Гитхаб

#text2image #text2video #tools
4
This media is not supported in your browser
VIEW IN TELEGRAM
Llama 3

Meta AI выпустили мощную языковую модель. Кроме того что она крутая и бесплатная, она еще умеет шустро рисовать. Но пока только для США

Попробовать здесь (включаем VPN США)
Альтернативная ссылка для всех (только генератор текста)

#assistant #chatbot #text2image #llm #vlm
👍5
ControlNet++: Improving Conditional Controlswith Efficient Consistency Feedback

Новый улучшенный контролнет.
Новый подход, который улучшает контроль генерации на уровне пикселей.

Доступны модели:
- LineArt
- Depth
- Segmentation
- Hed (SoftEdge)
- Canny

Код
Демо

#conditioning #image2image #text2image
👍82
Дисклеймер: я не поддерживаю ни фашизм, ни Гитлера, кейс считаю скандальным.

В Мичигане кто-то ухитрился всунуть изображение Гитлера на биллборд, да еще и написать ему зашифрованное поздравление. Биллборд находится на заправочной станции Marathon

Изображение, очевидно, сделано при помощи Controlnet.
Выглядит как поздравление некоего дяди Ади с 88 восхождением.
На реддите текст расшифровывают так:

88 - Hail Hitler (H - восьмая буква алфавита)
Adi - прозвище сами знаете кого
GDL - лига защиты язычников
GTV - “GoyimTV”, онлайн-видеоканал, управляемый GDL.
ХТ - Jon_Minadeo_II
WLM - White Lives Matter

реддит

#news
😁9🤡6😱5🍾1
Опубликован код конкурента InstanID, персонализатора FlashFace

Код
Колаб

#personalization #stylization #image2image
😁8👍41
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis

Новый метод дистилляции (ускорения) SD от ByteDance.
Сохраняет качество практически без потерь при сокращении шагов. Что позволяет делать генерацию по эскизу практически в реальном времени

Код/веса
Демо t2i
Демо Scribble

#optimization #text2image #image2image #realtime
10
AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation

Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.

Код

#assistant #agent
😁71
MoMA: Multimodal LLM Adapter for Fast PersonalizedImage Generation

Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.

Умеет редактировать контекст (погода, локация), текстуры.

От кого? Правильно, от ByteDance

Код
Модель

#text2image #text2image
🔥52