Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting
👍14🔥3
MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile
👍5😁1👨‍💻1
UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet
🔥8
Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)

Нравится картинка
Промпт:
real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview


Демо

#text2image #fluxc
👍91
UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)

Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики

Свободно комбинирует идентичности с разными объектами.

У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2

А прикручено собственно к UNO и OmniGen2

Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2

#personalization #referencing #text2image #image2image
👍8
Нейронавт | Нейросети в творчестве
Wan2.2-Fun-Reward-LoRAs Подтверждено, это релиз. + опубликовали Reward-LoRAs Reward LoRA можно использовать с базовой моделью #Wan22 и доработанными моделями (Wan2.2-Fun), что значительно повышает качество генерации видео Гитхаб воркфлоу - там же на гитхабе…
В чате трое включая меня отписались что воркфлоу не работает

Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.

воркфлоу
Видеоинструкция от автора воркфлоу

#workflow #controlnet #referencing #depth2video #pose2video #lora
👍7
В Сан-Франциско уже даже ИИ-агенты расклеивают объявлен6ия в поиске работы

#humor
😁5🤯1🥴1
CineScale;_4K_Text_to_Video_Generation_2160p_25fps_VP9_160kbit_Opus.webm
61 MB
CineScale: Free Lunch in High-Resolution Cinematic Visual Generation

Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества

— создаёт видео в разрешении 4K при минимальной настройке LoRA

— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении

В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами

Модельки маленькие, видимо лоры. Если есть A100 можете попробовать

Код

Спасибо @atttashe

#optimization #text2video #image2video #video2video
🔥72
Reve

Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI

— создаёт и ремиксит изображения

— редактирует изображения через простой текст

— объединяет элементы из разных изображений

— имеет редактор с перетаскиванием объектов -

— есть API

Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.

Вход через страны первого сорта

Подробнее у Сергея Цыпцына

Блог

#imageediting #referencing #GUI
👍6😁31