NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

HDM (Home made Diffusion Model)

Минималистичный генератор изображений по тексту от автора Lycoris.

Обучать можно на обычном домашнем железе, рекомендован GPU от 6GB, Оперативка от 16GB

Использует особую архитектуру XUT с кросс-вниманием на 343M. Работает с текстовым энкодером Qwen3-0.6B. Итого на весь генератор около 1B параметров

Есть чекпойнты 512, 768 и 1024
Пишут что может создавать изображения размером и больше 1024×1024
Умеет работать с разными соотношениями сторон.

Позволяет «управлять камерой» при генерации: сдвигать изображение и масштабировать его.

Обучен на данных Danbooru2023, создаёт изображения в аниме-стиле.

Гитхаб
ComfyUI

#text2image #optimization #anime

👍12❤2🔥2

1.65K views08:11

Нейронавт | Нейросети в творчестве

Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting

👍14🔥3

1.93K views09:12

Нейронавт | Нейросети в творчестве

MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile

👍5😁1👨‍💻1

3.43K views10:13

Нейронавт | Нейросети в творчестве

UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet

🔥8

2.03K views11:14

Нейронавт | Нейросети в творчестве

Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)

Нравится картинка
Промпт:

real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview

Демо

#text2image #fluxc

👍9❤1

1.96K views12:16

Нейронавт | Нейросети в творчестве

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)

Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики

Свободно комбинирует идентичности с разными объектами.

У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2

А прикручено собственно к UNO и OmniGen2

Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2

#personalization #referencing #text2image #image2image

👍8

1.82K views13:16

About

Blog

Apps

Platform