NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Awesome-Nano-Banana🍌-images

репозиторий с 68 кейсами использования Nano-Banana.
Промпты прилагаются

#prompting #imageediting

👍14🔥3

1.93K views09:12

Нейронавт | Нейросети в творчестве

MobileLLM-R1

Семейство языковых моделей меньше 1B параметров от запрещенных Meta AI.

Модели оптимизированы для использования на устройствах и отличаются высокой производительностью при относительно небольшом размере.

— Модель решает математические задачи.

— Помогает писать код.

— Справляется с научными задачами.

— Показывает хорошие результаты в тестах.

— Лучше некоторых больших моделей, хотя сама меньше по размеру.

— Её можно дообучать и использовать для исследований.

#assistant #mobile

👍5😁1👨‍💻1

3.43K views10:13

Нейронавт | Нейросети в творчестве

UFC: Universal Few-Shot Spatial Control for Diffusion Models

Новый метод обучения контролнета для любой диффузной генерилки на 30 примерах от KAIST

В исследовании обучали адаптеры для SD1.5 и SD v3.5-medium, есть HF но суть в том что так можно сделать адаптеры для любых диффузных генераторов на маленьком датасете

#controlnet

🔥8

2.03K views11:14

Нейронавт | Нейросети в творчестве

Есть демоспейс SRPO (Файнтюн Flux-dev от Tencent-Hunyuan с улучшенным реализмом и эстетикой)

Нравится картинка
Промпт:

real life photo of a fantasy Fish straight-walking from left to right in a human megapolis along the walkway as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguisewe can see the Fish's face thought the helmet's visor. People on the street are reacting to the unseen creature. masterpiece, wide view, distant view, sideview

Демо

#text2image #fluxc

👍9❤1

1.96K views12:16

Нейронавт | Нейросети в творчестве

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Еще один персонализатор-кастомизатор картинок от ByteDance из семейства UXO (UMO, USO и UNO)

Сохраняет идентичность при работе с несколькими референсными изображениями и снижает путаницу между ними за счет измерения оной путаницы с помощью новой метрики

Свободно комбинирует идентичности с разными объектами.

У них там внутри ByteDance должна быть нешуточная конкуренция ибо сравнивают свою модель с UNO, DreamO, OmniGen2

А прикручено собственно к UNO и OmniGen2

Гитхаб
HF
Демо UMO-UNO
Демо UMO-OmniGen2

#personalization #referencing #text2image #image2image

👍8

1.82K views13:16

Нейронавт | Нейросети в творчестве

Wan2.2-Fun-Reward-LoRAs Подтверждено, это релиз. + опубликовали Reward-LoRAs Reward LoRA можно использовать с базовой моделью #Wan22 и доработанными моделями (Wan2.2-Fun), что значительно повышает качество генерации видео Гитхаб воркфлоу - там же на гитхабе…

В чате трое включая меня отписались что воркфлоу не работает

Короче есть воркфлоу который работает с GGUF и safetensots Wan2.2-VACE-Fun
Только пишут что VACE-Fun это не оригинальный VACE.
И результаты он выдает даже хуже чем обычный Fun-Control. Ну или руки у меня кривые.

воркфлоу
Видеоинструкция от автора воркфлоу

#workflow #controlnet #referencing #depth2video #pose2video #lora

YouTube

Vace 2.2 Wan 2.2 Fun Vace Video to Video with photo reference. Video Outpainting GGUF. Best AI Guide

Wan 2.2 Fun Vace GGUF ComfyUI best workflow. Learning AI easy Tutorial. Image to video and video to video AI with image reference. avatar, AI animation. opensource video generator. Outpaint your image to video. Make your own pose to video with Vace. Installation…

👍7

2.29K views14:17

Нейронавт | Нейросети в творчестве

В Сан-Франциско уже даже ИИ-агенты расклеивают объявлен6ия в поиске работы

#humor

😁5🤯1🥴1

1.75K views15:18

Нейронавт | Нейросети в творчестве

CineScale;_4K_Text_to_Video_Generation_2160p_25fps_VP9_160kbit_Opus.webm

61 MB

CineScale: Free Lunch in High-Resolution Cinematic Visual Generation

Метод повышения разрешения генерации изображений и видео от Netflix.
Использует специальные подходы для устранения повторяющихся паттернов и повышения качества

— создаёт видео в разрешении 4K при минимальной настройке LoRA

— позволяет редактировать визуальные материалы с предварительным просмотром в низком разрешении

В качестве базовых моделей использовали Wan2.1 1.3B и 14B
Для инференса в 3К нужна A100, а в 4K - их нужно 8. Так что порешали проблемы с картинкой (см примеры на сайте) но не с вычислительными ресурсами

Модельки маленькие, видимо лоры. Если есть A100 можете попробовать

Код

Спасибо @atttashe

#optimization #text2video #image2video #video2video

🔥7❤2

1.7K views06:07

Нейронавт | Нейросети в творчестве

1:20

Media is too big

VIEW IN TELEGRAM

Reve

Обновился сервис создания и редактирования изображений. Теперь это контекстный редактор, конкурент Банана, QIE и иже с ними. Умеет все то что умеют конкуренты, но у него еще есть GUI

— создаёт и ремиксит изображения

— редактирует изображения через простой текст

— объединяет элементы из разных изображений

— имеет редактор с перетаскиванием объектов -

— есть API

Есть бесплатный тариф, каждый день насыпают новый лимит. Но сколько - не признаются.

Вход через страны первого сорта

Подробнее у Сергея Цыпцына

Блог

#imageediting #referencing #GUI

👍6😁3❤1

1.66K views07:11

About

Blog

Apps

Platform