NEW BOT Телеграм, страница

Kumori CLI Engine: A Python automation using InstantID and HuggingFace/Diffusers

автоматическое создание изображений с заданным персонажем по референсу на базе InstantID

Гитхаб

#text2image #image2image #stylization #personalization

🔥5❤3👍1

1.48K views06:57

0:14

Stylus: Automatic Adapter Selection for Diffusion Models

Автоматический выбор адаптеров (Lora) для диффузных генераторов. Сам на основе промпта подбирает подходящие Lora для генерации изображения.

Два раза одно и то же написал, получается. Ну со второго же раза стало понятнее, да?

Код

#finetuning #adapter

👍17😁2❤1

1.71K views07:53

0:59

Gen Dino Runner

В честь Дня динозавров гугл обновил свою браузерную миниигру, теперь вместо динозаврика можно сгенерить своего персонажа и препятствия

#news #gaming

🤯12👍4😁1

1.5K viewsedited 14:49

0:16

Пришло письмо с доступом в Morph Studio
У них теперь есть веб интерфейс.
Интересно, удастся ли выжать из нее что-нибудь интересное. Качество не впечатляет. Будем надеяться что качество подтянут. Зато есть какой-никакой интерфейс
Поделюсь ссылкой (не уверен что доступ дают всем без документов, но попробуйте):

Го тестить

#text2video

🔥5

1.66K views15:21

Forwarded from Psy Eyes (Andrey Bezryadin)

1:10

На HuggingFace появилась фича Use this model для запуска LLM и Text-2-Image моделей у себя локально через желаемый софт.

В настройках хаггинг аккаунта заходим в раздел Local Apps and Hardware. Можно здесь задать своё железо, но на фильтрацию AI-приложений похоже это не влияет. Я с ноута, где стоит двухгиговая 1050 запустил ламу 3 в Jan, всё ок.

Ставим галочки на софте, который вы используете для того, чтобы гонять модели локально. Для работы с текстом поддерживаются llama.cpp, LM Studio, Jan, Backyard AI. С картинками пока только Draw Things и, скоро, DiffusionBee, но они обе только на мак.

Нажимаем Browse Compatible Models —> выбираем приглянувшуюся нейронку —> кликаем Use this model в правом верхнем углу —> выбираем в каком софте запустить, и через диплинк в нём откроется окно для загрузки модели. Можно и просто исследуя хаггинг открыть понравившуюся нейронку нажав Use this model.

Доступны, в основном, квантизированные GGUF версии, которые можно скачать либо целиком, либо они состоят из нескольких частей и для работы понадобится скачать их все как архив из множества кусков (они обычно подписаны part_N). Чтобы понять какую модель грузить, можно глянуть страницу с описанием на хаггинге, если там про это есть. В противном случае качайте, то что как вам кажется нормально запуститься в памяти вашей видюхи. Как только модель загружена — можно генерить.

Если вы пилите своё приложение для запуска локальных моделей, то нажав Suggest a new local app вы можете предложить добавить его в список.

👍6❤1

1.41K views16:40

0:51

Пост превосходства отечественного ИИ.

Говорят, ChatGPT жалок в камень-ножницы-бумага. Проверил - и правда. А потом проверил Алису. К Алисе на хромой козе не подкатишь.

#humor

😁23❤2👏2💩2👎1

1.48K views07:25

0:14

Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control

Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный

Код
Демо

#personalization #image2image

👍14😁2

1.75K viewsedited 05:08

Опубликован официальный код адаптера материалов ZeST

Ждем в ComfyUI/A1111

Код
Демо

#material #image2image

ZeST: Zero-Shot Material Transfer from a Single Image

Перенос материала с одного изображения на другое без дообучения

Код

#material #image2image

👍8🔥1

1.5K views06:59

DeepSeek-VL

Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.

Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.

Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб

Гитхаб
HF
Демо

#chatbot #assistant

👍11🔥2

1.5K viewsedited 07:43

0:06

ReVideo: Remake a Video with Motion and Content Control

Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan

Код обещают в июне

#video2video

👍9

1.33K views06:29

Forwarded from Эксплойт

6:36

Media is too big

Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».

Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.

Специально для вас сделали перевод на русский язык.

@exploitex

🔥25👎2👍1

918 views06:35

DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.

Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения

Код

#text2image

👍7

1.23K views07:23