Stylus: Automatic Adapter Selection for Diffusion Models
Автоматический выбор адаптеров (Lora) для диффузных генераторов. Сам на основе промпта подбирает подходящие Lora для генерации изображения.
Два раза одно и то же написал, получается. Ну со второго же раза стало понятнее, да?
Код
#finetuning #adapter
Автоматический выбор адаптеров (Lora) для диффузных генераторов. Сам на основе промпта подбирает подходящие Lora для генерации изображения.
Два раза одно и то же написал, получается. Ну со второго же раза стало понятнее, да?
Код
#finetuning #adapter
👍17😁2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Gen Dino Runner
В честь Дня динозавров гугл обновил свою браузерную миниигру, теперь вместо динозаврика можно сгенерить своего персонажа и препятствия
#news #gaming
В честь Дня динозавров гугл обновил свою браузерную миниигру, теперь вместо динозаврика можно сгенерить своего персонажа и препятствия
#news #gaming
🤯12👍4😁1
Пришло письмо с доступом в Morph Studio
У них теперь есть веб интерфейс.
Интересно, удастся ли выжать из нее что-нибудь интересное. Качество не впечатляет. Будем надеяться что качество подтянут. Зато есть какой-никакой интерфейс
Поделюсь ссылкой (не уверен что доступ дают всем без документов, но попробуйте):
Го тестить
#text2video
У них теперь есть веб интерфейс.
Интересно, удастся ли выжать из нее что-нибудь интересное. Качество не впечатляет. Будем надеяться что качество подтянут. Зато есть какой-никакой интерфейс
Поделюсь ссылкой (не уверен что доступ дают всем без документов, но попробуйте):
Го тестить
#text2video
🔥5
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
На HuggingFace появилась фича Use this model для запуска LLM и Text-2-Image моделей у себя локально через желаемый софт.
В настройках хаггинг аккаунта заходим в раздел Local Apps and Hardware. Можно здесь задать своё железо, но на фильтрацию AI-приложений похоже это не влияет. Я с ноута, где стоит двухгиговая 1050 запустил ламу 3 в Jan, всё ок.
Ставим галочки на софте, который вы используете для того, чтобы гонять модели локально. Для работы с текстом поддерживаются llama.cpp, LM Studio, Jan, Backyard AI. С картинками пока только Draw Things и, скоро, DiffusionBee, но они обе только на мак.
Нажимаем Browse Compatible Models —> выбираем приглянувшуюся нейронку —> кликаем Use this model в правом верхнем углу —> выбираем в каком софте запустить, и через диплинк в нём откроется окно для загрузки модели. Можно и просто исследуя хаггинг открыть понравившуюся нейронку нажав Use this model.
Доступны, в основном, квантизированные GGUF версии, которые можно скачать либо целиком, либо они состоят из нескольких частей и для работы понадобится скачать их все как архив из множества кусков (они обычно подписаны part_N). Чтобы понять какую модель грузить, можно глянуть страницу с описанием на хаггинге, если там про это есть. В противном случае качайте, то что как вам кажется нормально запуститься в памяти вашей видюхи. Как только модель загружена — можно генерить.
Если вы пилите своё приложение для запуска локальных моделей, то нажав Suggest a new local app вы можете предложить добавить его в список.
В настройках хаггинг аккаунта заходим в раздел Local Apps and Hardware. Можно здесь задать своё железо, но на фильтрацию AI-приложений похоже это не влияет. Я с ноута, где стоит двухгиговая 1050 запустил ламу 3 в Jan, всё ок.
Ставим галочки на софте, который вы используете для того, чтобы гонять модели локально. Для работы с текстом поддерживаются llama.cpp, LM Studio, Jan, Backyard AI. С картинками пока только Draw Things и, скоро, DiffusionBee, но они обе только на мак.
Нажимаем Browse Compatible Models —> выбираем приглянувшуюся нейронку —> кликаем Use this model в правом верхнем углу —> выбираем в каком софте запустить, и через диплинк в нём откроется окно для загрузки модели. Можно и просто исследуя хаггинг открыть понравившуюся нейронку нажав Use this model.
Доступны, в основном, квантизированные GGUF версии, которые можно скачать либо целиком, либо они состоят из нескольких частей и для работы понадобится скачать их все как архив из множества кусков (они обычно подписаны part_N). Чтобы понять какую модель грузить, можно глянуть страницу с описанием на хаггинге, если там про это есть. В противном случае качайте, то что как вам кажется нормально запуститься в памяти вашей видюхи. Как только модель загружена — можно генерить.
Если вы пилите своё приложение для запуска локальных моделей, то нажав Suggest a new local app вы можете предложить добавить его в список.
👍6❤1
Пост превосходства отечественного ИИ.
Говорят, ChatGPT жалок в камень-ножницы-бумага. Проверил - и правда. А потом проверил Алису. К Алисе на хромой козе не подкатишь.
#humor
Говорят, ChatGPT жалок в камень-ножницы-бумага. Проверил - и правда. А потом проверил Алису. К Алисе на хромой козе не подкатишь.
#humor
😁23❤2👏2💩2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control
Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный
Код
Демо
#personalization #image2image
Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный
Код
Демо
#personalization #image2image
👍14😁2
Опубликован официальный код адаптера материалов ZeST
Ждем в ComfyUI/A1111
Код
Демо
#material #image2image
Ждем в ComfyUI/A1111
Код
Демо
#material #image2image
Telegram
Нейронавт | Нейросети в творчестве
ZeST: Zero-Shot Material Transfer from a Single Image
Перенос материала с одного изображения на другое без дообучения
Код
#material #image2image
Перенос материала с одного изображения на другое без дообучения
Код
#material #image2image
👍8🔥1
DeepSeek-VL
Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.
Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.
Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб
Гитхаб
HF
Демо
#chatbot #assistant
Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.
Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.
Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб
Гитхаб
HF
Демо
#chatbot #assistant
👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ReVideo: Remake a Video with Motion and Content Control
Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan
Код обещают в июне
#video2video
Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan
Код обещают в июне
#video2video
👍9
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».
Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.
Специально для вас сделали перевод на русский язык.
@exploitex
Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.
Специально для вас сделали перевод на русский язык.
@exploitex
🔥25👎2👍1
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis
Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.
Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения
Код
#text2image
Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.
Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения
Код
#text2image
👍7
CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме
Обучен на персонажах, с ними будут и лучшие результаты
Код
Демо
#imageto3d
Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме
Обучен на персонажах, с ними будут и лучшие результаты
Код
Демо
#imageto3d
❤8
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехал демоспейс CameraCtrl
1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!
Не удалось заставить ее обработать мою картинку, только примеры с демоспейса
Демо
#text2video #conditioning
1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!
Не удалось заставить ее обработать мою картинку, только примеры с демоспейса
Демо
#text2video #conditioning
👍7😐1