Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning

Что-то похожее на LoRA для LLM, но более лучшее.
Ждем в ComfyUI?

Гитхаб

#finetuning
👍7
Kumori CLI Engine: A Python automation using InstantID and HuggingFace/Diffusers

автоматическое создание изображений с заданным персонажем по референсу на базе InstantID

Гитхаб

#text2image #image2image #stylization #personalization
🔥53👍1
Stylus: Automatic Adapter Selection for Diffusion Models

Автоматический выбор адаптеров (Lora) для диффузных генераторов. Сам на основе промпта подбирает подходящие Lora для генерации изображения.

Два раза одно и то же написал, получается. Ну со второго же раза стало понятнее, да?

Код

#finetuning #adapter
👍17😁21
This media is not supported in your browser
VIEW IN TELEGRAM
Gen Dino Runner

В честь Дня динозавров гугл обновил свою браузерную миниигру, теперь вместо динозаврика можно сгенерить своего персонажа и препятствия

#news #gaming
🤯12👍4😁1
Пришло письмо с доступом в Morph Studio
У них теперь есть веб интерфейс.
Интересно, удастся ли выжать из нее что-нибудь интересное. Качество не впечатляет. Будем надеяться что качество подтянут. Зато есть какой-никакой интерфейс
Поделюсь ссылкой (не уверен что доступ дают всем без документов, но попробуйте):

Го тестить

#text2video
🔥5
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
На HuggingFace появилась фича Use this model для запуска LLM и Text-2-Image моделей у себя локально через желаемый софт.

В настройках хаггинг аккаунта заходим в раздел Local Apps and Hardware. Можно здесь задать своё железо, но на фильтрацию AI-приложений похоже это не влияет. Я с ноута, где стоит двухгиговая 1050 запустил ламу 3 в Jan, всё ок.

Ставим галочки на софте, который вы используете для того, чтобы гонять модели локально. Для работы с текстом поддерживаются llama.cpp, LM Studio, Jan, Backyard AI. С картинками пока только Draw Things и, скоро, DiffusionBee, но они обе только на мак.

Нажимаем Browse Compatible Models —> выбираем приглянувшуюся нейронку —> кликаем Use this model в правом верхнем углу —> выбираем в каком софте запустить, и через диплинк в нём откроется окно для загрузки модели. Можно и просто исследуя хаггинг открыть понравившуюся нейронку нажав Use this model.

Доступны, в основном, квантизированные GGUF версии, которые можно скачать либо целиком, либо они состоят из нескольких частей и для работы понадобится скачать их все как архив из множества кусков (они обычно подписаны part_N). Чтобы понять какую модель грузить, можно глянуть страницу с описанием на хаггинге, если там про это есть. В противном случае качайте, то что как вам кажется нормально запуститься в памяти вашей видюхи. Как только модель загружена — можно генерить.

Если вы пилите своё приложение для запуска локальных моделей, то нажав Suggest a new local app вы можете предложить добавить его в список.
👍61
Пост превосходства отечественного ИИ.

Говорят, ChatGPT жалок в камень-ножницы-бумага. Проверил - и правда. А потом проверил Алису. К Алисе на хромой козе не подкатишь.

#humor
😁232👏2💩2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control

Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный

Код
Демо

#personalization #image2image
👍14😁2
DeepSeek-VL

Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.

Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.

Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб

Гитхаб
HF
Демо

#chatbot #assistant
👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ReVideo: Remake a Video with Motion and Content Control

Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan

Код обещают в июне

#video2video
👍9
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».

Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.

Специально для вас сделали перевод на русский язык.

@exploitex
🔥25👎2👍1
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.

Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения

Код

#text2image
👍7
CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner

Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме

Обучен на персонажах, с ними будут и лучшие результаты

Код
Демо

#imageto3d
8