Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и демоспейс, где можно потестить генератор глубины для видео Depth Any Video

Демо HF
Демо replicate

#video2depth
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
Interactive Character Control with Auto-Regressive Motion Diffusion Models

Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?

Код
Видео от 2-минутного доктора

#humananimation #characteranimation #animatoin #realtime
👍7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Desktop V1

Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux

Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.

Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.

Forge, A1111 - ваш ход?

Записаться в вейтлист

#news #comfyUI
🔥24🥴2👍1
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities

Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)

А где же подвох подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256

В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).

На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?

Код
Колаб

#news #text2image #image2image #inpainting #outpainting #imageediting #image2text
🤔41👍1
Arch-Guard

От взлома языковых моделей защищаются всерьез.

Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.

Война технологий продолжается

#news #jailbreak
😁3👀3
This media is not supported in your browser
VIEW IN TELEGRAM
Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе

#humor #news
😁42🎃4😭3
Stable Diffusion 3.5

Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.

Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября

Уже поддерживается в ComfyUI

Модель HF
Гитхаб

Демо HF
API
Replicate

#text2image #news
🔥12👀1
Итак, кастомизация SD3.5

Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM

Официальный гайд

готовые лоры:
раз
два
три
———————————
Примеры ComfyUI

———————————
SD3.5-fp8 (пожатая модель)

Спионерил у @SergeyTsyptsyn

#lora #text2image #comfyui #finetuning
🔥5👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Mochi 1

Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)

Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)

#text2video
👍16😱31👏1🤡1
JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning
👍31
OmniGen: Unified Image Generation

Новый генератор изображений. По тексту не выдает ничего интересного. Но главная его суперсила - он принимает на вход и картинки тоже. Картинки с описанием что с ними нужно сделать.

И вот тут можно развернуться, и он может сделать красиво. Мне выпал счастливый билет, второй день не могу получить из демо ни одной картинки, так что примеры с гитхаба

Для 1024*1024 жрет порядка 24Гб VRAM. Это не предел, если что. Ну и на скорость не рассчитывайте.

Код
Демо

#text2image #image2image #personalization #multimodal2image
👍41
Motion Inversion for Video Customization

Генерация видео с движением, заданным другим видео. Качество картинки не впечатляет. В демо на выбор несколько разных чекпойнтов под разные движения камеры. Это мне что, под каждое движение камеры нужен будет отдельный чекпойнт? неудобно

Код
Демо

#text2video #motion2video
👍51🔥1