NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Qwen-Image-DiffSynth-ControlNets Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org Поддержка контролнетов под Qwen в #ComfyUI же, да? О нативной поддержке самого Qwen-Image написали вчера: Qwen-Image-Edit ComfyUI Native Support #news…

А теперь и лора #qwenimage лежит в репозитории Comfy-Org

Похоже, понимает любые управляющие изображения, только не контролнет, а лора

qwen_image_union_diffsynth_lora

Реддит

#lora

👍9

2.08K views09:12

Нейронавт | Нейросети в творчестве

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Streaming Sortformer

Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.

Возможности модели:

- диаризация на уровне кадров с тегами (например, spk_0, spk_1);

- точные временные метки для каждого помеченного высказывания;

- отслеживание 2–4+ говорящих с минимальной задержкой;

- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.

Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает

HF

#ASR #speech2text #stt

👍10❤1🍌1

1.77K views10:13

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt

Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta

Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)

Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.

Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.

Код

#gaussian #novelview

👍9

1.75K views12:16

Нейронавт | Нейросети в творчестве

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

Raylight

МультиGPU в #ComfyUI

Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей

Не тестировано на Windows

спасибо @nightkraw13r

#optimization #gpu

🔥6👍2

1.87K views14:46

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

This media is not supported in your browser

VIEW IN TELEGRAM

ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling

3D-реконструкция человека от запрещенной Meta по одной картинке, видео или 3D скану.

Разделяет скелет и внешнюю поверхность тела, чтобы отдельно настраивать форму тела и параметры скелета. Может изменять параметры скелета, например, увеличивать ширину плеч или длину рук, сохраняя реалистичность изображения.

На выходе меши, рендер, параметрические фигуры с позами

Код ждем

#humanreconstruction #imageto3D #videoto3d

👍11🔥7❤1

1.93K views07:12

Нейронавт | Нейросети в творчестве

Друзья, произошла нештатная ситуация.
У меня мало мемов, помогите!

#humor

😁13👍1

1.73K views14:17

Нейронавт | Нейросети в творчестве

Аттракцион невиданной щедрости 🚩

Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных

У вас есть три желания, не продешевите!

Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта

Забрать 3 бесплатных видео

#text2video #image2video #giveaway

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤1😁1

2.62K views16:13

Нейронавт | Нейросети в творчестве

Культовые фотографии + редактирующая модель + немного фантазии

Кидайте в комменты работы которые вам понравились

Реддит

Админ на выходных

👍18

1.69K views13:11

About

Blog

Apps

Platform