NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution

Наш чатик принес прекрасное.
Повышение разрешения и четкости изображений реального мира.

Работает с текстовым промптом, для этого в демо есть LLAVA

Склонен в светлых областях съедать яркость. Это пока все к чему я могу придраться не считая лого Адидас

Код
Демо

Спасибо @iNevestenko

#superresolution #upscale #imagerestoration

🔥12👍5🤔1

2.08K views06:18

Нейронавт | Нейросети в творчестве

1:36

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI-Copilot: Your Intelligent Assistant for ComfyUI

В названии все сказано. Ассистент для #ComfyUI от Alibaba
Умеет дебажить-фиксить ошибки, переделывать воркфлоу. А и с нуля создавать воркфлоу тоже умеет. Опишет какая нода что делает, порекомендует ноду, модель.

Работает по API с LLM провайдерами.
Есть интеграция LMStudio для локальных LLM

Ура, товарищи!

Гитхаб

👍13🤔5❤1

2.31K views07:11

Нейронавт | Нейросети в творчестве

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing

Бесконечная болталка на основе Wan2.1. Ну и там еще kokoro под капотом.

Модель для дублирования видео с редкими ключевыми кадрами. Создает новые видео на основе исходного видео и аудиодорожки, синхронизируя не только губы, но и движения головы, позу тела и выражение лица с аудио.
Умеет оживлять картинку по звуку и без входного звука - так написано в гитхабе.

Более точная синхронизация губ и меньше искажений рук и тела по сравнению с MultiTalk.

Ребята поленились сделать сайт проекта с примерами, но похоже проект стоящий. На видео пример с реддита

Гитхаб
HF
Kijai
ComfyUI wrapper nodes for InfiniteTalk

#imageanimation #speech2video #chracteranimation #video2video #lipsync #dubbing #image2video

👍12❤2

2.33K views08:11

Нейронавт | Нейросети в творчестве

flymyai-lora-trainer

Поддерживает обучение лор Qwen-Image-Edit

Сделали первую лору Qwen Image Edit Inscene LoRA
В этой лоре:

🎯 Улучшена согласованность сцен во время редактирования
🎬 Улучшена работа с перспективой камеры
🎭 Улучшена последовательность действий в сценах
🧠 Улучшено понимание пространства

На примерах слева голая модель, справа с лорой

#qwenimage #lora #finetuning #tools

👍14❤2😁1

2.4K views10:13

Нейронавт | Нейросети в творчестве

Qwen-Image-DiffSynth-ControlNets

Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org

Поддержка контролнетов под Qwen в #ComfyUI же, да?

О нативной поддержке самого Qwen-Image написали вчера:

Qwen-Image-Edit ComfyUI Native Support

#news #controlnet

👍8🔥2

2.07K views13:25

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

PERSONA: Personalized Whole-Body 3D Avatar with Pose-Driven Deformations from a Single Image

Полный 3D аватар человека по одной картинке, управляемый позой - переносом движения с образца.

Код

Спасибо @m_franz

#humanavatar #characteranimation #pose2video

❤9👍2😁1

2.19K views16:28

Нейронавт | Нейросети в творчестве

2:31

This media is not supported in your browser

VIEW IN TELEGRAM

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Mirage 2

Новая версия генератора игровых миров игрового движка от Dynamycs Lab

Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.

Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.

Если персонаж затупил жмем Shift

Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc

Подрезал у @cgevent

#game #realtime #world #text2world

👍8

1.81K views06:20

Нейронавт | Нейросети в творчестве

2:51

Media is too big

VIEW IN TELEGRAM

Qoder

Агентная платформа для вайбкодинга от Alibaba

Понимает архитектуру проекта.

Есть два режима
Chat Mode - быстрые задачи в чате
Quest Mode - расписываем ТЗ и делегируем агенту

Есть бесплатный ограниченный тариф с двухнедельной триалкой Pro тарифа

Устанавливается локально #macos / #windows

#vibecoding #agent #coding #desktop

👍4❤1🔥1

1.65K views07:11

Нейронавт | Нейросети в творчестве

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

DeepSeek-V3.1 уже в официальном чате.

21 августа опубликовали релиз.

- гибридный вывод: два режима — Think (с мышлением) и Non-Think;

- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;

- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;

- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;

- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1

- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;

Попробовать в чате

#news #assistant

👍8❤1😁1

1.59K views08:11

Нейронавт | Нейросети в творчестве

Qwen-Image-DiffSynth-ControlNets Контролнеты от DyffSynth под #qwenimage лежат в репозитории Comfy-Org Поддержка контролнетов под Qwen в #ComfyUI же, да? О нативной поддержке самого Qwen-Image написали вчера: Qwen-Image-Edit ComfyUI Native Support #news…

А теперь и лора #qwenimage лежит в репозитории Comfy-Org

Похоже, понимает любые управляющие изображения, только не контролнет, а лора

qwen_image_union_diffsynth_lora

Реддит

#lora

👍9

2.08K views09:12

Нейронавт | Нейросети в творчестве

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Streaming Sortformer

Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.

Возможности модели:

- диаризация на уровне кадров с тегами (например, spk_0, spk_1);

- точные временные метки для каждого помеченного высказывания;

- отслеживание 2–4+ говорящих с минимальной задержкой;

- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.

Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает

HF

#ASR #speech2text #stt

👍10❤1🍌1

1.77K views10:13

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt

Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta

Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)

Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.

Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.

Код

#gaussian #novelview

👍9

1.75K views12:16

About

Blog

Apps

Platform