NEW BOT Телеграм, страница

SteadyDancer : Harmonized and Coherent Human Image Animation with First-Frame Preservation

Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.

Построен на базе Wan2.1-I2V-14B-480P

HF

#characteranimation #image2video

🔥8👍2

1.7K views07:11

Нейронавт | Нейросети в творчестве

1:05

This media is not supported in your browser

Retake

В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:

- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку

- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование

- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.

Оплату берут только за те секунды видео, которые были изменены.

#videoediting

👍9🔥6

1.86K views08:11

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Moondream Segmentation

У Moondream новая функция - SVG сегментация

Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.

Побивает Gemini Flash 2.5, SAM3 на бенчах

Работает и для видео — нужно просто применять её к каждому кадру

Попробовать

#segmentation #noscript #image2noscript #image2mask

👍8

1.87K views09:12

Нейронавт | Нейросети в творчестве

1:28

This media is not supported in your browser

VIEW IN TELEGRAM

iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation

Универсальный динамичный мультигенератор картинок
Работает по принципу many-to-many, то есть может принимать несколько исходных изображений и генерировать на их основе несколько выходных изображений с учётом текстового запроса.

— умеет редактировать изображения: менять фон, цвет объектов, стиль, добавлять или удалять элементы

— создает картинки, сохраняя идентичность и стиль нескольких эталонных изображений

— комбинирует эталонные изображения с управляющими сигналами (карты глубины, OpenPose, Canny) для контролируемой генерации

— переносит художественные стили на контент, сохраняя его структуру

— меняет ракурс в сцене

— генерирует последовательные раскадровки из референсов персонажей с описаниями сюжета.

Гитхаб
HF

#referencing #text2image #image2image #imageediting

👍8

1.64K views10:13

Нейронавт | Нейросети в творчестве

Z-Image

Авторы наконец допилили сайт проекта, теперь все по красоте

И главное - Z-Image можно запустить в бесплатном колабе (не проверял)

#text2image #imageediting #colab

👍7

1.66K viewsedited 10:43

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Topaz's Flagship Upscale Models in ComfyUI

Топаз завезли в комфи.
Объясняю понятным языком: платно, в API ноды

для видео:

- Video Upscale (до 4K)

- Starlight Fast — повышение чёткости видео с помощью диффузионной технологии

- Starlight Creative (Astra) — творческое улучшение видео

- Apollo — интерполяция кадров

для изображений:

- Image Enhance (до 8K)

- Bloom (Reimagine) — креативное улучшение и переработка изображений

#upscale #comfyui #upscalevideo #imagerestoration #frameinterpolation

👍8😁2🤔1

1.76K viewsedited 11:14

Нейронавт | Нейросети в творчестве

ComfyUI-TBG-SAM3

Сегментатор SAM 3 прикрутили в #ComfyUI

воркфлоу

#segmentation #image2depth #workflow

❤8👍6

2.02K views12:16

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI-PainterFLF2V

Улучшает динамику генерации WAN, делая движения более плавными и естественными. Динамически усиленная версия оригинальной ноды для генерации по первому-последнему кадру

#wan #comfyui #FLF2V

👍18

2K views13:16

Нейронавт | Нейросети в творчестве

Sa2VA-Qwen3-VL-4B ByteDance выпустил Sa2VA на Qwen3-VL-4B Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео Гитхаб #segmentation #vlm #assistant #video2text #vide2mask #captiopning

Sa2VA-Qwen3-VL-2B

ByteDance выпустил сегментатор Sa2VA на Qwen3-VL-2B
4B было тут
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео

Гитхаб

#segmentation #vlm #assistant #video2text #vide2mask #captiopning

huggingface.co

ByteDance/Sa2VA-Qwen3-VL-2B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍6🔥2

1.72K views14:32

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

BlockVid: Block Diffusion for High-Fidelity and Coherent Minute-Long Video Generation

Очередной 'enlarge your video'

Видеогенератор высокой чёткости и с хорошей связностью длительностью до минуты от Alibaba.
Много архитектурных ухищрений придумали.
Кода, моделей нет

Зато есть основанный на той же папире

Inferix - движок нового поколения для синтеза иммерсивных миров на базе Wan-1.3B. А по сути - потоковый видеогенератор длинных интерактивных видео. То есть, сюжетом можно управлять на лету

Поддерживает Self Forcing, CausVid, MAGI-1

Гитхаб - тут хоть почти весь функционал еще в планах, но уже не просто красивая статья, а репозиторий в работе.

#text2video #streaming #interactive #longvideo

👍10❤2

1.86K views15:18

Нейронавт | Нейросети в творчестве

Prompting Guide - FLUX.2

Официальный гайд по промптингу Flux.2

Основное:

- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения

- позволяет использовать HEX-коды для точного подбора цветов

- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать

- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты

- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.

#guide #prompting

👍8❤7🥴1

10.6K views16:46

About

Blog

Apps

Platform