NEW BOT Телеграм, страница

Wan2.2 Day-0 Support in ComfyUI

Ну и спасибо разрабам, нативная поддержка новых моделей в #ComfyUI

5B работает на 8ГБ VRAM!

Доступны

Wan2.2-TI2V-5B: Text/Image to video, FP16

Wan2.2-I2V-A14B: Images to video, FP16/FP8

Wan2.2-T2V-A14B: Text to video, FP16/FP8

воркфлоу уже есть в официальном наборе (Workflow → Browse Templates → Video)

#text2video #image2video

👍21🔥5❤2

12.6K views12:46

Нейронавт | Нейросети в творчестве

Wan2.2_TI2V_5B-gguf

14B ждем

раз
два

#text2video #image2video #gguf

👍8🔥5❤1

2.7K views13:46

Нейронавт | Нейросети в творчестве

Wan2.2-I2V-A14B-GGUF

Там и воркфлоу лежит среди файлов

#text2video #image2video #gguf

👍8

2.37K views15:51

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Ускоряющая четырехшаговая лора WAN2.1-lightx2v работает с WAN2.2!

воркфлоу
лора

#text2video #lora #image2video #optimization #workflow

❤6👍2🔥2🤔1

2.45K views06:22

Нейронавт | Нейросети в творчестве

1:28

This media is not supported in your browser

VIEW IN TELEGRAM

Пока одни изобретают браузеры нового поколения, другие прикручивают ИИ-свистоперделки к старым

В Edge появился режим Copilot.
нейросеть группирует вкладки, пересказывает статьи, выполняет голосовые команды и подсказывает в нужный момент. Бесплатново. Но придется притвориться что вы не в России

#news #browser #agent

👀2❤1👍1😁1

1.56K views07:11

Нейронавт | Нейросети в творчестве

1:30

This media is not supported in your browser

VIEW IN TELEGRAM

JAM: A Tiny Flow-based Song Generator with Fine-grained Controllability and Aesthetic Alignment

Компактная модель для генерации песен из готовых текстов.

Основная фишка - позволяет точно контролировать, когда и как долго звучат слова и слоги в песне — можно подгонять вокал под нужный ритм. А также полный контроль над структурой песни - ну там когда куплеты когда припевы

На примерах да, контроль заметен, слова и акценты расставляет как человек

Код
Веса - 2 Гб

#music #text2music

👍5🔥1

1.75K views09:08

Нейронавт | Нейросети в творчестве

Music Arena

Арена / лидерборд генераторов музыки.
Можно поиграть с генерацией коротких кусочков. Мне сгенерил 11с и 30с
Лидерборд пока пуст

#text2music #leaderboard

👍7

1.87K views10:13

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Wan 2.2 понимает указания, нарисованные на первом кадре, как и VEO 3

Автор

#image2video #news

🔥18👍2😁1

2.78K views12:16

Нейронавт | Нейросети в творчестве

Wan 2.2 14B T2V (GGUF Q8) против Flux.1 Dev (GGUF Q8) в генерации картинок

Слева WAN, справа Flux
Автор не черрипикал, брал первые результаты.
WAN 2.2 полностью обратно совместим с лорами WAN 2.1 (так пишут)

Напомню, что не так давно сообщество заинтересовалось способностью видеогенераторов к созданию изображений

~~Скрипач~~ Flux не нужен?

воркфлоу
Реддит

#shootout #comparison #text2image

🔥21👍5❤2🥴1💯1

2.59K views13:22

Нейронавт | Нейросети в творчестве

ARC-Hunyuan-Video-7B

Пониматор коротких видео от Tencent

Одновременно обрабатывает картинку и звук.

Знает не только что происходит, но и когда.

Умеет делать подписи к видео с таймкодами, суммировать события, искать нужные моменты.

Код
Веса
Демо - вход по китайскому номеру 🤩

#vlm #assistant #video2text

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍2🤯2

2.06K viewsedited 15:51

Нейронавт | Нейросети в творчестве

1:47

Media is too big

VIEW IN TELEGRAM

ScenePainter: Semantically Consistent Perpetual 3D Scene Generation with Concept Relation Alignment

Генератор видео согласованных ракурсов сцены по одному исходному изображению

Выглядит как SD1.5, устаревше, а собака даже кринжово. Предположу что тут есть какие-то технические новшества, которые используют в других раболтах

Авторы использовали наработки WonderJourney, Break-A-Scene, Blended Diffusion, SAM

Код

#image2video #image2scene

👍2🔥1👀1

1.66K views17:21

Нейронавт | Нейросети в творчестве