Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.42K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
SkyReels V2

Новая версия видеогенератора, умеет делать "бесконечные" видео

Выпущены модели 1.3B / 5B / 14B и код

Первая модель с открытым весом, конкурирующая с Sora, Kling и Veo2 на VBench и human evals


Генерация сюжета, генерация видео по картинке, управление камерой (эта модель будет позже), синтез видео из заданных элементов

Гитхаб
Веса
Попробовать (попробуйте создать новый аккаунт если на старом нет кредитов)
————————————

SkyCaptioner-V1

Кэпшнер от SkyReels - модель для структурного текстового описания видео

Веса
Демо ждем

#text2video #image2video #video2text #captioning #text2movie
🔥15👍31
Новый драйвер Nvidia 576.02 может сжечь вашу видеокарту

Я просто паникер, поэтому сам не проверял

Новый драйвер Nvidia перестает обновлять данные с датчика температуры и не включает кулер даже при максимальной нагрузке

Безопасные версии драйверов:
для серий 30xx и 40xx - 566.36
для 50xx - 572.83

#news #driver #gpu #лучшеперебздетьчемнедобздеть
🔥9👌2👏1😁1🥴1
FramePack LoRa

Экспериментальная попытка прикрутить лору к FramePack. Последний основан на Hunyuan, поэтому попытка не бессмысленная.

Автор обучил лору на китайских боевиках 70-х

Первое видео - оригинальное видео

Второе - попытка воспроизвести резкое панорамирование оригинальным FramePack

Третье - FramePack с лорой

Похоже, что их можно подружить

Форк FramePack с поддержкой лоры
—————————————

Кстати, в FramePack можно разбивать промпт по тайкодам

1) в сборке от Neurogen
2) в FramePack Studio

#prompting #image2video #lora
👍52
Media is too big
VIEW IN TELEGRAM
MAGI-1

Новый видеогенератор длинных видео в опенсорсе
Две модели: 24B и 1.5B. Последняя вероятно запустится на RTX 4090


Попробовать можно онлайн, там насыпают кредитов

Попробовать
Веса
Код

#text2video #image2video
👍8
Media is too big
VIEW IN TELEGRAM
Vidu Q1

Обновка видеогенератора

1080p
Обещают четкую картинку, кинематографичные переходы, звуковые эффекты синхронизированные с видео

При регистрации нового аккаунта с промокодом VIDUQ1
дают 100 приветственных кредитов (мне дали 180 😕).

А за лайк видео в твиттере можно выиграть 600 кредитов и что-то там еще

[update] после трех генераций требует подписку

#text2video #image2video #video2sound #sfx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3😱1💩1
This media is not supported in your browser
VIEW IN TELEGRAM
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Это Flux Fill обученный на матрицах входных изображений.

Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.

Разрешение входных изображений в матрицах при обучении 384x384 пикселя

Много примеров на гитхабе и в демоспейсе

Очень интересно какое применение вы ему найдете?

Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA

Код
Демо
HF

#referencing #image2image #conditioning #text2image
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
DIA

Голосовая модель 1.6B параметров от Nari Labs.
Создана командой из 2 человек.
Послушайте как она умеет в эмоции в сравнении с Elevenlabs и Cesame

Есть управление эмоциями и тоном через входное аудио. Модель умеет создавать смех, кашель, прочищение горла и т.д.

Код
Демо
Демо 2
Колаб
Записаться в вейтлист более мощной модели

#tts #text2speech
🔥10👍41
PartField: Learning 3D Feature Fields for Part Segmentation and Beyond

Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах

Код

#segmentation #gaussian #3dsegmentation
🔥5
CoMotion: Concurrent Multi-person 3D Motion

Отслеживание и реконструкция 3D поз нескольких человек на видео от Apple

Код
Веса

#video2pose #humanreconstruction #video2mesh
👍7
UFO²: The Desktop AgentOS

Десктопный ИИ-агент от Microsoft
Работает в песочнице, так что ваш монитор не занят.
Выбирает для взиамодействия родные API если они доступны

Код
Документация

#agent #desktop
👍4👏2
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation

Генератор видео по одной картинке от Alibaba.
С контролем камеры и движения человеков. Утверждают что именно контроль камеры и движение человеков у них лучше всех

Код ждем

#image2video #cameracontrol #motioncontrol
👍91