Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Great Same New (Sasha Melentev)
Dataset Maker

Для ИИ-актрисы создания этот ComfUI скрипт генерит в один присест из одной фотографии человека 104 другие фотографии этого же человека с разных ракурсов и в разном освещении. Вишенка на троте - скрипт еще делает описание каждой новой фотографии, что удобно для последующей тренировки лоры или fine-tune'a.
Сразу же указать триггерное слово тоже можно.

Под капотом:
- Qwen Edit меняет ракурс, потом происходит апскейл и деблюр - картинка становится "в фокусе", потом - разгон на детали для большего реализма.
- Описание генерится через Mistral, будет нужен свой токен на этом сайте.

Системный промт. Вместо trigger_word нужно вставить свой.

Describe the character in picture, describe the characteristics of the face, jewelry, clothing, hairstyle, pose, where they are looking. Make the character's name is [trigger_word]. For example, “this is a photo of trigger_word in a white blazer, with a glass in the hand against a backdrop of rocky mountains.”
Write your denoscription in one sentence, no more than 38 words.


Из одной фотографии, Карл! Скрипто в комментариях по ссылке:
https://news.1rj.ru/str/GreatSameNew/255?comment=744

#Tools
🔥201
StealthAttack: Robust 3D Gaussian Splatting Poisoning via Density-Guided Illusions

Метод атаки на гауссовы сцены, который позволяет внедрять иллюзорные объекты, чтобы они были видны только с определённых ракурсов, минимально влияя на вид с других углов.

Одно из применений - вотермарк

Код

#gaussian
👍5😁5👎2😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Code2Video: Video Generation via Code

Агентный фреймворк для генерации образовательных видео с помощью исполняемого Python-кода. Модель позволяет создавать профессиональные образовательные видео, которые требуют предметных знаний, точной визуальной структуры и согласованных переходов.

Code2Video состоит из трёх сотрудничающих агентов:

Planner: структурирует лекционный контент и подготавливает соответствующие визуальные активы

Coder: преобразует структурированные инструкции в исполняемый Python-код

Critic: использует VLM для уточнения пространственной компоновки и обеспечения ясности

Лучшие результаты в качестве Планировщика и Кодера дает Claude-4-Opus. В качестве Критика - gemini-2.5-pro-preview-05-06

Гитхаб

#text2video #agent
👍72🔥1
Self-Forcing++: Towards Minute-Scale High-Quality Video Generation

Метод от ByteDance для создания длинных высококачественных видео с помощью диффузионных моделей. Модель преодолевает ограничения, связанные с дорогостоящими трансформерами и учителями с коротким горизонтом. Видимо, развитие идеи Self-Forcing

Может генерировать видео длиной до 4 минут 15 секунд, сохраняет временную согласованность, избегает накопления ошибок.

Использует знания модели-учителя и самостоятельно сгенерированные сегменты видео для обучения модели-ученика.

Код ждем

#optyimization #text2video
👍9
Media is too big
VIEW IN TELEGRAM
Ловите на прожарку еще одну работу Антона Зимина

Текст автора:

Сегодня у меня премьера — новое видео моего AI-бутика AiZ @aizproduction
(Аплодисменты, фанфары, ну или хотя бы дочитайте до конца).

Раньше, чтобы заставить кота сделать то, что написано в сценарии, нужно было вооружиться терпением Будды и мешком разных таблеток и спреев. Весь съемочный день мог пройти в ожидании — а кот смотрел на дрессировщиков и меня так, будто режиссер на площадке это он.

Теперь же я сижу за компьютером и… щёлк! Кот пошёл по нужной мне траектории. Щёлк! Кот делает именно то, что я задумал. Ни актеров, ни дрессировщиков, ни съемочной группы. Только я и цифровой кот, который никогда не заявит: «Я устал, возьмите дублёра».

Можно ли снимать обычную рекламу в ИИ, чтобы выглядела как настоящая съёмка? Можно!
Но — сюрприз! — легко это не даётся. Иногда я трачу на такой ролик больше времени, чем на реальную съёмку. Дешевле? Да! Бесплатно? Ох, милый мой друг, нет.

Коллеги говорят, что моя профессия уже никогда не будет прежней.
И это правда.
Грустно? Немного.
Интересно? Безумно.

IG: https://www.instagram.com/dp_director_azimin

ТГ: @antonzim

Vimeo: https://vimeo.com/antonzimin
🔥17👍7👎41😁1
Это что началось-то?
😁25👍10👎52🍌2
DC-VideoGen: Efficient Video Generation with Deep Compression Video Autoencoder

Ускорятор предобученных видеогенераторов. Позволяет повысить эффективность предварительно обученных моделей за счёт адаптации к пространству глубокой компрессии с лёгкой доработкой

Достигает сжатия в 32–64 раза в пространственном и в 4 раза во временном измерении, сохраняя качество реконструкции и возможность работы с более длинными видео

Для адаптации предварительно подготовленной модели Wan-2.1-14B к DC-VideoGen на графическом процессоре NVIDIA H100 требуется 10 дней — получаем снижение задержки вывода до 14,8 раз по сравнению с базовым Wan-2.1-14B 'без потери качества'

Один H100 может выдавать видео с разрешением до 2160x3840

Код и Веса ждем после юридического ревью

Спасибо @m_franz

#text2video #image2video #optimization
🔥13😱62🤔1
Image to Video Generator with Ovi

Демоспейс видеогенератора со звуком Ovi

Поскольку он навайбкоженный, работает криво. Там нужна дополнительная авторизация и она может глючить. В этом случае попробуйте другой браузер

#text2video #image2video #AV #text2Av #image2AV #sfx
👍4🔥1😁1