NEW BOT Телеграм, страница

Forwarded from Great Same New (Sasha Melentev)

This media is not supported in your browser

Dataset Maker

Для ИИ-актрисы создания этот ComfUI скрипт генерит в один присест из одной фотографии человека 104 другие фотографии этого же человека с разных ракурсов и в разном освещении. Вишенка на троте - скрипт еще делает описание каждой новой фотографии, что удобно для последующей тренировки лоры или fine-tune'a.
Сразу же указать триггерное слово тоже можно.

Под капотом:
- Qwen Edit меняет ракурс, потом происходит апскейл и деблюр - картинка становится "в фокусе", потом - разгон на детали для большего реализма.
- Описание генерится через Mistral, будет нужен свой токен на этом сайте.

Системный промт. Вместо trigger_word нужно вставить свой.

Describe the character in picture, describe the characteristics of the face, jewelry, clothing, hairstyle, pose, where they are looking. Make the character's name is [trigger_word]. For example, “this is a photo of trigger_word in a white blazer, with a glass in the hand against a backdrop of rocky mountains.”
Write your denoscription in one sentence, no more than 38 words.

Из одной фотографии, Карл! Скрипто в комментариях по ссылке:
https://news.1rj.ru/str/GreatSameNew/255?comment=744

#Tools

🔥20❤1

1.73K views07:11

Нейронавт | Нейросети в творчестве

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

StealthAttack: Robust 3D Gaussian Splatting Poisoning via Density-Guided Illusions

Метод атаки на гауссовы сцены, который позволяет внедрять иллюзорные объекты, чтобы они были видны только с определённых ракурсов, минимально влияя на вид с других углов.

Одно из применений - вотермарк

Код

#gaussian

👍5😁5👎2😐1

1.78K views09:12

Нейронавт | Нейросети в творчестве

1:12

This media is not supported in your browser

VIEW IN TELEGRAM

Code2Video: Video Generation via Code

Агентный фреймворк для генерации образовательных видео с помощью исполняемого Python-кода. Модель позволяет создавать профессиональные образовательные видео, которые требуют предметных знаний, точной визуальной структуры и согласованных переходов.

Code2Video состоит из трёх сотрудничающих агентов:

Planner: структурирует лекционный контент и подготавливает соответствующие визуальные активы

Coder: преобразует структурированные инструкции в исполняемый Python-код

Critic: использует VLM для уточнения пространственной компоновки и обеспечения ясности

Лучшие результаты в качестве Планировщика и Кодера дает Claude-4-Opus. В качестве Критика - gemini-2.5-pro-preview-05-06

Гитхаб

#text2video #agent

👍7❤2🔥1

2.17K views11:14

Нейронавт | Нейросети в творчестве

1:40

This media is not supported in your browser

VIEW IN TELEGRAM

1:44

This media is not supported in your browser

VIEW IN TELEGRAM

Self-Forcing++: Towards Minute-Scale High-Quality Video Generation

Метод от ByteDance для создания длинных высококачественных видео с помощью диффузионных моделей. Модель преодолевает ограничения, связанные с дорогостоящими трансформерами и учителями с коротким горизонтом. Видимо, развитие идеи Self-Forcing

Может генерировать видео длиной до 4 минут 15 секунд, сохраняет временную согласованность, избегает накопления ошибок.

Использует знания модели-учителя и самостоятельно сгенерированные сегменты видео для обучения модели-ученика.

Код ждем

#optyimization #text2video

👍9

1.84K views13:16

Нейронавт | Нейросети в творчестве

0:30

Media is too big

VIEW IN TELEGRAM

Ловите на прожарку еще одну работу Антона Зимина

Текст автора:

Сегодня у меня премьера — новое видео моего AI-бутика AiZ @aizproduction
(Аплодисменты, фанфары, ну или хотя бы дочитайте до конца).

Раньше, чтобы заставить кота сделать то, что написано в сценарии, нужно было вооружиться терпением Будды и мешком разных таблеток и спреев. Весь съемочный день мог пройти в ожидании — а кот смотрел на дрессировщиков и меня так, будто режиссер на площадке это он.

Теперь же я сижу за компьютером и… щёлк! Кот пошёл по нужной мне траектории. Щёлк! Кот делает именно то, что я задумал. Ни актеров, ни дрессировщиков, ни съемочной группы. Только я и цифровой кот, который никогда не заявит: «Я устал, возьмите дублёра».

Можно ли снимать обычную рекламу в ИИ, чтобы выглядела как настоящая съёмка? Можно!
Но — сюрприз! — легко это не даётся. Иногда я трачу на такой ролик больше времени, чем на реальную съёмку. Дешевле? Да! Бесплатно? Ох, милый мой друг, нет.

Коллеги говорят, что моя профессия уже никогда не будет прежней.
И это правда.
Грустно? Немного.
Интересно? Безумно.

IG: https://www.instagram.com/dp_director_azimin

ТГ: @antonzim

Vimeo: https://vimeo.com/antonzimin

🔥17👍7👎4❤1😁1

2.11K views15:18

Нейронавт | Нейросети в творчестве

Это что началось-то?

😁25👍10👎5❤2🍌2

2.36K views18:21

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation

Реконструкция 3D по нескольким видам

Код ждем
Демо

Спасибо @Dmitriy_Ru6ts0v

#image2scene #imageto3d #videoto3d #video2scene

👍7

2.28K views09:12

Нейронавт | Нейросети в творчестве