Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
History-Guided Video Diffusion

Метод генерации видео
За счет трюков с контекстом и трансформера форсированной диффуззи (DFoT) позволяет создавать консистентные ультрадлинные видео, видео бесконечной навигации, генерировать композиционное видео (сам не уверен о чем тут речь)

На видео с роботом объяснение работы модели, это непохоже на генерацию

Модельки небольшие, и разрешение у них 128x128 да 256x256, так что это пока не про контентмейкинг, а про фичи которые можно ожидать в видеогенераторах

Код
Демо

#image2video
🔥7🤔1
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers

Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой

За основу берут CogVideoX-5B и прикручивают лору

Код ждем

#personalization #text2video
👍4
InspireMusic: A Unified Framework for Controlled Music, Song, Audio Generation with Collaborative Semantic and Acoustic Tokens

Опенсорсный генератор музыки от Tongyi Lab и Alibaba Group

Умеет создавать музыку по тексту, продолжать музыку, реконструировать (непонятно)

Качеством звука пока не впечатлил, но это опенсорс, тут есть перспектива

Код
Демо

#text2music #music2music #music
🔥81👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Convergence

Лондонский стартап хвастается браузерным агентом, побивающим 200-долларовый Operator (или он уже бесплатный?)

На бесплатном тарифе 5 сессий в день и одна автоматизация

#assistant #agent
🤮5👍4💩3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Pippo : High-Resolution Multi-View Humans from a Single Image

Из одного портретного или в полный рост фото человека делает тёрнтейбл - фото облет студийного качества 512х512 (называют это 1K)

Код

#image2video #novelview
🔥13🤔1
Этот ролик, сделанный в Veo 2 - редчайший случай из всего потока генеративного видео, когда я верю что это люди в кадре, а не бестолковая кучка пикселей, мимикрирующих под людей. Они делают что-то осмысленное, а не имтируют движение. По крайней мере, мне это так выглядит

Ну и тут посмотреть бы на промпты и количество отбракованных версий. Скорее всего автор режиссер с опытом и понимает как работает камера и действие в кадре
👍9🔥3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Если честно, то даже я приподохренел.

Тут у нас была дискуссия (бессодержательная по большей части) за рекламу, ну штош, держите рекламы.
Давайте вы сначала посмотрите ролик со звуком(!), а потом почитаете тексты ниже...





















Пришлось смотреть 3 раза.

Конечно, я испортил весь эффект, тем что сразу акцентировал внимание на ролике. Но таки да, это генератив от Veo2. И тут Гугл, похоже, пока непобиваем.
Я вначале подумал, что дядьки с камерами настоящие и щас нам расскажут про совмещение ИИ и видео.

Но из настоящего тут только говорящая голова со странным акцентом в части behind the scenes

Пруф тут: https://www.youtube.com/watch?v=VqLWWYfCEbI

Нормальный такой 𝘢𝘯 𝘪𝘯𝘥𝘦𝘱𝘦𝘯𝘥𝘦𝘯𝘵 𝘤𝘳𝘦𝘢𝘵𝘪𝘷𝘦 𝘦𝘹𝘦𝘳𝘤𝘪𝘴𝘦 - как пишет автор. Один. Без ансамбля.

От себя добавлю, что закадровый нарратив для ИИ-роликов - это прям палочка выручалочка, недавно об этом думал.

Встречал немного снобистское мнение в прошлой жизни, что закадровый нарратив появляется там, где режиссер не может справиться со сценой или сценарием. Для ИИ - это идеальные костыли. Поглядите ролик еще раз.
И спать.

P.S. Огромное спасибо Всеволоду Тарану за такой шикарный ИИ-подгон.

@cgevent
🔥19👍4
Валентинки через Glif

Теперь каждый глиф стоит по-разному, но на старте вам дают 30 кредитов бесплатно и так же они ежедневно пополняются. А я подготовил для вас Глифы для Валентинок!

💰 В среднем 1 генерация в моих глифах тратит ~8 кредитов
💰 Оригинальный Glif — ~5 кредитов

Готовые глифы для Валентинок:
Оригинальный Glif — откуда я взял идею, генерирует картинку + милый текст через Sonnet. Из минусов — вотермарка.

Мой вариант. 2:3 размерность (1200x1600px) — Идеален для печати!
НО! Есть особенность сделал его с разделением промпта для Clip L и T5XXL.
Мне помогает вот этот промпт для любой LLM: Create prompts based on text for Clip L and T5XXL. Text: [Ваше описание или картинка]
Если не хочется заморачиваться с промптами для Clip L и T5XXL, просто вставьте одинаковый текст в оба поля.

Вариант с возможностью референс картинки. Добавил Redux туда.

HF Lora — для тех кто хочет локально погенерить

— Я распечатал эти открытки на акварельной бумаге, и они выглядят как настоящая пастель!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2