Нейросетевые мемы – Telegram
Нейросетевые мемы
3.15K subscribers
5.23K photos
1.04K videos
9 files
796 links
По всем вопросам писать https://news.1rj.ru/str/kostyanchik_94
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Behind the scenes или за кулисами Бананы.

Тут по сети расходится трюк для Бананы - подсовываете фото и говорите "сделай картинку того, как это снималось". И ну генерить кадр с зеленкой, операторами, светом, режиссером за монитором.

Но это только 10% потенциала Бананы. Похоже Gemini 3 знает очень много про кино- и видео-производство. Про параметры камер, света, типы кадров, виды светильников, ракурсы, терминологию и пр..

Поэтому вы можете загрузить любой кадр из фильма (рекламы, свадебного видео) и попросить:

generate a realistic behind the scene for this film scene, show me where the camera and lights are placed to film this scene, use arrows to label the name of the light, what kind of lights, light settings


(создай реалистичную закулисную сцену для этой сцены фильма, покажите мне, где расположены камера и освещение для съемки этой сцены, используйте стрелки, чтобы обозначить название освещения, тип освещения, настройки освещения)

Банана все распишет и подпишет. Может даже расстановку камер и света нарисовать как диаграмму.

Тут сейчас курсы операторского мастерства занервничали. Превизы задумались.. Осветители решили выпить..

Поглядите на все картинки с подписями. Да, вероятно там есть ошибки, но сдается мне Банана верно угадывает общий сетап света.

Сорс.

@cgevent
1🔥43
FLUX.2: Frontier Visual Intelligence

Слухи оказались правдивы, новую версию генератора картинок Flux 2 выпустили.
Внутри Mistral-3 VLM 24B

— сохраняет характер и стиль при работе с несколькими референсными изображениями;

— следует сложным структурированным подсказкам;

— читает и пишет сложный текст;

— соблюдает брендбуки;

— грамотно работает с освещением, макетами и логотипами;

— редактирует изображения размером до 4 мегапикселей, сохраняя детали и целостность изображения;

— поддерживает работу с до 10 референсными изображениями одновременно;

— создаёт детальные фотореалистичные изображения и инфографику со сложной типографикой;

— надёжно обрабатывает сложную типографику, включая создание инфографики, мемов и макетов пользовательских интерфейсов с читаемым мелким текстом.

В релиз вошли следующие модели семейства FLUX.2:

FLUX.2 [pro]: модель с высоким качеством генерации изображений, быстрой работой и относительно низкими затратами.

FLUX.2 [flex]: модель, которая позволяет настраивать параметры (количество шагов, шкала руководства) и хорошо рендерит текст и мелкие детали.

FLUX.2 [dev]: открытая модель с 32 миллиардами параметров, поддерживает синтез текста в изображение и редактирование изображений с несколькими входными изображениями.

FLUX.2 [klein]: предстоящий релиз — открытая модель, более мощная и удобная для разработчиков по сравнению с аналогами того же размера. Вписаться в бету

FLUX.2 - VAE: вариационный автоэнкодер для латентных представлений, обеспечивает баланс между обучаемостью, качеством и степенью сжатия.

BFL Playground
BFL API
HF
Демо

#text2image #referencing #image2image #imageediting #vlm
И примеры работы с рефами.
🔥6