Нейронутые | ИИ (Егор Апполонов) – Telegram
Нейронутые | ИИ (Егор Апполонов)
13.1K subscribers
1.18K photos
276 videos
1 file
334 links
Я — Егор Апполонов, эксперт по ии-видео. Победитель 3 международных конкурсов ии-фильмов. Связь @egorevna

Портфолио: https://egorappolonov.ru/ и @aigencydigital

Курс по ии-видео: https://aifilm.online/

РКН https://clck.ru/3NNPKh
Download Telegram
Давно собирался сделать этот пост: JSON-промпты

JSON-промпты — это как глянцевые маскировочные костюмы для "модных промт-инженеров". Выглядит технологично, звучит внушительно. Но работает ли это в реальности, особенно в задачах генерации изображений и видео (Veo, Nano Banana Pro и т.д)? Пора сказать правду.

JSON-промптинг: из чего он вырос

Изначально формат появился как способ систематизировать ввод: вместо «сделай мне красивую девушку на фоне заката», у нас появилась обертка, которая как бы превращает тебя в гуру генераций:

{
"subject": "beautiful woman",
"background": "sunset",
"mood": "romantic",
"lighting": "golden hour"
}

Выглядит профессионально, как будто ты не просто чувак с оплаченной нейросетью (один из тысяч), а режиссер нейронной постановки.

Но вот загвоздка: большинство моделей на вход все равно ждут текст — обычный человеческий текст. А значит, твой JSON просто становится fancy оберткой для конкатенации строк.

Серьезно. Люди с умным видом часами собирают JSON-схемы, прописывают "camera_type": "ARRI Alexa" и "mood": "melancholic optimism" в надежде, что это даст результат уровня Тарковского.

А нейросети тем временем просто ждут: ну скажи уже по-человечески, что ты хочешь. Даже Veo 3, даже Sora 2, даже Nano Banana Pro — это не API-интерфейс, это эмоции, кадры, кинематографическое мышление. А не JSON-запятые.

«Мы используем JSON для систематизации» — звучит красиво. А по факту?

Вы просто хардкодите хаос. Хотите на потоке делать 50 роликов — да, JSON может быть полезен. Но если вы думаете, что запихнете в промт "action": "epic slow motion" и получите рекламу Nike — у меня для вас плохие новости: без визуального мышления вы получите ровно то, что заказали (ерунду).

Хороший режиссер не думает о запятых, двоеточиях и модных скобках. Он думает в образах, световых пятнах, движении камеры, в драматургии сцены. Так что если вы сидите и пишете "bokeh": true и думаете, что сделали магию — я вас расстрою. Не-а. Настоящую магию делает не формат — ее делает вкус, насмотренность и понимание структуры кадра.

Когда JSON реально полезен

Есть ситуации, где JSON — мастхэв. Например:

Сквозные пайплайны: где ты автоматизируешь поток задач (промптинг → выбор модели → ассеты → видео).

API-интеграции: где каждый блок (персонаж, камера, движение, музыка) требует четкого структурирования.

Мультимодальная генерация: когда миксуешь текст, изображение, аудио и видео — и тебе нужно следить за форматами и параметрами.

А теперь по-честному

Veo 3.1? Прекрасно ест обычный промпт с «пиши по-человечески». Nano Banana Pro? Вообще не различает, запихнешь ты туда JSON или абзац в духе: «мужчина бежит по дождю в неоне». Главное — не формат, а смысл, тон, точность.

Так что когда я вижу посты в духе «сделайте себе шаблонный JSON и все будет кино», хочется напомнить: Sora, Kling, Veo и т.д. в первую очередь понимают язык эмоций, образов и кинематографической интуиции.

Не JSON делает видео вирусным, а режиссура.

Вывод

JSON-промпты — не магическая таблетка. Это просто формат. Полезный, когда надо систематизировать, особенно в команде или при масштабировании. Но для одиночного креатора, который хочет сделать вау-картинку или прокинуть драму в 30 секунд — это чаще всего избыточность. Лучше учите визуальное мышление, а не придумывайте, куда в JSON вставить “epic light flare with anamorphic distortion”.

p.s. Не использовал и никогда не планирую. И без них умею.
🔥52👍24💯5
Обновил сайт и портфолио

На досуге немного повайбкодил (всего-то 2192 строчки кода) и серьезно обновил дизайн сайта со своим портфолио. Сделал немного по-хулигански, люблю всякие красивые штуки.

Кстати, добавил и новые работы (ии-реклама), которые раньше не мог показывать. Так что непременно загляните по этой ссылке.
🔥31👍15
Я вам озвучу интересный парадокс рынка 2025 года: чем доступнее инструменты, тем дороже экспертиза. Кнопки есть у всех. Вкус, опыт, все необходимые навыки и стратегическое мышление: как всегда — у единиц.

В стоимость создания ии-видео высокого уровня заложена серьезная интеллектуальная наценка.

Знаете, почему?

Потому что в случае с низкобюджетными исполнителями вы получаете ровно то, за что заплатили: плохо сгенерерированное видео, в котором все плывет и ползет. Ну там бабку на бегемоте. Или кота, который весело мяукает и заканчивает это делать через 15 секунд, когда закончился хрон сгенерированного в Sora 2 шота.

Вы получаете видео, в котором ваш бренд в принципе узнаваем, но если присмотреться, вы поймете, что все логотипы поехали к чертям (потому что нейросети не умеют держать тексты — ну например, мелкие тексты на этикетках, поэтому нужен ручной ротоскопинг, трекинг и много чего еще). Вы поймете, что сценарий — унылое го%но. Что голоса мертвые, да и вообще ролик сделан так, что сразу видно:

Это сделала нейросеть. И сделала, конечно же, очень плохо.

Существует мнение, что нейросети уравняли всех. Что студент с ноутбуком теперь равен профессионалу, который играет в высшей лиге. Но, пожалуйста, друзья, снимите розовые очки. Это не ни разу так.

Лучшие игроки рынка — это, конечно же,профессионалы индустрии (реклама, видеопродакшн, маркетинг и тд), которые просто сменили кисти. Точнее добавили в свой пайплан новые инструменты, но стоят на прочном фундаменте многолетного опыта создания рекламных кампаний.

Я еще напишу отдельно, почему работа с низкобюджетными исполнителями, если вы хотите заказать ии-видео — это всегда лотерея, в которой вы всегда проиграете.

Не переключайтесь.
🔥37👍27🤣4🙈3🤬1
Если вы ищете подрядчика на создание ии-видео и в частности ии-рекламы, то я подготовил гайд, который настоятельно рекомендую прочесть. Это, казалось бы, очевидные истины, но все же стоит ознакомиться.

Читать по этой ссылке.

#статьи
👍24🔥6🙈1
Media is too big
VIEW IN TELEGRAM
Chat GPT обновил свою делалку картинок. Пытаются влезть на поляну Nano Banana Pro.

Протестирую — напишу свои впечатления. Пока просто смотрим черри-демку.
👍24🔥8
Пока Альман судорожно пытается догнать Google, последние выкатили еще одну внушительную порцию обновлений во Flow:

Nano Banana Pro получила апскейл до 2K и 4K

Пользователи Pro и Ultra теперь могут увеличивать изображения, созданные в Nano Banana Pro, до 2K и 4K.
Чтобы апскейлить изображение, достаточно навести курсор на готовую картинку, выбрать загрузку и указать нужное разрешение.

Что важно учитывать:

— апскейл доступен только для изображений, сгенерированных в Nano Banana Pro после 12 декабря.
— 2K доступен на тарифах Pro и Ultra;
— 4K — только на Ultra.

На время новогоднего периода апскейл в 2K и 4K не расходует кредиты и ограничен 200 изображениями в день для каждого разрешения. Лимиты и условия могут измениться позже.

Исправления с аудио в Veo 3

Команда также доработала логику обработки ошибок со звуком. Если раньше Veo 3 мог возвращать видео без аудио, теперь такие генерации считаются ошибочными:

— видео не будет возвращено пользователю;
— кредиты автоматически возвращаются.

Работа над стабильным и качественным звуком продолжается, но уже сейчас это изменение избавляет от потери кредитов из-за аудиобагов.

Ну что, Альтман, догоняй 🤣
👍24🔥12
Kling Video 2.6: Voice Control — кастомные голоса для персонажей

В модели Kling VIDEO 2.6 стала доступна функция Voice Control. Теперь можно создавать собственные голоса и жtстко привязывать их к персонажам, добиваясь стабильного совпадения между образом и звучанием. Что это дает на практике:

Стабильный голос на всём видео: голос сохраняет тембр и характер от начала до конца ролика.

Гибкая адаптация под контекст: один и тот же голос автоматически подстраивается под разные форматы — закадровый текст, диалог, речь, монолог. Меняется ритм, интонация и подача без дополнительной настройки.

Естественная работа с разными языками: голос, обученный на одном языке, может органично говорить на другом (например, китайский —> английский) без ручных конфигураций, сохраняя выразительность и узнаваемость. И да, русского пока нет.

Привязка голосов через промпт: достаточно указать в запросе формат вроде [Character@VoiceName], и модель сама закрепит нужный голос за персонажем. Это сильно упрощает сцены с несколькими героями и разными голосами.

Обновление делает Kling заметно ближе к полноценной работе с персонажами — не только визуально, но и на уровне звучания. Для сторителлинга, брендов и сериализованных форматов это серьезный шаг вперед. Ждем, когда добавят русский язык. Пока ни одна модель ранее не предлагала такой функции.
👍18🔥5
Сравнительный тест двух моделей.

Мужик в пиджаке — Kling 2.6 Audio. Мужик в рубашке — Veo 3.1 Fast.

Разница колоссальная.
👍21🔥15
Продолжим: красная худи — Veo 3.1 Fast. Коричневая — Kling 2.6 Audio. Смотрите, в частности, на зубы.
🔥22👍8
Мужик в синей рубашке — Kling 2.6 Audio, мужик в пестрой рубашке — Veo 3.1 Fast.

Veo на этом тесте по неясным причинам посыпалась и запихнула в рот женщине невнятное мычание. Я сделал несколько прогонов промта и всегда было одно и то же. Понятно, что если промт покрутить и допилить, все будет хорошо. Но выкладываю с глюком, чтобы вы понимали, что Veo далеко не идеальна.
👍17🔥7🤣5
This media is not supported in your browser
VIEW IN TELEGRAM
В комментариях спрашивали, а как с задачей справится Sora. Не стал делать все три теста, сделал только репера.
🔥24👍8
Media is too big
VIEW IN TELEGRAM
Было свободное время. Давно клипы не выкладывал. Звук традиционно погромче.

Досмотрите до конца.

Где делал: Veo, Sora 2 Pro, Kling, Nano Banana Pro, Sedance, Suno и всякое по мелочи.
👍33🔥14💯3👎2
Media is too big
VIEW IN TELEGRAM
Очень ценный кейс — когда заказчик приходит с доверием, а не с линейкой для измерения каждого пикселя по брифу.

Сделал серию новогодних роликов для промо акций в «Ленте» и «Магните».

Это сложная ии-реклама: в кадрах должна удерживаться целая семья, лось-маскот и, конечно, сам продукт, который обязан выглядеть абсолютно идентично оригиналу.

Технически это был сложный проект: креативная разработка, тысячи генераций, ротоскопинг, ручной кейинг, связка из нескольких нейросетей, музыка, ии-озвучка — все ради того, чтобы собрать теплые новогодние истории.

Истории, которые передают атмосферу праздника, четко рассказывают об акции и при этом действительно «вкусно» показывают продукт.

Комфортная коммуникация с заказчиком, адекватные правки, работа без микроменеджмента — и в итоге сдача в срок. Делюсь результатом.
1🔥71👍21🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну и второй ролик "Добрый", который могу показать. Классный, мне нравится.

Их было еще несколько, но остальные под NDA.
1🔥38👍15💩3
Премьера нового фильма, через... дцать минут... Рендерится.
2🤣10
Media is too big
VIEW IN TELEGRAM
Странно, почему этот фильм еще не сняли. Короче, вот вам.
🤣63🔥18👍10💩9👎5
Когда заходит разговор про ИИ-видео, сразу раздается хор:
«Ну видно же, что это ИИ!»

Девочки и мальчики, сейчас открою страшную тайну: оно и должно выглядеть как ИИ.

Ровно так же, как 3D в начале 2000-х выглядело как 3D. Как CGI в «Матрице» кричало «это графика». Как клипы MTV не пытались быть кино. Как TikTok не пытался быть телевидением.

ИИ-видео — это не подделка реальности, это новый визуальный язык.

И когда вы орете «видно, что ИИ», вы звучите ровно как люди, которые в 2005-м кричали: «Фу, это компьютерная графика, где настоящее кино?» — а потом десять лет смотрели только его.

Проблема не в том, что видно ИИ.

Проблема в том, что вам нечего сказать этим языком.

Плохое ИИ-видео видно не потому, что оно ИИ. А потому что там нет идеи, нет драматургии, нет ритма, нет вкуса.
Хорошее ИИ-видео не маскируется под «настоящее». Оно честно использует свою искусственность и бьет ей в лоб.

ИИ — это не способ «обмануть глаз».

Это способ расширить выразительность.
И если вы все еще оцениваете новый медиум по критерию «похоже ли на живую съемку» — вы просто опоздали на поезд.

Так что да.

ИИ должно быть видно.
Как когда-то было видно кино.

И те, кто это понимают, уже ушли вперед.

К сожалению, многие (большинство) заказчики все время просят: сделай нам как будто это реальная съемка. И так, 50% истории летит в утиль. С ии можно сделать все что угодно. А заказчики руками ии-режиссеров почему-то, с упорством пытаются сделать унылое «максимальный реализм».

Это все равно, что купить рояль Stainway, чтобы играть на нем «Собачий вальс».

Мнение автора тг-канала «Нейронутые», как всегда, скорее всего вызовет шквал критики. Но автор привык.
1🔥61👍31💯16👎5🤣4