Forwarded from Почему Полторашка?
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Часть 1
Недавно мы писали, что уже несколько крупных проектов воплотили в жизнь с помощью неройнок, а как это происходило, узнаем у Лины. В проектах Полторашки она отвечает за визуальную магию, рождающуюся на стыке нейросетей, видео и воображения.
Использовала все самые актуальные image- и video-модели. Midjourney и Flux для базовых изображений, для апскейла — Topaz и Magnific, а для анимации — Kling, Higgsfield, Hailuo AI, пробовали Veo. Нано Бананы тогда ещё не было, хотя она бы сильно помогла.
Бывало, что прямо в процессе работы прилетало обновление нейросети, и после тестов мы понимали, что нужно срочно переезжать на новую версию, потому что у неё движения реалистичнее.
В одном из проектов было важно добиться максимально естественных лиц. Поэтому после тестов всех моделей остановились на Veo.
Зависит от сложности. Если просто люди позируют, как было у нас в проектах, я делала очень быстро. На 1 кадр уходило в районе 15 минут. А вот у меня был кейс для Сибирской Коллекции, там нужен был десятисекундный сюжетный ролик одним кадром. Чтобы все сошлось, мы с продюсером потратили в общей сложности целую рабочую неделю.
Крупные компании соревнуются друг с другом и пытаются привлечь внимание разными стратегиями. Кто-то затачивает модель под создание нейрослопа (например Sora 2, с виральными, но мусорным роликами), Google же идет в противовес Sora и старается делать продукт для профессионалов. Есть и китайские модели, которые в некоторых задачах превосходят американские.
В целом, нейросети растут циклами, примерно раз в восемь месяцев, и крупные игроки стараются не отставать друг от друга. Я думаю, так будет продолжаться еще минимум года 3, так как возможностей для улучшения очень много: повышение качества датасета, улучшение архитектуры трансформера.
Ну, и проблем пока что хватает. На средних и дальних планах стабильность картинки всё ещё ниже среднего. Я сейчас генерирую много еды и, например, чтобы красиво разрезать бургер, это надо душу кому-то продать — на месте среза просто каша. А для клиента же важна правильная послойность продуктов, и задача превращается в нереальную. Лица в видео тоже пока нестабильны, но если сравнить с прошлым годом — прогресс огромный.
————————————
Интервью пришлось поделить на 2 части, потому что оно получилось огромным, и ТГ не дает выложить его единым постом. Ставьте банан, если ждёте 2 часть!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥5😁2
Forwarded from Почему Полторашка?
Часть 2
Первую часть прочитали? Тогда продолжаем! Отвечает на вопросы Лина, наш эксперт по нейронкам в Полторашке.
Есть несколько трудоёмких, но надёжных способов добиться того, что задумал:
— Найти похожие референсы и попросить текстовую модель подробно их описать — сюжет, свет, композицию, стиль, тип камеры. Потом собрать всё это в один точный промпт.
— Натренировать стилистическую лору — собрать датасет под желаемый стиль и дообучить Flux или Midjourney.
— Нарисовать скетч от руки, расставить предметы как представлялось в голове, дать скетч Нано Банане или ChatGPT, чтобы они достроили окружение, и генерить поверх.
Уловок масса, просто нужно время и терпение.
Концепт корнера в ТЦ от производителя подгузников
А ещё — фоны для концерта Голос поэта. Мы делали визуальное сопровождение для каждого музыкального выступления, и потом весь концерт показывали по Первому каналу, с нашими генерациями поверх трансляции. Это было невероятно!
Споры неизбежны, так как технология всё-таки новая. Хорошо, что они происходят, ведь мы можем слышать голоса всех направлений и специалистов, которым не всё равно. Если кто-то думает, что всё за тебя делает машина, этот человек банально не знаком с процессом работы в нейросетях, это абсолютно нормально.
Каждая нейросеть решает свою конкретную задачу: где-то еда лучше, где-то люди, где-то — движение. Какие-то вещи можно сделать только в Illustrator, какие-то — только в After Effects или Blender. Так будет и в будущем.
Да, ИИ — ещё один инструмент для нашей работы. Ещё один инструмент, чтобы создавать концепты, рекламу, миры, которых не существует. А вы что думаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4😁1