Журнал дизайнера | AI & Product – Telegram
Журнал дизайнера | AI & Product
361 subscribers
448 photos
47 videos
105 links
Product designer at Solar. Пишу про AI, про вайбкодинг, про дизайн, про себя

Автор — @flppva_a
Download Telegram
Как получать более эффективный и предсказуемый результат видеогенерации в Veo 3?

Ответ: правильный промптинг. Что я имею в виду?

У меня есть идея: супергерой в милитари одежде стоит на крыше в лучах заката, камера движется по дуге слева направо и фиксируется на крупном плане персонажа, персонаж на английском говорит: «Время защитить город», кинематографичная сцена, геройская музыка на фоне

Два варианта, как не надо делать

1. Написать промпт очень простыми формулировками, буквально с переводчиком (видео 1, видео 2)

2. Написать промпт по описанию с помощью простой задачи для любой LLM «напиши промпт» (видео 3)

Что мы получаем?

Банальное додумывание нейросеткой того, что ей вздумается, а также не следование заданному промпту. Ни в одном промпте не было указано, что супергерой девушка или супермен. Также Veo 3 решил изменить движение камеры на свой вкус. Как итог, мы будем получать совсем не то, что хотим, потратим много кредитов, разочаруемся в нейросетях и станем их ненавистниками

Как вы видите, результат по промпту от нейросети чуть лучше. НО! Мы не слышим музыку, не видим движения камеры по дуге

А как надо?

Промпт по JSON-структуре (видео 4). Её кайф в том, что можно расписать все детали предельно чётко: кто герой, какой у него костюм, куда движется камера, какая атмосфера, свет, речь, музыка и т.д. Мы можем дать нейросети больше конкретики, за счёт чего Veo 3 меньше додумывает детали

А чтобы не писать самостоятельно, можно нагрузить задачей готового GPT, который выдаст JSON-промпт. Не реклама, сама пользуюсь, очень удобный инструмент

Пробуйте и делитесь результатами! В комментариях прикладываю JSON-промпт и разбор структуры 🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6642
Промпт-инженер или промпт-ассистент?

Хочу более подробно остановиться на теме готовых ассистентов под любые задачи

Год назад в инфополе про нейронки мелькала следующая мысль: «надо писать качественные промпты, чтобы получать качественный результат». И все говорили про появление новой профессии — промпт-инженер

Однако, за это время появилось и продолжает появляться много ИИ-инструментов, которые позволяют буквально естественно общаться с нейросетью, почти как с другом. Вам больше не нужно писать сложные конструкции по типу «Ты — мой личный консультант по тому-то с опытом в миллион лет. Мне нужно то-то. Сделай то-то. Используй то-то. А то-то — не используй»

И вот пример — готовые GPT от OpenAI или Gem-боты в Gemini

🐻 Что это за звери?

Это обученные вами или другими людьми боты-ассистенты для решения конкретной задачи. Не нужно создавать каждый раз новый чат, писать заготовленный промпт. Ваш готовый бот всё знает и помнит, что вы в него заложили. Особенно актуально для решения типовых задач, повторяющихся из раза в раз

Тут два варианта, как использовать: найти в поиске готовые решения от других пользователей или создать своего ассистента

Если вы хотите создать своего ассистента, вам нужно ОДИН раз дать ему все необходимые инструкции, приложить файлы, то есть создать некую базу знаний, на которую бот будет опираться. А дальше дело техники

🤔 Примеры, как можно использовать

Контентмейкер. Выгрузите историю своего ТГ-канала в формате JSON, начните создавать бота и прикрепите в файлы историю канала. Напишите инструкцию, например, «Ты — мой контентмейкер. Ты будешь писать посты по моему запросу. Опирайся на историю канала в прикрепленном JSON. Сохрани мой стиль повествования, пиши человечно. Количество символов в каждом посте не более 2000»

Повар-нутрициолог. Здесь можно вообще ничего не прикреплять, а задать в инструкции, чтобы он выдавал вам рецепты под ваши продукты, попросить, чтобы он писал список продуктов для покупки, а также чтобы считал КБЖУ

Промпт-ассистент. Это как раз пример бота для промптов в Veo 3, который я прикрепляла в прошлом посте и нашла из готовых решений в самом ChatGPT. Научите своего бота писать промпты под любую нейросеть. Дайте контекст в инструкции, в каком формате вы ждёте от него промпты, на что ему опираться, покажите пример

👏 Вывод

Таким образом, мы тратим меньше времени на рутинные задачи с бесконечным созданием новых чатов и копированием одного и того же заготовленного промпта. Вы получаете готового ИИ-ассистента для получения наиболее точного результата. Бота можно дополнять через его настройки, так что если вдруг задача потребует больше контекста, вы знаете что делать

Однако, способ постепенно устаревает, потому что появляются более автоматизированные решения (привет, n8n). Но всё же имеет место быть и пока ещё удобен

Если попробуете — обязательно расскажите, удалось ли вам сделать своего ассистента для вашей задачи *️⃣
Please open Telegram to view this post
VIEW IN TELEGRAM
553
Дождались прорыва от OpenAI. Делюсь своими приколами из новой Sora 2 – нейросети, позволяющей генерировать видео с озвучкой. Ну вот не терпится OpenAI быть и оставаться лидерами рынка

Что изменилось

*️⃣Sora 2 – это теперь не просто нейронка, это теперь соцсеть в духе TikTok, где вся лента – сгенерированные видео. Приложение доступно в AppStore

*️⃣В Sora 2 теперь нельзя генерировать изображения. Хотя мне нравился стиль, который она выдает. Большая часть буквочелленджа была сделана в ней. Если вам ещё нужна старая Sora, то в настройках в веб-версии можно переключиться

*️⃣Появилась озвучка. Да, даже на русском языке. И не такая топорная как у Veo

*️⃣Можно создавать камео. Это будет блогер с вашим лицом, но все события и ситуации вымышленные. Так что у вас есть ещё один шанс стать популярным!

Но, конечно, кроме позитивных изменений, минусы есть: качество пока ещё не впечатляет, есть куча артефактов, много додумываний. Однако если раньше это было почти неконтролируемо, то теперь чуть более предсказуемо

Не буду говорить, что это «убийца Veo 3», но для старта – отлично! Будем посмотреть 🙃

Для тех, кто хочет попробовать

Sora 2 доступна только с подпиской ChatGPT Plus/Pro. У меня есть инвайт, готова поделиться с 4мя людьми 🎁

Просто напишите в комментариях или в сообщения канала, что вам нужен инвайт, и я пришлю
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥975
И снова новости! Браузер Comet от Perplexity теперь доступен всем без исключения. Без подписки, без очереди, без инвайтов

Обещают скоро подвезти мобильную версию и облачных агентов

Кто хотел «умный» браузер, скачивать тут
95👍1
Юра Ветров запустил седьмое исследование продуктовых дизайн-команд в России.

Уделите 5 минут и пройдите опрос — это полезно для всего сообщества. Пройти может любой: дизайнер, разработчик, маркетолог и т.д.

Респект Юре за то, что делает такие масштабные и важные исследования для комьюнити! 🫰

👉 ОПРОС 👈
Please open Telegram to view this post
VIEW IN TELEGRAM
Друзья, я приготовила для вас музыкальный нейроблиц. В полнейшем шокЭ, но не могу с вами не поделиться

Итак. 6 треков. 5 из них нейросеть. И только 1 реальный

Ваша задача: угадать, какой из этих треков создан настоящим исполнителем

Сразу скажу по жанру. Специфично, не всем такое нравится, и мне в том числе. По текстовому наполнению старалась выбирать популярное и близкое. Однако по стилю расхождения есть, чтобы слегка усложнить задачу

👀 Просьба к тем, кто знает или воспользуется какими-то сторонними способами интерпретации, кроме слуха, — не пишите ответ. Давайте оставим развлекательный момент для тех, кому интересно

Пишите вариант в комменты👇

P.S. Будет вторая часть уровня hard с розыгрышем приза, так что готовьтесь 😈
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯3🔥1👀1🤝1
*барабанная дробь*

Итоги вчерашнего блица

Правильный ответ – трек №1

Исполнитель The Milan, название трека Откройся. Поверим ему, что он не нейросеть? 😂

Как вам результат? Вы в шоке? Потому что я в полнейшем

Какой вывод можно сделать?

Нейросети (в данном случае Suno) уже настолько качественно делают свою работу, что среднестатистический человек без глубоких музыкальных знаний не сможет отличить настоящее от сгенерированного

Ответов было не очень много, но кто поучаствовал – вы просто супер 🩷

Готовьтесь ко второй части на следующей неделе, она будет связана со мной. Если угадаете – разыграю между правильно ответившими месячную подписку на Suno 🎁 Попробуете посоздавать свой топ-чарт ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
965
Ломая поверхность

Немножко откровений и рефлексии, а то давно мы с вами не рассуждали на важные темы о развитии

Случается так, что основная деятельность становится механической рутиной. Перестаешь включать мозг, делаешь на автомате, без особого погружения. В этом нет ничего страшного и критичного. Это даже своего рода мастерство, когда можешь выдавать результат с меньшими усилиями. Но это не должно, как по мне, становиться нормой

Мне не очень нравится эта черта в себе, потому что по жизни я стараюсь зрить в корень, находить смыслы во всём вокруг. А в работе всё чаще и чаще случается, что делаю на скорость. И, к сожалению, ошибки тоже случаются

В каком-то смысле это сопротивление и есть своего рода страх быть посредственным дизайнером. Делать некрасиво. Делать НЕПРОДУМАННО. Делать неудобно. Делать так, что всем пофиг на результат – и мне пофиг, и наоборот

Хорошие новости: это лечится. На днях я прочитала крутую статью от Илоны Саркисовой на тему погружения в предметную область (в комменты оставлю ссылку на статью). И меня это прочтение вдохновило порефлексировать, а достаточно хорошо ли я погружена в свою предметную область

Илона выделила 3 стадии глубины погружения в предметную область: Я ничего не знаю → Я знаю, чего я не знаю → Я кое-что знаю. И, делая вывод на основе своих подходов к задачам, я примерно между второй и третьей. Это именно про то, насколько хорошо я понимаю специфику своего продукта и своей зоны ответственности за результат. Я точно могу сказать, что сейчас не отвечу на вопрос, что такое JSOC, но я знаю, как мой внутренний пользователь заводит лицензии на продукты для клиента

Проще говоря, подход с глубоким погружением в контекст позволяет принимать более осознанные решения при проектировании интерфейсов. Но при этом это тоже требует определённого уровня ответственности и веры в результат

На работе меня ценят за скорость работы, за то, что я слышу пользователя и клиента, за то, что могу отстоять удобство или найти компромисс между целями бизнеса и разработкой. Я никогда не скажу на работе «слушайте, не знаю, как это сделать». У меня почти всегда есть какое-то решение и предложение, как мы можем сделать. А в сложных задачах с высоким уровнем абстракции так вообще поле для перформанса

И нет, это не перманентное. Бывают моменты, где я соглашаюсь с чужим решением, потому что оно лучше — в чём-то я по-прежнему учусь и не всегда могу сделать вау. Но! Знание юзабилити принципов и понимание продуктовых ценностей позволяют фильтровать плохие и хорошие предложения со стороны

Короче говоря, погружайтесь в предметную область. Красиво сделать или сделать как-то — это полбеды. А сделать так, чтобы попасть в цель для юзабилити и бизнеса очень нужный навык для вашего развития и эффективного результата

Вопрос с заковыркой. Что для вас важнее — сделать то, что от вас ждут, или сделать то, что принесёт результат?
🔥954
Журнал дизайнера | AI & Product
разыграю между правильно ответившими месячную подписку на Suno
Есть смысл вообще проводить розыгрыш?

А то ощущение, что канал на стадии вымирания. Грустно, но тупо некогда каналом заниматься. Куча работы, учеба в активной фазе. Щас еще на менторство вот вписалась, где тоже делать надо... Суета и шило в одном месте 😭

Напишите, готовы ли вы участвовать в этой заварушке или я могу забить?👇🏼
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1