Только вчера почему-то в первый раз увидела, что прямо в бинге можно расширить размер генерации из квадрата в 4:3. Бинг перегенеривает в большем формате, но всё равно близко к исходной картинке.
Почему вообще бинг? Потому что бинг делает сразу ровно по промпту. Бесплатно и быстро в вебе. Бинг выдает 4 картинки в .jpeg, а чат-гпт за это же время только одну в .webp(Я проспала тот момент, когда и зачем 3дшки стали юзаться в .glb, а 2дшки в .webp. Ни то, ни другое не особо удобно).
В чат-гпт начинаются бесконечные уговоры убрать то, добавить это, вернуть как было и тд. Намного быстрее в бинге сделать штук 12 картинок, одна попадёт в то, что надо, и её сразу в бинге расширить до 4:3.
Если формат нужен еще больше, то Крита из 4:3 в 16:9 изи делает.
Еще вариант аутпеинтить бесплатно можно тут, но есть ограничения по кредитам(решается созданием нескольких аккаунтов, что у работающих с иишкой давно схвачено - за пазухой припрятаны 10 дополнительных почт).
https://huggingface.co/spaces/fffiloni/diffusers-image-outpaint
#ImageAi_Aironically
Почему вообще бинг? Потому что бинг делает сразу ровно по промпту. Бесплатно и быстро в вебе. Бинг выдает 4 картинки в .jpeg, а чат-гпт за это же время только одну в .webp(Я проспала тот момент, когда и зачем 3дшки стали юзаться в .glb, а 2дшки в .webp. Ни то, ни другое не особо удобно).
В чат-гпт начинаются бесконечные уговоры убрать то, добавить это, вернуть как было и тд. Намного быстрее в бинге сделать штук 12 картинок, одна попадёт в то, что надо, и её сразу в бинге расширить до 4:3.
Если формат нужен еще больше, то Крита из 4:3 в 16:9 изи делает.
Еще вариант аутпеинтить бесплатно можно тут, но есть ограничения по кредитам(решается созданием нескольких аккаунтов, что у работающих с иишкой давно схвачено - за пазухой припрятаны 10 дополнительных почт).
https://huggingface.co/spaces/fffiloni/diffusers-image-outpaint
#ImageAi_Aironically
В гемини можно погонять редактирование своих картинок в чате и даже на русском языке. Справа нужно выбрать модель Gemini 2.0 Flash Experimental и в Output format - Images and text.
Как по мне, пока шляпология. Женщины и дети под цензурой, белый хлеб под цензурой, объекты иногда добавляются без теней.
#ImageAi_Aironically
Как по мне, пока шляпология. Женщины и дети под цензурой, белый хлеб под цензурой, объекты иногда добавляются без теней.
#ImageAi_Aironically
Рабочий пайплайн юзать гемини для 3дшки.
Если генерить 3дшку просто по фото, то качество будет так себе, поэтому:
1. Сначала кидаем фотку в гемини и просим сделать генерацию под 3д-рендер.
2. Полученную картинку кидаем в локальный хуньянь или любой другой 3д-генератор.
3. Получаем достойную болванку для допиливания.
В комменты прикреплю вариант с текстурами и сам файл .glb из хуньяня.
#3d_Aironically
Если генерить 3дшку просто по фото, то качество будет так себе, поэтому:
1. Сначала кидаем фотку в гемини и просим сделать генерацию под 3д-рендер.
2. Полученную картинку кидаем в локальный хуньянь или любой другой 3д-генератор.
3. Получаем достойную болванку для допиливания.
В комменты прикреплю вариант с текстурами и сам файл .glb из хуньяня.
#3d_Aironically
Гемини и консистентный персонаж 🔥
1. Сгенерить персонажа бесплатно в бинге или где угодно.
2. В гемини попросить сделать облёт вокруг персонажа в 360 градусов или конкретные ракурсы - side view, back view, top view.
При необходимости уточняйте keep the same position, background, light, color palette, level of details.
3. Для 3д полученные картинки отправить в платный Rodin, потому что он принимает несколько ракурсов.
4. Для обучения лоры можно вписать героя в разное окружение и добавить разные позы, чтобы быстро сделать хороший датасет для обучения.
5. Для видеонейронок можно и не обучать лору, а сразу нагенерить все стиллы с этим персонажем в нужных ракурсах, и он будет выглядеть консистентно.
Короче, 🔥🔥
#ImageAi_Aironically
#3d_Aironically
1. Сгенерить персонажа бесплатно в бинге или где угодно.
2. В гемини попросить сделать облёт вокруг персонажа в 360 градусов или конкретные ракурсы - side view, back view, top view.
При необходимости уточняйте keep the same position, background, light, color palette, level of details.
3. Для 3д полученные картинки отправить в платный Rodin, потому что он принимает несколько ракурсов.
4. Для обучения лоры можно вписать героя в разное окружение и добавить разные позы, чтобы быстро сделать хороший датасет для обучения.
5. Для видеонейронок можно и не обучать лору, а сразу нагенерить все стиллы с этим персонажем в нужных ракурсах, и он будет выглядеть консистентно.
Короче, 🔥🔥
#ImageAi_Aironically
#3d_Aironically
Image-01 в HailuoAI
В минимакс добавили режим Create Image для создания картинок, которые тут же можно отправить анимировать с тем же промптом.
1 картинка - 1 кредит. Ежедневно дают 100 кредитов(=100 картинок или =3 генерации видео или =2 генерации видео с умной камерой).
Потихоньку упаковывают. У них есть своя текстовая модель с дипсиком, озвучка, видеомодель и вот теперь и картинки.
#ImageAi_Aironically
В минимакс добавили режим Create Image для создания картинок, которые тут же можно отправить анимировать с тем же промптом.
1 картинка - 1 кредит. Ежедневно дают 100 кредитов(=100 картинок или =3 генерации видео или =2 генерации видео с умной камерой).
Потихоньку упаковывают. У них есть своя текстовая модель с дипсиком, озвучка, видеомодель и вот теперь и картинки.
#ImageAi_Aironically
Сегодня вспоминали Love Death and Robots. Вот эти серии для меня - высокое искусство, где всё сложилось с историей и визуалом. От Jibaro, Bad travelling и Tall grass я плачу, когда смотрю. Даже спустя время каждый раз глубокое эмоциональное переживание за рамками слов и картинок.
The witness
Sonnie's edge
The tall grass
Bad travelling
Jibaro
Вот эти мне не так нравятся, но они получили большой отклик у аудитории и знакомых:
The drowned giant
Zima blue
Pop squad
Остальные серии спустя время я либо не помню, либо помню, но нет желания пересмотреть.
В Secret Level визуал на таком же уровне, но идейно меня ничего не зацепило.
#Aironically
The witness
Sonnie's edge
The tall grass
Bad travelling
Jibaro
Вот эти мне не так нравятся, но они получили большой отклик у аудитории и знакомых:
The drowned giant
Zima blue
Pop squad
Остальные серии спустя время я либо не помню, либо помню, но нет желания пересмотреть.
В Secret Level визуал на таком же уровне, но идейно меня ничего не зацепило.
#Aironically
Одна из проблем ИИ-роликов - каждые 5 секунд зрителя выкидывает на новый фон и нет якорных предметов на заднике. Например, вход в комнату и барная стойка - якорные предметы. Они должны быть показаны несколько раз с разных точек, так зритель отслеживает движение, как герой зашел в комнату, подошел к барной стойке, вышел из комнаты. Но нейронка каждый раз генерит то новую барную стойку, то новый вход, поэтому получается карусель. Это детали, которые тут же ломают восприятие. И ещё перспектива с одной точкой схода на заднике мгновенно выдаёт нейронку и тоже портит впечатление.
Варианты решения:
1. Руками нужно править якорные предметы на стиллах, сводить все картинки, удалять лишние предметы, которые неумышленно стали якорными.
2. Делать 3дшку(делала на Санте и прямо сейчас делаю всех персов и локи на текущем проекте). Разумеется, сшить персонажа из 3д-нейронки гораздо быстрее, чем с нуля рукам лепить руками, но это всё ещё 3дшная техничка, которую хочется убрать.
3. Использовать PikaElements и другие подобные костыли. Мои задачи не получается сделать. Мне нужен заявочный план сверху, диалоговая восьмерка(комната с условной барной стойкой с одной стороны и поворот на 180 градусов в другую сторону на вход) и клоуз-ап, и чтобы во всех четырех ракурсах консистентно было направление света, расположение и масштаб персонажей и якорные предметы.
4. Мучаю гемини пару дней, потому что он потенциально может решить эту проблему.
Попытки нагенерить новую картинку из текущей с поворотом на 180 градусов, сделать сториборд, расширять текущую картинку не особо помогают.
Напомню общее правило, что гораздо легче сделать фон, а потом вписать в него персонажа(что в рисовании, что в генерациях), а не наоборот делать фон под персонажа. Тем более, что консистентный персонаж это решаемая задача.
Самый лучший результат, что у меня пока получается - "make me a walkthrough this interior - turnaround. make 5 images". Больше 5 картинок - слетает стиль.
5. Ещё какой-то способ??
#ImageAi_Aironically
Варианты решения:
1. Руками нужно править якорные предметы на стиллах, сводить все картинки, удалять лишние предметы, которые неумышленно стали якорными.
2. Делать 3дшку(делала на Санте и прямо сейчас делаю всех персов и локи на текущем проекте). Разумеется, сшить персонажа из 3д-нейронки гораздо быстрее, чем с нуля рукам лепить руками, но это всё ещё 3дшная техничка, которую хочется убрать.
3. Использовать PikaElements и другие подобные костыли. Мои задачи не получается сделать. Мне нужен заявочный план сверху, диалоговая восьмерка(комната с условной барной стойкой с одной стороны и поворот на 180 градусов в другую сторону на вход) и клоуз-ап, и чтобы во всех четырех ракурсах консистентно было направление света, расположение и масштаб персонажей и якорные предметы.
4. Мучаю гемини пару дней, потому что он потенциально может решить эту проблему.
Попытки нагенерить новую картинку из текущей с поворотом на 180 градусов, сделать сториборд, расширять текущую картинку не особо помогают.
Напомню общее правило, что гораздо легче сделать фон, а потом вписать в него персонажа(что в рисовании, что в генерациях), а не наоборот делать фон под персонажа. Тем более, что консистентный персонаж это решаемая задача.
Самый лучший результат, что у меня пока получается - "make me a walkthrough this interior - turnaround. make 5 images". Больше 5 картинок - слетает стиль.
5. Ещё какой-то способ??
#ImageAi_Aironically
В твиттер завезли Грок, в котором можно редачить свои картинки. И на фоне Гемини выглядит очень даже хорошо.
Дополнительные ракурсы из одной картинки, как в прошлом посте, конечно, не делает, но зато цензуры почти нет.
В Гемини я уже замучилась, потому что чтобы сгенерить женщину, нужно сначала сделать рядом с ней мужчину, а потом его стереть 🫠 Иначе аларм, ЖЕНЩИНА, блокировка генерации.
#ImageAi_Aironically
Дополнительные ракурсы из одной картинки, как в прошлом посте, конечно, не делает, но зато цензуры почти нет.
В Гемини я уже замучилась, потому что чтобы сгенерить женщину, нужно сначала сделать рядом с ней мужчину, а потом его стереть 🫠 Иначе аларм, ЖЕНЩИНА, блокировка генерации.
#ImageAi_Aironically
Reve
Протестила новую нейросеть, где можно генерить уникальные штуки, которые в других сетках сделать очень тяжело или невозможно.
Можно потестить бесплатно. Когда кредиты кончаются, в разделе Account слева вверху удаляйте свой аккаунт и логиньтесь заново прямо с той же почтой, чтобы продолжить генерить.
#ImageAi_Aironically
Протестила новую нейросеть, где можно генерить уникальные штуки, которые в других сетках сделать очень тяжело или невозможно.
Можно потестить бесплатно. Когда кредиты кончаются, в разделе Account слева вверху удаляйте свой аккаунт и логиньтесь заново прямо с той же почтой, чтобы продолжить генерить.
#ImageAi_Aironically