Forwarded from PHYGITAL+ART
Колаб, который лучше вас разберет картинку на запрос.
В примере оригинальное изображение и затем промпт, который выдал колаб поместил в SD.
Получаем промпт:
"a painting of a castle with a waterfall in front of it, a detailed matte painting by Tyler Edlin, featured on cgsociety, arts and crafts movement, artstation hq, unreal engine 5, unreal engine"
Теперь референс фото станет намного легче разбирать.
Больше нейронок для артов тут
В примере оригинальное изображение и затем промпт, который выдал колаб поместил в SD.
Получаем промпт:
"a painting of a castle with a waterfall in front of it, a detailed matte painting by Tyler Edlin, featured on cgsociety, arts and crafts movement, artstation hq, unreal engine 5, unreal engine"
Теперь референс фото станет намного легче разбирать.
Больше нейронок для артов тут
👍15🔥1
Forwarded from Нейроэстетика
🚘 Кто-то слил в сеть скриншоты готовящейся GTA VI
✨ Поговорим про prompt-инжиниринг или создание текстовых описаний на примере GTA VI.
На самом деле чтобы сгенерировать именно то, что вы хотите, нужно применять очень много текстовых трюков. Например в сети ещё нет скриншотов GTA VI. И поэтому нужно описывать очень подробно.
Нейросеть ничего знает про сеттинг игры, но мы можем его описать. Я выбрал следующие фразы:
- GTA Vice City graphics mods
- GTA Vice City 2024 remaster
- Miami, palms and Miami buildings
Теперь про графику. Сначала выходило очень примитивно, так как сеть цеплялась за GTA Vice City, госдеповских можно спасти:
- next-gen ps5 game
- unreal engine
- rtx reflection
- artstation
Изображения подучились уже качественные, но, в них не хватало реализма, слишком отдавало компьютерной графикой. Вернуть реализм просто:
- photorealistic screenshot
- still
- 50mm
- bokeh
В итоге я получил следующее текстовое описание: «still next-gen ps5 game Grand Theft Auto 6 2024 remaster, graphics mods, rain, red sunset, people, rtx reflections, GTA VI, Miami, palms and Miami buildings, photorealistic screenshot, unreal engine, 4K, 50mm bokeh, close-up ford mustang, gta vice city remastered, artstation
-W 704 -H 512 -n 9 -C 9 -s 100»
Где:
-W 704 -H 512 ширина и высота
-n 9 количество генераций за раз
-C 9 classifier free guidance scale 9
-s 100 количество денойзинг шагов
p.s.: я заметил, что подбор prompt’ов для Stable Diffusion очень отличается от DALL•E 2, скорее всего дело именно в датасетах
Канал про генеративные нейронные сети
🌊 Н е й р о э с т е т и к а
✨ Поговорим про prompt-инжиниринг или создание текстовых описаний на примере GTA VI.
На самом деле чтобы сгенерировать именно то, что вы хотите, нужно применять очень много текстовых трюков. Например в сети ещё нет скриншотов GTA VI. И поэтому нужно описывать очень подробно.
Нейросеть ничего знает про сеттинг игры, но мы можем его описать. Я выбрал следующие фразы:
- GTA Vice City graphics mods
- GTA Vice City 2024 remaster
- Miami, palms and Miami buildings
Теперь про графику. Сначала выходило очень примитивно, так как сеть цеплялась за GTA Vice City, госдеповских можно спасти:
- next-gen ps5 game
- unreal engine
- rtx reflection
- artstation
Изображения подучились уже качественные, но, в них не хватало реализма, слишком отдавало компьютерной графикой. Вернуть реализм просто:
- photorealistic screenshot
- still
- 50mm
- bokeh
В итоге я получил следующее текстовое описание: «still next-gen ps5 game Grand Theft Auto 6 2024 remaster, graphics mods, rain, red sunset, people, rtx reflections, GTA VI, Miami, palms and Miami buildings, photorealistic screenshot, unreal engine, 4K, 50mm bokeh, close-up ford mustang, gta vice city remastered, artstation
-W 704 -H 512 -n 9 -C 9 -s 100»
Где:
-W 704 -H 512 ширина и высота
-n 9 количество генераций за раз
-C 9 classifier free guidance scale 9
-s 100 количество денойзинг шагов
p.s.: я заметил, что подбор prompt’ов для Stable Diffusion очень отличается от DALL•E 2, скорее всего дело именно в датасетах
Канал про генеративные нейронные сети
🌊 Н е й р о э с т е т и к а
👍11🔥7❤1
Forwarded from Dev Meme / devmeme
Ok, what?! Those if/else AIs need some rest too from time to time
😁35😢11🤩9🎉7🔥6❤5
Forwarded from Нейросети и Блендер
Тут разворачивается настоящий детектив, недавно буквально из тени вышел сервис Kaedim, предлагают 2D в 3D по одной картинке и что внутри AI алгоритм, при этом какой именно нигде не сказано. Судя по прайсу за генерации, самый дешевый в 239$, были шутки, что индусы вручную делают.
А сегодня в их дискорде много раскопали инфы, у них нет ML спецов хоть каких-либо известных, вся команда практически 3D генералисты. Плюс набирают в команду 3D художников, которые за 15 минут могут накидать модель.
В общем под шквалом вопросов они закрыли дискорд сервер, убрали часть прайса и чуть увеличили цену с 239 $ до 539 $ за месяц по самому минимальному тарифу.
Профы в 3D заметили, что многие детали похожи на быстрые скетчи, нежели на алгоритмы в AI реконструкции 3D. Да и особых артефактов нет.
А сегодня в их дискорде много раскопали инфы, у них нет ML спецов хоть каких-либо известных, вся команда практически 3D генералисты. Плюс набирают в команду 3D художников, которые за 15 минут могут накидать модель.
В общем под шквалом вопросов они закрыли дискорд сервер, убрали часть прайса и чуть увеличили цену с 239 $ до 539 $ за месяц по самому минимальному тарифу.
Профы в 3D заметили, что многие детали похожи на быстрые скетчи, нежели на алгоритмы в AI реконструкции 3D. Да и особых артефактов нет.
Наблюдая в дискорде за всем процессом увидел ещё момент, после закрытия комментов в Discord, обычные пользователи нашли лазейки и создали ветку, где быстро организовали крутой ресерч по imageTO3D, какие есть сейчас решения, забавно. Сохранил их всех и поделюсь в отдельном посте.😁29👍4