DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training
Модель для создания реалистичных панорамных изображений на базе Flux с лорой
— улучшает качество существующих панорам за счёт устранения артефактов и искажений в полярных областях
— использует перспективные изображения для обогащения панорамного контента и повышения фотореализма
— обеспечивает согласованность границ и устраняет искажения в полярных регионах
— делает инпейнтинг и аутпейнтинг без дополнительного обучения
— использует несколько механизмов для контроля геометрии и искажения в латентном пространстве
Код
Демо
#panorama #text2panorama #text2image
Модель для создания реалистичных панорамных изображений на базе Flux с лорой
— улучшает качество существующих панорам за счёт устранения артефактов и искажений в полярных областях
— использует перспективные изображения для обогащения панорамного контента и повышения фотореализма
— обеспечивает согласованность границ и устраняет искажения в полярных регионах
— делает инпейнтинг и аутпейнтинг без дополнительного обучения
— использует несколько механизмов для контроля геометрии и искажения в латентном пространстве
Код
Демо
#panorama #text2panorama #text2image
👍6❤1
Лутаем 600+ кредитов Higgsfield и еще немножко если у вас есть подписка
Включаем американский ВПH, идем с новым имейлом на https://higgsfield.ai/me/settings и вставляем промокоды - все подряд которые подойдут
Для этих нужно прикинутся что вы из штатов(хотя у некоторых и без этого работает):
Эти промокоды сработают если у вас платная подписка(и тоже прикинувшись что вы из штатов):
раздачу подрезал у @AINetSD
#giveaway
Включаем американский ВПH, идем с новым имейлом на https://higgsfield.ai/me/settings и вставляем промокоды - все подряд которые подойдут
150CREDS_HIGGSFIELDSORAADS
SKETCH2VIDEOHIGGS_xWVAZ
Для этих нужно прикинутся что вы из штатов(хотя у некоторых и без этого работает):
SORASTREAM_150CREDS
HIGGSFIELD_SORA2TRENDS_150CREDITS
Эти промокоды сработают если у вас платная подписка(и тоже прикинувшись что вы из штатов):
STREAM200
GIFT200
раздачу подрезал у @AINetSD
#giveaway
👍12❤5🔥1
AVoCaDO: An AudioVisual Video Captioner Driven by Temporal Orchestration
Кэпшонер на базе Qwen2.5-Omni-7B, создает описание видео, учитывая как визуальную, так и аудиосоставляющую, синхронизируя их во времени
Код
HF
#captioning #VLM #video2text
Кэпшонер на базе Qwen2.5-Omni-7B, создает описание видео, учитывая как визуальную, так и аудиосоставляющую, синхронизируя их во времени
Код
HF
#captioning #VLM #video2text
👍11❤1
EPG: Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training
Новая #SOTA генератор картинок в пиксельном пространстве
Код ждем
#research #text2image
Новая #SOTA генератор картинок в пиксельном пространстве
первая успешная попытка обучить консистентную модель непосредственно на изображениях высокого разрешения без использования предварительно обученных VAE или диффузионных моделей.
Код ждем
#research #text2image
👍7🔥2
MAI-Image-1
Новый картинкогенератор от Microsoft
Сейчас на 9 месте на LMArena
Очевидно, умеет изображать текст.
Делают ставку на фотореализм и скорость:
Непонятно выдадут ли код или сервис, а пока пробуем на арене. Можно выбрать Direct Chat -> mai-image-1
#text2image
Новый картинкогенератор от Microsoft
Сейчас на 9 месте на LMArena
Очевидно, умеет изображать текст.
Делают ставку на фотореализм и скорость:
MAI-Image-1 отлично подходит для создания фотореалистичных изображений, таких как освещение (например, отраженный свет, блики), пейзажи и многое другое. Это особенно важно по сравнению со многими более крупными и медленными моделями. Благодаря сочетанию скорости и качества пользователи могут быстрее отображать свои идеи на экране, быстро просматривать их, а затем переносить свою работу в другие инструменты для дальнейшей доработки.
Непонятно выдадут ли код или сервис, а пока пробуем на арене. Можно выбрать Direct Chat -> mai-image-1
#text2image
👍5
Нейронавт | Нейросети в творчестве
MAI-Image-1 Новый картинкогенератор от Microsoft Сейчас на 9 месте на LMArena Очевидно, умеет изображать текст. Делают ставку на фотореализм и скорость: MAI-Image-1 отлично подходит для создания фотореалистичных изображений, таких как освещение (например…
Промпта слушается. А вот с качеством беда. Анатомию ломает. В художественные стили толком не умеет. Архитектура кривая. Да и в тексте ошибается. Ну может он будет легкий и быстрый хотя бы?
👍9🤷♂1
Нейронавт | Нейросети в творчестве
Промпта слушается. А вот с качеством беда. Анатомию ломает. В художественные стили толком не умеет. Архитектура кривая. Да и в тексте ошибается. Ну может он будет легкий и быстрый хотя бы?
а вот так с их промптом получилось.
Видимо когда текст идет основным объектом тогда он лучше справляется
Видимо когда текст идет основным объектом тогда он лучше справляется
NEURONAUT written in the sand at sunset over the beach
👍13