Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

Модель для создания реалистичных панорамных изображений на базе Flux с лорой

— улучшает качество существующих панорам за счёт устранения артефактов и искажений в полярных областях

— использует перспективные изображения для обогащения панорамного контента и повышения фотореализма

— обеспечивает согласованность границ и устраняет искажения в полярных регионах

— делает инпейнтинг и аутпейнтинг без дополнительного обучения

— использует несколько механизмов для контроля геометрии и искажения в латентном пространстве

Код
Демо

#panorama #text2panorama #text2image
👍61
Лутаем 600+ кредитов Higgsfield и еще немножко если у вас есть подписка

Включаем американский ВПH, идем с новым имейлом на https://higgsfield.ai/me/settings и вставляем промокоды - все подряд которые подойдут

150CREDS_HIGGSFIELDSORAADS

SKETCH2VIDEOHIGGS_xWVAZ


Для этих нужно прикинутся что вы из штатов(хотя у некоторых и без этого работает):
SORASTREAM_150CREDS

HIGGSFIELD_SORA2TRENDS_150CREDITS


Эти промокоды сработают если у вас платная подписка(и тоже прикинувшись что вы из штатов):
STREAM200

GIFT200


раздачу подрезал у @AINetSD

#giveaway
👍125🔥1
AVoCaDO: An AudioVisual Video Captioner Driven by Temporal Orchestration

Кэпшонер на базе Qwen2.5-Omni-7B, создает описание видео, учитывая как визуальную, так и аудиосоставляющую, синхронизируя их во времени

Код
HF

#captioning #VLM #video2text
👍111
EPG: Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training

Новая #SOTA генератор картинок в пиксельном пространстве

первая успешная попытка обучить консистентную модель непосредственно на изображениях высокого разрешения без использования предварительно обученных VAE или диффузионных моделей.


Код ждем

#research #text2image
👍7🔥2
Говорят, VEO 3.1 сегодня выйдет

#news
👍6😱3
MAI-Image-1

Новый картинкогенератор от Microsoft

Сейчас на 9 месте на LMArena

Очевидно, умеет изображать текст.
Делают ставку на фотореализм и скорость:
MAI-Image-1 отлично подходит для создания фотореалистичных изображений, таких как освещение (например, отраженный свет, блики), пейзажи и многое другое. Это особенно важно по сравнению со многими более крупными и медленными моделями. Благодаря сочетанию скорости и качества пользователи могут быстрее отображать свои идеи на экране, быстро просматривать их, а затем переносить свою работу в другие инструменты для дальнейшей доработки.


Непонятно выдадут ли код или сервис, а пока пробуем на арене. Можно выбрать Direct Chat -> mai-image-1

#text2image
👍5