Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
LUMIERE: A Space-Time Diffusion Model for Realistic Video Generation

Генератор видео от Google.

- по тексту
- по изображению
- inpainting
- стилизация
- синемаграфия - анимация отдельных объектов

Шикарно, что с доступом, Google?

#text2video #image2video #inpainting #stylization
3
FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring

Улучшайзер-энхенсер-апскейлер видео. Из мыльного видео низкого разрешения делает четкое видео высокого разрешения.
Новый лидер в этом типе задач.

Код ждем

#video2video #enhance #upscale #superresolution
👏2
RPG: Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs

Фреймворк, использующий MLLM (GPT4, Gemini-Pro) в качестве переписчика промтов и планировщика композиции изображения по регионам. Гибкий, прикручивается к разным диффузиям, в т.ч. SDXL, SDv1.5. Не требует дообучения и выдает топовые результаты высокого разрешения на генерации изображений. В деле замешаны Pika.

Планируют выпустить версию с контролнет, прикрутить редактирование изображений и запустить демоспейс.

Код

#text2image
🔥11
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion

В Baidu тоже придумали как улучшить генерацию картинок при помощи мультимодальных языковых моделей (MLLM).
Тут вам и персонализация, и сложные сцены с несколькими объектами.

Код ждем

#text2image #image2image #personalization
👍3
Нейромедуза в ударе

#humor
😁13🔥4
Вонка

Посмотрел на днях новый мюзикл. Запал он мне в сердечко. Милый и добрый. Да, много наивных моментов, но это сказка, а для жанра важны песни, визуалка и доброта, а не железная логика.

И Шаламе со своим театральным опытом тут как нельзя кстати.

#оффтоп
👎8👍6🔥21
Forwarded from AI для Всех (Artemii)
Translator Agent

Друзья, мне сегодня понадобилось переводить много документов и приделывать к ним Certificate of Translation.

Конечно же я решил эту задачу с помощью LLM, и что бы добру не пропадать даром - выложил свой скрипт в Open Source.

Что умеет Translator Agent?

Он умеет взять PDF (например сохраненку с веб-страницы) -> перевести ее без всякого лишнего (типа навигации по странице) и пришлепнуть сертификат перевода, который останется только подписать (ну и проверить тщательно конечно же).

Пожалуйста распространите, и не стесняйтесь контрибьютить и расширять функционал (например добавить сохранение веб-страницы в pdf)!

🖥Git-repo
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥121
Под высококачественный генератор картинок Würstchen появились контролнеты. Сейчас доступны инпейнтинг и canny. Опробовать можно в дискорде

Дискорд

#text2image #image2image
2
Завтра в 23:00 по Москве проведем розыгрыш билета на Aisummit здесь, в этом канале в прямом эфире.

На данный момент поступило 4 заявки на участие, шансы каждого участника 25%. Прием заявок прекращается 29 января в 23:00

#розыгрыш #giveaway
Forwarded from Denis Sexy IT 🤖
Нашел совершенно тупой способ проводить время с ChatGPT: даешь ей скучную картинку и просишь конвертировать в постер к фильму, столько эпичности на ровном месте иногда

Так воскресенье и прошло ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17😁91
Open-Vocabulary SAM: segment and recognize twenty-thousand classes interactively

Сегментатор изображений с открытым словарем, вдохновленный SAM. Быстрый, превосходит простую комбинацию SAM и CLIP

Код
Демо

#image2mask #segmentation
4👍2