Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
RPG: Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs

Фреймворк, использующий MLLM (GPT4, Gemini-Pro) в качестве переписчика промтов и планировщика композиции изображения по регионам. Гибкий, прикручивается к разным диффузиям, в т.ч. SDXL, SDv1.5. Не требует дообучения и выдает топовые результаты высокого разрешения на генерации изображений. В деле замешаны Pika.

Планируют выпустить версию с контролнет, прикрутить редактирование изображений и запустить демоспейс.

Код

#text2image
🔥11
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion

В Baidu тоже придумали как улучшить генерацию картинок при помощи мультимодальных языковых моделей (MLLM).
Тут вам и персонализация, и сложные сцены с несколькими объектами.

Код ждем

#text2image #image2image #personalization
👍3
Нейромедуза в ударе

#humor
😁13🔥4
Вонка

Посмотрел на днях новый мюзикл. Запал он мне в сердечко. Милый и добрый. Да, много наивных моментов, но это сказка, а для жанра важны песни, визуалка и доброта, а не железная логика.

И Шаламе со своим театральным опытом тут как нельзя кстати.

#оффтоп
👎8👍6🔥21
Forwarded from AI для Всех (Artemii)
Translator Agent

Друзья, мне сегодня понадобилось переводить много документов и приделывать к ним Certificate of Translation.

Конечно же я решил эту задачу с помощью LLM, и что бы добру не пропадать даром - выложил свой скрипт в Open Source.

Что умеет Translator Agent?

Он умеет взять PDF (например сохраненку с веб-страницы) -> перевести ее без всякого лишнего (типа навигации по странице) и пришлепнуть сертификат перевода, который останется только подписать (ну и проверить тщательно конечно же).

Пожалуйста распространите, и не стесняйтесь контрибьютить и расширять функционал (например добавить сохранение веб-страницы в pdf)!

🖥Git-repo
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥121
Под высококачественный генератор картинок Würstchen появились контролнеты. Сейчас доступны инпейнтинг и canny. Опробовать можно в дискорде

Дискорд

#text2image #image2image
2
Завтра в 23:00 по Москве проведем розыгрыш билета на Aisummit здесь, в этом канале в прямом эфире.

На данный момент поступило 4 заявки на участие, шансы каждого участника 25%. Прием заявок прекращается 29 января в 23:00

#розыгрыш #giveaway
Forwarded from Denis Sexy IT 🤖
Нашел совершенно тупой способ проводить время с ChatGPT: даешь ей скучную картинку и просишь конвертировать в постер к фильму, столько эпичности на ровном месте иногда

Так воскресенье и прошло ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17😁91
Open-Vocabulary SAM: segment and recognize twenty-thousand classes interactively

Сегментатор изображений с открытым словарем, вдохновленный SAM. Быстрый, превосходит простую комбинацию SAM и CLIP

Код
Демо

#image2mask #segmentation
4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Аспирантка Лорен Рамлан запустила Doom на клетках кишечной палочки.

Клетки функционировали как пиксели, отображая флуоресцентной подсветкой по одному кадру каждые 8 часов 20 минут. На прохождение уйдет около 666 лет.

#оффтоп
🤯16😁8🤔1👀1
Напоминаю, сегодня в 23:00 по Москве проведем розыгрыш билета на Aisummit здесь, в этом канале в прямом эфире.

С победителем свяжется организатор и вручит приз.

На данный момент поступило 7 заявок на участие, шансы каждого участника все еще высоки. Прием заявок прекращается сегодня в 23:00.

Репостом вы можете увеличить свои шансы, читайте оригинальный пост.

#розыгрыш #giveaway
🔥1