RPG: Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs
Фреймворк, использующий MLLM (GPT4, Gemini-Pro) в качестве переписчика промтов и планировщика композиции изображения по регионам. Гибкий, прикручивается к разным диффузиям, в т.ч. SDXL, SDv1.5. Не требует дообучения и выдает топовые результаты высокого разрешения на генерации изображений. В деле замешаны Pika.
Планируют выпустить версию с контролнет, прикрутить редактирование изображений и запустить демоспейс.
Код
#text2image
Фреймворк, использующий MLLM (GPT4, Gemini-Pro) в качестве переписчика промтов и планировщика композиции изображения по регионам. Гибкий, прикручивается к разным диффузиям, в т.ч. SDXL, SDv1.5. Не требует дообучения и выдает топовые результаты высокого разрешения на генерации изображений. В деле замешаны Pika.
Планируют выпустить версию с контролнет, прикрутить редактирование изображений и запустить демоспейс.
Код
#text2image
🔥11
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion
В Baidu тоже придумали как улучшить генерацию картинок при помощи мультимодальных языковых моделей (MLLM).
Тут вам и персонализация, и сложные сцены с несколькими объектами.
Код ждем
#text2image #image2image #personalization
В Baidu тоже придумали как улучшить генерацию картинок при помощи мультимодальных языковых моделей (MLLM).
Тут вам и персонализация, и сложные сцены с несколькими объектами.
Код ждем
#text2image #image2image #personalization
👍3
Вонка
Посмотрел на днях новый мюзикл. Запал он мне в сердечко. Милый и добрый. Да, много наивных моментов, но это сказка, а для жанра важны песни, визуалка и доброта, а не железная логика.
И Шаламе со своим театральным опытом тут как нельзя кстати.
#оффтоп
Посмотрел на днях новый мюзикл. Запал он мне в сердечко. Милый и добрый. Да, много наивных моментов, но это сказка, а для жанра важны песни, визуалка и доброта, а не железная логика.
И Шаламе со своим театральным опытом тут как нельзя кстати.
#оффтоп
Кинопоиск
«Вонка» (Wonka, 2023)
🎬 Мечтая открыть магазин в городе, известном своим шоколадом, молодой и бедный Вилли Вонка обнаруживает, что индустрией управляет картель жадных шоколатье. Подробная информация о фильме Вонка на сайте Кинопоиск.
👎8👍6🔥2❤1
Forwarded from AI для Всех (Artemii)
Translator Agent
Друзья, мне сегодня понадобилось переводить много документов и приделывать к ним Certificate of Translation.
Конечно же я решил эту задачу с помощью LLM, и что бы добру не пропадать даром - выложил свой скрипт в Open Source.
Что умеет Translator Agent?
Он умеет взять PDF (например сохраненку с веб-страницы) -> перевести ее без всякого лишнего (типа навигации по странице) и пришлепнуть сертификат перевода, который останется только подписать (ну и проверить тщательно конечно же).
Пожалуйста распространите, и не стесняйтесь контрибьютить и расширять функционал (например добавить сохранение веб-страницы в pdf)!
🖥 Git-repo
Друзья, мне сегодня понадобилось переводить много документов и приделывать к ним Certificate of Translation.
Конечно же я решил эту задачу с помощью LLM, и что бы добру не пропадать даром - выложил свой скрипт в Open Source.
Что умеет Translator Agent?
Он умеет взять PDF (например сохраненку с веб-страницы) -> перевести ее без всякого лишнего (типа навигации по странице) и пришлепнуть сертификат перевода, который останется только подписать (ну и проверить тщательно конечно же).
Пожалуйста распространите, и не стесняйтесь контрибьютить и расширять функционал (например добавить сохранение веб-страницы в pdf)!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤1
Под высококачественный генератор картинок Würstchen появились контролнеты. Сейчас доступны инпейнтинг и canny. Опробовать можно в дискорде
Дискорд
#text2image #image2image
Дискорд
#text2image #image2image
❤2
Forwarded from Denis Sexy IT 🤖
Нашел совершенно тупой способ проводить время с ChatGPT: даешь ей скучную картинку и просишь конвертировать в постер к фильму, столько эпичности на ровном месте иногда
Так воскресенье и прошло☕️
Так воскресенье и прошло
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17😁9⚡1
Open-Vocabulary SAM: segment and recognize twenty-thousand classes interactively
Сегментатор изображений с открытым словарем, вдохновленный SAM. Быстрый, превосходит простую комбинацию SAM и CLIP
Код
Демо
#image2mask #segmentation
Сегментатор изображений с открытым словарем, вдохновленный SAM. Быстрый, превосходит простую комбинацию SAM и CLIP
Код
Демо
#image2mask #segmentation
❤4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Аспирантка Лорен Рамлан запустила Doom на клетках кишечной палочки.
Клетки функционировали как пиксели, отображая флуоресцентной подсветкой по одному кадру каждые 8 часов 20 минут. На прохождение уйдет около 666 лет.
#оффтоп
Клетки функционировали как пиксели, отображая флуоресцентной подсветкой по одному кадру каждые 8 часов 20 минут. На прохождение уйдет около 666 лет.
#оффтоп
🤯16😁8🤔1👀1
Напоминаю, сегодня в 23:00 по Москве проведем розыгрыш билета на Aisummit здесь, в этом канале в прямом эфире.
С победителем свяжется организатор и вручит приз.
На данный момент поступило 7 заявок на участие, шансы каждого участника все еще высоки. Прием заявок прекращается сегодня в 23:00.
Репостом вы можете увеличить свои шансы, читайте оригинальный пост.
#розыгрыш #giveaway
С победителем свяжется организатор и вручит приз.
На данный момент поступило 7 заявок на участие, шансы каждого участника все еще высоки. Прием заявок прекращается сегодня в 23:00.
Репостом вы можете увеличить свои шансы, читайте оригинальный пост.
#розыгрыш #giveaway
Telegram
Нейронавт | Нейросети в творчестве
AIsummit
Сегодня в полночь билеты подорожают. И вы еще можете вписаться в розыгрыш бесплатного билета, написав к этому или к оригинальному посту комментарий "Хочу билет"
17 февраля 2024 в Москве состоится конференция про искусственный интеллект для бизнеса.…
Сегодня в полночь билеты подорожают. И вы еще можете вписаться в розыгрыш бесплатного билета, написав к этому или к оригинальному посту комментарий "Хочу билет"
17 февраля 2024 в Москве состоится конференция про искусственный интеллект для бизнеса.…
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
TIP-Editor: An Accurate 3D Editor Following Both Text-Prompts And Image-Prompts
В Tencent изобрели редактор 3D-сцен по текстовым промтам и картинкам. Под капотом притаились гауссианы. Есть только препринт и это видео
Препринт
#3Dto3D #scene2scene #3Dedit #gaussian
В Tencent изобрели редактор 3D-сцен по текстовым промтам и картинкам. Под капотом притаились гауссианы. Есть только препринт и это видео
Препринт
#3Dto3D #scene2scene #3Dedit #gaussian
❤4🔥3👍1