AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
Агент для автоматического выполнения заданий в интернете. На основе языковой модели, естественно. Давно жду пригодную модель для этих целей.
Пока есть только экспериментальный код. Авторы планируют адаптировать свою модель к работе с реальными сайтами. Наверно, обучали на игрушечных, я не знаю.
Код
#assistant #agent
😁7❤1
MoMA: Multimodal LLM Adapter for Fast PersonalizedImage Generation
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
Мультимодальный LLM-адаптер (#MLLM), специализируется на создании персонализированных изображений с учетом тематики.
Умеет редактировать контекст (погода, локация), текстуры.
От кого? Правильно, от ByteDance
Код
Модель
#text2image #text2image
🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
LGM: Large Multi-View Gaussian Model for High-Resolution 3D Content Creation
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
Генератор 3D моделей по тексту и по одному изображению на гауссианах
Код
Демо
#gaussian #textto3D #imageto3D
👏6🔥3
Ладно, раскрою секрет. Меня несколько раз спрашивали где я беру новости. Так я вам и сказал, ага, вы же сразу пойдете сами там брать, и мне не останется. Поэтому секрет такой: читайте Сергея Цыпцына, и будете в курсе происходящего в цифровом мире.
С Сергеем я знаком еще с 2015 года когда он пришел знакомиться на студию Scandinava. Легендарный автор лучшей книги про Maya на русском языке, организатор CG Event'а, эксперт в области компьютерной графики. Если вы всё еще не знаете, он ведет один из самых популярных каналов про ИИ Метаверсище и ИИще. Уже из названия можно понять что там вас ожидает авторский стиль.
В духе Сергея строить сбывающиеся прогнозы и даже указывать цифровому миру куда ему катиться.
Он не устаёт "хоронить" профессионалов самых разных направлений — от художников до разработчиков. Но дед пошёл дальше и казнил... камеру-раздеватор. Почитайте, это любопытно.
Он проверяет и докапывается до сути там где остальные просто репостят не разбираясь. Он первый спалил что Kaedim нанял индусов имитировать ИИ. Почитайте, там целый сериал
А еще на его счету 625 употреблений слова «кожаный» в постах (это не шутка, проверено!).
В общем, рекомендую подписаться и читать его блог, чтобы действительно понимать и осмысливать, как развивается всё это ИИ-безобразие в нашем мире.
С Сергеем я знаком еще с 2015 года когда он пришел знакомиться на студию Scandinava. Легендарный автор лучшей книги про Maya на русском языке, организатор CG Event'а, эксперт в области компьютерной графики. Если вы всё еще не знаете, он ведет один из самых популярных каналов про ИИ Метаверсище и ИИще. Уже из названия можно понять что там вас ожидает авторский стиль.
В духе Сергея строить сбывающиеся прогнозы и даже указывать цифровому миру куда ему катиться.
Он не устаёт "хоронить" профессионалов самых разных направлений — от художников до разработчиков. Но дед пошёл дальше и казнил... камеру-раздеватор. Почитайте, это любопытно.
Он проверяет и докапывается до сути там где остальные просто репостят не разбираясь. Он первый спалил что Kaedim нанял индусов имитировать ИИ. Почитайте, там целый сериал
А еще на его счету 625 употреблений слова «кожаный» в постах (это не шутка, проверено!).
В общем, рекомендую подписаться и читать его блог, чтобы действительно понимать и осмысливать, как развивается всё это ИИ-безобразие в нашем мире.
❤16🤡10😁4🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко начинает жечь в преддверии Adobe Max.
Поглядите, как должен выглядеть интерфейс для работы с ИИ-картинками.
IP-Adapter и Style Reference, Firefly 3 и многое другое от Адобченко. Ждем к вечеру еще новостей.
Поглядите, как должен выглядеть интерфейс для работы с ИИ-картинками.
IP-Adapter и Style Reference, Firefly 3 и многое другое от Адобченко. Ждем к вечеру еще новостей.
🤔11🔥4💩3
Вы наверняка слышали про Chatbot Arena, где можно пользоваться топовыми LLM бесплатно.
Встречайте TEXT TO IMAGE ARENA - лидерборд генераторов картинок по тексту
#comparison #shootout #leaderboard
Встречайте TEXT TO IMAGE ARENA - лидерборд генераторов картинок по тексту
#comparison #shootout #leaderboard
👍18🤡4🔥3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
StreamMultiDiffusion: Real-Time Interactive Generation withRegion-Based Semantic Control
Интерактивная генерация картинки по мульти промпту и заданным областям в реальном времени
Код
Демо SD1.5
Демо SDXL
#text2image #conditioning #realtime
Интерактивная генерация картинки по мульти промпту и заданным областям в реальном времени
Код
Демо SD1.5
Демо SDXL
#text2image #conditioning #realtime
🔥7👍2👎2🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
Генератор картинок ideogram выкатил новую функцию describe - описание изображения. Но только для пользователей, оплативших подписку.
как пользоваться
#image2text #news
как пользоваться
#image2text #news
👍6🔥2
HiDiffusion: Unlocking Higher-Resolution Creativity and Efficiency in Pretrained Diffusion Models
Решает проблему с клонирующимися объектами на высоких разрешениях при генерации картинок. Причем всего в одну строку кода.
Авторы используют U-Net~ с пониманием разрешения (RAU-Net), который динамически регулирует размер карты объектов для устранения дублирования
Интегрируется в различные диффузные модели. Поддерживает контролнет, инпейнтинг. Выглядит многообещающе.
Код
Колаб
#text2image
Решает проблему с клонирующимися объектами на высоких разрешениях при генерации картинок. Причем всего в одну строку кода.
Авторы используют U-Net~ с пониманием разрешения (RAU-Net), который динамически регулирует размер карты объектов для устранения дублирования
Интегрируется в различные диффузные модели. Поддерживает контролнет, инпейнтинг. Выглядит многообещающе.
Код
Колаб
#text2image
🔥13👍4
IDM-VTON: Improving Diffusion Models for Authentic Virtual Try-on in the Wild
Еще одна виртуальная примерочная
Код
Демо
Колаб
#image2image
Еще одна виртуальная примерочная
Код
Демо
Колаб
#image2image
👍7👀2
This media is not supported in your browser
VIEW IN TELEGRAM
musicgen-songstarter-v0.2
Тут модель musicgen-stereo-melody-large дообучили делать из вашего мычания музыку.
Помучил, не удалось заставить его следовать мелодии. Может у вас получится?
Код
Демо
Колаб
#voice2music #audio2music
Тут модель musicgen-stereo-melody-large дообучили делать из вашего мычания музыку.
Помучил, не удалось заставить его следовать мелодии. Может у вас получится?
Код
Демо
Колаб
#voice2music #audio2music
😁7💩1
PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation
Пушка для AR/VR. Интерактивные гауссианы
Код
#gaussian #rendering #dynamics #interactive
Пушка для AR/VR. Интерактивные гауссианы
Код
#gaussian #rendering #dynamics #interactive
🤯10🔥6
DSINE: Rethinking Inductive Biases for Surface Normal Estimation
Генератор нормалей. Требует на два порядка меньше данных для обучения чем Omnidata v2 и независим от разрешения и соотношения сторон. Приятно что работает на уличных сценах/сценах реального мира, значит может пригодиться в композе.
Код
#image2normal #video2normal
Генератор нормалей. Требует на два порядка меньше данных для обучения чем Omnidata v2 и независим от разрешения и соотношения сторон. Приятно что работает на уличных сценах/сценах реального мира, значит может пригодиться в композе.
Код
#image2normal #video2normal
🔥9