Nano Banana
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
👍6🔥3
Skywork-UniPic
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
👍3👎3
Miromind
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
👍9
Media is too big
VIEW IN TELEGRAM
Раздача студенческих промокодов на ElevenLabs, Vercel, Bolt, Lovable, HeyGen, Hedra, Higgsfield и другие сервисы
В основном скидки. Но на сам ElevenLabs - целая подписка на 3 месяца. Но понадобится карточка Visa/Mastercard
1. Регаем временную студенческую почту здесь. Указываем домен imail.edu.vn.
2. На странице раздачи указываем эту почту, свой номер телефона. Мой обычный российский прокатил
3. Вводим пришедшие коды подтверждения телефона и почты
Промокодов ограниченное количество, может уже разобрали
Ну там еще и игра есть
#giveaway
В основном скидки. Но на сам ElevenLabs - целая подписка на 3 месяца. Но понадобится карточка Visa/Mastercard
1. Регаем временную студенческую почту здесь. Указываем домен imail.edu.vn.
2. На странице раздачи указываем эту почту, свой номер телефона. Мой обычный российский прокатил
3. Вводим пришедшие коды подтверждения телефона и почты
Промокодов ограниченное количество, может уже разобрали
Ну там еще и игра есть
#giveaway
👍8🔥2🥴1
Нейронавт | Нейросети в творчестве
Skywork-UniPic И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки UniPic-1 - авторегрессионная модель с нуля UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M…
А тут и Гигачат подтянулся с редактированием картинок. Ну и чего тянуть, я его затестил. Все что он смог - надеть на Форреста шлем. Скафандр - нивкакую. И лягушонка Пепе не знает
Но это бесплатно, быстро и прямо в телеграме
Пользуйтесь @gigachat_bot
#imageediting #bot
Но это бесплатно, быстро и прямо в телеграме
Пользуйтесь @gigachat_bot
#imageediting #bot
👎10👍4😐2🤷♂1🌚1
Media is too big
VIEW IN TELEGRAM
В Китае сейчас проходят World Humanoid Robot Games — олимпийские игры для роботов. В забеге на 1500м робот Unitree H1 отклонился от дорожки чтобы сбить с ног человека со словами "Смотри куда прешь, кожаный мешок!", после чего выиграл забег с результатом 6 минут 34 секунды.
Ладно, про слова это неточно, я по губам и языку тела прочитал
#news #robot #яниначтоненамекаю
Ладно, про слова это неточно, я по губам и языку тела прочитал
#news #robot #яниначтоненамекаю
😁13❤1👍1
Story2Board: A Training‑Free Approach for Expressive Storyboard Generation
Модель для генерации раскадровок из текстового описания без необходимости обучения модели.
В качестве базовой модели под капотом - FLUX.1-dev
- сохраняет идентичность персонажей на всех панелях раскадровки;
- обеспечивает разнообразие компоновки и фона в разных панелях;
- преобразует свободные текстовые описания историй в структурированные подсказки для каждой панели раскадровкии
Код
#text2story #storyboard
Модель для генерации раскадровок из текстового описания без необходимости обучения модели.
В качестве базовой модели под капотом - FLUX.1-dev
- сохраняет идентичность персонажей на всех панелях раскадровки;
- обеспечивает разнообразие компоновки и фона в разных панелях;
- преобразует свободные текстовые описания историй в структурированные подсказки для каждой панели раскадровкии
Код
#text2story #storyboard
🔥10👍4❤1
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
❤5👀3👎2🤔1😱1
Опубликованы модели на основе CogVideoX-5B и Wan-2.1-14B оживлятора персонажей по образцу движения MTVCrafter
Веса
#characteranimation #pose2video
Веса
#characteranimation #pose2video
Telegram
Нейронавт | Нейросети в творчестве
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
👍3👎2
Media is too big
VIEW IN TELEGRAM
ToonComposer
Кто тут просил модель для анимации, вот она
Модель, "берущая на себя до 70% рутины" в создании аниме. Рисует промежуточные кадры и раскрашивает.
Создаёт видео из одного эскиза и цветного кадра.
Есть контроль ключевых кадров.
Заполняет пустые области эскиза по контексту и промпту.
Код
Демо ждем
#sketch2animation #animation #frameinterpolation #anime
Кто тут просил модель для анимации, вот она
Модель, "берущая на себя до 70% рутины" в создании аниме. Рисует промежуточные кадры и раскрашивает.
Создаёт видео из одного эскиза и цветного кадра.
Есть контроль ключевых кадров.
Заполняет пустые области эскиза по контексту и промпту.
Код
Демо ждем
#sketch2animation #animation #frameinterpolation #anime
20🔥8👍4❤2🥴1
Puppeteer: Rig and Animate Your 3D Models
Астрологи объявили день аниматора на канале Нейронавт.
Авториггер-аниматор моделей от ByteDnace
Создает скелет, рассчитвыет веса скиннинга, анимирует модель по видеообразцу. Работает как с профессиональными моделями, так и продуктом 3D-генераторов
Код ждем
#rigging #animation #3danimation #motion2animation #3d
Астрологи объявили день аниматора на канале Нейронавт.
Авториггер-аниматор моделей от ByteDnace
Создает скелет, рассчитвыет веса скиннинга, анимирует модель по видеообразцу. Работает как с профессиональными моделями, так и продуктом 3D-генераторов
Код ждем
#rigging #animation #3danimation #motion2animation #3d
❤6👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer
Новый подход к плотностной 3D-реконструкции, решает задачу предсказания карт точек с помощью Transformer-модели без энкодера.
На выходе карта точек, карта уверенности в системах координат мира и камеры, положение камеры
На сайте можно интерактивно покрутить несколько примеров
Код
#image2scene #video2scene #3d
Новый подход к плотностной 3D-реконструкции, решает задачу предсказания карт точек с помощью Transformer-модели без энкодера.
На выходе карта точек, карта уверенности в системах координат мира и камеры, положение камеры
На сайте можно интерактивно покрутить несколько примеров
Код
#image2scene #video2scene #3d
❤8🔥3👍2