NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
❤5👀3👎2🤔1😱1
Опубликованы модели на основе CogVideoX-5B и Wan-2.1-14B оживлятора персонажей по образцу движения MTVCrafter
Веса
#characteranimation #pose2video
Веса
#characteranimation #pose2video
Telegram
Нейронавт | Нейросети в творчестве
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
👍3👎2
Media is too big
VIEW IN TELEGRAM
ToonComposer
Кто тут просил модель для анимации, вот она
Модель, "берущая на себя до 70% рутины" в создании аниме. Рисует промежуточные кадры и раскрашивает.
Создаёт видео из одного эскиза и цветного кадра.
Есть контроль ключевых кадров.
Заполняет пустые области эскиза по контексту и промпту.
Код
Демо ждем
#sketch2animation #animation #frameinterpolation #anime
Кто тут просил модель для анимации, вот она
Модель, "берущая на себя до 70% рутины" в создании аниме. Рисует промежуточные кадры и раскрашивает.
Создаёт видео из одного эскиза и цветного кадра.
Есть контроль ключевых кадров.
Заполняет пустые области эскиза по контексту и промпту.
Код
Демо ждем
#sketch2animation #animation #frameinterpolation #anime
20🔥8👍4❤2🥴1
Puppeteer: Rig and Animate Your 3D Models
Астрологи объявили день аниматора на канале Нейронавт.
Авториггер-аниматор моделей от ByteDnace
Создает скелет, рассчитвыет веса скиннинга, анимирует модель по видеообразцу. Работает как с профессиональными моделями, так и продуктом 3D-генераторов
Код ждем
#rigging #animation #3danimation #motion2animation #3d
Астрологи объявили день аниматора на канале Нейронавт.
Авториггер-аниматор моделей от ByteDnace
Создает скелет, рассчитвыет веса скиннинга, анимирует модель по видеообразцу. Работает как с профессиональными моделями, так и продуктом 3D-генераторов
Код ждем
#rigging #animation #3danimation #motion2animation #3d
❤6👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer
Новый подход к плотностной 3D-реконструкции, решает задачу предсказания карт точек с помощью Transformer-модели без энкодера.
На выходе карта точек, карта уверенности в системах координат мира и камеры, положение камеры
На сайте можно интерактивно покрутить несколько примеров
Код
#image2scene #video2scene #3d
Новый подход к плотностной 3D-реконструкции, решает задачу предсказания карт точек с помощью Transformer-модели без энкодера.
На выходе карта точек, карта уверенности в системах координат мира и камеры, положение камеры
На сайте можно интерактивно покрутить несколько примеров
Код
#image2scene #video2scene #3d
❤8🔥3👍2
LIA-X: Interpretable Latent Portrait Animator
Оживлятор портретов по видеообразцу.
Позволяет также редактировать изображения и видео.
Умеет менять ракурс на персонажа в 3D пространстве.
Разбирает движения лица на простые элементы.
Контроль глаз, рта.
Похоже что проект на своей модели, нет упоминаний ни WAN, ни CogVideo, ничего такого
Код
Демо
Веса - 3.6 Gb
#portrainanimation #motion2video #imageediting #videoediting
Оживлятор портретов по видеообразцу.
Позволяет также редактировать изображения и видео.
Умеет менять ракурс на персонажа в 3D пространстве.
Разбирает движения лица на простые элементы.
Контроль глаз, рта.
Похоже что проект на своей модели, нет упоминаний ни WAN, ни CogVideo, ничего такого
Код
Демо
Веса - 3.6 Gb
#portrainanimation #motion2video #imageediting #videoediting
1🔥8👍3🥴1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁12
DINOv3: Self-supervised learning for vision at unprecedented scale
Новая версия модели от запрещенной в РФ Meta AI
Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности
Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.
Благодаря этому превосходит даже специализированные модели
Есть несколько вариантов весов под разные вычислительные мощности
Гитхаб
HF
#image2depth #segmentation #video2mask #video2depth
Новая версия модели от запрещенной в РФ Meta AI
Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности
Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.
Благодаря этому превосходит даже специализированные модели
Есть несколько вариантов весов под разные вычислительные мощности
Гитхаб
HF
#image2depth #segmentation #video2mask #video2depth
🔥8👍2❤1