Опубликован код и веса редактора видео MIMO
И даже есть китайский демоспейс
В базе Stable Diffusion 1.5 но видеопамяти надо от 40 ГБ
Ну может хоть быстрый ... непонятно насколько он актуален теперь при всех возможностях WAN и коммерческих моделей
Тестировали на GPU A100, L20
Гитхаб
Демо
Спасибо @Dmitriy_Ru6ts0v
#video2video #humananimation #personalization #videoediting #videoinpainting
И даже есть китайский демоспейс
В базе Stable Diffusion 1.5 но видеопамяти надо от 40 ГБ
Ну может хоть быстрый ... непонятно насколько он актуален теперь при всех возможностях WAN и коммерческих моделей
Тестировали на GPU A100, L20
Гитхаб
Демо
Спасибо @Dmitriy_Ru6ts0v
#video2video #humananimation #personalization #videoediting #videoinpainting
Telegram
Нейронавт | Нейросети в творчестве
MIMO: Controllable Character Video Synthesis withSpatial Decomposed Modeling
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше…
Манипуляции с персонажем в полный рост на видео. Модель декомпозит исходное видео с применением карты глубины - на главного перса, задник и скрытую передним планом часть. Дальше…
🔥8😁3👍1
imgupscaler.ai
Годный апскейлер картинок
Есть также апскейл видео, реставрация старых фото, удаление блюра, шарпенинг текста на фото
Ну видео апскейлер сомнительный, может там просто RealESRGAN
А вот для картинок вполне - юзайте Pro ибо Fast некачественный.
Апскейлит пошагово 2K - 4K и т д. На 2K результат максимально понравился, на 4K уже вместо глаз месиво и цвет искажен
Лимиты неизвестны
#upscale #upscalevideo #imagerestoration #deblur
Годный апскейлер картинок
Есть также апскейл видео, реставрация старых фото, удаление блюра, шарпенинг текста на фото
Ну видео апскейлер сомнительный, может там просто RealESRGAN
А вот для картинок вполне - юзайте Pro ибо Fast некачественный.
Апскейлит пошагово 2K - 4K и т д. На 2K результат максимально понравился, на 4K уже вместо глаз месиво и цвет искажен
Лимиты неизвестны
#upscale #upscalevideo #imagerestoration #deblur
❤4🔥3
Нейронавт | Нейросети в творчестве
Ну что, кто что успел натренить?
Я натренил три лоры себя для сравнения Flux / kontext / Qwen-Image
Здесь QI с разными художниками
А вы показывайте что у вас интересного?
#neuronaut_art
Я натренил три лоры себя для сравнения Flux / kontext / Qwen-Image
Здесь QI с разными художниками
А вы показывайте что у вас интересного?
#neuronaut_art
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Wan 2.2 Remix
Версия #WAN22 от китайцев со встроенным ускорителем, с фокусом на реалистичные движения людей.
Есть SFW и NSFW версии. NSFW не рекомендовано для SFW целей, думаю что не сможет, сильно затюнен на NSFW, сами посмотрите на CivitAI
Рекомендуемые настройки:
Steps: 4–8
CFG: 1
Shift: 5–10
Sampler: Euler
Scheduler: Simple
HF
CiviAI - NSFW
NSFW-Wan-UMT5-XXL - рекомендованный CLIP
ТГ канал: https://news.1rj.ru/str/wan22remix
Спасибо @Bolserge, Gos
#text2video #image2video #nsfw
Версия #WAN22 от китайцев со встроенным ускорителем, с фокусом на реалистичные движения людей.
Есть SFW и NSFW версии. NSFW не рекомендовано для SFW целей, думаю что не сможет, сильно затюнен на NSFW, сами посмотрите на CivitAI
Рекомендуемые настройки:
Steps: 4–8
CFG: 1
Shift: 5–10
Sampler: Euler
Scheduler: Simple
HF
CiviAI - NSFW
NSFW-Wan-UMT5-XXL - рекомендованный CLIP
ТГ канал: https://news.1rj.ru/str/wan22remix
Спасибо @Bolserge, Gos
#text2video #image2video #nsfw
❤14👍6🔥2
Tiny Recursive Model (TRM)
Samsung придумал новую архитектуру рекурсивного мышления для построения языковых моделей, которая при размере всего 7М параметров (!!!) — оказалась круче DeepSeek-R1, Gemini 2.5 Pro и o3-mini в тестах на логику и мышление.
Работает так:
1. Делает первый черновой ответ.
2. Думает над ним внутри себя.
3. Проверяет и исправляет свои мысли.
4. Перерабатывает ответ, чтобы он был точнее.
5. Повторяет, пока не будет уверен в своем решении.
* Маленькая: всего 7 миллионов параметров, это в 10 000 раз меньше, чем у современных LLM
* Эффективная: работает лучше больших моделей, но требует меньше ресурсов.
* Логика важнее всего: TRM показывает, что хорошая архитектура важнее объема данных.
* Доступная: может работать на слабых устройствах, не нужны мощные сервера.
Неплохо, в следующем году будем пользоваться модельками уровня DeepSeek локально на телефоне?
Гитхаб
Препринт
#research #llm #TRM
Samsung придумал новую архитектуру рекурсивного мышления для построения языковых моделей, которая при размере всего 7М параметров (!!!) — оказалась круче DeepSeek-R1, Gemini 2.5 Pro и o3-mini в тестах на логику и мышление.
Работает так:
1. Делает первый черновой ответ.
2. Думает над ним внутри себя.
3. Проверяет и исправляет свои мысли.
4. Перерабатывает ответ, чтобы он был точнее.
5. Повторяет, пока не будет уверен в своем решении.
* Маленькая: всего 7 миллионов параметров, это в 10 000 раз меньше, чем у современных LLM
* Эффективная: работает лучше больших моделей, но требует меньше ресурсов.
* Логика важнее всего: TRM показывает, что хорошая архитектура важнее объема данных.
* Доступная: может работать на слабых устройствах, не нужны мощные сервера.
Неплохо, в следующем году будем пользоваться модельками уровня DeepSeek локально на телефоне?
Гитхаб
Препринт
#research #llm #TRM
🤯11😱7👍5🔥3⚡2