Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.75K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Опубликован код и веса редактора видео MIMO
И даже есть китайский демоспейс

В базе Stable Diffusion 1.5 но видеопамяти надо от 40 ГБ
Ну может хоть быстрый ... непонятно насколько он актуален теперь при всех возможностях WAN и коммерческих моделей

Тестировали на GPU A100, L20

Гитхаб
Демо

Спасибо @Dmitriy_Ru6ts0v

#video2video #humananimation #personalization #videoediting #videoinpainting
🔥8😁3👍1
imgupscaler.ai

Годный апскейлер картинок
Есть также апскейл видео, реставрация старых фото, удаление блюра, шарпенинг текста на фото

Ну видео апскейлер сомнительный, может там просто RealESRGAN

А вот для картинок вполне - юзайте Pro ибо Fast некачественный.
Апскейлит пошагово 2K - 4K и т д. На 2K результат максимально понравился, на 4K уже вместо глаз месиво и цвет искажен

Лимиты неизвестны

#upscale #upscalevideo #imagerestoration #deblur
4🔥3
Wan 2.2 Remix

Версия #WAN22 от китайцев со встроенным ускорителем, с фокусом на реалистичные движения людей.

Есть SFW и NSFW версии. NSFW не рекомендовано для SFW целей, думаю что не сможет, сильно затюнен на NSFW, сами посмотрите на CivitAI

Рекомендуемые настройки:

Steps: 4–8
CFG: 1
Shift: 5–10
Sampler: Euler
Scheduler: Simple

HF
CiviAI - NSFW
NSFW-Wan-UMT5-XXL - рекомендованный CLIP
ТГ канал: https://news.1rj.ru/str/wan22remix

Спасибо @Bolserge, Gos

#text2video #image2video #nsfw
14👍6🔥2
Tiny Recursive Model (TRM)

Samsung придумал новую архитектуру рекурсивного мышления для построения языковых моделей, которая при размере всего 7М параметров (!!!) — оказалась круче DeepSeek-R1, Gemini 2.5 Pro и o3-mini в тестах на логику и мышление.

Работает так:

1. Делает первый черновой ответ.
2. Думает над ним внутри себя.
3. Проверяет и исправляет свои мысли.
4. Перерабатывает ответ, чтобы он был точнее.
5. Повторяет, пока не будет уверен в своем решении.

* Маленькая: всего 7 миллионов параметров, это в 10 000 раз меньше, чем у современных LLM
* Эффективная: работает лучше больших моделей, но требует меньше ресурсов.
* Логика важнее всего: TRM показывает, что хорошая архитектура важнее объема данных.
* Доступная: может работать на слабых устройствах, не нужны мощные сервера.

Неплохо, в следующем году будем пользоваться модельками уровня DeepSeek локально на телефоне?

Гитхаб
Препринт

#research #llm #TRM
🤯11😱7👍5🔥32