Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.

Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения

Код

#text2image
👍7
CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner

Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме

Обучен на персонажах, с ними будут и лучшие результаты

Код
Демо

#imageto3d
8
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехал демоспейс CameraCtrl

1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!

Не удалось заставить ее обработать мою картинку, только примеры с демоспейса

Демо

#text2video #conditioning
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering

Устранение проблемы появляющихся/исчезающих пятен при реконструкции сцены гауссианами

Код

#gaussian #rendering
👍6😱2
AnyNode v0.1 (🍄 beta)

Универсальная нода для ComfyUI.
Это не шутка. Делает все что сможете сформулировать текстовым запросом.
Ограничена возможностями подключенной языковой модели. Да, разумеется, магия работает на #LLM

Поддерживает ChatGPT, Gemini, а также локальные модели.
В будущем сможет создавать новые ноды.

Гитхаб
Реддит
Туториал (youtube)

#extension
🔥151👍1
Codestral

Свежий ассистент программиста от Mistral.
Уже доступен в API и в VS Code.
Знает 80+ языков программирования.
Размер модели 22B, пожатая влезет на видюху.
Контекстное окно 32к токенов
Превосходит на humaneval не только лишь всех

Веса
Демо

#coding #assistant
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
StreamV2V

Замена лица/стилизация потокового видео в реальном времени.
Ну как в реальном, 20 кадров в секунду 512×512 на A100.
Заявлен рилтайм на RTX 4090, но без инфы по скорости 🤡

Код

#realtime #video2video #stylization
Please open Telegram to view this post
VIEW IN TELEGRAM
👎82😁2🎃2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
I2VEdit: First-Frame-Guided Video Editing via Image-to-Video Diffusion Models

Редактор видео по одному кадру.
Показываем ему образец изменений в одном кадре, и I2VEdit распространяет изменения с одного кадра на все видео.

- замена/удаление/добавление объектов
- стилизация
- виртуальная примерочная

Код ждем

#video2video #stylization #inpainting #videoediting
🔥11👍2
MusePose: a Pose-Driven Image-to-Video Framework for Virtual Human Generation

Анимация персонажа по одному изображению и позе.
Да, опенсорс аналог AnimateAnyone от авторов MuseV и MuseTalk
Авторы благодарят за исследования AnimateAnyone и код Moore-AnimateAnyone

Код
Демо ждем

#image2video #humananimation #characteranimation #pose2video
👍7