Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
4M: Massively Multimodal Masked Modeling

Мультимодальная нейронка от Apple
Умеет выполнять всяческие задания.
Генерация, описание, сегментация, инпейнтинг, технические карты.
Легко дообучается на определенную модальность и новую задачу.

Код
Демо

#multimodal #text2image #image2text #image2image #inpainting #segmentation #image2depth
👍8
websim.ai

Генератор сайтов по адресу.
Пишете ссылку на сайт - получаете сайт.
Ну и галерею посмотрите/

Накидывайте в комментарии свои творения

https://kissmyshinymetalass.com
Hauktuah
hauktuah.com

#text2site
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
ShareGPT4Video: Improving Video Understanding and Generation with Better Captions

Модель для подробного описания видео. Генерировать видео по тексту тоже умеет, но качество 🫤

Код
Демо (описание)
Демо (генерация)

#captioning #vlm #video2text #text2video
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
L4GM: Large 4D Gaussian Reconstruction Model

Реконструкция 3D объектов в движении гауссианами по видео с одного ракурса.
Под капотом гауссианы. Работает шустро.

NVIDIA кодом не поделилась

#videoto3d #gaussian #video2animation
👍41
Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation

В полку ускоряторов прибыло.
Ускорение диффузных генераторов до нескольких шагов. В Демо ускоренный SD3

Код
Демо

#optimization
👍5
Media is too big
VIEW IN TELEGRAM
SEE-2-SOUND: Zero-Shot Spatial Environment-to-Spatial Sound

Генератор пространственного звука по изображению или видео.
Идея интересная, звуки пока даже по смыслу часто не попадают😒

Код
Демо

#image2sound #video2sound #image2audio #video2audio
Please open Telegram to view this post
VIEW IN TELEGRAM
👀3🔥1
Long Code Arena

Лидерборд языковых моделей на задачах, связанных с программированием

#coding #leaderboard
👍6
CosmicMan: A Text-to-Image Foundation Model for Humans

Новая базовая модель для генерации портретов

Код
Демо

#text2image
👍81
4 ИИ-персонажа реагируют на твиттер в рилтайме на твитче.
Стив Джобс, Эйнштейн, Майкл Джексон, Мэрилин Монро

Твитч

#live #news
👀6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model

Управляемое оживление картинки по траектории, ключевым точкам, и, похоже, по входному аудио речи

Код
Демо (траектория)

#image2video
8🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
NaRCan: Natural Refined Canonical Image with Integration of Diffusion Prior for Video Editing

Редактор видео. Считывает деформации, и по ним лепит результат.
Судя по демо, быстрый как понос.
- матчмувинг
- стилизация по тексту
- трекинг заданного сегмента

Код ждем
Демо

#videoediting #video2video #stylization #matchmoving #tracking
👍4😁2