Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
HunyuanImage 3.0

Самый мощный опенсорсный генератор картинок

Иолее чем 80B параметров, из которых 13B активных

Под капотом совет экспертов #MoE

— может обрабатывать сложные промпты длиной до тысячи слов

— генерирует точный текст внутри изображений

— создаёт детальные комиксы

— формирует выразительные эмодзи

— разрабатывает живые и привлекательные иллюстрации

Обещают выпустить Instruct- версию, дистиллированные чекпойнты, поддержку VLLM, генерацию по картинке, пошаговое редактирование

Готовьте 170 ГБ на диске и ≥3×80 ГБ VRAM (для лучшей производительности рекомендуется 4×80 ГБ)

Пишут что совместим с Flashattention и FlashInfer

Гитхаб
HF
Попробовать

#text2image
😁19🔥9😱7😐3👍2
Воскресный опрос. Сколько у вас VRAM?
Anonymous Poll
11%
0-6 ГБ
17%
8-10 ГБ
20%
12 ГБ
23%
16 ГБ
0%
20ГБ
17%
24 ГБ
12%
Больше. Я олигарх
😭9😁8🤔1🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models

Вставляет что угодно на видео из одного или нескольких источников

генерация одного 5-секундного видео (121 кадр) в разрешении 480p занимает примерно 90 секунд при использовании 8 видеокарт NVIDIA A100

Код ждем

Спасибо @m_franz

#videoediting #video2video #videoinpainting
🔥8👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
А что если настанет светлое будущее, мы все переедем в светлый VR. Как в Матрице только светлый. Но там также как и во сне для справления естественных нужд придется выходить в реал. Кто не вышел - тот обосрамился

#оффтоп #humor
😁20
Пост-ироничный промптинг

- сколько «strawberries» в слове «R»?
- 3

#humor
😁28
Media is too big
VIEW IN TELEGRAM
Tunee

Сервис для создания музыки в режиме диалога


- создает песни на основе настроения пользователя

- имитируеи стиль заданной музыкальной композиции с вокалом

- переделывает песни в новые версии, сохраняя суть

- ищет актуальные музыкальные тренды в режиме реального времени

- есть заготовки скриптов для разных сценариев создания музыки

- прицепом создает видеоклипы

На старте выдали 450 кредитов - еще недавно давали по 1000 - не тормозим

#text2music #music2music #musicediting
👍3
Media is too big
VIEW IN TELEGRAM
Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation

Модель от NVIDIA для генерации 3D и 4D сцен на гауссианах из текста, одного изображения или видео с использованием видеодиффузионной модели

Для начального изображения из текста используют Flux. А также под капотом NVIDIA Cosmos и GEN3C
Вот и представьте себе сколько ресурсов оно жрет

Код

#image2scene #videoto4d #videoto3d #gaussian #4d #video2scene
👍5🔥2
Media is too big
VIEW IN TELEGRAM
LongLive: Real-time Interactive Long Video Generation

Еще один проект NVIDIA
Генерация видео в реальном времени.

Позволяет генерировать видео с различными переходами: действиями, сменой окружения, введением объектов и персонажей, при этом переходы плавные, долго удерживает согласованность

В базе - Wan2.1-T2V-1.3B

На сайте куча 60-секундных примеров, несколько 240-секундных

Скорость генерации 20,7 FPS на одном H100 и 24,8 FPS при квантовании FP8 с незначительной потерей качества

Код
HF - модель с лорой весят 8.5 ГБ

#text2video #realtime
👍7🔥31
LetzAI

Платформа генерации и редактирования изображений/видео

добавлены видеомодели (VEO3 и Wan), сейчас только для избранных тестеров, а позже станут доступны всем

новый редактор изображений, который поддерживает до 9 референсных изображений и функцию «Guided Creation» (она заменила «Inpainting»)

эксклюзивный апскейлер с рулькой креативности, способный увеличивать разрешение изображений до 12 МП при фиксированной цене 20 кредитов (0,04 доллара) за любое разрешение

На старте выдали 500 кредитов.
Стоимость одного изображения составляет 5 кредитов, один апскейл - 20 кредитов, а одно редактирование - 30 кредитов.

Есть рефералка, за регу по моей ссылке обещают +240 кредитов. Но я не знаю какое базовое количество кредитов.

Поклянчить ранний доступ: contact@letz.ai

#imageediting #text2video #image2video #text2image #referencing #upscale #online
1👍4
This media is not supported in your browser
VIEW IN TELEGRAM
VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction

Модель улучшает качество сцен на гауссианах, делая их более согласованными и точными. Она работает так:

— берёт несколько изображений объекта с разных ракурсов

— анализирует их, выделяя ключевые особенности

— создаёт 3D-модель, учитывая глубину и расположение объектов

— адаптирует уровень детализации в зависимости от сложности сцены

— позволяет генерировать новые виды объекта на основе созданной 3D-модели

Код ждем
Веса ждем

#gaussian
🔥41
Krea-CSG (Krea Foundation)

Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам

Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)

#gguf #text2image #optimization #workflow
👍18