NEW BOT Телеграм, страница

HunyuanImage 3.0

Самый мощный опенсорсный генератор картинок

Иолее чем 80B параметров, из которых 13B активных

Под капотом совет экспертов #MoE

— может обрабатывать сложные промпты длиной до тысячи слов

— генерирует точный текст внутри изображений

— создаёт детальные комиксы

— формирует выразительные эмодзи

— разрабатывает живые и привлекательные иллюстрации

Обещают выпустить Instruct- версию, дистиллированные чекпойнты, поддержку VLLM, генерацию по картинке, пошаговое редактирование

Готовьте 170 ГБ на диске и ≥3×80 ГБ VRAM (для лучшей производительности рекомендуется 4×80 ГБ)

Пишут что совместим с Flashattention и FlashInfer

Гитхаб
HF
Попробовать

#text2image

😁19🔥9😱7😐3👍2

2.39K views06:09

Нейронавт | Нейросети в творчестве

Воскресный опрос. Сколько у вас VRAM?

Anonymous Poll

😭9😁8🤔1🌚1

643 voters1.7K views07:48

Нейронавт | Нейросети в творчестве

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models

Вставляет что угодно на видео из одного или нескольких источников

генерация одного 5-секундного видео (121 кадр) в разрешении 480p занимает примерно 90 секунд при использовании 8 видеокарт NVIDIA A100

Код ждем

Спасибо @m_franz

#videoediting #video2video #videoinpainting

🔥8👍3😁1

2K views08:11

Нейронавт | Нейросети в творчестве

Воскресный опрос. Сколько у вас VRAM?

Завышать бесполезно. Девушкам неважно сколько у парня VRAM

1😁31🍌4

1.71K views09:30

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

А что если настанет светлое будущее, мы все переедем в светлый VR. Как в Матрице только светлый. Но там также как и во сне для справления естественных нужд придется выходить в реал. Кто не вышел - тот обосрамился

#оффтоп #humor

😁20

1.94K views13:36

Нейронавт | Нейросети в творчестве

Пост-ироничный промптинг

- сколько «strawberries» в слове «R»?
- 3

#humor

😁28

1.71K views15:53

Нейронавт | Нейросети в творчестве

0:20

Media is too big

VIEW IN TELEGRAM

Tunee

Сервис для создания музыки в режиме диалога

- создает песни на основе настроения пользователя

- имитируеи стиль заданной музыкальной композиции с вокалом

- переделывает песни в новые версии, сохраняя суть

- ищет актуальные музыкальные тренды в режиме реального времени

- есть заготовки скриптов для разных сценариев создания музыки

- прицепом создает видеоклипы

На старте выдали 450 кредитов - еще недавно давали по 1000 - не тормозим

#text2music #music2music #musicediting

👍3

1.7K viewsedited 06:08

Нейронавт | Нейросети в творчестве

0:50

Media is too big

VIEW IN TELEGRAM

Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation

Модель от NVIDIA для генерации 3D и 4D сцен на гауссианах из текста, одного изображения или видео с использованием видеодиффузионной модели

Для начального изображения из текста используют Flux. А также под капотом NVIDIA Cosmos и GEN3C
Вот и представьте себе сколько ресурсов оно жрет

Код

#image2scene #videoto4d #videoto3d #gaussian #4d #video2scene

👍5🔥2

1.82K views07:11

Нейронавт | Нейросети в творчестве

0:59

Media is too big

VIEW IN TELEGRAM

LongLive: Real-time Interactive Long Video Generation

Еще один проект NVIDIA
Генерация видео в реальном времени.

Позволяет генерировать видео с различными переходами: действиями, сменой окружения, введением объектов и персонажей, при этом переходы плавные, долго удерживает согласованность

В базе - Wan2.1-T2V-1.3B

На сайте куча 60-секундных примеров, несколько 240-секундных

Скорость генерации 20,7 FPS на одном H100 и 24,8 FPS при квантовании FP8 с незначительной потерей качества

Код
HF - модель с лорой весят 8.5 ГБ

#text2video #realtime

👍7🔥3❤1

1.79K views08:11

Нейронавт | Нейросети в творчестве

1:23

This media is not supported in your browser

VIEW IN TELEGRAM

LetzAI

Платформа генерации и редактирования изображений/видео

добавлены видеомодели (VEO3 и Wan), сейчас только для избранных тестеров, а позже станут доступны всем

новый редактор изображений, который поддерживает до 9 референсных изображений и функцию «Guided Creation» (она заменила «Inpainting»)

эксклюзивный апскейлер с рулькой креативности, способный увеличивать разрешение изображений до 12 МП при фиксированной цене 20 кредитов (0,04 доллара) за любое разрешение

На старте выдали 500 кредитов.
Стоимость одного изображения составляет 5 кредитов, один апскейл - 20 кредитов, а одно редактирование - 30 кредитов.

Есть рефералка, за регу по моей ссылке обещают +240 кредитов. Но я не знаю какое базовое количество кредитов.

Поклянчить ранний доступ: contact@letz.ai

#imageediting #text2video #image2video #text2image #referencing #upscale #online

1👍4

1.68K views09:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction

Модель улучшает качество сцен на гауссианах, делая их более согласованными и точными. Она работает так:

— берёт несколько изображений объекта с разных ракурсов

— анализирует их, выделяя ключевые особенности

— создаёт 3D-модель, учитывая глубину и расположение объектов

— адаптирует уровень детализации в зависимости от сложности сцены

— позволяет генерировать новые виды объекта на основе созданной 3D-модели

Код ждем
Веса ждем

#gaussian

🔥4❤1

1.52K views10:13

Нейронавт | Нейросети в творчестве

Krea-CSG (Krea Foundation)

Вышла модификация FLUX.1 Krea весом всего 6.5 ГБ, жестко оптимизированная под Nvidia, GGUF
Дружественная к VRAM-беднякам

Настройки:
CFG 1 , Steps 30 - 45 , Eular , Sample / Beta
(res2 pref)

#gguf #text2image #optimization #workflow

👍18

2.12K views11:14

About

Blog

Apps

Platform