Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
NitroDiffusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training

Генератор картинок.
Принципиально новый подход к диффузной генерации за один шаг с использованием динамической состязательной сети

Есть два чекпойнта: NitroSD-Realism и NitroSD-Vibrant

Репозиторий HF
Демо

#text2image
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Sora v2

- хронометраж 1 минута
- видео из текста
- видео из текста и картинки
- видео из текста и видео

"очень, очень скоро" 🤩

источник

#news #text2video #image2video #video2video
Please open Telegram to view this post
VIEW IN TELEGRAM
😁92👍2👀2🎃1
TRELLIS: Structured 3D Latents for Scalable and Versatile 3D Generation

Генератор/редактор 3D моделей от Microsoft

- генерация по тексту
- генерация по картинке
- генерация вариаций заданной модели
- изменение заданной модели по текстовому промпту

По железу надо минимум 16 GB VRAM

Код
Демо

#textto3d #imageto3d #3dediting #3dto3d
12👍1🔥1
PaliGemma 2

Модель понимания визуальных данных от Google, способная распознавать объекты, эмоции, создавать подробные описания изображений

Уже в Anychat

HF
Kaggle

#VLM #image2text #assistant
4
Sora не дадут евросоюзянам и британцам. И россиянам, естественно.
А доступ или предоставление доступа в регионах вне списка официального доступа выльется в блокировку аккаунта

Список стран с доступом к Sora

#news
💩15👏52👍1😁1
Sora

Релизнули на стриме
По картинке и по тексту. До 1080p.

Есть Sora Turbo - облегченная, для быстрых генераций

#news
🔥62
Humor Arena

Арена/лидерборд языковых моделей по придумыванию шуток.
Видимо, все на английском.
Есть топ лучших шуток, можете глянуть. Все однотипные имхо

Хостится не на HF, не теряйте

#leaderboard
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation

Генератор 3D сцены по картинке.

Получив входное изображение сцены, мы сегментируем его на несколько частей и используем многоэкземплярную диффузную модель, основанную на этих изображениях, для создания композиционных 3D-экземпляров сцены. Эти 3D-экземпляры могут быть непосредственно объединены в сцену. Общее время обработки составляет всего 40 секунд.


Код ждем

#imageto3d
👍8🔥3
Pleias

Семейство небольших языковых моделей, обученных только на открытых данных.

350M, 1.2B и 3B параметров

- мультиязычные, несколько европейских языков (каких?)
- безопасные, самые низкие результаты в тесте токсичности
- эффективны при выполнении ключевых задач, таких как поиск знаний.
- способны эффективно работать на локальном железе потребительского уровня (CPU, без квантизации)

веса

#news #llm
👍41
xAI Aurora

Генератор картинок в Grok
Недиффузный, что интересно, а авторегрессионный.

Диффузные генераторы проявляют изображение из шума постепенно за несколько шагов. Авторегрессия сразу создает патчи (кусочки) готового изображения

Aurora умеет не только создавать, но изменять картинки. Архитектура позволяет легко принимать на вход и текст, и изображение

Доступ - через Grok, видимо, на подписке

#news #text2image #image2image
👍81
Media is too big
VIEW IN TELEGRAM
MEMO: Memory-Guided Diffusion for Expressive Talking Video Generation

Говорящая голова, оживление портрета по звуку речи.
Работает с разными языками, стилями портретов, речи, поворотами головы

Код
Демо спасибо @p0lygon

#talkinghead #lypsync #speech2video
🔥12
Negative Token Merging: Image-based Adversarial Feature Guidance

NegToMe увеличивает вариативность сгенерированных картинок.
Прикручивали к флюксу

Код
Демо (Flux)

#text2image #flux
👍8🔥1