NEW BOT Телеграм, страница

GenXD: Generating Any 3D and 4D Scenes

Генерация 3D и 4D сцен от Университета Сингапура и Microsoft

На вход подают камеру и движения объекта (сам не понял. Видимо, видео)

Код ждем

#videoto3d #videoto4d

👍4

2.04K views09:09

Нейронавт | Нейросети в творчестве

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

DiffSplat: Repurposing Image Diffusion Models for Scalable 3D Gaussian Splat Generation

Генератор 3D объектов на гауссианах по картинке, по тексту. Поддерживает контроль генерации контролнетом - в примерах есть canny, depth, normals

Модель представляет собой файнтюн PixArt-Sigma-XL-2-512-MS

Код
Веса
Демо ждем

#textto3d #imageto3d #gaussian #conditioning #text2gaussian #image2gaussian

🔥6👍2

2.23K viewsedited 09:38

Нейронавт | Нейросети в творчестве

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

LLaSA: Scaling Train-Time and Test-Time Compute for LLaMA-based Speech Synthesis

Новая SOTA (state of the art - достижение) в клонировании голоса с контролем эмоций и ультрареалистичным звуком.

Клонирует голос с акцентом по 5-10 секундному образцу

Хотя на TTS-арене на 12 месте, но может еще рано, он еще свежий

В основе Llama 3.2

Поддерживает клонирование голоса на английском и китайском языках

Есть 1B, 3B, обещают 8B

Сайта не нашел. Есть видео от какого-то индуса с локальным запуском

Гитхаб - обучение с нууля
Демо
local-llasa-tts - для локального запуска с GUI на gradio

#voicecloning #tts #text2speech #leaderboard

👍10❤2

2.27K views11:47

Нейронавт | Нейросети в творчестве

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

T2V 01 Director

Новая версия видеогенератора от Hailuo
Основная фишка - контроль камеры.

Гайд от режиссера Мигеля Иванова

#text2video #image2video #cameracontrol

🔥17

3.66K views07:47

Нейронавт | Нейросети в творчестве

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

trumped.ai

Негерируем фейковые заявления Трампа

#text2video #tts #lipsync #voicecloning

🔥12🍾2

2.51K views09:20

Нейронавт | Нейросети в творчестве

3:52

Media is too big

VIEW IN TELEGRAM

YuE: Open Music Foundation Models for Full-Song Generation

Заявка на конкуренцию Suno в опенсорсе - китайский генератор песен.
Русского языка пока нет, есть английский, китайский, японский и корейский.

Влезает в 24ГБ VRAM

Код
Видеотуториал

#text2music #music

❤6👍4

2.16K viewsedited 07:50

Нейронавт | Нейросети в творчестве

1:17

This media is not supported in your browser

VIEW IN TELEGRAM

В 3D генератор Hunyuan3D-2 завезли приблуду для Блендера

Инструкция на гитхабе

#textto3d #imageto3d #blender

👍13🔥4

2.31K views08:37

Нейронавт | Нейросети в творчестве

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

Riffusion FUZZ

Новая модель для генерации музыки на сервисе Riffusion

Интересная фишка - персонализация. По мере накопления ваших генераций сервис запоминает ваши предпочтения и подстраивается под вас

Умеет песни и инструментал
Есть свой генератор текстов Ghostwriter

Умеет делать музыку из вашего образца

Есть функция Remix - переработка чужой или своей генерации

На время бетатестирования все бесплатно

Демо - не знаю зачем, но здесь будет демоспейс

#text2music #music2music #audio2music

❤7👍4

2.13K views09:13

Нейронавт | Нейросети в творчестве

1:07

This media is not supported in your browser

VIEW IN TELEGRAM

NVIDIA Broadcast 2.0.0

День звука на канале продолжается

Обновилась утилита рилтаймовой обработки звука и видео

По звуку:
удаляет эхо, посторонний шум, оставляя голос. наверчивает ИИ-эквалазер, приближая говномикрофоны к студийному качеству

По видео: направляет зрачки в камеру, блюрит фон, заменяет фон, удаляет шум. Релайтинг лица - подсвечивает лицо виртуальным источником.

#realtime #streaming #denoise #audioenhance #eyecontact #bgreplacement #bg #relighting #deecho

👍11🔥2

2.61K viewsedited 11:43

Нейронавт | Нейросети в творчестве

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

Luma апскейл 4K

Недавно всем выдали доступ к своей модели Ray 2
А теперь вот представили видеоапскейлер для генераций

Ну и не стоит ждать от него чудес

#upscale

👍7🤔1

2.23K views06:09

Нейронавт | Нейросети в творчестве

o3-mini для всех

Open AI таки выдали всем свою рассуждающую модель o3-mini

По лимитам для бесплатников непонятно

Пользуемся

#news

Openai

OpenAI o3-mini

Pushing the frontier of cost-effective reasoning.

👍5

1.98K views08:57

Нейронавт | Нейросети в творчестве

Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement

День звука продолжается

Клонировщик-генератор голоса с контролем эмоций и тембра

Есть 4 модели

- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.

Примеры по ссылке в заголовке

Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать

Код

#voicecloning #speech2speech #tts #text2speech

GitHub

Amphion/models/vc/vevo at main · open-mmlab/Amphion

Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audi...

🔥5😭3👍2

2.47K views10:17

Нейронавт | Нейросети в творчестве

Отличный подарок к дню рождения, спасибо ❤️

5❤18🍾9👍1

1.99K views19:28

Нейронавт | Нейросети в творчестве

Коллекция фигурок пополнилась

#оффтоп

🔥19👍8

1.94K views13:49

Нейронавт | Нейросети в творчестве

Мемов на сон грядущий

#humor

😁30👎6💩5🤡3😐2

1.93K views19:58

Нейронавт | Нейросети в творчестве

не зашло) 🤷‍♂️

🤡5

1.99K views20:46

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Inference Providers

HuggingFace запустил Inference Providers - бессерверный запуск моделей.

Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.

Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF

Бесплатным пользователям отсыпают немножко токенов в день

#news

❤6👍2

1.98K viewsedited 08:03

About

Blog

Apps

Platform