Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.48K photos
3.75K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Speech

генератор речи от Гугла доступен в AI Studio

Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п

Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем

#tts #text2speech
👍16👏2
ViewComfy

Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.

Обещают сделать поддержку инпейнтинга

Код
Туториал
Оф канал на ютубе

#comfy2web #webapp
4👍1
Remade AI Video Canvas

Remade AI сделали холст для работы с видео

Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине

Бонус: забирайте новые лоры спасибо @Vvicca1

#text2video #image2video #lora
👍31
QuickVideo

Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма

Код

#VLM #optimization #video2text #realtime
👍5
На HF появились две дистиллированные модели генератора длинных видео MAGI-1

4.5B_distill и
4.5B_distill_quant

Говорят, что даже на убунту с трудом заводится. А на Windows и подавно

Веса
Ветка на Реддит

#text2video #image2video
👍6
HunyuanPortrait

Аниматор-оживлятор портретов от Tencent.

Переносит на портрет мимику и движения головы с референсного видео

Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM

Код
Веса

#portrainanimation #lipsync #characteranimation #motion2video
👍7😁2🤔21
This media is not supported in your browser
VIEW IN TELEGRAM
spAItial

Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику

Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео

Записаться в вейтлист

#textto3d #text2scene #gaussian
👍9😱32