Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
NeuTTS Air

Говорилка текста с возможностью мгновенного клонирования голоса на 0.7B параметров. Предназначена для локального использования на различных устройствах, "отличается реалистичностью звучания"

Построена на базе языковой модели Qwen 0.5B и использует собственный аудиокодек NeuCodec для высокого качества звука при низком битрейте

Генерирует речь в реальном времени на устройствах среднего уровня

Клонирует голос, используя всего 3 секунды аудио

Но боюсь, владеет только английским, монолог идущего к реке закину в комменты

GGUF Q8 и Q4

Гитхаб
Демо

#tts #text2speech #voicecloning #mobile #realtime
👍10🔥3👀3
This media is not supported in your browser
VIEW IN TELEGRAM
Chaplin

Визуальное распознавание речи (VSR), инструмент считывает движения губ в режиме реального времени и переводит в текст

Работает полностью локально.

#VSR #video2text #lipreading #realtime
🔥14👍4😱4🥴1
Media is too big
VIEW IN TELEGRAM
ControlHair: Physically-based Video Diffusion for Controllable Dynamic Hair Rendering

Управляемый рендер динамических волос с использованием физически обоснованной видеодиффузии. Модель позволяет контролировать движение волос с помощью сигналов, генерируемых физическим симулятором

Сначала создает покадровую симуляцию с заданными исходными (направление ветра, жесткость волос, движение человека и т п), потом заворачивает ее с заданным ракурсом камеры в управляющий контролнет, а контролнет отдает видеогенератору.

Прикручено к модифицированному Wan 2.1

Код ждем

#simulation #controlnet #conditioning #image2video
🔥8👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Для лентяев вроде меня которые еще не установили себе Sora 2

Sora 2 добавили в дискорд FakeMe

Временно можно пользоваться бесплатно.

Использование:
/sora2 prompt:"A dragon flying over a volcano" 
опционально: aspect_ratio и quality


Дискорд

#text2image
😁7👍2
This media is not supported in your browser
VIEW IN TELEGRAM
LanPaint 1.4 Wan 2.2 inpainting

В думающий инпейнтер LanPaint завезли инпейнтинг видео с #WAN22

Нюанс: жрет около 40ГБ VRAM

#inpainting #wan22 #workflow #videoinpainting
1🔥12👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Open Ai представили конструктор агентов Agent Builder

Стрим кажется еще идет
https://www.youtube.com/live/hS1YqcewH0c

#news #agent
👍4
ComfyUI 0.3.63

Субграфы теперь можно публиковать - сохранять в бибилиотеку нод

Selection Toolbox был переработан: добавлены новые иконки для упрощения идентификации и расширяемое меню, которое открывает возможности для добавления новых функций в будущем. В дальнейшем может появиться возможность кастомизации функционала Selection Toolbox

#comfyUI
🔥20👍2
Hunyuan-Vision-1.5-Thinking

Самая мощная визуально-языковая модель от Hunyuan-Tencent

Делит 3 место на LMarena с gemini-2.5-flash-preview и Claude-Opus-4

Гитхаб
API
Веса обещают опубликовать
Чат на LMarena

#vlm
👍71
Qwen-Image-Edit-Rapid-AIO

Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.

Три версии по 29 ГБ каждая

V1: Qwen-Image-Edit-2509 и 4-step Lightning v2.0. Присыпано небольшим количеством лор NSFW. Универсальный вариант для SFW и NSFW. рекомендуется использовать sa_solver/beta, но euler_a/beta и er_sde/beta тоже могут дать достойные результаты.

V2: Используется набор ускорителей Qwen-Image-Edit, объединяющий 8- и 4- шаговые в одном. Значительно изменены настройки NSFW LoRa для более эффективного использования в SFW и NSFW. Настоятельно рекомендуется использовать sa_solver/simple.

V3: Используются новые лоры Qwen-Image-Edit lightning. Значительно скорректирован микс NSFW лор, удалены плохие и добавлены лучшие. Настоятельно рекомендуется sa_solver/beta

воркфлоу там же в репозитории

#optimization #imageediting #workflow
👍8🔥5
Kaleido

Модель от Meta AI (запрещено в РФ) создает фотореалистичные изображения и видео любых сцен и объектов с любого ракурса. Созданные ракурсы могут быть использованы для реконструкции 3D сцен (авторы используют NeuS2)

На вход можно подать одно изображение, несколько изображений.

Умеет интерпретировать коллажи

Кода нет

#research #novelview #imageto3d #image2scene
👍4