Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Мультиагентная платформа для автоматизации задач на десктопе от авторов Mobile-Agent (Alibaba)

Код

#agent
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Sesame CSM 1B

На прошлой неделе Sesame AI Labs показали интерактивную демку крышесносной голосовой модели, вам еще предлагали практиковать на ней английский.

Сейчас уже доступны веса и код

Модель генерирует RVQ аудио коды по входному тексту и аудио. Плюс, под капотом помогает Llama с декодером

Возможен файнтюн на разные голоса

На русский из коробки не стоит рассчитывать. В датасете был в основном английский.

Код
Веса

#voicemode #text2speech #csm
10🔥1
Lara

Новый переводчик
Все пишут что убийца DeepL, но я думаю что это просто маркетинг такой

На бесплатном тарифе:
- Перевод текста без форматирования: до 5000 символов в день.
- Перевод речи с микрофона, до 2 минут за сеанс
- Перевод документов: до 4 страниц в день (без ограничений по количеству документов размером до 200 МБ каждый).
- Режим инкогнито: текст удаляется сразу после перевода.
- Использование API: до 10 000 символов в месяц.

Есть три режима: точный, литературный и творческий;
Для качественного перевода можно добавить к фразе контекст

#translation #text2text
🥴4👍1👎1
Perplexity Windows / Perplexity Comet

Тут в коментах выяснилось что я дед, который и переводит браузером и ищет инфу в браузере.

Специально для меня Perplexity выпустили десктопное приложения для Windows (мобильные аппки уже давно есть) и анонсировали свой браузер Comet, записаться в вейтлист можно тут

Авось мягко перееду на современные технологии

#search #news #assistant
🔥13👍2
LBM: Latent Bridge Matching for Fast Image-to-Image Translation

Универсальный метод преобразования изображений

Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение

Код
Демо (релайтинг)

#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
5👍1🔥1
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering

Очередная работа Nvidia в направлении реконструкции/рендера/растеризации объемных сцен.
Выглядит как, ответ Radiant Foam

SVRaster стремится объединить скорость рендеринга гауссиан с преимуществами воксельных сеток без нейросетей и гауссиан (я правильно прочитал?)

Принцип как в nerf и 3DGS - на вход подаем ограниченный набор ракурсов сцены, на выходе вид с любого ракурса.

Код

#gaussian #rendering #novelview #image2scene #video2scene #realtime
🔥10
Image-01

Генератор изображений от Hailuo

Ежедневно насыпают 100 кредитов бесплатно, 1 картинка стоит 1 кредит

Попробовать - выбираем вкладку Create Image

#text2image
1👍7
KV-Edit: Training-Free Image Editing for Precise Background Preservation

Редактирование изображений по маске и промпту, с упором на сохранение фона неизменным.

Код
Демо
ComfyUI

#imageediting #inpainting
👍91💩1