NEW BOT Телеграм, страница

FlowFeat: Pixel-Dense Embedding of Motion Profiles

Конкурент DINO и V-JEPA, создаёт детализированные представления видеоданных на уровне пикселей, используя информацию о движении.

В принципе должно работать для сегментации

Интересно где сравнение с DINO v3

Гитхаб

#segmentation #video2mask

❤5👍2🤔1🤯1

2.09K views16:19

Нейронавт | Нейросети в творчестве

XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation Генератор картинок по тексту от ByteDance Позволяет точно управлять несколькими объектами в одном изображении. Детальная настройка семантических атрибутов, таких…

XVerse Demo

Демоспейс июньского генератора картинок от ByteDAnce

#text2image #subjectcontrol #multisubject

👍4🔥1

1.89K views17:22

Нейронавт | Нейросети в творчестве

1:14

Media is too big

VIEW IN TELEGRAM

Space DJ

Кто-то навайбкодил.
Летаешь в космосе где каждая звездочка это музыкальный стиль.
Управление неудобное но вверху можно включить автопилот.
Лупы генерятся в реальном времени.
Можно перейти в Google AI Studio и продолжить эксперименты там.

#music #realtime

🔥13👍3❤2🤯1

2.02K views18:22

Нейронавт | Нейросети в творчестве

ChatGPT-5.1

Платным подписчикам выдали новую версию.

Разговорный стиль + улучшенное следование инструкциям.

Есть 2 режима:

Instant — быстрый

Thinking — для сложных задач

Можно выбрать тон — Профессиональный, Откровенный, Необычный

#assistant #news

👍4

1.64K views06:09

Нейронавт | Нейросети в творчестве

ComfyUI Advanced Camera Prompts

Генератор промптов для управления камерой в #ComfyUI, оптимизированный для работы с Qwen-Edit-2509-Multiple-angles от dx8152. Анализирует данные камеры из нод Load 3D и автоматически генерирует промпты.

Спасибо @m_franz

#imageediting #novelview #cameracontrol

❤9👍6🔥3

2.04K views07:11

Нейронавт | Нейросети в творчестве

Киберпанк который мы заслужили

Пишут что это реальная пакистанская газета Dawn

#humor

😁33

1.77K viewsedited 08:11

Нейронавт | Нейросети в творчестве

3:27

Media is too big

VIEW IN TELEGRAM

FireRedTTS-2: Towards Long Conversational Speech Generation for Podcast and Chatbot

Китайский голосовой движок с поддержкой мультиспикер диалога и клонированием голоса.
Проверил в демо - по-русски говорит. Но Демо быстро выжрало лимит а сохранить я ничего не успел.

— генерирует стабильную и естественную речь

— надёжно переключает говорящих

— учитывает контекст при формировании просодии

— использует новый токенизатор речи с частотой 12,5 Гц, который ускоряет обучение и вывод, увеличивает максимальную длину диалога и улучшает моделирование текста

Вот кстати про частоту - у потоковых голосовых моделей есть параметр частота токенизатора, это не частота дискретизации аудиосигнала.

Можно пилить подкасты в комфи

HF
Демо
ComfyUI-FireRedTTS

#voicecloning #tts #text2speech #russian #comfyUI

🔥6❤1👍1

2.13K views11:11

Нейронавт | Нейросети в творчестве

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

MuleRun

Маркетплейс ИИ-агентов под разные задачи.
Доступно более 180 агентов:

- инвестиции и исследование рынка

- дизайн для электронной коммерции

- создание контента

- помощь в играх

- автоматизация рабочих процессов и т д

При регистрации по реферральной ссылке дают 200 кредитов

#agent #marketplace

👍3👎1

1.6K views12:16

Нейронавт | Нейросети в творчестве

apply_texture_qwen_image_edit_2509

Продолжаем парад лор для #QIE

Лора для смены текстуры на объектах

#texture #lora #image2image #imageediting #referencing

👍11

2.13K views13:05

Нейронавт | Нейросети в творчестве

ERNIE-4.5-VL-28B-A3B-Thinking: A Breakthrough in Multimodal AI Очередной визуал-мыслитель Эрни от Baidu 28B параметров, из них 3B активных. Думает с помощью изображений, может увеличивать и уменьшать их, чтобы рассмотреть детали Использует внешние инструменты…

ERNIE 5.0

ОМГ! Горшочек не вари! Новый версии выходят слишком часто.

Ну ладно, тут не просто новая версия. Тут омнимодальная модель на 2.4T (трлн.) параметров

Может работать с текстом, изображениями, аудио и видео как на входе, так и на выходе.

Попробовать в чате

#assistant #vlm #omnimodal

👍6

1.77K views15:18

Нейронавт | Нейросети в творчестве