NEW BOT Телеграм, страница

LongCat-Video-Avatar

Генератор на базе LongCat-Video создаёт реалистичные длительные видеоролики с липсинком и сохранением идентичности персонажа

Генерирует видео на основе аудио и текста или аудио, текста и изображения

Умеет петь, продлять видео, делать мультидиалог, видеоподкасты, продающие видео

Гитхаб
HF
MS

#ati2v #at2v #avatar #longvideo #characteranimation #speech2animation #image2video

🔥10❤2

1.07K views07:11

Нейронавт | Нейросети в творчестве

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Seedance 1.5

Еще одна обновка видеогенератора от ByteDance

Заявлены естественные диалоги и качественный липсинк
Ежедневные бесплатные генерации в СapCut

https://www.capcut.com/tools/seedance-1-5-ai-video-generator
https://dreamina.capcut.com/ai-tool/generate - Model 3.5

#text2video #image2video

👍6😁2

1.09K views07:41

Нейронавт | Нейросети в творчестве

DistillPatch LoRA

Восстанавливает истинную 8-шаговую скорость Turbo для любой LoRA, обученной на Z-Image Turbo

решает проблему ухудшения качества изображений (размытие) при использовании стандартной тренировки LoRA в Z-Image Turbo при параметрах steps=8 и cfg=1

HF
Демо
MS
MS Демо
Гитхаб

#lora #zimage #optimization

🔥6😁1

1.13K views09:12

Нейронавт | Нейросети в творчестве

0:59

Media is too big

VIEW IN TELEGRAM

TRELLIS.2

А вот и треллис обновился.

Генератор текстурировапнных PBR 3D моделей по картинке, разрешение до 1536³

4B параметров.
Обрабатывает сложные структуры: открытые поверхности, nonmanifold-геометрию, внутренние структуры

SC-VAE: Sparse Compression VAE - придумали 3D-VAE для сжатия воксельных данных.

Гитхаб
Демо
HF

#imageto3d #pbr

❤6🔥4👍3

1.12K views10:13

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

EgoX: Egocentric Video Generation from a Single Exocentric Video

Еще одна работа на субъективный вид от первого лица (POV), от KAIST

Превращает видео с видом со стороны в видео от лица одного из персонажей

Лора на базе Wan 2.1 14B i2v

Код ждем

#video2pov #pov #video2video #cameracontrol #lora

🔥3😱2

1.03K views11:14

Нейронавт | Нейросети в творчестве

chatterbox-turbo

Новая версия голосовой модели от Resemble AI, всего 350М параметров

Для естественности можно добавлять паралингвистические теги, например [cough], [laugh], [chuckle]

В аудиофайлы, созданные с помощью Chatterbox, встраиваются незаметные нейронные водяные знаки Perth, которые сохраняются при сжатии MP3, редактировании аудио и других манипуляциях

Ну и главное - есть мультиязычная версия модели на 500М параметров, поддерживающая более 23 языков, в том числе русский

HF
Демо
Демо мультиязычный - спасибо @Black_human

#voicecloning #tts #russian

🔥8

1K views12:16

Нейронавт | Нейросети в творчестве

1:26

This media is not supported in your browser

VIEW IN TELEGRAM

Molmo 2: State-of-the-art video understanding, pointing, and tracking

Семейство пониматоров видео и изображений от AI2 (Allen AI)

#SOTA среди открытых моделей

— обгоняет Gemini 3 Pro и другие открытые модели в отслеживании объектов в видео

— поддерживает работу с одиночными изображениями, несколькими изображениями и видеоклипами разной длины

— указывает конкретные события и объекты в видео, а не просто даёт описательные ответы

— выполняет подсчёт объектов с указанием их местоположения, отслеживание нескольких объектов, плотную разметку видео, обнаружение аномалий и артефактов, работает с субтитрами в видео

Molmo 2 (8B) — лучшая общая модель для работы с видео
Molmo 2 (4B) — оптимизирована для эффективности

Эти две модели на базе Qwen 3

Molmo 2-O (7B) — полностью открытая модель с контролем над всеми компонентами

Playground
HF

#vlm #multimodal

👍5❤1🔥1

957 views13:16

Нейронавт | Нейросети в творчестве

ChatGPT Images Быстрый и точный редактор картинок от Open AI Новый король? посмотрим Пробуем в ChatGPT #imageediting #text2image

Gpt-image-1.5 Prompting Guide

Руководство по промптингу Gpt-image-1.5

#prompting #guide

Openai

Gpt-image-1.5 Prompting Guide | OpenAI Cookbook

gpt-image-1.5 is our latest image generation model, designed for production-quality visuals and highly controllable creative workflows. I...

👍2👎1

759 views14:17

Нейронавт | Нейросети в творчестве

1:30

This media is not supported in your browser

VIEW IN TELEGRAM

Music Videos by Mozart AI

Короче вот в чем суть обновки у генератора музыки Mozart AI

Они теперь делают видеоклипы до минуты хронометража

Vibe Sessions — путь от идеи к готовой песне и музыкальному видео в формате чата

Studio Session — среда мультитрек, генерирует стемы и лупы, работает с MIDI-инструментами, эффектами, делает аутпейнтинг и расширения, использует микшер

Ну что ж, суно и удио ушли, на поляне стало просторнее

#music #vusicediting #music2video #musicvideo #midi

🔥3👍1

643 views15:18

Нейронавт | Нейросети в творчестве

Gemini 3 Flash: frontier intelligence built for speed

Еще версия иишки от гугла

Мультимодальная модель почти на уровне Gemini 3 Pro но быстрее и дешевле

Тоже понимает картинки и видео, и аудио. Умеет кодить

#news #assistant

❤7

530 views16:11

About

Blog

Apps

Platform