NEW BOT Телеграм, страница

UltraGen: High-Resolution Video Generation with Hierarchical Attention

Видеогенератор 4K, масштабирует предварительно обученные модели с низким разрешением/

В исследовании масштабировали Wan-T2V-1.3B

Кода нет, так чисто посмотреть

#text2video #research

👍4👀4

2K views17:21

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Suno.ai V4.5

Выдали всем бесплатно, по несколько генераций в день

Бонусом еще два минутных трека на v5

#news #text2music

👍12❤2

1.91K views18:28

Нейронавт | Нейросети в творчестве

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

Video-As-Prompt: Unified Semantic Control for Video Generation

Видеогенератор использует видео как пропмт, создавая видео, семантически согласованные с референсами

— создаёт видео с одинаковой семантикой при разных референсных видео и одинаковых изображениях

— переносит семантику (концепцию, стиль, движение, ракурс камеры) с референсного видео на разные изображения

— сохраняет семантику и идентичность при корректировке мелких атрибутов с помощью промпта

— генерирует видео с определёнными концепциями

— создаёт видео в заданном стиле

— воспроизводит заданные движения и стили танца

— имитирует различные движения камеры, включая сложные, вроде дolly zoom (эффекта Хичкока)

Код
HF - прикрутили к WAN2.114B и CogVideox-5B

#referencing #text2video #video2video

👍6❤3🔥2

2.22K views08:11

Нейронавт | Нейросети в творчестве

2:01

Media is too big

VIEW IN TELEGRAM

Stable Video Infinity: Infinite-Length Video Generation with Error Recycling

И еще один костыль для увеличения сами знаете чего - хронометража генерируемого видео

SVI создает видео любой длины с высокой временной согласованностью, правдоподобными переходами между сценами и управляемыми сюжетными линиями

Базовая модель — Wan 2.1 14B

Ждем версию Wan 2.2-5B-SVI

Код
HF

спасибо @m_franz

#longvideo #text2video #image2video

👍14

2.26K viewsedited 10:13

Нейронавт | Нейросети в творчестве

BoldVoice Accent Oracle

Онлайн определятор акцента в английском языке.

Давно не говорил на ангельском, у меня явный русский акцент

Сможете обмануть его?

#misc #online #speech

😁8👍3🤯1

1.77K views11:14

Нейронавт | Нейросети в творчестве

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Закинул видео своего медведя на реконструкцию в HunyuanWorld-Mirror по 24 отобранным кадрам

Гауссова сцена далека от идеала, на меш интереснее смотреть. Надо увеличивать количество ракурсов.

Закину гауссианы и меш в комменты для интересующихся

#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth

❤4👍1

1.71K views12:16

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

Claude Desktop

Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию

#MacOS / #Windows

#desktop #assistant

🥴10👍5👎1

1.77K viewsedited 13:17

Нейронавт | Нейросети в творчестве

BLIP3o-NEXT: Advanced Multimodal Foundation Model

Мультимодальная модель, развитие BLIP3o
Гибрид авторегресси и диффузии
Генератор / пониматор картинок от Salesforce

Улучшенное соответствие подсказкам и точность рендеринга текста за счет обучения с подкреплением по методу GRPO

Хорошо справляется с задачами, требующими пространственной структуры (например, рендеринг текста или генерация нескольких объектов

Гитхаб
HF - там целый зоопарк от 3B до 8B

#text2image #image2text #multimodal #ar #captioning

👍6❤1

2.11K views16:12

Нейронавт | Нейросети в творчестве

когда твоя девушка работала через AWS

контекст:
на днях полег облачный сервис AWS прихватив с собой полмира, включая

не только крупнейшие сайты, но и умные матрасы

. И это на фоне сообщения о том что Amazon якобы заменил 40% DevOps-инженеров AWS искусственным интеллектом за несколько дней до сбоя

#humor

😁27🤷‍♂2👍1

2.01K views17:21

Нейронавт | Нейросети в творчестве

Claude Desktop Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию #MacOS / #Windows #desktop #assistant

#Humor

😁21👍1

1.7K views06:37

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

LTX-2

Новая версия видеогенератора от Lightricks
Создает видео со звуком в 4K, 50 фпс, рилтайм (нет)

На вход можно подать что угодно: текст, изображения, видео, аудио, карты глубины и отснятый материал для управляемой генерации

Поддерживает лоры и генерацию по нескольким ключевым кадрам

Попробовать (кроме россиян), можно на офсайте

Уже есть на Fal.ai, также можно чекнуть Replicate, ComfyUI

Тест человекорыбом частично провалился. Где рыба, Лебовски?

И тоже не умеет делать лунную походку.

Может оно и 4К по количеству пикселей но не по качеству. Ну зато быстрый. Ждем опенсорс

Гитхаб - новую модель опубликуют в конце ноября

Спасибо @m_franz

#any2video #text2video #image2video

🔥8😱2❤1⚡1👍1

1.74K views07:10

Нейронавт | Нейросети в творчестве

ахах!
лайтрикс что за намеки?

#humor

😁12👍1

1.58K views07:29

Нейронавт | Нейросети в творчестве

Sa2VA-Qwen3-VL-4B

ByteDance выпустил Sa2VA на Qwen3-VL-4B
Модель объединяет SAM2 и LLaVA для глубокого понимания изображений и видео

Гитхаб

#segmentation #vlm #assistant #video2text #vide2mask #captiopning

huggingface.co

ByteDance/Sa2VA-Qwen3-VL-4B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥10👍2🤔1

2.13K views08:11

About

Blog

Apps

Platform