NEW BOT Телеграм, страница

RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers

Рецепты наших дедушек. Сделать ваше генеративное видео вдвое длиннее очень просто, нужен всего лишь простой советский... freq[k-1]=(2*np.pi)/(L*s)

Короче, этот трюк позволяет создавать генеративное видео длиннее без какого-либо дообучения. На примерах видео удлинено с 129 до 261 кадров

Бонус - так можно не только увеличивать количество кадров, но повышать разрешение (см картинки)

Код - прикручено к Hunyuan, планируют прикрутить к другим моделям

#text2video

🔥8😁5👍3🎃1

2.22K views10:35

Нейронавт | Нейросети в творчестве

1:02

This media is not supported in your browser

VIEW IN TELEGRAM

Wan2.1

Генератор видео по тексту и по картинке от Alibaba, опенсорс

Требует всего 8.19 GB VRAM для работы

Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p

Гитхаб
Веса

#text2video #image2video

🔥8👏1

2.06K viewsedited 14:57

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

QwQ-Max-Preview

Рассуждалка от Qwen, обновленная Qwen2.5-Max

——————
YandexGPT 5

Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги

Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой

#news #assistant #reasoning

❤4👍4🔥1

1.96K views17:50

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI-WanVideoWrapper

Ноды видеогенератора Wan2.1 для #ComfyUI

В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video

Сохраняйте спокойствие, работы ведутся

Пожатые веса

#image2video

❤7😁3🔥2👍1

1.82K views10:18

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini Code Assist стал бесплатным.

Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц

Доступно для VSCode, Jetbrains. Github

Блог

#coding

👍14🔥2

2.56K views10:50

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Proxy Lite

Convergence опубликовали в общий доступ младшую версию своего браузерного агента

3B параметров
На основе Qwen2.5-VL-3B-Instruct

Код/Веса

#agent #browser #vlm

🔥7❤1

1.94K viewsedited 12:06

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Keyframe Control Lora

Лора ключевых кадров для HunyuanVideo T2V (T2V, генератор по тексту - так в репозитории написано)

Задаем два кадра и количество кадров - получаем видео, начинающееся с первого, оканчивающееся вторым

#lora #text2video #image2video

👍13❤1

1.93K views14:37

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Видеогенератор Wan2.1 поддерживается в #ComfyUI нативно
Судя по тому что по инструкции надо скачать fp8_e4m3fn модель, не удивлюсь если всю работу взяли у Kijai

У людей t2i (она может оказывается и просто картинки генерить) заводится даже на RTX2060!
Для видео на 1.3B модели заготовьте 15ГБ VRAM, а для 14B - 40ГБ VRAM

Блог

#text2video #image2video

👍8❤2

1.79K viewsedited 07:53

Нейронавт | Нейросети в творчестве

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

Prompt-to-Leaderboard (P2L)

Теперь на lmarena.ai можете создавать свои лидерборды написав промпт во вкладке Chat.
Этим занимаются специально обученные модели, начинающиеся с 'p2l-'

Впрочем, можете организовать и свою арену с блекджеком и ботами, ведь есть веса и код

Гитхаб
Веса

#prompt2leaderboard #p2l #text2leaderboard

👍4❤1

1.76K views08:23

Нейронавт | Нейросети в творчестве

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

moonshine-live

Распознавание речи в реальном времени на Moonshine

Демо
Модели

#speech2text #ASR #subnoscripts #realtime

🔥4

1.83K views08:53

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors

Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090

Код

#video2scene #rendering #videoto3D

👍19🤯6🔥2

1.94K views09:40

Нейронавт | Нейросети в творчестве

GHOST 2.0: Generative High-fidelity One Shot Transfer of Heads

Перенос головы с фото на фото от Sber AI.
Не лица, а головы. Все кто имел дело с заменой лиц, понимают о чем речь.

Пишут что единственный аналог - HeSer, по метрикам его побили

Код
Демо
Хабр

#headswap #faceswap

💩17🔥7👎4🥴3❤2

2.25K views15:00

Нейронавт | Нейросети в творчестве

GPT-4.5

Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus

#news #assistant #reasoning

👍4❤1

2.1K views20:31

Нейронавт | Нейросети в творчестве

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion

Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд

Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX

Код
Демо (еще не работает)

#PBR #textto3d

🔥4🤔1

2.08K views08:27

About

Blog

Apps

Platform