NEW BOT Телеграм, страница - 739912018

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.45K photos

3.72K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token

Эффективная визуально-языковая модель.
Понимает изображения и видео.

на обработку одной картинки уходит 40 мс. А на обработку трехчасового видео хватит 24Гб VRAM.

Изображение кодируется одним единственным токеном, за счет чего и эффективность. Холмс, но как?

Код
Веса

#vlm #assistant

👍11🤷‍♂2

2.17K views05:38

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно

Код ждем

#gaussian #videoto3d #video2gaussian

👍11

1.75K views06:09

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

TransPixar: Advancing Text-to-Video Generation with Transparency

Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.

Генерация по тексту и по картинке

Прикрутили к CogvideoX и mochi

Код
Демо

#text2video #image2video #RGBA

🔥8❤2👍1

1.97K views10:40

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images

Новинка от Stability AI

Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.

На основе SF3D

Позволяет интерактивно редактировать модель

Код
Демо

#imageto3d #image2mesh

👍8🤯1

1.98K views11:13

Нейронавт | Нейросети в творчестве

Grok iOS

Мобильное приложение вышло в AppStore в США

Веб-версию ждем

#assistant #mobile #ios

👍4🔥2

1.76K views13:30

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Апскейлер видео от ByteDance

Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.

Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M

Прикручено к I2VGen-XL и CogVideoX-5B

Претрейн на CogVideX-5B поддерживает исходники только 720x480

Иyфу по потреблению VRAM не нашел

Код
Демо

#upscale #enhance #video2video

👍12🔥4🤔1

3.39K views22:00

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

покажу лучший вариант

Applio

Инструмент преобразования голоса.
Умеет переводить текст в речь, клонировать голос, смешивать голоса.

Есть поддержка плагинов

Есть рулька скорости произношения.

Работает быстрее чем ebook2audiobook

Applio есть в Pinokio

Сделал небольшое видео как перевести скан учебника в аудиокнигу

Сайт
Демо
Код
Колаб
Дискорд

#tts #text2speech #voicecloning #tutorial

Быстро загружаем учебник в мозг для экзамена

Делаем сжатую аудиокнигу из отсканированного учебника.
Ссылки:

https://notebooklm.google.com
https://chat.mistral.ai
https://github.com/IAHispano/Applio

Мой телеграм:
https://news.1rj.ru/str/+2VsYoqohonBhNGMy

🔥18👍5❤1👏1

2.45K viewsedited 07:54

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Оценка позы по изображению и по видео

Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб

#poseestimation #image2pose #video2pose

👍5🔥1

1.8K views10:13