NEW BOT Телеграм, страница - 92045499

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.46K photos

3.73K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

OpenHands: Code Less, Make More

Опенсорсный ИИ-разработчик софта. Ходят слухи что аналог Devin

Умеет фиксить код, запускать команды, ходить по ссылкам, вызывать API, ~~пиз~~ копировать код с StackOverflow

#coding #assistant

👍12🎃3🤯1

1.91K views14:08

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control

Управление генерацией видео через понимание объема.

- управление камерой
- перенос движения с видео на 3D меш
- перенос движения с видео на изображение
- манипуляция объектами

Код ждем

#motioncontrol #cameracontrol #motiontransfer

👍5🤯3

1.82K views05:04

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token

Эффективная визуально-языковая модель.
Понимает изображения и видео.

на обработку одной картинки уходит 40 мс. А на обработку трехчасового видео хватит 24Гб VRAM.

Изображение кодируется одним единственным токеном, за счет чего и эффективность. Холмс, но как?

Код
Веса

#vlm #assistant

👍11🤷‍♂2

2.17K views05:38

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно

Код ждем

#gaussian #videoto3d #video2gaussian

👍11

1.75K views06:09

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

TransPixar: Advancing Text-to-Video Generation with Transparency

Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.

Генерация по тексту и по картинке

Прикрутили к CogvideoX и mochi

Код
Демо

#text2video #image2video #RGBA

🔥8❤2👍1

1.97K views10:40

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images

Новинка от Stability AI

Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.

На основе SF3D

Позволяет интерактивно редактировать модель

Код
Демо

#imageto3d #image2mesh

👍8🤯1

1.98K views11:13

Нейронавт | Нейросети в творчестве

Grok iOS

Мобильное приложение вышло в AppStore в США

Веб-версию ждем

#assistant #mobile #ios

👍4🔥2

1.76K views13:30

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Апскейлер видео от ByteDance

Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.

Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M

Прикручено к I2VGen-XL и CogVideoX-5B

Претрейн на CogVideX-5B поддерживает исходники только 720x480

Иyфу по потреблению VRAM не нашел

Код
Демо

#upscale #enhance #video2video

👍12🔥4🤔1

3.39K views22:00

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

покажу лучший вариант

Applio

Инструмент преобразования голоса.
Умеет переводить текст в речь, клонировать голос, смешивать голоса.

Есть поддержка плагинов

Есть рулька скорости произношения.

Работает быстрее чем ebook2audiobook

Applio есть в Pinokio

Сделал небольшое видео как перевести скан учебника в аудиокнигу

Сайт
Демо
Код
Колаб
Дискорд

#tts #text2speech #voicecloning #tutorial

Быстро загружаем учебник в мозг для экзамена

Делаем сжатую аудиокнигу из отсканированного учебника.
Ссылки:

https://notebooklm.google.com
https://chat.mistral.ai
https://github.com/IAHispano/Applio

Мой телеграм:
https://news.1rj.ru/str/+2VsYoqohonBhNGMy

🔥18👍5❤1👏1

2.45K viewsedited 07:54