NEW BOT Телеграм, страница - 223974377

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.43K photos

3.7K videos

41 files

4.74K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

TransPixar: Advancing Text-to-Video Generation with Transparency

Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.

Генерация по тексту и по картинке

Прикрутили к CogvideoX и mochi

Код
Демо

#text2video #image2video #RGBA

🔥8❤2👍1

1.97K views10:40

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images

Новинка от Stability AI

Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.

На основе SF3D

Позволяет интерактивно редактировать модель

Код
Демо

#imageto3d #image2mesh

👍8🤯1

1.98K views11:13

Нейронавт | Нейросети в творчестве

Grok iOS

Мобильное приложение вышло в AppStore в США

Веб-версию ждем

#assistant #mobile #ios

👍4🔥2

1.76K views13:30

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Апскейлер видео от ByteDance

Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.

Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M

Прикручено к I2VGen-XL и CogVideoX-5B

Претрейн на CogVideX-5B поддерживает исходники только 720x480

Иyфу по потреблению VRAM не нашел

Код
Демо

#upscale #enhance #video2video

👍12🔥4🤔1

3.39K views22:00

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

покажу лучший вариант

Applio

Инструмент преобразования голоса.
Умеет переводить текст в речь, клонировать голос, смешивать голоса.

Есть поддержка плагинов

Есть рулька скорости произношения.

Работает быстрее чем ebook2audiobook

Applio есть в Pinokio

Сделал небольшое видео как перевести скан учебника в аудиокнигу

Сайт
Демо
Код
Колаб
Дискорд

#tts #text2speech #voicecloning #tutorial

Быстро загружаем учебник в мозг для экзамена

Делаем сжатую аудиокнигу из отсканированного учебника.
Ссылки:

https://notebooklm.google.com
https://chat.mistral.ai
https://github.com/IAHispano/Applio

Мой телеграм:
https://news.1rj.ru/str/+2VsYoqohonBhNGMy

🔥18👍5❤1👏1

2.44K viewsedited 07:54

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Оценка позы по изображению и по видео

Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб

#poseestimation #image2pose #video2pose

👍5🔥1

1.8K views10:13

Нейронавт | Нейросети в творчестве

ComfyUI-TangoFlux

Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux

#text2audio #text2sfx #foley

GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…

ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...

👍6🔥4❤1

1.84K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks

Новое поколение липсинка от Baidu

Работает и с головными уборами.
Анимирует не только лицо но и фон.

Все потому что внутри претрейн Cogvideox-5b-i2v

Код
Веса

#lipsync #talkinghead #humananimation #portraitanimation

👍13❤1👎1

3.78K views11:04

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

EditAR: Unified Conditional Generation with Autoregressive Models

Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA

- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске

Код ждем

#imageediting #conditioning #controlnet

👍4❤1🤮1

2K views11:39

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Да она же обдолбаная

Робот от Realbotix для общения

#news #robot

😁11🥴8💯2🤡1

2.11K viewsedited 18:19

Нейронавт | Нейросети в творчестве

FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on

Виртуальная примерочная от Tencent

Код
Демо HF
Демо 2

#tryon

👍6🤡1

2.17K views07:25

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Consistent Flow Distillation for Text-to-3D Generation

Генерация 3D-моделей с использованием предварительно обученного генератора картинок с мультиракурсно согласованным гауссовым шумом

Код

#textto3d

👍8🔥2

1.85K views08:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation

Реконструкция 3D объектов в экстремальных условиях освещения

Проект Гугла, кода нет

#relighting #nerf #3Dreconstruction #photogrammetry

😭2👀2❤1

1.68K views08:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Fast Music Remover

Удаление фонового шума с аудиозаписи

Код

#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation

👍16🔥2❤1

1.97K views09:12