This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
TransPixar: Advancing Text-to-Video Generation with Transparency
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
🔥8❤2👍1
SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
👍8🤯1
Media is too big
VIEW IN TELEGRAM
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
👍12🔥4🤔1
Нейронавт | Нейросети в творчестве
покажу лучший вариант
Applio
Инструмент преобразования голоса.
Умеет переводить текст в речь, клонировать голос, смешивать голоса.
Есть поддержка плагинов
Есть рулька скорости произношения.
Работает быстрее чем ebook2audiobook
Applio есть в Pinokio
Сделал небольшое видео как перевести скан учебника в аудиокнигу
Сайт
Демо
Код
Колаб
Дискорд
#tts #text2speech #voicecloning #tutorial
Инструмент преобразования голоса.
Умеет переводить текст в речь, клонировать голос, смешивать голоса.
Есть поддержка плагинов
Есть рулька скорости произношения.
Работает быстрее чем ebook2audiobook
Applio есть в Pinokio
Сделал небольшое видео как перевести скан учебника в аудиокнигу
Сайт
Демо
Код
Колаб
Дискорд
#tts #text2speech #voicecloning #tutorial
YouTube
Быстро загружаем учебник в мозг для экзамена
Делаем сжатую аудиокнигу из отсканированного учебника.
Ссылки:
https://notebooklm.google.com
https://chat.mistral.ai
https://github.com/IAHispano/Applio
Мой телеграм:
https://news.1rj.ru/str/+2VsYoqohonBhNGMy
Ссылки:
https://notebooklm.google.com
https://chat.mistral.ai
https://github.com/IAHispano/Applio
Мой телеграм:
https://news.1rj.ru/str/+2VsYoqohonBhNGMy
🔥18👍5❤1👏1
ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
👍5🔥1
ComfyUI-TangoFlux
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
GitHub
GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…
ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...
👍6🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks
Новое поколение липсинка от Baidu
Работает и с головными уборами.
Анимирует не только лицо но и фон.
Все потому что внутри претрейн Cogvideox-5b-i2v
Код
Веса
#lipsync #talkinghead #humananimation #portraitanimation
Новое поколение липсинка от Baidu
Работает и с головными уборами.
Анимирует не только лицо но и фон.
Все потому что внутри претрейн Cogvideox-5b-i2v
Код
Веса
#lipsync #talkinghead #humananimation #portraitanimation
👍13❤1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
EditAR: Unified Conditional Generation with Autoregressive Models
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
👍4❤1🤮1
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on
Виртуальная примерочная от Tencent
Код
Демо HF
Демо 2
#tryon
Виртуальная примерочная от Tencent
Код
Демо HF
Демо 2
#tryon
👍6🤡1
Consistent Flow Distillation for Text-to-3D Generation
Генерация 3D-моделей с использованием предварительно обученного генератора картинок с мультиракурсно согласованным гауссовым шумом
Код
#textto3d
Генерация 3D-моделей с использованием предварительно обученного генератора картинок с мультиракурсно согласованным гауссовым шумом
Код
#textto3d
👍8🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation
Реконструкция 3D объектов в экстремальных условиях освещения
Проект Гугла, кода нет
#relighting #nerf #3Dreconstruction #photogrammetry
Реконструкция 3D объектов в экстремальных условиях освещения
Проект Гугла, кода нет
#relighting #nerf #3Dreconstruction #photogrammetry
😭2👀2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Fast Music Remover
Удаление фонового шума с аудиозаписи
Код
#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation
Удаление фонового шума с аудиозаписи
Код
#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation
👍16🔥2❤1