VibeVoice-finetuning
Неофициальный способ файнтюна топовой говорилки VibeVoice
В процессе разработки
Для 1.5B LoRa рекомендовано минимум 16gb VRAM
Для 7B LoRa - минимум 48gb VRAM
#podcast #voicecloning #tts #text2speech #text2podcast #finetuning #lora
Неофициальный способ файнтюна топовой говорилки VibeVoice
В процессе разработки
Для 1.5B LoRa рекомендовано минимум 16gb VRAM
Для 7B LoRa - минимум 48gb VRAM
#podcast #voicecloning #tts #text2speech #text2podcast #finetuning #lora
GitHub
GitHub - voicepowered-ai/VibeVoice-finetuning: Unofficial WIP LoRa Finetuning repository for VibeVoice
Unofficial WIP LoRa Finetuning repository for VibeVoice - voicepowered-ai/VibeVoice-finetuning
👍5
marble
Генератор миров по картинке и по тексту от worldlabs.ai
По тексту - сначала генерит картинку
Работает на гауссианах. По сути это генератор 3D сцен на гауссианах под соусом навигабельных миров.
Есть две модели: Marble 01-mini и Marble 01-Plus. Вторая качественнее, медленнее и впятеро дороже по кредитам. Но все генерации сейчас бесплатные
Работает в том числе и на VR гарниртурах
Можно экспортировать сцену в файл.
Говорят что доступ через вейтлист но я свободно зашел и нагенерил немножко, см второе видео
Попробовать
#image2world #image2scene #gaussian #world
Генератор миров по картинке и по тексту от worldlabs.ai
По тексту - сначала генерит картинку
Работает на гауссианах. По сути это генератор 3D сцен на гауссианах под соусом навигабельных миров.
Есть две модели: Marble 01-mini и Marble 01-Plus. Вторая качественнее, медленнее и впятеро дороже по кредитам. Но все генерации сейчас бесплатные
Работает в том числе и на VR гарниртурах
Можно экспортировать сцену в файл.
Говорят что доступ через вейтлист но я свободно зашел и нагенерил немножко, см второе видео
Попробовать
#image2world #image2scene #gaussian #world
👍12👎3❤1
HuMo GGUF + workflow
Кванты HuMo на Wan2.1:
https://huggingface.co/Alissonerdx/Wan2.1-HuMo-GGUF/tree/main/GGUF
https://huggingface.co/Kijai/WanVideo_comfy/tree/main/HuMo
воркфлоу - официальный в ComfyUI-WanVideoWrapper, на сейфтензорах
воркфлоу GGUF от LateInClass
говорилка в воркфлоу: https://huggingface.co/Kijai/MelBandRoFormer_comfy/tree/main
Видео от автора вф
#referencing #text2video #image2video #audio2video #gguf #workflow
Кванты HuMo на Wan2.1:
https://huggingface.co/Alissonerdx/Wan2.1-HuMo-GGUF/tree/main/GGUF
https://huggingface.co/Kijai/WanVideo_comfy/tree/main/HuMo
воркфлоу - официальный в ComfyUI-WanVideoWrapper, на сейфтензорах
воркфлоу GGUF от LateInClass
говорилка в воркфлоу: https://huggingface.co/Kijai/MelBandRoFormer_comfy/tree/main
Видео от автора вф
#referencing #text2video #image2video #audio2video #gguf #workflow
Telegram
Нейронавт | Нейросети в творчестве
HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning
Видеогенератор при участии Bytedance
— генерирует видео на основе текста, изображений и аудио
— удерживает идентичность и характеристики изображаемого субъекта
— синхронизирует…
Видеогенератор при участии Bytedance
— генерирует видео на основе текста, изображений и аудио
— удерживает идентичность и характеристики изображаемого субъекта
— синхронизирует…
👍7🔥1
Higgsfield Soul бесплатно с лимитами
Впервые за долгое время Хиггс не обманывает, а действительно дает что-то бесплатно
Генератором фотографий Soul можно пользоваться бесплатно, дают 30 кредитов в день на это дело
Но только по входной картинке или тексту. Бесплатно создать персонажа не дадут.
Генерим здесь
#personalization #referencing #photoreal
Впервые за долгое время Хиггс не обманывает, а действительно дает что-то бесплатно
Генератором фотографий Soul можно пользоваться бесплатно, дают 30 кредитов в день на это дело
Но только по входной картинке или тексту. Бесплатно создать персонажа не дадут.
Генерим здесь
#personalization #referencing #photoreal
👍5❤2😁1
LanPaint + Qwen-Image-Edit / Wan 2.2 T2I
В думающий инпейнтер картинок LanPaint добавили поддержку Wan 2.2 T2I и QIE
Несколько часов назад навалили новых workfow в репозиторий
Я сравнил на одном примере голый QIE / QIE с инпентинг лорой / LanPaint QIE
LanPaint безумно долгий на стандартных 5 шагах — 15 минут без ускоряющей лоры 512х512 на 4060Ti
С восьмишаговой лорой - 12 минут
За это время он делает несколько попыток и что-то там оценивает и переделывает. В комфи можно наблюдать его версии на иконке в очереди инференса - они обновляются на каждом шаге.
Но вот по качеству инпейнтинга он явно выигрывает у остальных вариантов.
Это только на одном примере, кто знает, может на других примерах будет иначе
Старый воркфлоу LanPaint QI у меня работает лучше чем новый LanPaint QIE
#inpainting #qwenimage #wan22 #workflow #comparison #shootout
В думающий инпейнтер картинок LanPaint добавили поддержку Wan 2.2 T2I и QIE
Несколько часов назад навалили новых workfow в репозиторий
Я сравнил на одном примере голый QIE / QIE с инпентинг лорой / LanPaint QIE
LanPaint безумно долгий на стандартных 5 шагах — 15 минут без ускоряющей лоры 512х512 на 4060Ti
С восьмишаговой лорой - 12 минут
За это время он делает несколько попыток и что-то там оценивает и переделывает. В комфи можно наблюдать его версии на иконке в очереди инференса - они обновляются на каждом шаге.
Но вот по качеству инпейнтинга он явно выигрывает у остальных вариантов.
Это только на одном примере, кто знает, может на других примерах будет иначе
Старый воркфлоу LanPaint QI у меня работает лучше чем новый LanPaint QIE
#inpainting #qwenimage #wan22 #workflow #comparison #shootout
👍7🤔4🔥1🍾1
Нейронавт | Нейросети в творчестве
Krea Realtime Video Krea запускает генерацию видео в реальном времени (12+ fps). На вход принимает рисование, текстовые подсказки, веб-камеру или стрим экрана Под капотом подход основан на современных идеях “модели мира”: системах, которые изучают, как развиваются…
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Realtime Video
Прислали на днях доступ со ссылкой на нерабочий сайт.
А теперь выпустили в доступ для платных подписанов генерацию видео в реальном времени
#realtime #video2video #sketch2video
Прислали на днях доступ со ссылкой на нерабочий сайт.
А теперь выпустили в доступ для платных подписанов генерацию видео в реальном времени
#realtime #video2video #sketch2video
👀9👍4🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Убегая от вооруженного базукой робота, лучи поноса направляйте по адресу китайских студентов из Чунциня
#robot
#robot
😁12😐8🍾5❤1👍1
Tongyi DeepResearch
Первый полностью открытый веб-агент, который демонстрирует результаты, сопоставимые с DeepResearch от OpenAI. Модель от Alibaba способна решать сложные задачи, связанные с поиском информации и рассуждениями
Работает в двух режимах: Native ReAct Mode для стандартного рассуждения и Heavy Mode для сложных многоэтапных исследовательских задач
Умеет решать комплексные задачи, например, планировать путешествия с учётом специфических требований или проводить юридические исследования, анализируя судебную практику и законы.
Гитхаб
HF
#deepresearch #agent #assistant
Первый полностью открытый веб-агент, который демонстрирует результаты, сопоставимые с DeepResearch от OpenAI. Модель от Alibaba способна решать сложные задачи, связанные с поиском информации и рассуждениями
Работает в двух режимах: Native ReAct Mode для стандартного рассуждения и Heavy Mode для сложных многоэтапных исследовательских задач
Умеет решать комплексные задачи, например, планировать путешествия с учётом специфических требований или проводить юридические исследования, анализируя судебную практику и законы.
Гитхаб
HF
#deepresearch #agent #assistant
👍8🔥1
Postshot v1
Вышел из беты инструмент полного цикла для работы с полями света (нерфы, гауссианы)
Бета лицензия превратится в бесплатный тариф 26 сентября. На бесплатном тарифе рендер с вотермаком, входные изображения ограничены 8 бит.
На двух платных тарифах предлагают экспорт в .PLY, поддержку исходников 4K и HDR (16bit or 32bit) и прочие плюшки.
Так что бежим пользоваться всеми плюшками бесплатно - осталась неделя.
#gui #tools #gaussian #nerf #windows #desktop
Вышел из беты инструмент полного цикла для работы с полями света (нерфы, гауссианы)
Бета лицензия превратится в бесплатный тариф 26 сентября. На бесплатном тарифе рендер с вотермаком, входные изображения ограничены 8 бит.
На двух платных тарифах предлагают экспорт в .PLY, поддержку исходников 4K и HDR (16bit or 32bit) и прочие плюшки.
Так что бежим пользоваться всеми плюшками бесплатно - осталась неделя.
#gui #tools #gaussian #nerf #windows #desktop
👍4❤2😭1
Media is too big
VIEW IN TELEGRAM
MapAnything: Universal Feed-Forward Metric 3D Reconstruction
Реконструкция 3D сцены с камерой по разным входным данным - изображениям, позиции камеры, глубине или даже по частичной реконструкции.
Напрямую вычисляет 3D геометрию сцены и параметры камер
Код
Демо
#3d #image2scene #any2scene #imageto3d #3dto3d #image2normal #image2depth
Реконструкция 3D сцены с камерой по разным входным данным - изображениям, позиции камеры, глубине или даже по частичной реконструкции.
Напрямую вычисляет 3D геометрию сцены и параметры камер
Код
Демо
#3d #image2scene #any2scene #imageto3d #3dto3d #image2normal #image2depth
👍5🔥1