🔥7👏2👍1
Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models
Новый уровень контроля генерации. Какой-то контролнет/лора на стероидах.
Это штука чинит руки, например.
Код
Обученные XL слайдеры
#text2image
Новый уровень контроля генерации. Какой-то контролнет/лора на стероидах.
Это штука чинит руки, например.
Код
Обученные XL слайдеры
#text2image
👍6😱4
Нейронавт | Нейросети в творчестве
Video
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
еще наделал
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Re-tell.ai
Сервис генерации речи NPC.
Фишка - эмоции можно прописывать текстовым промтом.
Запуск бета-тестирования через неделю.
реддит
Записаться в вейтлист
#text2speech #tts #text2voice #text2emotion #voice
Сервис генерации речи NPC.
Фишка - эмоции можно прописывать текстовым промтом.
Запуск бета-тестирования через неделю.
реддит
Записаться в вейтлист
#text2speech #tts #text2voice #text2emotion #voice
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation of Speech by Hierarchical Variational Inference for Zero-shot Speech Synthesis
Генератор речи из текста по короткому заданному образцу. Воспроизводит не только индивидуальный голос, но и эмоции с интонациями.
Пока только английский язык, скоро сделают мультиязычную версию.
Код
Демо
#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning
Генератор речи из текста по короткому заданному образцу. Воспроизводит не только индивидуальный голос, но и эмоции с интонациями.
Пока только английский язык, скоро сделают мультиязычную версию.
Код
Демо
#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning
👍4
Forwarded from Нейросети и Блендер
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Stable Diffusion Video
ComfyUI теперь поддерживает Stable Diffusion Video и при этом инференс влезает в 8GB VRAM, что позволит генерить даже на T4.
Некоторые пояснения к параметрам:
— video_frames: количество генерируемых видеокадров. (В зависимости от моделей от 1 до 24)
— motion_bucket_id: чем выше число, тем больше движения будет в видео.
— fps: чем выше частота кадров, тем менее прерывистым будет видео.
— augmentation level: количество шума, добавляемого к начальному изображению. Чем оно выше, тем меньше видео будет похоже на исходное изображение. Увеличьте его для большего движения.
— VideoLinearCFGGuidance: этот узел немного улучшает выборку для этих видеомоделей, он линейно масштабирует cfg по разным кадрам.
Качество генераций очень нравится, еще бы поддержку ControlNet и Lora, и станет заменой AnimateDiff.
В комментах скидываю два .json для ComfyUI.
ComfyUI теперь поддерживает Stable Diffusion Video и при этом инференс влезает в 8GB VRAM, что позволит генерить даже на T4.
Некоторые пояснения к параметрам:
— video_frames: количество генерируемых видеокадров. (В зависимости от моделей от 1 до 24)
— motion_bucket_id: чем выше число, тем больше движения будет в видео.
— fps: чем выше частота кадров, тем менее прерывистым будет видео.
— augmentation level: количество шума, добавляемого к начальному изображению. Чем оно выше, тем меньше видео будет похоже на исходное изображение. Увеличьте его для большего движения.
— VideoLinearCFGGuidance: этот узел немного улучшает выборку для этих видеомоделей, он линейно масштабирует cfg по разным кадрам.
Качество генераций очень нравится, еще бы поддержку ControlNet и Lora, и станет заменой AnimateDiff.
Если возникнет ошибка при генерации связанная с xformers, то при запуске добавить параметр:
--use-pytorch-cross-attentionВ комментах скидываю два .json для ComfyUI.
🔥7
ZipLoRA: Any Subject in Any Style by Effectively Merging LoRAs
LoRA на стероидах от Google Research. Метод, позволяющий эффективно объединять LoRa объектов и стилей чтобы генерировать любой объект в любом стиле.
Авторы не поделились кодом, но уже есть неофициальная версия от умельцев
Код (неофициальный)
#finetuning #text2image
LoRA на стероидах от Google Research. Метод, позволяющий эффективно объединять LoRa объектов и стилей чтобы генерировать любой объект в любом стиле.
Авторы не поделились кодом, но уже есть неофициальная версия от умельцев
Код (неофициальный)
#finetuning #text2image
❤5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Breathing Life Into Sketches UsingText-to-Video Priors
Нейронимация noscript по текстовому промту от NVIDIA.
Из ограничений: умеет анимироват ьтолько один объект. Кроме того, модель обучена на одном конкретном стиле эскизов, и в остальных стилях не стоит ожидать хороших результатов. В будущем собираются это починить.
Код обещают выложить
#sketch2video #image2video #vector2video
Нейронимация noscript по текстовому промту от NVIDIA.
Из ограничений: умеет анимироват ьтолько один объект. Кроме того, модель обучена на одном конкретном стиле эскизов, и в остальных стилях не стоит ожидать хороших результатов. В будущем собираются это починить.
Код обещают выложить
#sketch2video #image2video #vector2video
❤3👍1