Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Vanksy

Редко пощу чужой арт, как раз тот случай

Есть слайдшоу на youtube
🔥7👏2👍1
Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models

Новый уровень контроля генерации. Какой-то контролнет/лора на стероидах.
Это штука чинит руки, например.

Код
Обученные XL слайдеры

#text2image
👍6😱4
This media is not supported in your browser
VIEW IN TELEGRAM
Re-tell.ai

Сервис генерации речи NPC.
Фишка - эмоции можно прописывать текстовым промтом.
Запуск бета-тестирования через неделю.

реддит
Записаться в вейтлист

#text2speech #tts #text2voice #text2emotion #voice
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation of Speech by Hierarchical Variational Inference for Zero-shot Speech Synthesis

Генератор речи из текста по короткому заданному образцу. Воспроизводит не только индивидуальный голос, но и эмоции с интонациями.

Пока только английский язык, скоро сделают мультиязычную версию.

Код
Демо

#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Stable Diffusion Video

ComfyUI теперь поддерживает Stable Diffusion Video и при этом инференс влезает в 8GB VRAM, что позволит генерить даже на T4.

Некоторые пояснения к параметрам:
video_frames: количество генерируемых видеокадров. (В зависимости от моделей от 1 до 24)
motion_bucket_id: чем выше число, тем больше движения будет в видео.
fps: чем выше частота кадров, тем менее прерывистым будет видео.
augmentation level: количество шума, добавляемого к начальному изображению. Чем оно выше, тем меньше видео будет похоже на исходное изображение. Увеличьте его для большего движения.
VideoLinearCFGGuidance: этот узел немного улучшает выборку для этих видеомоделей, он линейно масштабирует cfg по разным кадрам.

Качество генераций очень нравится, еще бы поддержку ControlNet и Lora, и станет заменой AnimateDiff.

Если возникнет ошибка при генерации связанная с xformers, то при запуске добавить параметр:
--use-pytorch-cross-attention


В комментах скидываю два .json для ComfyUI.
🔥7
ZipLoRA: Any Subject in Any Style by Effectively Merging LoRAs

LoRA на стероидах от Google Research. Метод, позволяющий эффективно объединять LoRa объектов и стилей чтобы генерировать любой объект в любом стиле.

Авторы не поделились кодом, но уже есть неофициальная версия от умельцев

Код (неофициальный)

#finetuning #text2image
5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Breathing Life Into Sketches UsingText-to-Video Priors

Нейронимация noscript по текстовому промту от NVIDIA.
Из ограничений: умеет анимироват ьтолько один объект. Кроме того, модель обучена на одном конкретном стиле эскизов, и в остальных стилях не стоит ожидать хороших результатов. В будущем собираются это починить.

Код обещают выложить

#sketch2video #image2video #vector2video
3👍1