This media is not supported in your browser
VIEW IN TELEGRAM
Phidias : A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion
генератор 3D моделей по картинке, по тексту, по референсной 3D модели
Код - тестировали на RTX 4090 и A100
#textto3d #imageto3d #3dto3d
генератор 3D моделей по картинке, по тексту, по референсной 3D модели
Код - тестировали на RTX 4090 и A100
#textto3d #imageto3d #3dto3d
🔥7👍6👎1
CogView4-6B
Генератор картинок
Конкурент flux
Поддерживает очень длинный контекст, хорошо следует промпту
Выходное разрешение от 512 до 2048 пикселей с шагом 32
По потреблению памяти терпимо. Главный вопрос что с кастомизацией?
Гитхаб
Демо
#text2image
Генератор картинок
Конкурент flux
Поддерживает очень длинный контекст, хорошо следует промпту
Выходное разрешение от 512 до 2048 пикселей с шагом 32
По потреблению памяти терпимо. Главный вопрос что с кастомизацией?
Гитхаб
Демо
#text2image
🔥10👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Pandora3D
Генератор текстурированных 3D моделей от Tencent.
По тексту, по изображению, по набору изображений с разных ракурсов
В архиве 100Гб
Код
#textto3d #imageto3d
Генератор текстурированных 3D моделей от Tencent.
По тексту, по изображению, по набору изображений с разных ракурсов
В архиве 100Гб
Код
#textto3d #imageto3d
🔥4🥴4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
DiffRhythm: Blazingly Fast and Embarrassingly Simple End-to-End Full-Length Song Generation with Latent Diffusion
Генератор музыки в опенсорсе
Очень быстрый
Отличительная особенность - можно задавать тайминги для текста
Но всего два языка - английский и китайский
Сейчас доступна модель DiffRhythm-base (1m35s)
Старшую DiffRhythm-full (4m45s) выложат позже
Код
Демо
#music #text2music
Генератор музыки в опенсорсе
Очень быстрый
Отличительная особенность - можно задавать тайминги для текста
Но всего два языка - английский и китайский
Сейчас доступна модель DiffRhythm-base (1m35s)
Старшую DiffRhythm-full (4m45s) выложат позже
Код
Демо
#music #text2music
👍6🔥4🥴2
This media is not supported in your browser
VIEW IN TELEGRAM
Kokoro Web
Веб версия генератора речи Kokoro
Можно пользоваться онлайн или установить локально. Для локальной версии есть API, совместимый с Open AI
Русского языка по прежнему нет
Код
#tts #text2speech
Веб версия генератора речи Kokoro
Можно пользоваться онлайн или установить локально. Для локальной версии есть API, совместимый с Open AI
Русского языка по прежнему нет
Код
#tts #text2speech
🔥2👍1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
HunyuanVideo-I2V
Допилили наконец видео по картинке
С блэкждеком, ComfyUI и лорами
Запасайтесь VRAM? для 720p нужно 60Гб
Веса
Код
#image2video
Допилили наконец видео по картинке
С блэкждеком, ComfyUI и лорами
Запасайтесь VRAM? для 720p нужно 60Гб
Веса
Код
#image2video
🔥16🥴4👍3❤2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
LTX-Video v0.9.5
Обновка видеогенератора
- Поддержка ключевых кадров и продолжения видео
- нативная поддержка в #ComfyUI
- Поддержка более высоких разрешений
- Улучшенное понимание промптов
- Улучшенный VAE
- Новое интерактивное веб-приложение в LTX-Studio
- Автоматическое улучшение промптов
Кому интересно, оно без цензуры
Гитхаб
ComfyUI
Попробовать на офсайте (притворитесь что вы не в России)
Обновка видеогенератора
- Поддержка ключевых кадров и продолжения видео
- нативная поддержка в #ComfyUI
- Поддержка более высоких разрешений
- Улучшенное понимание промптов
- Улучшенный VAE
- Новое интерактивное веб-приложение в LTX-Studio
- Автоматическое улучшение промптов
Кому интересно, оно без цензуры
Гитхаб
ComfyUI
Попробовать на офсайте (притворитесь что вы не в России)
❤6👍2🔥2
Нейронавт | Нейросети в творчестве
HunyuanVideo-I2V Допилили наконец видео по картинке С блэкждеком, ComfyUI и лорами Запасайтесь VRAM? для 720p нужно 60Гб Веса Код #image2video
HunyuanVideo-I2V GGUF / FP8
Уже есть квантизованные версии
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q4_K_S.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q6_K.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q8_0.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/resolve/main/hunyuan_video_I2V_fp8_e4m3fn.safetensors
Спасибо @kuvshin8
Уже есть квантизованные версии
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q4_K_S.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q6_K.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V-Q8_0.gguf
https://huggingface.co/Kijai/HunyuanVideo_comfy/resolve/main/hunyuan_video_I2V_fp8_e4m3fn.safetensors
Спасибо @kuvshin8
huggingface.co
hunyuan_video_I2V-Q4_K_S.gguf · Kijai/HunyuanVideo_comfy at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥13❤3
Опубликован код редактора аватара головы GaussianAvatar-Editor
Код
Спасибо @Dmitriy_Ru6ts0v
#humanavatar #gaussian #gaussianeditor
Код
Спасибо @Dmitriy_Ru6ts0v
#humanavatar #gaussian #gaussianeditor
Telegram
Нейронавт | Нейросети в творчестве
GaussianAvatar-Editor: Photorealistic Animatable Gaussian Head Avatar Editor
Редактор аватара головы на гауссианах
Код ждем
#humanavatar #gaussian #gaussianeditor
Редактор аватара головы на гауссианах
Код ждем
#humanavatar #gaussian #gaussianeditor
❤6
SD3.5 TurboX
Ускоренный генератор картинок #SD35 от Tensorart
SD3.5 Large TurboX - генерация за 8 шагов, вшестеро быстрее. Доступен в видео лоры и .ckpt
SD3.5 Medium TurboX - генерация за 4 шага. 768x1248 за одну секунду на RTX 3080, в 13 раз быстрее оригинала
Реддит
#text2image #optimization
Ускоренный генератор картинок #SD35 от Tensorart
SD3.5 Large TurboX - генерация за 8 шагов, вшестеро быстрее. Доступен в видео лоры и .ckpt
SD3.5 Medium TurboX - генерация за 4 шага. 768x1248 за одну секунду на RTX 3080, в 13 раз быстрее оригинала
Превосходит официальную версию SD 3.5 Turbo по детализации изображения, разнообразия, насыщенности и реалистичности. Обратите внимание, что значения CFG, отличные от единицы, дают вдвое большую скорость генерации по сравнению с CFG = 1.
Реддит
#text2image #optimization
🔥5👍4
LanPaint
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
Точный инпейнтинг, заставляющий модель "думать" перед итерациями денойза.
Не требует дообучения.
Работает с любой моделью SD, в том числе с лорами
Есть ноды #ComfyUI
Гитхаб
Воркфлоу
#inpainting #image2image
👍19😐4
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Есть две новости: хорошая и очень хорошая.
1. У Hedra.com вышла обновленная модель Character-3. Не могу сказать, что там прямо прорыв. Все как раньше - первая версия была прям вау, потому что на рынке было мало таких решений, а теперь я\мы зажрались и такие: "ничоособенного".
2. Hedra решила собрать у себя Hedra Studio и дать возможность генерить видосы другими генераторами (ну то есть закосить по Креа или Фриипик с целью обогащения на перепродаже API).
Только вот с перепродажей экономика странная.
Вам на входе (бесплатный логин гуглом) дают 400 кредитов.
Генерация Хуньянем стоит 70 кредитов.
Генерация самой Хедрой - 14 (без аудио) и 89(!) с аудио на входе.
А теперь внимание: генерация с помощью Veo2 стоить 1 (один, прописью) кредит.
Я проверил, да, 1 кредит.
Получается вы можете за 10 баксов в месяц иметь 1000 генераций и возможность докупать кредиты примерно по такой же цене.
И прыгать по аккаунтам и тратить про 400 бесплатных кредитов.
В чем подвох, кто платит за банкет?
Маркетинг коллаб Гугла и Хедры или хитрый способ нагнать лидов? (а потом сменить раскладки по кредитам, о которых на сайте ни слова)
Кстати, там есть все кроме Sora, даже Хуньянь Image2Video и голимый SkyReel. А вот Wan - нет.
При генерации с Veo2 ваши промпты будут безбожно переписаны, просто имейте это в виду.
P/S/ Можно генерить параллельно. Но выбор аспектов и разрешений - ограниченный.
@cgevent
1. У Hedra.com вышла обновленная модель Character-3. Не могу сказать, что там прямо прорыв. Все как раньше - первая версия была прям вау, потому что на рынке было мало таких решений, а теперь я\мы зажрались и такие: "ничоособенного".
2. Hedra решила собрать у себя Hedra Studio и дать возможность генерить видосы другими генераторами (ну то есть закосить по Креа или Фриипик с целью обогащения на перепродаже API).
Только вот с перепродажей экономика странная.
Вам на входе (бесплатный логин гуглом) дают 400 кредитов.
Генерация Хуньянем стоит 70 кредитов.
Генерация самой Хедрой - 14 (без аудио) и 89(!) с аудио на входе.
А теперь внимание: генерация с помощью Veo2 стоить 1 (один, прописью) кредит.
Я проверил, да, 1 кредит.
Получается вы можете за 10 баксов в месяц иметь 1000 генераций и возможность докупать кредиты примерно по такой же цене.
И прыгать по аккаунтам и тратить про 400 бесплатных кредитов.
В чем подвох, кто платит за банкет?
Маркетинг коллаб Гугла и Хедры или хитрый способ нагнать лидов? (а потом сменить раскладки по кредитам, о которых на сайте ни слова)
Кстати, там есть все кроме Sora, даже Хуньянь Image2Video и голимый SkyReel. А вот Wan - нет.
При генерации с Veo2 ваши промпты будут безбожно переписаны, просто имейте это в виду.
P/S/ Можно генерить параллельно. Но выбор аспектов и разрешений - ограниченный.
@cgevent
🔥7👍1
Нейронавт | Нейросети в творчестве
SD3.5 TurboX Ускоренный генератор картинок #SD35 от Tensorart SD3.5 Large TurboX - генерация за 8 шагов, вшестеро быстрее. Доступен в видео лоры и .ckpt SD3.5 Medium TurboX - генерация за 4 шага. 768x1248 за одну секунду на RTX 3080, в 13 раз быстрее оригинала…
TensorArt Stable Diffusion 3.5 Large TurboX
А вот и демо, можно потыкать
Демо
#text2image #optimization
А вот и демо, можно потыкать
Демо
#text2image #optimization
huggingface.co
Stable Diffusion 3.5 Large TurboX - a Hugging Face Space by multimodalart
Enter a text prompt to create an image. You can also customize the image size, style, and randomness. The app will generate and display the image based on your input.
👍4
Layered Image Vectorization via Semantic Simplification
Послойный векторизатор растровых изображений.
Сначала выделяет крупные структуры, и только потом накидывается на мелкие детали. На выходе многослойный вектор
Код ждем
#image2vector #image2noscript
Послойный векторизатор растровых изображений.
Сначала выделяет крупные структуры, и только потом накидывается на мелкие детали. На выходе многослойный вектор
Код ждем
#image2vector #image2noscript
👍12🔥6👎2