This media is not supported in your browser
VIEW IN TELEGRAM
Tora: Trajectory-oriented Diffusion Transformer for Video Generation
Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX
Код
#text2video #image2video #motioncontrol
Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX
Код
#text2video #image2video #motioncontrol
👍8🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
NotebookLM
Сервис гугла для превращения PDF в подкаст получил новую фичу.
Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.
#text2voice #pdf2voice
Сервис гугла для превращения PDF в подкаст получил новую фичу.
Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.
#text2voice #pdf2voice
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Stencil Brush From Sd ControlNet
Плагин к Блендеру для текстурирования на базе SD
#blender #plugin #texturing
Плагин к Блендеру для текстурирования на базе SD
#blender #plugin #texturing
😁7👍2
GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling
А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.
Код
#gaussian
А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.
Код
#gaussian
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и демоспейс, где можно потестить генератор глубины для видео Depth Any Video
Демо HF
Демо replicate
#video2depth
Демо HF
Демо replicate
#video2depth
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
Interactive Character Control with Auto-Regressive Motion Diffusion Models
Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?
Код
Видео от 2-минутного доктора
#humananimation #characteranimation #animatoin #realtime
Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?
Код
Видео от 2-минутного доктора
#humananimation #characteranimation #animatoin #realtime
👍7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Desktop V1
Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux
Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.
Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.
Forge, A1111 - ваш ход?
Записаться в вейтлист
#news #comfyUI
Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux
Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.
Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.
Forge, A1111 - ваш ход?
Записаться в вейтлист
#news #comfyUI
🔥24🥴2👍1
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities
Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)
А где жеподвох подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256
В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).
На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?
Код
Колаб
#news #text2image #image2image #inpainting #outpainting #imageediting #image2text
Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)
А где же
А вот он:
Претрейны есть для 512*512 и 256*256
В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).
На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?
Код
Колаб
#news #text2image #image2image #inpainting #outpainting #imageediting #image2text
🤔4❤1👍1
Нейронавт | Нейросети в творчестве
Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer Генератор картинок по тексту от Nvidia и компании. Может эффективно генерировать изображения с разрешением до 4096 × 4096. Из фишек - скорость даже на GPU ноутбука, четкое…
У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
😁8
Arch-Guard
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
huggingface.co
katanemo/Arch-Guard · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁3👀3
This media is not supported in your browser
VIEW IN TELEGRAM
Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе
#humor #news
#humor #news
😁42🎃4😭3
Нейронавт | Нейросети в творчестве
У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой. И демка которая возможно проживет несколько дней F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 Гитхаб Демо спасибо за наводку @p0lygon #news #text2image
Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения
#news
#news
❤13
Stable Diffusion 3.5
Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.
Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября
Уже поддерживается в ComfyUI
Модель HF
Гитхаб
Демо HF
API
Replicate
#text2image #news
Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.
Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября
Уже поддерживается в ComfyUI
Модель HF
Гитхаб
Демо HF
API
Replicate
#text2image #news
🔥12👀1
Итак, кастомизация SD3.5
Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM
Официальный гайд
готовые лоры:
раз
два
три
———————————
Примеры ComfyUI
———————————
SD3.5-fp8 (пожатая модель)
Спионерил у @SergeyTsyptsyn
#lora #text2image #comfyui #finetuning
Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM
Официальный гайд
готовые лоры:
раз
два
три
———————————
Примеры ComfyUI
———————————
SD3.5-fp8 (пожатая модель)
Спионерил у @SergeyTsyptsyn
#lora #text2image #comfyui #finetuning
🔥5👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Mochi 1
Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)
Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)
#text2video
Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)
Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)
#text2video
👍16😱3❤1👏1🤡1
JoyCaption Alpha 2 - Batch Script
Скрипт для пакетной обработки картинок в JoyCaption.
Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии
Реддит
#image2text #captioning
Скрипт для пакетной обработки картинок в JoyCaption.
Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии
Реддит
#image2text #captioning
👍3❤1