Janus
Мультимодальная модель от DeepSeek.
Текст и картинки.
Модель компактная, основана на DeepSeek-LLM-1.3b-base
Гитхаб
Веса на HF
#VLM #assistant #multimodal #text2image #image2text
Мультимодальная модель от DeepSeek.
Текст и картинки.
Модель компактная, основана на DeepSeek-LLM-1.3b-base
Гитхаб
Веса на HF
#VLM #assistant #multimodal #text2image #image2text
👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
DepthCrafter ComfyUI
Ноды генератора глубины DepthCrafter
Можете создавать видео с картой глубины на основе любого входного видео
Для рендеринга длинных видео в высоком разрешении (768p и выше) требуется довольно большой объем видеопамяти (>16 ГБ). При меньшем разрешении и более коротких видео будет использоваться меньше видеопамяти. Вы также можете сократить значение context_window для экономии видеопамяти.
Эта модель глубины хорошо сочетается с пакетом Depthflow для создания последовательной анимации глубины
#comfyUI #video2depth
Ноды генератора глубины DepthCrafter
Можете создавать видео с картой глубины на основе любого входного видео
Для рендеринга длинных видео в высоком разрешении (768p и выше) требуется довольно большой объем видеопамяти (>16 ГБ). При меньшем разрешении и более коротких видео будет использоваться меньше видеопамяти. Вы также можете сократить значение context_window для экономии видеопамяти.
Эта модель глубины хорошо сочетается с пакетом Depthflow для создания последовательной анимации глубины
#comfyUI #video2depth
❤9🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Робот-манипулятор MAiRA отдает указания жалким людишкам дирижирует Дрезденским симфоническим оркестром.
#news
#news
😁14🤡5
Обновка от Дениса, автора бесплатного бота @everyone_ai_bot
сделал важное обновление для тех, кто занимается генерацией изображений.
Теперь можно настраивать все параметры-семплер, количество шагов, сид и все остальное для детерминированной генерации. Есть 2 модели Flux. Все также бесплатно.
Также можно создавать вариации и добавил Hires для SDXL моделей.
#text2image #bot
сделал важное обновление для тех, кто занимается генерацией изображений.
Теперь можно настраивать все параметры-семплер, количество шагов, сид и все остальное для детерминированной генерации. Есть 2 модели Flux. Все также бесплатно.
Также можно создавать вариации и добавил Hires для SDXL моделей.
#text2image #bot
🔥11❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Tora: Trajectory-oriented Diffusion Transformer for Video Generation
Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX
Код
#text2video #image2video #motioncontrol
Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX
Код
#text2video #image2video #motioncontrol
👍8🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
NotebookLM
Сервис гугла для превращения PDF в подкаст получил новую фичу.
Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.
#text2voice #pdf2voice
Сервис гугла для превращения PDF в подкаст получил новую фичу.
Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.
#text2voice #pdf2voice
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Stencil Brush From Sd ControlNet
Плагин к Блендеру для текстурирования на базе SD
#blender #plugin #texturing
Плагин к Блендеру для текстурирования на базе SD
#blender #plugin #texturing
😁7👍2
GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling
А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.
Код
#gaussian
А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.
Код
#gaussian
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и демоспейс, где можно потестить генератор глубины для видео Depth Any Video
Демо HF
Демо replicate
#video2depth
Демо HF
Демо replicate
#video2depth
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
Interactive Character Control with Auto-Regressive Motion Diffusion Models
Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?
Код
Видео от 2-минутного доктора
#humananimation #characteranimation #animatoin #realtime
Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?
Код
Видео от 2-минутного доктора
#humananimation #characteranimation #animatoin #realtime
👍7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Desktop V1
Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux
Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.
Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.
Forge, A1111 - ваш ход?
Записаться в вейтлист
#news #comfyUI
Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux
Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.
Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.
Forge, A1111 - ваш ход?
Записаться в вейтлист
#news #comfyUI
🔥24🥴2👍1
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities
Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)
А где жеподвох подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256
В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).
На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?
Код
Колаб
#news #text2image #image2image #inpainting #outpainting #imageediting #image2text
Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)
А где же
А вот он:
Претрейны есть для 512*512 и 256*256
В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).
На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?
Код
Колаб
#news #text2image #image2image #inpainting #outpainting #imageediting #image2text
🤔4❤1👍1
Нейронавт | Нейросети в творчестве
Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer Генератор картинок по тексту от Nvidia и компании. Может эффективно генерировать изображения с разрешением до 4096 × 4096. Из фишек - скорость даже на GPU ноутбука, четкое…
У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
😁8
Arch-Guard
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
huggingface.co
katanemo/Arch-Guard · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁3👀3
This media is not supported in your browser
VIEW IN TELEGRAM
Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе
#humor #news
#humor #news
😁42🎃4😭3