Text Behind Image AI Editor
Хит этой недели. Инструмент для добавления текста за объектом.
И сразу альтернатива на gradio - чуть меньше интерактивности, а по сути то же самое.
Оба инструмента поддерживают русский язык. Затестил обе. Gradio сделал лучше, без кантов
#imageediting #tools
Хит этой недели. Инструмент для добавления текста за объектом.
И сразу альтернатива на gradio - чуть меньше интерактивности, а по сути то же самое.
Оба инструмента поддерживают русский язык. Затестил обе. Gradio сделал лучше, без кантов
#imageediting #tools
👍11😁2
Stable Diffusion 3.5 Prompt Guide
Официальное руководство по написанию промптов для #SD35
#prompting #Guide #tutorial
Официальное руководство по написанию промптов для #SD35
#prompting #Guide #tutorial
👍11🎃2
Увидел что тут не хватает мема про ИИ или роботов - прояви гражданскую мемную позицию в комментариях
#humor
#humor
😁15👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Код RayGauss тоже недавно выложили
Готовьте 24ГБ VRAM для качества как у авторов
Код
#gaussian #rendering #novelview
Готовьте 24ГБ VRAM для качества как у авторов
Код
#gaussian #rendering #novelview
👍5🔥1🤯1
Athene-V2-Agent
Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах
Дообучен из Qwen-2.5-72B-Intruct
#assistant #agent
Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах
Дообучен из Qwen-2.5-72B-Intruct
#assistant #agent
👍6🔥2
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
MagicQuill: An Intelligent Interactive Image Editing System
Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM
Код
Демо
#imageediting
Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM
Код
Демо
#imageediting
👍13⚡1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
Понимание и генерация 3D сеток языковой моделью.
В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.
Налетаем, пробуем.
Код
Веса
Демо
#textto3d #3dtotext #assistant
Понимание и генерация 3D сеток языковой моделью.
В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.
Налетаем, пробуем.
Код
Веса
Демо
#textto3d #3dtotext #assistant
🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SuperSplat 1.9.0
Опенсорсный редактор 3D сцен на гауссианах
Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.
Код
Попробовать онлайн
#gaussian #3Dedit
Опенсорсный редактор 3D сцен на гауссианах
Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.
Код
Попробовать онлайн
#gaussian #3Dedit
👍7🔥2
Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал
Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются
Видео
Реддит
#lora #tutorial
Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются
Видео
Реддит
#lora #tutorial
YouTube
Multiple Consistent Characters in One Single Flux Lora!
Multiple Consistent Characters in One Single Flux Lora!
This video will show you how to set up training to set up a Lora that contains different multiple characters.
It is not the best when working with multiple people but it works great with objects, settings…
This video will show you how to set up training to set up a Lora that contains different multiple characters.
It is not the best when working with multiple people but it works great with objects, settings…
👍9
Ultravox
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation
Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?
Код ждем
Демо ждем
#textto3d #text2gaussian #gaussian
Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?
Код ждем
Демо ждем
#textto3d #text2gaussian #gaussian
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Suno v4
Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен
#text2music #music2music
Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен
#text2music #music2music
❤9😭3🔥2💩1🎃1