Athene-V2-Agent
Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах
Дообучен из Qwen-2.5-72B-Intruct
#assistant #agent
Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах
Дообучен из Qwen-2.5-72B-Intruct
#assistant #agent
👍6🔥2
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
MagicQuill: An Intelligent Interactive Image Editing System
Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM
Код
Демо
#imageediting
Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM
Код
Демо
#imageediting
👍13⚡1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
Понимание и генерация 3D сеток языковой моделью.
В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.
Налетаем, пробуем.
Код
Веса
Демо
#textto3d #3dtotext #assistant
Понимание и генерация 3D сеток языковой моделью.
В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.
Налетаем, пробуем.
Код
Веса
Демо
#textto3d #3dtotext #assistant
🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SuperSplat 1.9.0
Опенсорсный редактор 3D сцен на гауссианах
Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.
Код
Попробовать онлайн
#gaussian #3Dedit
Опенсорсный редактор 3D сцен на гауссианах
Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.
Код
Попробовать онлайн
#gaussian #3Dedit
👍7🔥2
Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал
Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются
Видео
Реддит
#lora #tutorial
Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются
Видео
Реддит
#lora #tutorial
YouTube
Multiple Consistent Characters in One Single Flux Lora!
Multiple Consistent Characters in One Single Flux Lora!
This video will show you how to set up training to set up a Lora that contains different multiple characters.
It is not the best when working with multiple people but it works great with objects, settings…
This video will show you how to set up training to set up a Lora that contains different multiple characters.
It is not the best when working with multiple people but it works great with objects, settings…
👍9
Ultravox
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation
Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?
Код ждем
Демо ждем
#textto3d #text2gaussian #gaussian
Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?
Код ждем
Демо ждем
#textto3d #text2gaussian #gaussian
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Suno v4
Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен
#text2music #music2music
Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен
#text2music #music2music
❤9😭3🔥2💩1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Pixtral Large 124B
Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN
в чате:
- Веб-поиск
- Canvas - аналог OpenAI Canvas
- Понимание PDF и изображений
- Flux Pro!
Чат
#assistant
Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN
в чате:
- Веб-поиск
- Canvas - аналог OpenAI Canvas
- Понимание PDF и изображений
- Flux Pro!
Чат
#assistant
❤7👍1
Anychat
Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.
Для коммерческих конечно понадобится токен
#assistant #llm
Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.
Для коммерческих конечно понадобится токен
#assistant #llm
👍6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
AnimateAnything: Consistent and Controllable Animation for video generation
Очередная попытка управлять движением при генерации видео
Код ждем
#cameracontrol #motioncontrol #image2video
Очередная попытка управлять движением при генерации видео
Код ждем
#cameracontrol #motioncontrol #image2video
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation
Портретная анимация по звуку речи для людей и животных
Код
#facialanimation #speech2video #image2video #talkinghead
Портретная анимация по звуку речи для людей и животных
Код
#facialanimation #speech2video #image2video #talkinghead
👍10😁1
This media is not supported in your browser
VIEW IN TELEGRAM
GeneX: Generative World Explorer
Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения
#news #worldunderstanding
Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения
#news #worldunderstanding
👍5❤1
Обновлен бесплатный тариф видеогенератора Kling
Теперь дают 366 кредитов в месяц и ограниченный доступ к платным функциям - 5 генераций с платными функциями в месяц.
Ну и еще они готовят видеоредактор
#news #text2video #image2video
Теперь дают 366 кредитов в месяц и ограниченный доступ к платным функциям - 5 генераций с платными функциями в месяц.
Ну и еще они готовят видеоредактор
#news #text2video #image2video
❤12⚡2
Обновка GPT-4o
Креативнее тексты, улучшена читабельность и релевантность, улучшено понимание файлов
#news #assistant
Креативнее тексты, улучшена читабельность и релевантность, улучшено понимание файлов
#news #assistant
👍2
Опубликован код Sana - генератора картинок от Nvidia
Diffusers, ComfyUI - ждем
Код
Демо 1.6B 1024px - спасибо @m_franz
#text2image
Diffusers, ComfyUI - ждем
Код
Демо 1.6B 1024px - спасибо @m_franz
#text2image
Telegram
Нейронавт | Нейросети в творчестве
Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer
Генератор картинок по тексту от Nvidia и компании.
Может эффективно генерировать изображения с разрешением до 4096 × 4096.
Из фишек - скорость даже на GPU ноутбука, четкое…
Генератор картинок по тексту от Nvidia и компании.
Может эффективно генерировать изображения с разрешением до 4096 × 4096.
Из фишек - скорость даже на GPU ноутбука, четкое…
❤6🥴3
R1-Lite
Способная к рассуждениям #LLM от DeepSeek, конкурент o1, ждем в опенсорсе
По бенчмаркам лучше o1-preview в кодинге и математике, в остальном послабее
Попробовать можно на их сайте, включив «Deep Think». Дают 50 сообщений в день бесплатно
Попробовать
#assistant
Способная к рассуждениям #LLM от DeepSeek, конкурент o1, ждем в опенсорсе
По бенчмаркам лучше o1-preview в кодинге и математике, в остальном послабее
Попробовать можно на их сайте, включив «Deep Think». Дают 50 сообщений в день бесплатно
Попробовать
#assistant
👍5🎃1
FLUX.1 Tools
BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools
Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры
FLUX.1 Fill: современные модели #inpainting и #outpainting, позволяющие редактировать и расширять реальные и сгенерированные изображения с текстовым описанием и бинарной маской.
FLUX.1 Depth: Модели, обученные для обеспечения структурного руководства на основе карты глубины, извлеченной из входного изображения и текстовой подсказки.
FLUX.1 Canny: модели, обученные для обеспечения структурного руководства на основе тонких контуров, извлеченных из входного изображения и текстовой подсказки.
FLUX.1 Redux: адаптер, позволяющий смешивать и воссоздавать входные изображения и текстовые подсказки.
Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров
fal.ai
Replicate
Together.ai
Freepik
krea.ai
Гитхаб
Веса на HF
ComfyUI
#controlnet #conditioning #image2image #text2image #news #flux
BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools
Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры
FLUX.1 Fill: современные модели #inpainting и #outpainting, позволяющие редактировать и расширять реальные и сгенерированные изображения с текстовым описанием и бинарной маской.
FLUX.1 Depth: Модели, обученные для обеспечения структурного руководства на основе карты глубины, извлеченной из входного изображения и текстовой подсказки.
FLUX.1 Canny: модели, обученные для обеспечения структурного руководства на основе тонких контуров, извлеченных из входного изображения и текстовой подсказки.
FLUX.1 Redux: адаптер, позволяющий смешивать и воссоздавать входные изображения и текстовые подсказки.
Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров
fal.ai
Replicate
Together.ai
Freepik
krea.ai
Гитхаб
Веса на HF
ComfyUI
#controlnet #conditioning #image2image #text2image #news #flux
🔥20