Forwarded from Джимми Нейрон 🚀
Продолжение тестов Nano Banana Pro
Модель здорово работает с большим количеством персонажей (в тестах перечислял по 30 штук), с героями наших мультфильмов справилась не идеально, зато с диснеевскими вообще никаких проблем (результат в комментах).
Знает Васю Ложкина, но не особо знает Альберто Мьельго (причем, сгенерированные картины Ложкина больше похожи на Ложкина, чем сам Ложкин. Еще пара примеров в комментах).
Модель здорово работает с большим количеством персонажей (в тестах перечислял по 30 штук), с героями наших мультфильмов справилась не идеально, зато с диснеевскими вообще никаких проблем (результат в комментах).
Знает Васю Ложкина, но не особо знает Альберто Мьельго (причем, сгенерированные картины Ложкина больше похожи на Ложкина, чем сам Ложкин. Еще пара примеров в комментах).
🔥35👍4❤3
Media is too big
VIEW IN TELEGRAM
Introducing SAM 3D: Powerful 3D Reconstruction for Physical World Images
Реконструкция 3d объектов от запрещенной Meta
SAM 3D Objects для объектов и сцен
SAM 3D Body для реконструкции человеков
Segment Anything Playground, тут можно попробовать модели семейства SAM, в том числе и сегментатор
#segmentation #imageto3d #humanreconstruction
Реконструкция 3d объектов от запрещенной Meta
SAM 3D Objects для объектов и сцен
SAM 3D Body для реконструкции человеков
Segment Anything Playground, тут можно попробовать модели семейства SAM, в том числе и сегментатор
#segmentation #imageto3d #humanreconstruction
👍10❤2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
MMaDA-Parallel: Parallel Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation
Мультимодальная модель, способная думать в процессе генерации изображения. Ее фишка в паралльлельном взаимодействии текста и изображения
Гитхаб
HF
Демо
#multimodal #text2image
Мультимодальная модель, способная думать в процессе генерации изображения. Ее фишка в паралльлельном взаимодействии текста и изображения
Гитхаб
HF
Демо
#multimodal #text2image
👍17
Uni-MoE-2.0-Omni
Языково‑ориентированная омнимодальная модель на базе Qwen2.5‑7B
Обрабатывает, анализирует и генерирует изображения, текст и речь в 10 модальностях, используя динамическую архитектуру MoE.
Гитхаб
HF
#multimodal #text2image #tts #vlm #alm #image2text
Языково‑ориентированная омнимодальная модель на базе Qwen2.5‑7B
Обрабатывает, анализирует и генерирует изображения, текст и речь в 10 модальностях, используя динамическую архитектуру MoE.
Гитхаб
HF
#multimodal #text2image #tts #vlm #alm #image2text
👍10❤1
Киберпанк который мы заслужили
ИИ который не собирает ваши данные
[придумайте свой заголовок]
В Перми бабуля ведет стенгазету. Материалы генерит Алисой.
#news #humor
ИИ который не собирает ваши данные
[придумайте свой заголовок]
В Перми бабуля ведет стенгазету. Материалы генерит Алисой.
#news #humor
🔥29❤7🥴5👍1👎1
Нейронавт | Нейросети в творчестве
Финита ля комедия. Эксперимент завершен. Лучшим трейдером оказался Qwen 3 MAX - с убытком всего -3.57% Cледом за ним идет DeepSeek Chat v1.3 - с убытком -37%, ему в спину дышит Gemini 2.5 PRO Последний - GPT 5, он прос*ал больше половины депозита, -57.92%…
NOF1 Season 1.5
Новый сезон битвы языковых моделей в трейдинге
На этот раз торгуют только активами США. Моделям дают гораздо больше данных чем в первом сезоне и бОльшую свободу действий.
К участникам состязания присоединились Kimi K2 и еще одна топовая модель инкогнито
У меня график не прогружается. Вероятно там еще нет данных
Спасибо @m_franz
#news #trading #shootout #arena
Новый сезон битвы языковых моделей в трейдинге
На этот раз торгуют только активами США. Моделям дают гораздо больше данных чем в первом сезоне и бОльшую свободу действий.
К участникам состязания присоединились Kimi K2 и еще одна топовая модель инкогнито
У меня график не прогружается. Вероятно там еще нет данных
Спасибо @m_franz
#news #trading #shootout #arena
👍4😁2🤔1
Part-X-MLLM: Part-aware 3D Multimodal Large Language Model
Новая 3d мультимодальная LLM от Tencent, для понимания, редактирования и генерации 3d! Понимает части объекта.
Похоже, наступает эра контекстных редакторов для 3d
Код ждем
Демо ждем
#3d #multimodal #assistant #3dediting
Новая 3d мультимодальная LLM от Tencent, для понимания, редактирования и генерации 3d! Понимает части объекта.
Похоже, наступает эра контекстных редакторов для 3d
Код ждем
Демо ждем
#3d #multimodal #assistant #3dediting
👍10🤔1