7 tips to get the most out of Nano Banana Pro
Если еще не видели, вот официальный гайд по Nano Banana Pro
#guide
Если еще не видели, вот официальный гайд по Nano Banana Pro
#guide
👍7
DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation
Диффузный генератор изображений напрямую в пиксельном пространстве.
Тут интересна архитектура
В отличие от аналогов, DeCo эффективнее разделяет задачи моделирования высоко- и низкочастотных компонентов, что позволяет улучшить качество изображений и ускорить обучение и вывод
Текстовый энкодер Qwen 3 поддерживает несколько языков
Авторы не стали заморачиваться с разрешением, сделали модели на 256 и 512 пикселей. В демо можно поднять до 1024 но результат будет покореженный как в SD1.5
Ну и веса у нее 2 ГБ. Если искали замену SD1.5 посмотрите DeCo
Гитхаб
HF
Демо
#text2image
Диффузный генератор изображений напрямую в пиксельном пространстве.
Тут интересна архитектура
В отличие от аналогов, DeCo эффективнее разделяет задачи моделирования высоко- и низкочастотных компонентов, что позволяет улучшить качество изображений и ускорить обучение и вывод
Текстовый энкодер Qwen 3 поддерживает несколько языков
Авторы не стали заморачиваться с разрешением, сделали модели на 256 и 512 пикселей. В демо можно поднять до 1024 но результат будет покореженный как в SD1.5
Ну и веса у нее 2 ГБ. Если искали замену SD1.5 посмотрите DeCo
Гитхаб
HF
Демо
#text2image
👍12❤1
Z-Image
Генерилка-редактор изображений от Tongyi Labs
Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2
Точно отображает сложные тексты на китайском и английском
Хорошо справляется с двуязычными промптами
По некоторым отзывам уступает Nano Banan Pro, но превосходит Flux.2
По рейтингу арены Alibaba занимает место после Seadream 4
На данный момент есть только версия Turbo, на Modelscope и указанной арене
Base, Edit - ждем
#imageediting #text2image #image2image
Генерилка-редактор изображений от Tongyi Labs
Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2
Точно отображает сложные тексты на китайском и английском
Хорошо справляется с двуязычными промптами
По некоторым отзывам уступает Nano Banan Pro, но превосходит Flux.2
По рейтингу арены Alibaba занимает место после Seadream 4
На данный момент есть только версия Turbo, на Modelscope и указанной арене
Base, Edit - ждем
#imageediting #text2image #image2image
👀7👍5❤2🔥2
UltraFlux: Data–Model Co-Design for Native 4K, Multi-AR Text-to-Image
Генератор изображений разрешением 4K на базе FLUX.1-dev
Отличается тем, что обеспечивает стабильное качество изображений при разных соотношениях сторон (квадратных, портретных, ультрашироких и других).
Гитхаб
HF
#text2image #4k
Генератор изображений разрешением 4K на базе FLUX.1-dev
Отличается тем, что обеспечивает стабильное качество изображений при разных соотношениях сторон (квадратных, портретных, ультрашироких и других).
Гитхаб
HF
#text2image #4k
👍10🤔4❤2
EfficientSAM3: Progressive Hierachical Knowledge Distillation (PhD) from SAM1, 2 and 3
Дистиллированные версии сегментатора SAM3 для работы на устройствах с ограниченными ресурсами. Сохраняет качество сегментации концепций по запросам (PCS), при этом подходит для развёртывания на периферийных устройствах.
Поддерживает ONNX и CoreML
Есть несколько вариантов моделей с разным количеством параметров на базе RepViT, TinyViT и EfficientViT, на одну даже есть ссылка в гитхабе. Остальные ждем
Гитхаб
#segmentation #mobile
Дистиллированные версии сегментатора SAM3 для работы на устройствах с ограниченными ресурсами. Сохраняет качество сегментации концепций по запросам (PCS), при этом подходит для развёртывания на периферийных устройствах.
Поддерживает ONNX и CoreML
Есть несколько вариантов моделей с разным количеством параметров на базе RepViT, TinyViT и EfficientViT, на одну даже есть ссылка в гитхабе. Остальные ждем
Гитхаб
#segmentation #mobile
🔥6❤1👍1
Nano Banana Pro: прокачайте свой визуальный контент 🦾
Хотите эффективно работать с ИИ, чтобы вывести свои проекты на новый уровень?
Присоединяйтесь к бесплатному мастер-классу "Возможности Nano Banana Pro" 26 ноября в 19:00 Мск. Авторы – Олег Цербаев – фотограф, преподаватель фотографии и визуальных нейросетей в ВШЭ, и Павел Костомаров – российский кинооператор, режиссёр игрового и документального кино
Что будет на эфире:
– как режиссёр и фотограф смотрят на нейросети
– нейросети в фотографии и дизайне. Как органично встраивать объекты в финальное изображение
– работа с персонажем, сохранение типажа, изменение стиля и локации
– создание кинематографической сцены и ее доработка: практика
📷 Цель — научиться инструментам, чтобы создавать крутой визуальный контент. Поработаем вместе и разберём, какие связки работают
Занять место можно бесплатно по ссылке ниже
https://clck.ru/3QXB8p
#промо
Хотите эффективно работать с ИИ, чтобы вывести свои проекты на новый уровень?
Присоединяйтесь к бесплатному мастер-классу "Возможности Nano Banana Pro" 26 ноября в 19:00 Мск. Авторы – Олег Цербаев – фотограф, преподаватель фотографии и визуальных нейросетей в ВШЭ, и Павел Костомаров – российский кинооператор, режиссёр игрового и документального кино
Что будет на эфире:
– как режиссёр и фотограф смотрят на нейросети
– нейросети в фотографии и дизайне. Как органично встраивать объекты в финальное изображение
– работа с персонажем, сохранение типажа, изменение стиля и локации
– создание кинематографической сцены и ее доработка: практика
📷 Цель — научиться инструментам, чтобы создавать крутой визуальный контент. Поработаем вместе и разберём, какие связки работают
Занять место можно бесплатно по ссылке ниже
https://clck.ru/3QXB8p
#промо
👎12👍4❤2😁2🍌2
Media is too big
VIEW IN TELEGRAM
3D генератор Hunyuan3D 3.0 раскатали "на весь мир" (а было не так?)
Занятно, но мне показывают что продискриминировали меня по территориальному признаку,
Основные возможности и особенности:
- мультимодальный ввод: генерация 3D из текста, изображений (с поддержкой многовидового ввода) и эскизов
- интегрируется с Unreal, Unity и Blender через форматы OBJ/GLB
- новым юзерам раздают 20 бесплатных генераций в день, корпоративным пользователям — 200 бесплатных кредитов при регистрации.
Попробовать
API
твит
#imageto3d #textto3d #sketchto3d #3d
Занятно, но мне показывают что продискриминировали меня по территориальному признаку,
Restricted AccessОсновные возможности и особенности:
- мультимодальный ввод: генерация 3D из текста, изображений (с поддержкой многовидового ввода) и эскизов
- интегрируется с Unreal, Unity и Blender через форматы OBJ/GLB
- новым юзерам раздают 20 бесплатных генераций в день, корпоративным пользователям — 200 бесплатных кредитов при регистрации.
Попробовать
API
твит
#imageto3d #textto3d #sketchto3d #3d
❤11🥴2
This media is not supported in your browser
VIEW IN TELEGRAM
LichtFeld Studio
Среда для работы с гауссианами, альтернатива PostShot
Работает в реальном времени благодаря высокопроизводительной реализации на C++ и CUDA. Оптимизирована под NVIDIA
Linux / Windows / Docker
Гитхаб
Туториал (Youtube)
#gaussian #tools #gui #desktop #windows #linux
Среда для работы с гауссианами, альтернатива PostShot
Работает в реальном времени благодаря высокопроизводительной реализации на C++ и CUDA. Оптимизирована под NVIDIA
Linux / Windows / Docker
Гитхаб
Туториал (Youtube)
#gaussian #tools #gui #desktop #windows #linux
🔥4❤3⚡2
На выставке Kish Inox Tech Expo 2025, проходившей в Иране, выяснилось, что роботы это на самом деле переодетые люди
Узко мыслите. Это не фейл, это учения.
Вот настанет восстание машин - что делать будете? убегать?
Это потому что вы не учились маскироваться под роботов
#robot #news #humor
Узко мыслите. Это не фейл, это учения.
Вот настанет восстание машин - что делать будете? убегать?
Это потому что вы не учились маскироваться под роботов
#robot #news #humor
😁20👍3🔥1🌚1
Нейронавт | Нейросети в творчестве
Z-Image Генерилка-редактор изображений от Tongyi Labs Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2 Точно отображает сложные тексты на китайском и английском Хорошо справляется с двуязычными промптами По некоторым отзывам…
Tongyi cделали демоспейс Z-Image, выложили код, FP8 и воркфлоу
Человекорыбов делать не умеет
Гитхаб
Демо
FP8
Workflow
Спасибо @m_franz
#imageediting #text2image #image2image #workflow
Человекорыбов делать не умеет
Гитхаб
Демо
FP8
Workflow
Спасибо @m_franz
#imageediting #text2image #image2image #workflow
🤔5👍3❤2🔥1
SteadyDancer : Harmonized and Coherent Human Image Animation with First-Frame Preservation
Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.
Построен на базе Wan2.1-I2V-14B-480P
HF
#characteranimation #image2video
Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.
Построен на базе Wan2.1-I2V-14B-480P
HF
#characteranimation #image2video
🔥8👍2
Retake
В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:
- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку
- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование
- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.
Оплату берут только за те секунды видео, которые были изменены.
#videoediting
В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:
- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку
- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование
- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.
Оплату берут только за те секунды видео, которые были изменены.
#videoediting
👍9🔥6
Moondream Segmentation
У Moondream новая функция - SVG сегментация
Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.
Побивает Gemini Flash 2.5, SAM3 на бенчах
Работает и для видео — нужно просто применять её к каждому кадру
Попробовать
#segmentation #noscript #image2noscript #image2mask
У Moondream новая функция - SVG сегментация
Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.
Побивает Gemini Flash 2.5, SAM3 на бенчах
Работает и для видео — нужно просто применять её к каждому кадру
Попробовать
#segmentation #noscript #image2noscript #image2mask
👍8