NEW BOT Телеграм, страница

Z-Image

Генерилка-редактор изображений от Tongyi Labs
Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2

Точно отображает сложные тексты на китайском и английском

Хорошо справляется с двуязычными промптами

По некоторым отзывам уступает Nano Banan Pro, но превосходит Flux.2

По рейтингу арены Alibaba занимает место после Seadream 4

На данный момент есть только версия Turbo, на Modelscope и указанной арене

Base, Edit - ждем

#imageediting #text2image #image2image

👀7👍5❤2🔥2

2.12K views08:41

UltraFlux: Data–Model Co-Design for Native 4K, Multi-AR Text-to-Image

Генератор изображений разрешением 4K на базе FLUX.1-dev

Отличается тем, что обеспечивает стабильное качество изображений при разных соотношениях сторон (квадратных, портретных, ультрашироких и других).

Гитхаб
HF

#text2image #4k

👍10🤔4❤2

1.74K views09:42

EfficientSAM3: Progressive Hierachical Knowledge Distillation (PhD) from SAM1, 2 and 3

Дистиллированные версии сегментатора SAM3 для работы на устройствах с ограниченными ресурсами. Сохраняет качество сегментации концепций по запросам (PCS), при этом подходит для развёртывания на периферийных устройствах.

Поддерживает ONNX и CoreML

Есть несколько вариантов моделей с разным количеством параметров на базе RepViT, TinyViT и EfficientViT, на одну даже есть ссылка в гитхабе. Остальные ждем

Гитхаб

#segmentation #mobile

🔥6❤1👍1

1.55K views12:26

Nano Banana Pro: прокачайте свой визуальный контент 🦾

Хотите эффективно работать с ИИ, чтобы вывести свои проекты на новый уровень?

Присоединяйтесь к бесплатному мастер-классу "Возможности Nano Banana Pro" 26 ноября в 19:00 Мск. Авторы – Олег Цербаев – фотограф, преподаватель фотографии и визуальных нейросетей в ВШЭ, и Павел Костомаров – российский кинооператор, режиссёр игрового и документального кино

Что будет на эфире:

– как режиссёр и фотограф смотрят на нейросети
– нейросети в фотографии и дизайне. Как органично встраивать объекты в финальное изображение
– работа с персонажем, сохранение типажа, изменение стиля и локации
– создание кинематографической сцены и ее доработка: практика

📷 Цель — научиться инструментам, чтобы создавать крутой визуальный контент. Поработаем вместе и разберём, какие связки работают

Занять место можно бесплатно по ссылке ниже

https://clck.ru/3QXB8p

#промо

👎12👍4❤2😁2🍌2

1.62K views13:16

1:25

Media is too big

3D генератор Hunyuan3D 3.0 раскатали "на весь мир" (а было не так?)

Занятно, но мне показывают что продискриминировали меня по территориальному признаку, Restricted Access

Основные возможности и особенности:

- мультимодальный ввод: генерация 3D из текста, изображений (с поддержкой многовидового ввода) и эскизов

- интегрируется с Unreal, Unity и Blender через форматы OBJ/GLB

- новым юзерам раздают 20 бесплатных генераций в день, корпоративным пользователям — 200 бесплатных кредитов при регистрации.

Попробовать
API

твит

#imageto3d #textto3d #sketchto3d #3d

❤11🥴2

2.29K viewsedited 14:19

0:20

LichtFeld Studio

Среда для работы с гауссианами, альтернатива PostShot
Работает в реальном времени благодаря высокопроизводительной реализации на C++ и CUDA. Оптимизирована под NVIDIA

Linux / Windows / Docker

Гитхаб
Туториал (Youtube)

#gaussian #tools #gui #desktop #windows #linux

🔥4❤3⚡2

2.05K viewsedited 15:18

1:01

На выставке Kish Inox Tech Expo 2025, проходившей в Иране, выяснилось, что роботы это на самом деле переодетые люди

Узко мыслите. Это не фейл, это учения.
Вот настанет восстание машин - что делать будете? убегать?
Это потому что вы не учились маскироваться под роботов

#robot #news #humor

😁20👍3🔥1🌚1

1.8K views16:27

Z-Image Генерилка-редактор изображений от Tongyi Labs Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2 Точно отображает сложные тексты на китайском и английском Хорошо справляется с двуязычными промптами По некоторым отзывам…

Tongyi cделали демоспейс Z-Image, выложили код, FP8 и воркфлоу

Человекорыбов делать не умеет

Гитхаб
Демо
FP8
Workflow

Спасибо @m_franz

#imageediting #text2image #image2image #workflow

🤔5👍3❤2🔥1

1.6K viewsedited 06:09

0:03

0:03

0:03

SteadyDancer : Harmonized and Coherent Human Image Animation with First-Frame Preservation

Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.

Построен на базе Wan2.1-I2V-14B-480P

HF

#characteranimation #image2video

🔥8👍2

1.71K views07:11

1:05

Retake

В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:

- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку

- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование

- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.

Оплату берут только за те секунды видео, которые были изменены.

#videoediting

👍9🔥6

1.86K views08:11

0:13