Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
7 tips to get the most out of Nano Banana Pro

Если еще не видели, вот официальный гайд по Nano Banana Pro

#guide
👍7
DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

Диффузный генератор изображений напрямую в пиксельном пространстве.

Тут интересна архитектура

В отличие от аналогов, DeCo эффективнее разделяет задачи моделирования высоко- и низкочастотных компонентов, что позволяет улучшить качество изображений и ускорить обучение и вывод

Текстовый энкодер Qwen 3 поддерживает несколько языков

Авторы не стали заморачиваться с разрешением, сделали модели на 256 и 512 пикселей. В демо можно поднять до 1024 но результат будет покореженный как в SD1.5

Ну и веса у нее 2 ГБ. Если искали замену SD1.5 посмотрите DeCo

Гитхаб
HF
Демо

#text2image
👍121
Z-Image

Генерилка-редактор изображений от Tongyi Labs
Под капотом Qwen3-VL 4B, что поинтереснее чем Mistral small 32B который у Flux.2

Точно отображает сложные тексты на китайском и английском

Хорошо справляется с двуязычными промптами

По некоторым отзывам уступает Nano Banan Pro, но превосходит Flux.2

По рейтингу арены Alibaba занимает место после Seadream 4

На данный момент есть только версия Turbo, на Modelscope и указанной арене

Base, Edit - ждем

#imageediting #text2image #image2image
👀7👍52🔥2
UltraFlux: Data–Model Co-Design for Native 4K, Multi-AR Text-to-Image

Генератор изображений разрешением 4K на базе FLUX.1-dev

Отличается тем, что обеспечивает стабильное качество изображений при разных соотношениях сторон (квадратных, портретных, ультрашироких и других).

Гитхаб
HF

#text2image #4k
👍10🤔42
EfficientSAM3: Progressive Hierachical Knowledge Distillation (PhD) from SAM1, 2 and 3

Дистиллированные версии сегментатора SAM3 для работы на устройствах с ограниченными ресурсами. Сохраняет качество сегментации концепций по запросам (PCS), при этом подходит для развёртывания на периферийных устройствах.

Поддерживает ONNX и CoreML

Есть несколько вариантов моделей с разным количеством параметров на базе RepViT, TinyViT и EfficientViT, на одну даже есть ссылка в гитхабе. Остальные ждем

Гитхаб

#segmentation #mobile
🔥61👍1
Nano Banana Pro: прокачайте свой визуальный контент 🦾

Хотите эффективно работать с ИИ, чтобы вывести свои проекты на новый уровень?

Присоединяйтесь к бесплатному мастер-классу "Возможности Nano Banana Pro" 26 ноября в 19:00 Мск. Авторы – Олег Цербаев – фотограф, преподаватель фотографии и визуальных нейросетей в ВШЭ, и Павел Костомаров – российский кинооператор, режиссёр игрового и документального кино

Что будет на эфире:

– как режиссёр и фотограф смотрят на нейросети
– нейросети в фотографии и дизайне. Как органично встраивать объекты в финальное изображение
– работа с персонажем, сохранение типажа, изменение стиля и локации
– создание кинематографической сцены и ее доработка: практика

📷 Цель — научиться инструментам, чтобы создавать крутой визуальный контент. Поработаем вместе и разберём, какие связки работают

Занять место можно бесплатно по ссылке ниже

https://clck.ru/3QXB8p

#промо
👎12👍42😁2🍌2
Media is too big
VIEW IN TELEGRAM
3D генератор Hunyuan3D 3.0 раскатали "на весь мир" (а было не так?)

Занятно, но мне показывают что продискриминировали меня по территориальному признаку, Restricted Access

Основные возможности и особенности:

- мультимодальный ввод: генерация 3D из текста, изображений (с поддержкой многовидового ввода) и эскизов

- интегрируется с Unreal, Unity и Blender через форматы OBJ/GLB

- новым юзерам раздают 20 бесплатных генераций в день, корпоративным пользователям — 200 бесплатных кредитов при регистрации.

Попробовать
API

твит

#imageto3d #textto3d #sketchto3d #3d
11🥴2
This media is not supported in your browser
VIEW IN TELEGRAM
LichtFeld Studio

Среда для работы с гауссианами, альтернатива PostShot
Работает в реальном времени благодаря высокопроизводительной реализации на C++ и CUDA. Оптимизирована под NVIDIA

Linux / Windows / Docker

Гитхаб
Туториал (Youtube)

#gaussian #tools #gui #desktop #windows #linux
🔥432
На выставке Kish Inox Tech Expo 2025, проходившей в Иране, выяснилось, что роботы это на самом деле переодетые люди

Узко мыслите. Это не фейл, это учения.
Вот настанет восстание машин - что делать будете? убегать?
Это потому что вы не учились маскироваться под роботов

#robot #news #humor
😁20👍3🔥1🌚1
SteadyDancer : Harmonized and Coherent Human Image Animation with First-Frame Preservation

Оживлятор-аниматор человеков по картинке с сохранением первого кадра и точным управлением движением. Превосходит конкурентов, требует меньше ресурсов для обучения.

Построен на базе Wan2.1-I2V-14B-480P

HF

#characteranimation #image2video
🔥8👍2
Retake

В LTX Studio завезли инструмент для редактирования видео. С его помощью можно:

- перефразировать диалог, сохраняя оригинальный голос, исполнение и обстановку

- изменить начало или конец сцены, скорректировать темп, эмоции или кадрирование

- улучшить темп, подачу, исполнение и ритм в рамках одного кадра.

Оплату берут только за те секунды видео, которые были изменены.

#videoediting
👍9🔥6
Moondream Segmentation

У Moondream новая функция - SVG сегментация

Превращает текстовые промпты, точки или рамки в SVG-полигоны с пиксельной точностью.

Побивает Gemini Flash 2.5, SAM3 на бенчах

Работает и для видео — нужно просто применять её к каждому кадру

Попробовать

#segmentation #noscript #image2noscript #image2mask
👍8