Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.48K photos
3.75K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Заработал демоспейс примерочной-раздевалочной Voost

Демо

спасибо @Dmitriy_Ru6ts0v

#tryon #tryoff
🥴8👍7😁3
This media is not supported in your browser
VIEW IN TELEGRAM
Meschers: Geometry Processing of Impossible Objects

Рендерилка невозможных объектов типа фигур Эшера
Вместо того чтобы хранить трёхмерные координаты точек, хранит двумерные позиции и разницу глубин между линиями. Это позволяет отображать невозможные конструкции и работать с ними как с обычными 3D-объектами.

Можно сглаживать поверхности, вычислять расстояния и выполнять другие операции с геометрией.

Можно «обратить» рендеринг — то есть превратить обычный объект в невозможный, подгоняя его под заданное изображение. Чую лавину новых невозможных фигур.

Код ждем

#research #rendering
👍8🤔3
Заработал демоспейс редактора картинок от Stepfun NextStep-1-Large-Edit

Но похоже что даже на всего один прогон нужно больше кредитов чем выдают на бесплатном тарифе

Демо

#text2image #imageediting
😭2👍1
DeepSeek-V3.1-Base

Обновку выложили на HF без официального релиза.

Контекстное окно увеличили до 128К.
Знания до июля 2024.

#news #assistant
👍3🔥1🤯1
Оказывается у Qwen-Image-Edit чтото сломалось. Вчера разработчики починили и просят попробовать все заново.

Ну я и попробовал.
А заодно сравнил с nano-banana и Flux Kontext на арене.
Qwen понимает и слушается лучше контекста. Но похоже что банан еще круче

Промпт:

Give him an alike-looking sister wearing the same outfit, standing next to him, standing straight, hands in pockets, serious face. Keep the man unchanged, maintain his original pose, maintain original framing


Попробовать в чате - раньше он у меня даже не прогружался, сегодня даже выдает картинки

#imageediting #QWENIMAGE #shootout #comparison
😁10👍4😱1
Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval

Генератор интерактивных длинных видео с сохранением согласованности сцены. Иначе говоря, генератор игровых миров с хорошей памятью что где стояло. Про интерактивное управление речь не идет, но видимо предполагается использование в интерактивных системах (умничаю. В играх). Траектория камеры задается прямо координатами, а не размытыми направо-налево.

Умеет генерировать сцены по одной картинке

Код ждем

#text2world #image2world #image2video
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона

Сделано в Gabber - Real-time AI Engine

Реддит

#assistant #music2text #realtime
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Distilled-3DGS: Distilled 3D Gaussian Splatting

Сокращает примерно в десять раз количество гауссиан необходимых для высококачественного рендеринга сцен, без потери качества изображения.

Обеспечивает качество рендеринга, сравнимое с лучшими существующими методами (#SOTA) или даже превосходящее их

Код ждем

#gaussian #rendering #novelview
1👍12🔥4
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

Видеопримерочная на VideoX-Fun / Wan2.1-I2V-14B
Для описания одежды используют Qwen2.5-VL-7B-Instruct.
Ну и еще там под капотом openpose, densepose и прочее.

Короче если ктото хотел затюнить WAN 2.1 под примерку то вот оно

Код

#tryon #image2video
👍72