NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

qwen-edit-skin

Lora Qwen-Image-Edit-2509 для реалистичной кожи

Спасибо @Bolserge

#lora #realism #qie

👍17

1.93K views07:11

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Видеогенераторы в качестве ризонеров (рассуждателей).
Новая парадигма объединяет визуальное и текстовое рассуждение в единой временной структуре

Справляется с задачами, ориентированными на зрение, например, решает головоломки типа Eyeballing Puzzles, где превосходит современные VLM-модели на 10%

Гитхаб

#reasoning #research

👍10

2.06K views08:11

Нейронавт | Нейросети в творчестве

V-Thinker: Interactive Thinking with Images

Еще одна похожая работа - размышление изображениями

Гитхаб
HF

#reasoning #assistant #research

👍7❤1

1.96K views09:12

Нейронавт | Нейросети в творчестве

Polaris-Alpha

На openrouter появилась модель, которая предположительно является тестовой версией GPT-5.1

Пишут что выдает очень мало галлюцинаций и стиль ответов похож на GPT

Мне потестить не удалось - роутер выдает ошибку

#new #assistant

👀6👍2🔥2

1.59K views10:13

Нейронавт | Нейросети в творчестве

Good new everyone!

Лондонский суд отклонил иск Getty Images к Stability AI. Аргумент компании о том, что Stable Diffusion — «пиратская копия» их изображений, не сработал: суд решил, что модель не хранит и не копирует исходники. Это снижает риски для разработчиков ИИ.

#news

Reuters

Getty Images largely loses landmark UK lawsuit over AI image generator

Getty Images largely lost its London lawsuit against artificial intelligence company Stability AI over its image generator on Tuesday, prompting Getty and some lawyers to call for stronger protections for copyright owners in Britain.

👍15🔥4😁3

2.03K views11:14

Нейронавт | Нейросети в творчестве

#humor

😁35🤯2❤1👍1🌚1

2.02K views12:16

Нейронавт | Нейросети в творчестве

Тем временем вайбкодинг стал словом 2025 года по мнению британского словаря Collins

#news #vibecoding

😈4😎3👍1😁1

1.76K views13:16

Нейронавт | Нейросети в творчестве

#humor

😁23🥴2❤1👍1

1.82K views14:17

Нейронавт | Нейросети в творчестве

Тем временем вайбкодинг стал словом 2025 года по мнению британского словаря Collins #news #vibecoding

#humor

😁50❤4💯3👍1🔥1

2.16K views17:48

Нейронавт | Нейросети в творчестве

pi-Flow: Policy-Based Flow Models

Новый метод от Adobe и Stanford University, позволяющий дистиллировать диффузные генераторы

Есть 4-шаговые и 8-шаговые адаптеры

Гитхаб
HF pi-Qwen-Image
HF pi-FLUX.1
pi-Qwen Demo
pi-FLUX Demo
ComfyUI pi-Flow Nodes

спасибо @m_franz

#optimization #text2image #comfyui

👍11😱2

1.98K views06:09

Нейронавт | Нейросети в творчестве

Trajectory Control in ComfyUI - Wan ATI

Стримчик от Comfy Org про контроль траектории в WAN ATI

#comfyui #tutorial #cameracontrol #motioncontrol

YouTube

Trajectory Control in ComfyUI - Wan ATI

You’ve seen those wild viral videos where the background drifts and folds like an M.C. Escher fever dream — that’s Wan ATI Trajectory Control.

Today, Fill’s not just explaining it — he’s showing off his animated spline editor, a creative tool that lets you…

👍3

1.6K views07:11

Нейронавт | Нейросети в творчестве

EVTAR: End2End Virtual Try-on with Visual Reference

Виртуальная примерочная на базе Flux-Kontext.dev с использованием дополнительных визуальных референсов. Надевает целевую одежду на изображение человека, учитывая референсные изображения для более точного отображения деталей одежды.

Гитхаб
HF

#tryon

👍10

1.87K views08:11

Нейронавт | Нейросети в творчестве

Step-Audio-EditX

Опенсорсная аудиомодель от Степана (Stepfun) на базе LLM на 3B параметров.
Выразительное и итеративное редактирование звука.
Генератор речи по тексту без дообучения

Среди примеров есть очистка аудио от шума, ускорение речи, смена эмоции в речи, перевод обычной речи в шепот, контроль 10 типов паралингвистических особенностей (например, дыхание, смех, вздох, вопросы и т. д.)

Китайский и английский

работает на частоте 41.6Hz. Тут вероятно опечатка и речь о килогерцах

Оптимальный объем VRAM 32 GB, оптимальный хронометрах аудио - до 30 сек

Гитхаб
HF
Демо

#tts #text2speech #audioediting #speechcontrol #speechediting #speech2speech

👍9❤1

1.79K viewsedited 09:12

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-2509-Light_restoration

Еще интересная лора #QIE от dx8152

Удаляет с изображения освещение. То есть, выполняет первый шаг релайтинга. Может пригодиться для создания датасетов релайтинга

Демо

#lora #relighting

🔥11👍3

1.91K views10:13

About

Blog

Apps

Platform