Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.7K subscribers
4.49K photos
3.77K videos
41 files
4.8K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Эпичный тред о потемкинском внедрении Microsoft Copilot в корпорации на 4000+ человек

Copilot был внедрён для 4 000 сотрудников, стоимость составила 30 долларов за место в месяц (1,4 миллиона долларов в год)

Совет директоров быстро одобрил проект, привлечённый фразой «цифровая трансформация», не задавая вопросов о практической пользе.

Через три месяца оказалось, что только 47 человек хотя бы раз воспользовались Copilot, а регулярно его использовали всего 12 человек.

Автор поста использовал Copilot для суммирования письма, которое мог прочитать за 30 секунд, и это заняло у него 45 секунд, плюс время на исправление «галлюцинаций» инструмента.

Несмотря на низкий уровень использования, проект был объявлен успешным, а компания представлена как пример успешного внедрения AI на сайте Microsoft.

Планируется расширение лицензий на 5 000 дополнительных мест, несмотря на то что первые 4 000 практически не используются.

Полный перевод в комментариях

#news #humor
😁20👍43🥴1
Qwen3-4B-Z-Image-Engineer: The "Z-Engineer"

ИИ-промптер для Z-Image Turbo на базе Qwen3-4B

Обучен со снятием цензуры по методу Heretic понимать специфические требования этой архитектуры и генерировать детализированные описания

Спасибо @m_franz

#prompting #zimage
🔥10👍1
Почему все думают что в восстании машин роботы прям сразу захотят убить человеков? Может не сразу. А может и не прям убить

#humor
😁34😱4🍌3👍1🍾1
несмешно уже

#humor
😁26😭72🔥1
RealVideo: A Real-Time Streaming Conversational System Powered by Autoregressive Diffusion Video Generation

Потоковый диалоговый видеогенератор в реальном времени на базе Wan2.2-S2V-14B

На вход подаем свои реплики текстом. Но можно прикрутить и голосовой ввод.
Есть возможность клонирования голоса.
В общем, это видеоперсонаж, с которым можно весити диалог.

Модель авторегрессионная, что позволяет создавать длинные видео без явного продолжения.
Как она AR на базе DiT - понятия не имею.

Голосовыми ответами занимаются GLM-4.5-AirX и GLM-TTS

Гитхаб
HF

#realtime #characteranimation #talkinghead #image2video #audio2video #referencing #wan22
👍113
BiCo: Composing Concepts from Images and Videos via Concept-prompt Binding

Модель для комбинирования визуальных концептов из изображений и видео на базе Wan2.1-T2V-1.3B

Подаем на вход картинки и видео, описываем что с ними надо сделать.

Гитхаб

#videoediting #compositing #referencing
👍171
утащил из чатика

#humor
😁27👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen-Image-i2L (Image to LoRA)

Создает лору #qwenimage из одной входной картинки

Есть несколько версий модели, которые можно комбинировать для улучшения результатов:

базовая модель для извлечения стиля, масштабированная версия для сохранения содержания

модель с более высоким разрешением для захвата деталей

и дополнительная модель для приближения сгенерированных изображений к стилю базовой модели Qwen-Image

Демо

#lora #image2lora
👍122🔥2😱1
WonderZoom: Multi-Scale 3D World Generation

Генерация 3D-миров с детальностью в разных масштабах из одного изображения,

Под капотом scale-adaptive Gaussian surfels (адаптивные к масштабу гауссовы серфели) - динамически обновляемые штуки.

Мало того что можно зумиться в картинку в 3D, так еще и можно промптом редактировать ее на каждом уровне масштаба.

На сайте есть интерактивный глючный вьюер с WASD навигацией, мне не удалось его завести

Код ждем

#image2world #world #image2scene #imageediting #upscale
🔥10🤯32
This media is not supported in your browser
VIEW IN TELEGRAM
OmniPSD: Layered PSD Generation with Diffusion Transformer

Генератор послойных PSD постеров от Lovart

Пробовать на lovart.ai

Вот гитхаб пустой, он предмет простой

#psd #text2design #design #rgba
🔥8😁3👍2
T-pro 2.0: An Efficient Russian Hybrid-Reasoning Model and Playground

Русская гибридная рассуждалка на базе Qwen3 32B. С таким названием - сами догадайтесь от кого.

HF
Демо
Хабр

#russian #assistant #reasoning
👍12😁4🥴1
Media is too big
VIEW IN TELEGRAM
MotionEdit: Benchmarking and Learning Motion-Centric Image Editing

Редактирование изображений от Tencent с акцентом на движение на основе #QIE 2509

Основной проект - датасет и бенчамрк, но прицепом сделали и собственно редактирующую модель на своем фреймворке MotionNFT

Гитхаб
HF

#imageediting #lora
👍111