Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.7K subscribers
4.5K photos
3.79K videos
41 files
4.82K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform

Китайская среда для рендера и работы с всевозможными гауссианами и 3D-мешами в браузере. Построена на базе WebGPU и ONNX Runtime

Есть three.js с API на TypeScript для интеграции в веб-приложения

Гитхаб
Попробовать

#3d #gaussian #nerf #3d #3dediting #rendering #onlone #realtime
👍51
Media is too big
VIEW IN TELEGRAM
Сервис для стилизации видео Mago Studio вышел в открытую бету

Обещают что попробовать можно бесплатно
Скидка 40% на первую покупку по промокоду LAUNCH

Пробуем здесь. Если сможем достучаться до сайта

#video2video #styletransfer #stylization
👀5👍31
relsim: Relational Visual Similarity

Adobe и Co придумали новый метод измерения визуальной схожести изображений — через реляционную схожесть, а не только через атрибуты.

В отличие от существующих методов (например, LPIPS, CLIP, DINO), которые фокусируются на внешних атрибутах изображений, relsim улавливает скрытые взаимоотношения между визуальными элементами

Гитхаб

#research #vlm
👍13🔥3
WindowSeat: Reflection Removal through Efficient Adaptation of Diffusion Transformers

Удаление отражений со снимков сделанных через стекло

Лора для #QIE 2509

Гитхаб
Демо
HF

#lora #imageediting #reflectionremoval
👍20
Media is too big
VIEW IN TELEGRAM
Efficiently Reconstructing Dynamic Scenes One D4RT at a Time

В DeepMind придумали как эффективно реконструировать динамическую 3D сцену из одного видео.
Гауссианы в препринте не упомянуты

Кода нет

#videoto4d #4d #video2scene
🔥9
LivingSwap. Preserving Source Video Realism: High-Fidelity Face Swapping for Cinematic Quality

"Качественная" замена лиц на видео с сохранением реалистичности исходного видеоматериала.
Фокус на качестве уровня кино.
Первая модель для замены лиц, которая применяет подход с использованием видеоэталона


Использует ключевые кадры как сигналы для внедрения целевой идентичности, что позволяет гибко и контролируемо редактировать видео

— в отличие от GAN-методов не страдает от мерцания и дрожания в длинных последовательностях

— в сравнении с диффузионными моделями лучше сохраняет мелкие детали и избегает несоответствий с претренированными данными

— эффективнее методов на основе инпейнтинга в сохранении мелких деталей и избежании визуальных артефактов

— лучше адаптируется к длинным видео благодаря стратегии временного сшивания и использованию ключевых кадров

Базовая модель — VACE 14B

Код ждем

#faceswap #videoediting
🔥20👍2
StereoWorld: Geometry-Aware Monocular-to-Stereo Video Generation

#SOTA в создании стереоскопического видео из монокулярного видео с высокой визуальной точностью и геометрической корректностью

Базовая модель — Wan2.1-T2V-1.3B. За оценку глубины отвечает Video Depth Anything

Кто умеет косить глазами для просмотра стерео - ставьте 👀

Кода нет

#novelview #video2video #stereo #mono2stereo
👀26👍4🔥3😁32
Эпичный тред о потемкинском внедрении Microsoft Copilot в корпорации на 4000+ человек

Copilot был внедрён для 4 000 сотрудников, стоимость составила 30 долларов за место в месяц (1,4 миллиона долларов в год)

Совет директоров быстро одобрил проект, привлечённый фразой «цифровая трансформация», не задавая вопросов о практической пользе.

Через три месяца оказалось, что только 47 человек хотя бы раз воспользовались Copilot, а регулярно его использовали всего 12 человек.

Автор поста использовал Copilot для суммирования письма, которое мог прочитать за 30 секунд, и это заняло у него 45 секунд, плюс время на исправление «галлюцинаций» инструмента.

Несмотря на низкий уровень использования, проект был объявлен успешным, а компания представлена как пример успешного внедрения AI на сайте Microsoft.

Планируется расширение лицензий на 5 000 дополнительных мест, несмотря на то что первые 4 000 практически не используются.

Полный перевод в комментариях

#news #humor
😁204👍4🥴1
Qwen3-4B-Z-Image-Engineer: The "Z-Engineer"

ИИ-промптер для Z-Image Turbo на базе Qwen3-4B

Обучен со снятием цензуры по методу Heretic понимать специфические требования этой архитектуры и генерировать детализированные описания

Спасибо @m_franz

#prompting #zimage
🔥10👍1
Почему все думают что в восстании машин роботы прям сразу захотят убить человеков? Может не сразу. А может и не прям убить

#humor
😁34😱4🍌3👍1🍾1
несмешно уже

#humor
😁26😭72🔥1