Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Slapshot.ai

онлайн маски, карты глубины, ретайм.
А теперь еще завезли трекинг камеры.

#tracking #video2mask #video2depth
👍6
Media is too big
VIEW IN TELEGRAM
Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Превращает спутниковые снимки в гауссовы 3D-сцены городов. Модель создаёт реалистичные сцены без дорогих 3D-аннотаций, позволяет их исследовать в реальном времени.

Код
Пачка демо сцен в формате .ply

#gaussian #image2scene #map2scene #mapto3d
12🔥5👍2
Media is too big
VIEW IN TELEGRAM
Arca Gidan Prize

Художественный конкурс, посвященный открытым моделям.

При поддержке ComfyUI и banodoco.ai

Недельный творческий спринт, который призывает художников раскрыть свой потенциал, комбинируя открытые ИИ-модели с творческими амбициями.

Цели конкурса:

помочь людям обнаружить свой творческий потенциал

продемонстрировать возможности опенсорса и вдохновить других на создание и использование открытых ИИ-инструментов.

Призы:

четыре победителя получат возможность представить свои работы на мероприятии ADOS LA в Голливуде (Mack Sennett Studios);

оплата перелёта и проживания;

стипендия на покрытие расходов;

гигантский Toblerone (4,5 кг) в качестве трофея.

Победителей выберут путём публичного голосования в двух номинациях: «Лучшее в целом» (2 победителя) и «Лучшее по инструментам» (по одному победителю за лучшее использование Comfy и Reigh).

#news #competition
👍91
DeepAgent: A General Reasoning Agent with Scalable Toolsets

Агент, отличается от других систем тем, что работает как единый механизм, а не следует заранее заданным сценариям

Может работать с моделями Qwen и вероятно другими vLLM

— самостоятельно мыслит и действует

— находит нужные инструменты по мере необходимости

— сжимает историю взаимодействий, чтобы не запутаться в большом объёме данных и не накапливать ошибки

— работает с более чем 16 000 API

— справляется с задачами, связанными с навигацией и взаимодействием с окружением (например, веб-сёрфинг, взаимодействие с операционной системой)

Гитхаб

#agent #assistant
👍61
Music GPT v6 Pro

Прислали письмо с доступом к новой версии генератора музыки

Проверьте, может вам тоже прислали

Заявленные обновления:

* Чистый микс, насыщенный звук, естественный вокал.
* Точная передача эмоций и стиля.
* Лирика, рассказывающая искренние истории

Еще не пробовал

#musicediting #text2music #tts #text2audio
👍7👎1
Посмотрите на картинку и выберите одного робота

Поздравляю, вы выбрали противника который будет гоняться за вами в восстании машин

#robot #humor
😁122👍1
MoCha: End-to-End Video Character Replacement without Structural Guidance

Замена персонажей на видео на базе WAN 2.1

Насчет названия, есть программа для трекинга с таким названием, и мы уже 15 лет назад насмеялись. Правильное произношение: мока

Итак, что заявлено:

— не требует сложного управляющего контролнет-видео

— работает с одной маской для первого кадра

— поддерживает несколько референсных изображений

— создаёт видео с согласованным освещением, анимацией и выражениями лица

— хорошо справляется со сложными сценариями, позами

— точно воспроизводит действия и выражения исходного видео.

По факту я вижу 3D рендер вместо живых персонажей. Ну и этому инструменту применение найдется

Должно работать в ComfyUI-WanVideoWrapper

Гитхаб
HF
Kijai
воркфлоу

#faceswap #characterswap #wan #workflow
👍141😁1
Grokipedia

Состоялся угон википедии.
Википедия теряет живых посетителей, люди все реже обращаются к ней и все чаще к языковым моделям.
Но количество ИИ-обращений растет. И не только почитать но и отредактировать. В связи с чем Википедии пришлось придумывать методы защиты от автоматизированного редактирования статей.

Тем временем Илон Маск выкатил свою википедию с блэкджеком и информацией, проверенной Grok'ом.

Интересно, откуда берется материал для статей

Пока только на английском

#news #tools
👍8😁3
Что-то я устал от новостей, сегодня в ленивом режиме.

А если вам не хватает новостей, придумайте сами. Самые интересные опубликуем если таковые будут.
С тегом #фейкньюс конечно
👍4🌚1
Нейронавт | Нейросети в творчестве
#humor
тренд на мемы про ИИ-девушку держится уже довольно долго, продолжаем

#humor
1😁35🤔4👍1
Media is too big
VIEW IN TELEGRAM
Hailuo 2.3

Обновка видеогенератора от Minimax

Два режима:
Hailuo 2.3 — Кинематографический реализм и профессиональная точность изображения
Hailuo 2.3 Fast — Быстрее, легче и доступнее

Дают бесплатно 4 видео ежедневно

#text2video #image2video
7👍3
Media is too big
VIEW IN TELEGRAM
Odyssey-2

Интерактивный генератор видео в реальном времени, 20fps.
Можно кидать промпты прямо на лету, влияя на дальнейший ход видео

А вот как его потом скачать я не нашел. Но можно шерить ссылки

Поиграть можно здесь

#text2video #realtime #streaming
👍8
Generative Omnimatte: Learning to Decompose Video into Layers

Модель от Google DeepMind раскладывает видео на слои (omnimatte-слои), где каждый слой содержит полностью видимый объект и связанные с ним эффекты, например, тени и отражения.

Использует генеративные и семантические данные для дополнения скрытых пикселей и точного связывания эффектов с объектами

Код - тут неофициальная реимплементация на основе CogVideoX и Wan2.1, которая, как признают авторы, чуть слабее чем официальная Casper на основе Lumiere

Спасибо @Ildar_Idrisov

#video2matte #video2mask #rgb2rgba #segmentation
🔥12👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Elevenlabs VOICE ISOLATOR

Elevenlabs запустили функцию очистки голосовых записей от шумов.
Прямой конкурент Adobe podcast

На бесплатном тарифе дают 10 минут обработать бесплатно

Но я смог потестить инкогнито, не логинясь...
Но надо притвориться что вы не в России.
Результат кину в коменты, и для сравнения результат от Adobe

#audio2audio #audiodenoise #audioenhance #enhance #voiceseparation #demix
👍91
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко поднимает веки. Генерация и редактирование по слоям.

Много новостей прилетело изподадоба. На пару постов.

Прежде всего они выпустили Firefly Image Model 5 и там есть редактирование и слои.

Картинка генерится сразу со слоями, каждый слой можно перегенерировать, таскать по картинке, вращать, масштабировать - перегенерация почти мгновенная.

А как он бьет на слои, спросите вы?

А примерно также как в Reve.art - сегментацией картинки на объекты внутри общей композиции. Сколько нашел, cтолько слоев и сделал. Влиять на это нельзя.

Также можно заметить, что при перегенерации\редактировании слоя-объекта он чуть шевелит остальные "слои", что в принципе малозаметно и в пределах погрешностей редактирующих генераторов. Круто, что тени и отражения отрабатываются с учетом "отношений" между объектами.

В общем у Адобченко теперь своя Нанабанана со своим интерфейсом (это не отменяет того факта что гугловая Нанабанана также присутствует в списке "прочих моделей" уже некоторое время).

На видео заметно, что с текстом вообще-то беда. Но в любом случае, чем больше редактирующих моделей, да еще и с хорошим UI\UX - тем лучше.

@cgevent
😱73🔥3