Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Moshi

Голосовой ассистент от французской компании Kyutai.
Вся фишка в акцентах и инотнациях.
Русского не знает.
Попробовал. туповат.

Код ждем
Демо

#assistant
😁71👍1
А чтение мысленных образов тоже не стоит на месте.
Ученые из Нидерландов добились вот такого результата реконструкции изображений по сигналам активности мозга макаки.

верхний ряд - картинки, показанные макаке.
второй ряд - реконструкция по результатам нового исследования
нижний ряд - результат предыдущего исследования

В этот раз сигналы считывали через имплант. До этого исследования проводили на людях, считывая активность с помощью МРТ

Новость

#science #brain #mindreading #news
🤯12👍4🤔1
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control

Китайский оживлятор персонажей по образцу движения.
Авторы отказались от диффузии и пошли другим путем.
Мне кажется, или они решили проблему со ртом?
Инференс за 12.8ms на RTX 4090 (одного кадра? целого видео?)

Дообученный на животный, позволяет легко управлять мордами животных

Код
Колаб
ComfyUI

#image2video #pose2video
🔥22👍3😁1
Lazy Diffusion Transformer for Interactive Image Editing

Редактирование изображения по маске. Генерируются только пиксели под маской. Скорость зависит по большей части только от размера маски. Получается эффективный инпейнтинг.

Кода нет

#imagw2image #inpainting
4👍4
Kolors

Новый крутой генератор картинок от авторов Kling.
В будущем обзаведется Lora, Controlnet, IP-adapter, ComfyUI.
Хороним Stability?

Гитхаб
Демо

#text2image
👍16👎1😁1
Media is too big
VIEW IN TELEGRAM
На и сам Kling тоже обновился до версии 2.

Прикрутили ключевые кадры как в Luma, контроль камеры, негативный промпт.
Хрон расширили до 10 секунд.
И самое главное, пользоваться теперь можно на сайте в браузере. Но все равно вход через Wechat

#text2video #image2video
👍11
ControlNet++: All-in-one ControlNet for image generations and editing!

Один универсальный SDXL контролнет чтоб править всеми который работает с более 10 препроцессоров и , соответственно, выполняет более 10 контролнетных задач.
Архитектура основана на Controlnet и расширена с заявкой на поддержку генерации в качестве Midjourney (что бы это ни значило)

Гитхаб
Веса на HF

#controlnet #conditioning #text2image #image2image
🔥9👍5
Вязантийская империя в исполнении ideogram, SD3 и Kolors.
Угадаете кто где?

#neuronaut_art
👍1
Media is too big
VIEW IN TELEGRAM
CharacterGen: Efficient 3D Character Generation from Single Images with Multi-View Pose Calibration

Генератор 3D-персонажей по одному входному изображению, унифицированных по позе, предположительно пригодных для рига и анимации.

Код

#imageto3D
🔥7👍3
Tile-upscaler

Не буду репостить про фотошоп плагин Magnific который fic установишь без vpn и подписки Adobe, а потом он еще и сам денег просит.

Держите апскейлер на идеях Clarity и Controlnet-tile.
Есть ощущение что там встроен "улучшайзер" лиц который их сглаживает.
Для сохранения деталей помогает рулька HDR, но она портит контраст. А в остальном нравится.

Код там же в демоспейсе во вкладке Files справа вверху

#upscale
😁10😐7👍42