Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Denis Sexy IT 🤖
Нашел совершенно тупой способ проводить время с ChatGPT: даешь ей скучную картинку и просишь конвертировать в постер к фильму, столько эпичности на ровном месте иногда

Так воскресенье и прошло ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17😁91
Open-Vocabulary SAM: segment and recognize twenty-thousand classes interactively

Сегментатор изображений с открытым словарем, вдохновленный SAM. Быстрый, превосходит простую комбинацию SAM и CLIP

Код
Демо

#image2mask #segmentation
4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Аспирантка Лорен Рамлан запустила Doom на клетках кишечной палочки.

Клетки функционировали как пиксели, отображая флуоресцентной подсветкой по одному кадру каждые 8 часов 20 минут. На прохождение уйдет около 666 лет.

#оффтоп
🤯16😁8🤔1👀1
Напоминаю, сегодня в 23:00 по Москве проведем розыгрыш билета на Aisummit здесь, в этом канале в прямом эфире.

С победителем свяжется организатор и вручит приз.

На данный момент поступило 7 заявок на участие, шансы каждого участника все еще высоки. Прием заявок прекращается сегодня в 23:00.

Репостом вы можете увеличить свои шансы, читайте оригинальный пост.

#розыгрыш #giveaway
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
TIP-Editor: An Accurate 3D Editor Following Both Text-Prompts And Image-Prompts

В Tencent изобрели редактор 3D-сцен по текстовым промтам и картинкам. Под капотом притаились гауссианы. Есть только препринт и это видео

Препринт

#3Dto3D #scene2scene #3Dedit #gaussian
4🔥3👍1
OneDiff

Ускоритель диффузионных генераторов. Работает с картинками и видео. Работает с ComfyUI, diffusers и Stable Diffusion web UI. Работает с SDXL, SD1.5/2.1, Lora, Controlnet. Этого мало? Работает с SVD

Гитхаб
Плейграунд

#text2image #text2video #tools
🔥11
Media is too big
VIEW IN TELEGRAM
Поздравляем победителя розыгрыша @itsmyfavourite 🎉🎉🎉

С вами свяжутся организаторы.

В случае если с вами никак не удастся связаться или откажетесь от приза, билет получит @alex_ramazanov

#giveaway #розыгрыш
🔥6👍2
Nous Research наконец-то реализовали идею, которая кмк давно уже витала в воздухе: скрестить блокчейн и ИИ, чтобы наконец-то получить объективный лидерборд для моделей

В топ лидерборда Huggingface давно залетают LLM размером всего в 7B. Чисто из-за того, что популярные бенчмарки уже, скорее всего, попали в большие дампы всего интернета. Не говоря о том, что недобросовестные ресерчеры могут просто обучиться на тесте и получить свою минуту славы

Nous предлагают логичное решение – данные должны быть закрытые, постоянно обновляющиеся, но при этом обязательно децентрализованные. На их лидерборде GPT-4 постоянно догенеривает синтетические тестовые примеры, а эвалюаторы в распределенной сети Bittensor прогоняют добавленные модели на свежей выборке. Так, бенчмарк есть одновременно у всех и ни у кого, и при этом постоянно меняется 🤯

Очень хочу посмотреть, какое там будет ранжирование, когда туда закинут популярные модели последних месяцев 👀 Особенно с очень большими заявлениями о метриках в статье, типа SOLAR

https://huggingface.co/spaces/NousResearch/finetuning_subnet_leaderboard
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🥴4🤔21
Студии VFX продолжают вкатываться в ИИ

Scanline VFX ищет Research Scientist, Computer Graphics, Computer Vision, and Machine Learning

вакансия

#news
🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Тиктоковский Depth Anything теперь в библиотеке Transformers.js для браузера.

Облегченная модель 25M параметров.
Можно запустить даже локально, а можно поиграть в демоспейсе, он шустрый!

Демо

#image2depth #imageto3D
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception

Скоро мультимодальные LLM, с фичей визуального восприятия будут работать прямо у вас в мобилке. Автономно.

Вот одна из разработок, которую уже сейчас можно ставить на андроид

Код

#LLM #VLM #assistant
1👍1🤯1
Пришел бета доступ раскадровщика Katalist
Кто вписывался в вейтлист - проверьте почту

#text2image #storyboard #text2story
🔥4👍2
Media is too big
VIEW IN TELEGRAM
Media2Face: Co-speech Facial Animation Generation With Multi-Modality Guidance

Генератор говорящей 3D головы по звуку речи. И поющей. И зевающей. А еще он анимирует не только лицо, но и движения головы.

Код ждем

#talkinghead #speech2head #speech2animation #audioto3D
👍5