Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.75K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Depth Anything V2

Быстрее, лучше, детальнее.
Гитхаб-репозиторий сломался, временно все на huggingface
Доступны три модели, самая старшая еще ждет релиза

Демо

#image2depth
🔥16👍51
Meme Generator v2

Природа создала айтишников чтобы они создали генератор мемов.
Пишем тему получаем мем.
Под капотом #SD3 и GPT4

Го генерить мемы

#meme #text2meme #text2image
👍12
5 инструментов эффективного DS-инженера

Любому DS-инженеру важно перенимать навыки и инструменты от разработчиков — этого требует рынок.

Ведь инженеры тоже пишут код, правят бизнес-логику, стараются снижать bus factor и хотят, чтобы в проектах не было багов. Но следить приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.

Чтобы помочь в этих задачах и упростить вашу жизнь, есть множество инструментов. И команда DeepSchool познакомит вас с пятеркой самых важных уже в этот четверг!

20 июня в 18:00 МСК DeepSchool проведёт открытую лекцию «5 инструментов эффективного DS-инженера».

На лекции расскажут:
1️⃣ как сделать эксперименты воспроизводимыми
- версионирование данных, кода и моделей
- управление зависимостями
2️⃣ инструменты, которые повысят качество кода
- линтеры и тесты
- Continuous Integration
3️⃣ как упростить свою работу
- lightning
- трекинг и визуализация в CML

🙋‍♂️Спикеры лекции:
- Егор Осинкин — Lead CV Engineer в EPAM
- Тимур, Фатыхов — ex Lead CV Engineer в Koronapay

Регистрируйтесь по ссылке!

После регистрации вы получите список полезных библиотек и сервисов для CV-инженеров!🎁
Также в телеграм-боте будет краткий анализ CV-вакансий, где можно посмотреть, как менялись зарплаты, как они зависят от требований и от грейдов.

Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21
Пачка анонсов от Meta:

Meta Chameleon — языковые модели 7B и 34B для обработки смешанного ввода и вывода текста.

Meta Multi-Token Prediction — предварительно обученные языковые модели для работы с кодом.

Мета-JASCO — модели преобразования текста в музыку, которые могут принимать различные входные данные. Посмотрите примеры, модель - огонь, жду потирая руки

Meta AudioSeal — модель добавления вотермарков на аудио, специально разработанная для распознавания речи, создаваемой искусственным интеллектом. Модель доступна по коммерческой лицензии

DIG-In — какая-то штука для исследований и разработок в области географических данных и культурных предпочтений в системах искусственного интеллекта.

#news #coding #LLM #text2music #music2music
🔥13🎃1
DeepSeek-Coder-V2

Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
Знает 338 языков программирования, длина контекста 128 К

Гитхаб
Попробовать

#coding
🔥15
А теперь пачка релизов от NVIDIA, более 50 препринтов на CVPR 2024

Начнем с того что они показали свой крутой персонализатор без дообучения JeDi
И выкладывать его в опенсорс, видимо, не собираются. Ну что ж, кросивое

#personalization #text2image
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.

Код

#tracking #poseestimation #image2pose #video2pose
👍13
VILA: On Pre-training for Visual Language Models

NVIDIA. #VLM пониматор картинок и видео с открытым исходным кодом.

Код
Демо

#video2text #image2text
👍14
волшебно хороши, как не поделиться!