Depth Anything V2
Быстрее, лучше, детальнее.
Гитхаб-репозиторий сломался, временно все на huggingface
Доступны три модели, самая старшая еще ждет релиза
Демо
#image2depth
Быстрее, лучше, детальнее.
Гитхаб-репозиторий сломался, временно все на huggingface
Доступны три модели, самая старшая еще ждет релиза
Демо
#image2depth
🔥16👍5❤1
Open-Sora 1.2
В релизе: 3D-VAE, rectified flow и score condition. Улучшено качество видео.
Веса
Галерея
Демо
#text2video
В релизе: 3D-VAE, rectified flow и score condition. Улучшено качество видео.
Веса
Галерея
Демо
#text2video
👍9🔥6
Meme Generator v2
Природа создала айтишников чтобы они создали генератор мемов.
Пишем тему получаем мем.
Под капотом #SD3 и GPT4
Го генерить мемы
#meme #text2meme #text2image
Природа создала айтишников чтобы они создали генератор мемов.
Пишем тему получаем мем.
Под капотом #SD3 и GPT4
Го генерить мемы
#meme #text2meme #text2image
👍12
5 инструментов эффективного DS-инженера
Любому DS-инженеру важно перенимать навыки и инструменты от разработчиков — этого требует рынок.
Ведь инженеры тоже пишут код, правят бизнес-логику, стараются снижать bus factor и хотят, чтобы в проектах не было багов. Но следить приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.
Чтобы помочь в этих задачах и упростить вашу жизнь, есть множество инструментов. И команда DeepSchool познакомит вас с пятеркой самых важных уже в этот четверг!
20 июня в 18:00 МСК DeepSchool проведёт открытую лекцию «5 инструментов эффективного DS-инженера».
На лекции расскажут:
1️⃣ как сделать эксперименты воспроизводимыми
- версионирование данных, кода и моделей
- управление зависимостями
2️⃣ инструменты, которые повысят качество кода
- линтеры и тесты
- Continuous Integration
3️⃣ как упростить свою работу
- lightning
- трекинг и визуализация в CML
🙋♂️Спикеры лекции:
- Егор Осинкин — Lead CV Engineer в EPAM
- Тимур, Фатыхов — ex Lead CV Engineer в Koronapay
Регистрируйтесь по ссылке!
После регистрации вы получите список полезных библиотек и сервисов для CV-инженеров!🎁
Также в телеграм-боте будет краткий анализ CV-вакансий, где можно посмотреть, как менялись зарплаты, как они зависят от требований и от грейдов.
Зарегистрироваться
Любому DS-инженеру важно перенимать навыки и инструменты от разработчиков — этого требует рынок.
Ведь инженеры тоже пишут код, правят бизнес-логику, стараются снижать bus factor и хотят, чтобы в проектах не было багов. Но следить приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.
Чтобы помочь в этих задачах и упростить вашу жизнь, есть множество инструментов. И команда DeepSchool познакомит вас с пятеркой самых важных уже в этот четверг!
20 июня в 18:00 МСК DeepSchool проведёт открытую лекцию «5 инструментов эффективного DS-инженера».
На лекции расскажут:
- версионирование данных, кода и моделей
- управление зависимостями
- линтеры и тесты
- Continuous Integration
- lightning
- трекинг и визуализация в CML
🙋♂️Спикеры лекции:
- Егор Осинкин — Lead CV Engineer в EPAM
- Тимур, Фатыхов — ex Lead CV Engineer в Koronapay
Регистрируйтесь по ссылке!
После регистрации вы получите список полезных библиотек и сервисов для CV-инженеров!🎁
Также в телеграм-боте будет краткий анализ CV-вакансий, где можно посмотреть, как менялись зарплаты, как они зависят от требований и от грейдов.
Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2❤1
Пачка анонсов от Meta:
Meta Chameleon — языковые модели 7B и 34B для обработки смешанного ввода и вывода текста.
Meta Multi-Token Prediction — предварительно обученные языковые модели для работы с кодом.
Мета-JASCO — модели преобразования текста в музыку, которые могут принимать различные входные данные. Посмотрите примеры, модель - огонь, жду потирая руки
Meta AudioSeal — модель добавления вотермарков на аудио, специально разработанная для распознавания речи, создаваемой искусственным интеллектом. Модель доступна по коммерческой лицензии
DIG-In — какая-то штука для исследований и разработок в области географических данных и культурных предпочтений в системах искусственного интеллекта.
#news #coding #LLM #text2music #music2music
Meta Chameleon — языковые модели 7B и 34B для обработки смешанного ввода и вывода текста.
Meta Multi-Token Prediction — предварительно обученные языковые модели для работы с кодом.
Мета-JASCO — модели преобразования текста в музыку, которые могут принимать различные входные данные. Посмотрите примеры, модель - огонь, жду потирая руки
Meta AudioSeal — модель добавления вотермарков на аудио, специально разработанная для распознавания речи, создаваемой искусственным интеллектом. Модель доступна по коммерческой лицензии
DIG-In — какая-то штука для исследований и разработок в области географических данных и культурных предпочтений в системах искусственного интеллекта.
#news #coding #LLM #text2music #music2music
🔥13🎃1
DeepSeek-Coder-V2
Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
Знает 338 языков программирования, длина контекста 128 К
Гитхаб
Попробовать
#coding
Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
Знает 338 языков программирования, длина контекста 128 К
Гитхаб
Попробовать
#coding
🔥15
А теперь пачка релизов от NVIDIA, более 50 препринтов на CVPR 2024
Начнем с того что они показали свой крутой персонализатор без дообучения JeDi
И выкладывать его в опенсорс, видимо, не собираются. Ну что ж, кросивое
#personalization #text2image
Начнем с того что они показали свой крутой персонализатор без дообучения JeDi
И выкладывать его в опенсорс, видимо, не собираются. Ну что ж, кросивое
#personalization #text2image
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects
NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.
Код
#tracking #poseestimation #image2pose #video2pose
NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.
Код
#tracking #poseestimation #image2pose #video2pose
👍13
VILA: On Pre-training for Visual Language Models
NVIDIA. #VLM пониматор картинок и видео с открытым исходным кодом.
Код
Демо
#video2text #image2text
NVIDIA. #VLM пониматор картинок и видео с открытым исходным кодом.
Код
Демо
#video2text #image2text
👍14