Пачка анонсов от Meta:
Meta Chameleon — языковые модели 7B и 34B для обработки смешанного ввода и вывода текста.
Meta Multi-Token Prediction — предварительно обученные языковые модели для работы с кодом.
Мета-JASCO — модели преобразования текста в музыку, которые могут принимать различные входные данные. Посмотрите примеры, модель - огонь, жду потирая руки
Meta AudioSeal — модель добавления вотермарков на аудио, специально разработанная для распознавания речи, создаваемой искусственным интеллектом. Модель доступна по коммерческой лицензии
DIG-In — какая-то штука для исследований и разработок в области географических данных и культурных предпочтений в системах искусственного интеллекта.
#news #coding #LLM #text2music #music2music
Meta Chameleon — языковые модели 7B и 34B для обработки смешанного ввода и вывода текста.
Meta Multi-Token Prediction — предварительно обученные языковые модели для работы с кодом.
Мета-JASCO — модели преобразования текста в музыку, которые могут принимать различные входные данные. Посмотрите примеры, модель - огонь, жду потирая руки
Meta AudioSeal — модель добавления вотермарков на аудио, специально разработанная для распознавания речи, создаваемой искусственным интеллектом. Модель доступна по коммерческой лицензии
DIG-In — какая-то штука для исследований и разработок в области географических данных и культурных предпочтений в системах искусственного интеллекта.
#news #coding #LLM #text2music #music2music
🔥13🎃1
DeepSeek-Coder-V2
Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
Знает 338 языков программирования, длина контекста 128 К
Гитхаб
Попробовать
#coding
Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
Знает 338 языков программирования, длина контекста 128 К
Гитхаб
Попробовать
#coding
🔥15
А теперь пачка релизов от NVIDIA, более 50 препринтов на CVPR 2024
Начнем с того что они показали свой крутой персонализатор без дообучения JeDi
И выкладывать его в опенсорс, видимо, не собираются. Ну что ж, кросивое
#personalization #text2image
Начнем с того что они показали свой крутой персонализатор без дообучения JeDi
И выкладывать его в опенсорс, видимо, не собираются. Ну что ж, кросивое
#personalization #text2image
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects
NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.
Код
#tracking #poseestimation #image2pose #video2pose
NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.
Код
#tracking #poseestimation #image2pose #video2pose
👍13
VILA: On Pre-training for Visual Language Models
NVIDIA. #VLM пониматор картинок и видео с открытым исходным кодом.
Код
Демо
#video2text #image2text
NVIDIA. #VLM пониматор картинок и видео с открытым исходным кодом.
Код
Демо
#video2text #image2text
👍14
Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В комментах ещё)
❤10🔥9😁7👎1