Machinelearning – Telegram
383K subscribers
4.44K photos
853 videos
17 files
4.88K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥61
AutoAD: Movie Denoscription in Context

MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Denoscriptions.

MAD - это масштабный набор данных, собранный из аудиоописаний фильмов
.

🖥 Github: https://github.com/Soldelli/MAD

Paper: https://arxiv.org/abs/2303.16899v1

💨 Dataset: https://paperswithcode.com/dataset/lsmdc

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍123🔥3😁1
DPF: Learning Dense Prediction Fields with Weak Supervision

🖥 Github: https://github.com/cxx226/dpf

Paper: https://arxiv.org/abs/2303.16890v1

💨 Dataset: https://paperswithcode.com/dataset/pascal-context

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍141🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
3D Line Mapping Revisited

LIMAP is a toolbox for mapping and localization with line features.

Интерфейсы для различных геометрических операций над 2D/3D линиями.

🖥 Github: https://github.com/cvg/limap

Paper: https://arxiv.org/abs/2303.17504v1

💨 Dataset: https://paperswithcode.com/dataset/hypersim

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍113🔥2🤯1
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research

Propose a three-stage processing pipeline for filtering noisy data and generating high-quality captions, where ChatGPT.

Конвейер обработки для фильтрации зашумленных данных и создания высококачественных титров
.

🖥 Github: https://github.com/xinhaomei/wavcaps

Paper: https://arxiv.org/abs/2303.17395v1

💨 Dataset: https://paperswithcode.com/dataset/sounddescs

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4🔥2
vid2vid-zero for Zero-Shot Video Editing

We propose vid2vid-zero, a simple yet effective method for zero-shot video editing.

Мы предлагаем vid2vid-zero, простой, но эффективный метод редактирования видео.

🖥 Github: https://github.com/baaivision/vid2vid-zero

Paper: https://arxiv.org/abs/2303.17599v1

💨 Dataset: https://paperswithcode.com/dataset/sounddescs

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🤔3🔥2
⚡️Token Merging for Stable Diffusion

Token Merging (ToMe) speeds up transformers by merging redundant tokens, which means the transformer has to do less work.

Используя только чистый python и pytorch, Token Merging для SD ускоряет генерацию изображений в 2 раза, за счет объединения лишних токенов.

pip install tomesd

🖥 Github: https://github.com/dbolya/tomesd

Paper: https://arxiv.org/abs/2303.17604v1

💨 Blog: https://research.facebook.com/blog/2023/2/token-merging-your-vit-but-faster/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥63👌1
⭐️ HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace

Language serves as an interface for LLMs to connect numerous AI models for solving complicated AI tasks!

Система, использующая LLM (например, ChatGPT) для подключения различных моделей ИИ в сообществах машинного обучения (например, HuggingFace) для решения задач ИИ.

🖥 Github: https://github.com/microsoft/JARVIS

Paper: https://arxiv.org/abs/2303.17604v1

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍206🔥1🥰1
WeakTr: Exploring Plain Vision Transformer for Weakly-supervised Semantic Segmentation

🖥 Github: https://github.com/hustvl/weaktr

Paper: https://arxiv.org/abs/2304.01184v1

💨 Dataset: https://paperswithcode.com/dataset/imagenet

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Segment Anything

The Segment Anything Model (SAM) produces high quality object masks from input prompts such as points or boxes, and it can be used to generate masks for all objects in an image.

Новая модель - Segment Anything, нейросеть, которая в один клик может вырезать любой объект из фото или видео.

🖥 Github: https://github.com/facebookresearch/segment-anything

⭐️ Project: https://segment-anything.com/

Paper: https://arxiv.org/abs/2304.02643v1

💨 Dataset: https://segment-anything.com/dataset/index.html

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍105🥰1
StackLLaMA: A hands-on guide to train LLaMA with RLHF

In this post, we went through the entire training cycle for RLHF, starting with preparing a dataset with human annotations.

В этой статье блога мы покажем все этапы обучения модели LlaMa для ответов на вопросы на Stack Exchange с RLHF.

🤗 Hugging face: https://huggingface.co/blog/stackllama

Demo: https://huggingface.co/spaces/philschmid/igel-playground

💨 Dataset: https://huggingface.co/datasets/HuggingFaceH4/stack-exchange-preferences

📌 Paper: https://arxiv.org/abs/2302.13971

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍96🔥1
🔥 Что такое согласованность данных и почему с ней все так сложно

Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.

ai_machinelearning_big_data
🔥42👍1🥴1
Media is too big
VIEW IN TELEGRAM
Painter → SegGPT: Vision Foundation Models from BAAI

SegGPT, a generalist model for segmenting everything in context.

Фреймворк, которые объединяет различные задачи сегментации в универсальную контекстную систему обучения, которая подходит для различных типов сегментации.

🖥 Github: https://github.com/baaivision/painter

Paper: https://arxiv.org/abs/2304.03284v1

Demo: https://huggingface.co/spaces/BAAI/SegGPT

💨 Dataset: https://paperswithcode.com/dataset/youtube-vos

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103🔥2
Instruction Tuning with GPT-4

First attempt to use GPT-4 to generate instruction-following data for LLM finetuning.

Это репозиторий для GPT-4-LLM, целью которого является обмен данными, сгенерированными GPT-4 для построения LLM, с помощью контролируемого обучения и обучения с подкреплением.

🖥 Github: https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM

Paper: https://arxiv.org/abs/2304.03277v1

Project: https://instruction-tuning-with-gpt-4.github.io/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍6🔥3
DiffMimic: Efficient Motion Mimicking with Differentiable Physics

Utilizing differentiable physics simulators (DPS), DiffMimic simplifies policy learning into a state matching problem, providing faster and more stable convergence than reinforcement learning-based techniques.

В данном фреймворке используются дифференцируемые физические симуляторы (DPS) и предлагается эффективный метод имитации движения, получивший название DiffMim.


🖥 Github: https://github.com/jiawei-ren/diffmimic

Paper: https://arxiv.org/abs/2304.03274v1

Project: https://diffmimic.github.io/

⭐️ Demo: https://diffmimic-demo-main-g7h0i8.streamlit.app/

⭐️ Video: https://youtu.be/B0unbsvGsLc

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥2
Стартовал набор в ШАД — двухгодичную программу Академии Яндекса для тех, кто хочет исследовать Machine Learning и работать в IT-индустрии. Обучение проходит по 4 направлениям:
— data science
— инфраструктура больших данных
— разработка машинного обучения
— анализ данных в прикладных науках

Для опытных разработчиков и ML-исследователей есть альтернативный образовательный трек.
Программа ШАДа полностью бесплатна. Учиться можно дистанционно или офлайн — в одном из 6 филиалов. Скорее переходите по ссылке и заполняйте анкету участника: https://clck.ru/344m9d

Чтобы узнать подробности об обучении в ШАДе и задать вопросы кураторам программы, приходите на День открытых дверей 13 апреля. Ссылка для регистрации: https://academy.yandex.ru/dataschool/enroll#openday
👍125🥰5🔥3👎1
⛹️‍♂️ SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes

A Large-Scale Multi-Object Tracking Dataset in Sports Scenes.

Новый крупный набор данных многообъектного отслеживания в различных видах спорта, собранных для трех видов спорта - баскетбола, волейбола и футбола.


🖥 Github: https://github.com/MCG-NJU/SportsMOT/tree/main/codes

Paper: https://arxiv.org/abs/2304.05170v1

⭐️ Dataset: https://paperswithcode.com/dataset/sportsmot

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍163🔥3
Х5 Tech проведет Data science meetup #1

В программе:

🎯 Кто такие Data-спецназ X5 Tech, как пришли к автоматизации А/Б тестирования в оффлайне и что делать математику в ритейле

Расскажут Мария Шабалкова и Александр Сахнов, X5 Tech

🎯 Различия поведения пользователя на устройствах с экраном и без и как адаптировать ML-модели под изменение поведение пользователя на примере умной колонки

Выступит Прохор Гладких, SberDevices

🎯 Как правильно построить процесс разметки и освободить сотрудников от классификации обращений на 1000+ классов

Поделится Андрей Сон, Alfa-Bank

📅 26 апреля, начало в 18:00
🌐 Формат - онлайн

Зарегистрироваться
👍123👎1