Machinelearning – Telegram
384K subscribers
4.46K photos
863 videos
17 files
4.9K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
💬 Expanding Language-Image Pretrained Models for General Video Recognition by Microsoft.

Video-specific prompting scheme, which leverages video content information for generating discriminative textual prompts.

Github: https://github.com/microsoft/VideoX/tree/master/X-CLIP

Paper: https://arxiv.org/abs/2208.02816v1

Dataset: https://paperswithcode.com/dataset/ucf101

@ai_machinelearning_big_data
👍83🔥3
🚀 @machinelearning_interview - в Канале собраны все возможные вопросы и ответы с собеседований по Аналитике данных и Машинному обучению. Канал от Data Analytics.

Материалы канала реально помогут подготовиться к data science собеседованию.

👉Перейти
👍111
👍11🔥2
🧩 Per-Clip Video Object Segmentation

Progressive matching mechanism for efficient information-passing within a clip.

Github: https://github.com/pkyong95/PCVOS

Paper: https://arxiv.org/abs/2208.01924v1

Dataset: https://paperswithcode.com/dataset/davis

Video: https://youtu.be/6QATHDwrUx0

@ai_machinelearning_big_data
👍13
Эволюция машинного обучения и проблема «черного ящика»

Какие бенчмарки используются в ML?
Благодаря чему произошел прорыв в технологиях машинного обучения?
Как метод LIME помогает интерпретировать алгоритмы ИИ?
Почему нейронки по-прежнему работают не так, как хотелось бы ученым?

Ученые Yandex Research рассказали, как они исследуют логику нейросетей и почему людям до сих пор сложно прочитать их «мысли».
👍21🔥51
👍13🔥2👎1
🎼 ROC: A New Paradigm for Lyric-to-Melody Generation

Muzic is a research project on AI music that empowers music understanding and generation with deep learning and artificial intelligence.

Github: https://github.com/microsoft/muzic

Paper: https://arxiv.org/abs/2208.05697v1

Project: https://www.microsoft.com/en-us/research/project/ai-music/

@ai_machinelearning_big_data
👍17🔥62
🗣 Speech Enhancement and Dereverberation with Diffusion-based Generative Models

Github: https://github.com/sp-uhh/sgmse

Paper: https://arxiv.org/abs/2208.05830v1

Pretrained checkpoints: https://drive.google.com/drive/folders/1CSnkhUSoiv3RG0xg7WEcVapyLuwDaLbe?usp=sharing

@ai_machinelearning_big_data
🔥10👍3
🧔 StyleFaceV - Official PyTorch Implementation

StyleFaceV produces high-fidelity identity-preserving face videos with vivid movements

Github: https://github.com/arthur-qiu/stylefacev

Project: http://haonanqiu.com/projects/StyleFaceV.html

Video: https://youtu.be/BZNLcD04-Fc

Paper: https://arxiv.org/abs/2208.07862v1

Dataset: https://paperswithcode.com/dataset/faceforensics-1

@ai_machinelearning_big_data
🔥12👍3
🎆 Unifying Visual Perception by Dispersible Points Learning

Conceptually simple, flexible, and universal visual perception head for variant visual task

Github: https://github.com/sense-x/unihead

Paper: https://arxiv.org/abs/2208.08630v1

Model: https://drive.google.com/file/d/1TwFCog_PMd1HWA7s-s9pN2F_fgyMyR3x/view

Datasets: https://paperswithcode.com/dataset/imagenet

@ai_machinelearning_big_data
👍12🔥3
👍10🐳4🔥3
🔥 Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

Masked "language" modeling on images (Imglish), texts (English), and image-text pairs ("parallel sentences") in a unified manner.

Github: https://github.com/microsoft/unilm/tree/master/beit

Paper: https://arxiv.org/abs/2208.10442v1

Datasets: https://paperswithcode.com/dataset/visual-genome

@ai_machinelearning_big_data
🔥12👍6😱4👏1
👍19🔥2🕊1