NEW BOT Телеграм, страница - 149852658

Machinelearning

@ai_machinelearning_big_data

348K subscribers

4.54K photos

914 videos

17 files

4.98K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

348K subscribers

Machinelearning

↪️

Zero-shot image-to-text generation with BLIP-2

The model bridges the gap between vision and natural language modalities by adding a transformer between pre-trained models.

BLIP-2 — это новая модель визуального языка, которую можно использовать для нескольких задач преобразования изображения в текст. Это эффективный подход, который можно применять для получения качественных промптов.

💨

Hugging Face: https://huggingface.co/blog/blip-2

💻

Demo: https://huggingface.co/spaces/Salesforce/BLIP2

🖥

Github: https://github.com/salesforce/LAVIS

⭐️

Paper: https://arxiv.org/abs/2301.12597

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥4❤2

8.06K views08:01

Machinelearning

🌐 Как организовать работу над ML-экспериментами с помощью MLflow

MLOps — набор практик и инструментов, которые помогают стандартизировать и повысить эффективность процессов работы с машинным обучением. Эксперты VK Cloud и Karpov.Courses выпустили на Хабре полезную статью, где показали последовательность действий по выстраиванию MLOps-подхода в облаке с помощью JupyterHub и MLflow. Подробнее тут.

ai_machinelearning_big_data

👍8

7.35K views07:48

Machinelearning

T2I-Adapter

Network that can provide extra guidance to pre-trained text-to-image models while freezing the original large text-to-image models.

T2I-Adapter набор aдаптеров для диффузионных моделей(~ 70 млн параметров ).Подходит для широкого спектра задач text-to-image, генерация скетчей, редактирование изображений по тексту, объединение нескольких адаптеров вместе и многое другое.

🖥

Github: https://github.com/TencentARC/T2I-Adapter

🤗 Hugging Face: https://huggingface.co/TencentARC/T2I-Adapter

⭐️

Paper: https://arxiv.org/abs/2302.08453v1

💻

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🔥3❤1

7.52K views09:48

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

3D-aware Conditional Image Synthesis (pix2pix3D)

Model synthesizes a 3d photo from different viewpoints.

3D генеративная модель для управляемого синтеза фотореалистичных изображений.

🖥

Github: https://github.com/dunbar12138/pix2pix3D

⭐️

Project: https://huggingface.co/TencentARC/T2I-Adapter

⭐️

Paper: https://arxiv.org/abs/2302.08509

💻

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🥰2❤1

7.41K views16:02

Machinelearning

👁

EdgeYOLO: An Edge-Real-Time Object Detector

EdgeYOLO reaches 34FPS with 50.6% AP in COCO2017 dataset and 25.9% AP in VisDrone2019 (image input size is 640x640, batch=16, post-process included).

Новый детектор обнаружения небольших объектов с высокой точностью, не требующий больших вычислительных мощностей.

🖥

Github: https://github.com/lsh9832/edgeyolo

⭐️

Paper: https://arxiv.org/abs/2302.07483v1

⭐️

Weights: https://github.com/LSH9832/edgeyolo/releases/tag/v0.0.0

💻

Dataset: https://paperswithcode.com/dataset/visdrone

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥20👍7❤2😁1🤣1

8.75K views10:01

Machinelearning

🚀

Slapo: A Schedule Language for Large Model Training

Slapo is a schedule language for progressive optimization of large deep learning model training.

Slapo позволяет использовать набор примитивов на PyTorch, запуская их по расписанию, для оптимизации обучения без изменения самой модели.

🚀 Мощная оптимизация.

pip3 install slapo

🖥

Github: https://github.com/awslabs/slapo

⭐️

Paper: https://arxiv.org/abs/2302.08005v1

💻

Docs: https://awslabs.github.io/slapo/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🔥5🥰2🤔1🥱1

8.87K views08:34

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

💠

MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation

MultiDiffusion - модель, позволяющая создавать любые изображения, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.

⭐️

Project: https://multidiffusion.github.io/

🖥

Github: https://github.com/omerbt/MultiDiffusion

⭐️

Paper: https://arxiv.org/abs/2302.08113v1

💻

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14🔥5❤4

8.04K views08:07

Machinelearning

Media is too big

VIEW IN TELEGRAM

🔍 Planar Object Tracking via Weighted Optical Flow

Method for planar object 8 degrees-of-freedom pose.

WOFT - новый невероятно точный метод отслеживания объектов.

⭐️

Project: https://cmp.felk.cvut.cz/~serycjon/WOFT/

🖥

Github: https://github.com/serycjon/WOFT

⭐️

Paper: arxiv.org/pdf/2301.10057.pdf

💻

Dataset : https://www3.cs.stonybrook.edu/~hling/data/POT-210/planar_benchmark.html

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14🔥10❤3

8.54K views14:33

Machinelearning

🔍

A meta-dataset for few-shot image classification

Meta Album is a meta-dataset created for few-shot learning, meta-learning, continual learning and so on.

Meta-datase — это набор метаданных, созданный , состоящий из 40 датасетов разбитых на 10 уникальных категорий. Это постоянно пополняемый набор метаданных.

⭐️

Meta-dataset: https://meta-album.github.io/

🖥

Github: https://github.com/ihsaan-ullah/meta-album

⭐️

Paper: https://arxiv.org/abs/2302.08909v1

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥3❤1👏1

9.37K views07:00

Machinelearning

💨

3D Object Tracking

Multi-modality tracker that fuses information from visual appearance and geometry to estimate object poses.

Список алгоритмов по отслеживанию 3D-объектов.

🖥

Github: https://github.com/dlr-rm/3dobjecttracking

⭐️

Paper: https://arxiv.org/abs/2302.11458v1

⏩

Video: https://www.youtube.com/watch?v=0ORZvDDbDjA

💻

Dataset : https://paperswithcode.com/dataset/ycb-video

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥3❤1

7.91K views09:30

Machinelearning

Video Localized Narratives

Video Localized Narratives, a new form of multimodal video annotations connecting vision and language.

Новая модель от Google позволяет генерировать аннотации к видео, фиксируя даже сложные события.

Авторы уже аннотировали 20 тыс. видео из датасетов OVIS, UVO и Oops, в общей сложности 1,7 млн. слов.

🖥

Github: https://github.com/google/video-localized-narratives

⭐️

Paper: https://arxiv.org/abs/2302.11217v1

⏩

Project: https://www.youtube.com/watch?v=0ORZvDDbDjA

💻

Dataset : https://paperswithcode.com/dataset/video-localized-narratives

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17🔥6❤2

8.81K viewsedited 09:21

Machinelearning

📡

Learning Visual Representations via Language-Guided Sampling

New approach deviates from image-text contrastive learning by relying on pre-trained language models to guide the learning rather than minimize a cross-modal similarity.

Новый альтернативный подход к визуальному обучению: с использованием языкового сходства для выборки семантически схожих пар изображений.

🖥

Github: https://github.com/mbanani/lgssl

⭐️

Paper: https://arxiv.org/abs/2302.12248v1

⏩

Pre-trained Checkpoints: https://www.dropbox.com/sh/me6nyiewlux1yh8/AAAPrD2G0_q_ZwExsVOS_jHQa?dl=0

💻

Dataset : https://paperswithcode.com/dataset/redcaps

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤2🔥2

9.28K views07:12

Machinelearning

🌐 Как наладить технологии автоматического перевода в своём проекте?

В статье на Хабре Андрей Соколов из команды прикладных исследований ВКонтакте подробно и доступным языком рассказал о том, как они сделали свой переводчик для постов и сообщений в мессенджере. Материал будет полезен для тех, кто тоже хочет попробовать использовать и развернуть переводы у себя в проекте.

Для чтения статьи не потребуется специальный уровень знаний: в ней нет излишних технических подробностей. При этом в ней вы найдёте ссылки на полезные ресурсы и выдержки из интересных источников.

ai_machinelearning_big_data

👍10🔥5❤2

8.77K views09:35

Machinelearning

💡

The ChatGPT Cheat Sheet

Подробная шпаргалка по работе с ChatGpt.

💨

Cheat Sheet

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥5❤1🐳1

11.3K views11:35

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

📃

OccDepth: A Depth-aware Method for 3D Semantic Occupancy Network

Maybe the first academic open work on stereo 3D SSC method with vision-only input.

Первый метод SSC под названием OccDepth, который использует неявную информацию из стереоизображений для восстановления трехмерных геометрических структур.

🖥

Github: https://github.com/megvii-research/occdepth

⭐️

Paper: https://arxiv.org/abs/2302.13540v1

💻

Dataset : https://paperswithcode.com/dataset/nyuv2

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥9❤3

9.54K views07:38

Machinelearning

👁

Deep Contextual Video Compression

A group-based offset diversity where the cross-group interaction is proposed for better context mining.

Официальная реализация Pytorch для нейронного сжатия видео и изображений.

🖥

Github: https://github.com/microsoft/dcvc

⭐️

Paper: https://arxiv.org/abs/2302.14402v1

💻

Dataset : https://paperswithcode.com/dataset/vimeo90k-1

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥3❤2⚡1👎1

8.36K views09:19

Machinelearning

😊 HugNLP

HugNLP is a unified and comprehensive NLP library based on HuggingFace Transformer.

HugNLP — это новая универсальная NLP библиотека основанная на Hugging Face, для повышения удобства и эффективности работы c текстами.

🖥

Github: https://github.com/wjn1996/hugnlp

⏩

Paper: https://arxiv.org/abs/2302.14286v1

⭐️

Dataset: https://paperswithcode.com/dataset/clue

⏩

HF for complex text classification: https://huggingface.co/blog/classification-use-cases

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🤗4🔥2👏2🥰1

9.28K viewsedited 08:15