NEW BOT Телеграм, страница - 426932899

Machinelearning

@ai_machinelearning_big_data

348K subscribers

4.54K photos

914 videos

17 files

4.98K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

348K subscribers

Machinelearning

NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection

NeRF-Det - это новый метод обнаружения трехмерных объектов на основе RGB-изображений. В методе NeRF используется для явной оценки 3D-геометрии объекта, что повышает эффективность распознавания.

🖥

Github: https://github.com/facebookresearch/nerf-det

📕

Paper: https://arxiv.org/abs/2307.14620v1

⚡

Project: https://chenfengxu714.github.io/nerfdet/

🔗 Dataset: https://paperswithcode.com/dataset/arkitscenes

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16🔥4❤1

7.49K views10:00

Machinelearning

👗

Fashion Matrix: Editing Photos by Just Talking

Hierarchical AI system called Fashion Matrix dedicated to editing photos by just talking.

Fashion Matrix объединяет различные визуальные и языковые модели и в комплексного ИИ-помощника в области моды.

Система состоит из трех модулей: Fashion Assistant, Fashion Designer и AutoMasker, которые используют LLM в качестве поддержки интеллектуальной обработки текста.

🖥

Github: https://github.com/Zheng-Chong/FashionMatrix

📕

Paper: https://arxiv.org/abs/2307.13240

👁

Video: https://www.youtube.com/watch?v=1z-v0RSleMg&t=3s

⏩

Demo : https://3040fb6b6c32c3715e.gradio.live/

🔗 Dataset: https://paperswithcode.com/dataset/densepose

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16🔥8❤5🤔1

7.43K views09:06

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

📷

Powerful Multi-Task Transformers for Scene Understanding

TaskExpert, a novel multi-task mixture-of-experts model that enables learning multiple representative task-generic feature spaces and decoding task-specific features in a dynamic manner.

Мощные многозадачные модели трансформеров для анализа и понимания сцен.

🖥

Github: https://github.com/prismformore/multi-task-transformer

📕

Paper: https://arxiv.org/abs/2307.15324v1

🔗 State of art: https://paperswithcode.com/sota/monocular-depth-estimation-on-cityscapes-3d?p=joint-2d-3d-multi-task-learning-on-cityscapes

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14🔥4❤1

7.11K views15:02

Machinelearning

Как создавать качественные ML-системы

Команда VK Cloud перевела две статьи о ML-проектах. В первой части подробнее о жизненном цикле, ценности для бизнеса, важности проектной документации и концепциях PoC или MVP.

Во второй части: Data-centric ИИ, данны для обучения, разметка и очистка, синтетические данные, Data Engineering и ETL.

💼

Habr: https://habr.com/ru/companies/vk/articles/749850/

⏩

Habr2: https://habr.com/ru/companies/vk/articles/749852/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤1🔥1😱1

6.92K views08:57

Machinelearning

🦙 ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.

Открытая платформа для обучения, настройки и оценки больших языковых моделей.

git clone git@github.com:OpenBMB/ToolBench.git

🖥

Github: https://github.com/openbmb/toolbench

📕

Paper: https://arxiv.org/abs/2307.16789v1

⭐️

Project: openbmb.github.io/ToolBench/

☑️

Demo: https://github.com/openbmb/toolbench#web-ui

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14❤3🔥1

7.24K views11:02

Machinelearning

⏩

SEED-Bench: Benchmarking Multimodal LLMs with Generative Comprehension

A benchmark for evaluating Multimodal LLMs using multiple-choice questions.

Система генерации вопросов с несколькими вариантами ответов, ориентированных на конкретные параметры оценки, включающая процессы автоматической фильтрации и ручной проверки.

🖥

Github: https://github.com/ailab-cvc/seed-bench

📕

Paper: https://arxiv.org/abs/2307.16125v1

☑️

Dataset: https://paperswithcode.com/dataset/seed-bench

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍4🔥2👏1

7K views19:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.

MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.

🖥

Github: https://github.com/geekan/metagpt

📕

Paper: https://arxiv.org/abs/2308.00352v1

☑️

Roadmap: https://github.com/geekan/MetaGPT/blob/main/docs/ROADMAP.md

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10❤5🔥3

7.24K views11:28

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Unified Model for Image, Video, Audio and Language Tasks

UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks.

Унифицированная модель с для задач обработки изображений, видео, аудио и языка.

🖥

Github: https://github.com/mshukor/unival

📕

Paper: https://arxiv.org/abs/2307.16184

⭐️

Project: https://unival-model.github.io/

☑️

Demo: https://huggingface.co/spaces/mshukor/UnIVAL

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍8🔥4

7.16K views18:45

Machinelearning

⚡️

Improving Pixel-based MIM by Reducing Wasted Modeling Capability

A new method that explicitly utilizes low-level features from shallow layers to aid pixel reconstruction.

MMPreTrain - это набор инструментов для предварительного обучения с открытым исходным кодом, основанный на PyTorch. Он является частью проекта OpenMMLab.

🖥

Github: https://github.com/open-mmlab/mmpretrain

📕

Paper: https://arxiv.org/abs/2308.00261v1

⭐️

Project: mmpretrain.readthedocs.io/en/latest/

☑️

Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤2🔥1🤔1

6.75K views12:02

Machinelearning

Как маленькая нейроязыковая модель победила большую облачную

Разработчики Яндекс Клавиатуры рассказали, как отказались от n-граммной модели и выбрали нейроязыковую, поделились итоговой архитектурой модели и показали, насколько получился прирост по метрике saved keys в разных группах приложениях.

🔗 Хабр: https://habr.com/ru/companies/yandex/articles/751598/

ai_machinelearning_big_data

👍22❤3

6.73K views14:02

Machinelearning

💼

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Qwen-7B outperforms the baseline models of a similar model size, and even outperforms larger models of around 13B parameters, on a series of benchmark datasets.

Большая языковая модель на основе трансформеров, которая предварительно обучена на большом объеме данных, включая веб-тексты, книги, кодексы и т.д.

По сравнению с моделями аналогичного размера, значительно превосходит конкурентов на ряде эталонных датасетов.

Токенизатор модели, включает более 150 к. токенов.

🖥

Github: https://github.com/QwenLM/Qwen-7B

📕

Paper: https://github.com/QwenLM/Qwen-7B/blob/main/tech_memo.md

☑️

Dataset: https://paperswithcode.com/dataset/mmlu

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥4🥰2❤1

7.52K viewsedited 16:09

Machinelearning

🦩 OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

An open-source framework for training large multimodal models.

OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.

OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.

pip install open-flamingo

🖥

Github: https://github.com/mlfoundations/open_flamingo

📕

Paper: https://arxiv.org/abs/2308.01390

⭐️

Demo: https://huggingface.co/spaces/openflamingo/OpenFlamingo

☑️

Dataset: https://paperswithcode.com/dataset/flickr30k

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥4🥰1

15.7K views10:01

Machinelearning

✅

LISA: Reasoning Segmentation via Large Language Model

New segmentation task -- reasoning segmentation. The task is designed to output a segmentation mask given a complex and implicit query text.

LISA раскрывает новые возможности сегментации мультимодальных LLM и позволяет решать сложные задачи рассуждения на знание реального мира.

🖥

Github: https://github.com/dvlab-research/lisa

📕

Paper: https://arxiv.org/abs/2308.00692v2

☑️

Dataset: https://github.com/dvlab-research/lisa#dataset

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥18👍7❤2❤‍🔥1

9.43K views18:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🧍‍♂ Reconstructing Three-Dimensional Models of Interacting Humans

Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.

Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.

🖥

Github: https://github.com/sminchisescu-research/imar_vision_datasets_tools

📕

Paper: https://arxiv.org/abs/2308.01854v1

⭐️

Project: https://ci3d.imar.ro/

☑️

Dataset: https://paperswithcode.com/dataset/chi3d

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21❤2🔥2🥰1

9.01K views08:55