Machinelearning – Telegram
383K subscribers
4.44K photos
855 videos
17 files
4.88K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🦙 ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.

Открытая платформа для обучения, настройки и оценки больших языковых моделей.

git clone git@github.com:OpenBMB/ToolBench.git

🖥 Github: https://github.com/openbmb/toolbench

📕 Paper: https://arxiv.org/abs/2307.16789v1

⭐️Project: openbmb.github.io/ToolBench/

☑️ Demo: https://github.com/openbmb/toolbench#web-ui

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍143🔥1
SEED-Bench: Benchmarking Multimodal LLMs with Generative Comprehension

A benchmark for evaluating Multimodal LLMs using multiple-choice questions.

Система генерации вопросов с несколькими вариантами ответов, ориентированных на конкретные параметры оценки, включающая процессы автоматической фильтрации и ручной проверки.

🖥 Github: https://github.com/ailab-cvc/seed-bench

📕 Paper: https://arxiv.org/abs/2307.16125v1

☑️ Dataset: https://paperswithcode.com/dataset/seed-bench

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍4🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.


MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.

🖥 Github: https://github.com/geekan/metagpt

📕 Paper: https://arxiv.org/abs/2308.00352v1

☑️ Roadmap: https://github.com/geekan/MetaGPT/blob/main/docs/ROADMAP.md

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Unified Model for Image, Video, Audio and Language Tasks

UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks.

Унифицированная модель с для задач обработки изображений, видео, аудио и языка.

🖥 Github: https://github.com/mshukor/unival

📕 Paper: https://arxiv.org/abs/2307.16184

⭐️Project: https://unival-model.github.io/

☑️ Demo: https://huggingface.co/spaces/mshukor/UnIVAL

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥4
⚡️ Improving Pixel-based MIM by Reducing Wasted Modeling Capability

A new method that explicitly utilizes low-level features from shallow layers to aid pixel reconstruction.

MMPreTrain - это набор инструментов для предварительного обучения с открытым исходным кодом, основанный на PyTorch. Он является частью проекта
OpenMMLab.

🖥 Github: https://github.com/open-mmlab/mmpretrain

📕 Paper: https://arxiv.org/abs/2308.00261v1

⭐️Project: mmpretrain.readthedocs.io/en/latest/

☑️ Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥1🤔1
Как маленькая нейроязыковая модель победила большую облачную

Разработчики Яндекс Клавиатуры рассказали, как отказались от n-граммной модели и выбрали нейроязыковую, поделились итоговой архитектурой модели и показали, насколько получился прирост по метрике saved keys в разных группах приложениях.

🔗 Хабр: https://habr.com/ru/companies/yandex/articles/751598/

ai_machinelearning_big_data
👍223
💼 Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Qwen-7B outperforms the baseline models of a similar model size, and even outperforms larger models of around 13B parameters, on a series of benchmark datasets.

Большая языковая модель на основе трансформеров, которая предварительно обучена на большом объеме данных, включая веб-тексты, книги, кодексы и т.д.

По сравнению с моделями аналогичного размера, значительно превосходит конкурентов на ряде эталонных датасетов.

Токенизатор модели, включает более 150 к. токенов.

🖥 Github: https://github.com/QwenLM/Qwen-7B

📕 Paper: https://github.com/QwenLM/Qwen-7B/blob/main/tech_memo.md

☑️ Dataset: https://paperswithcode.com/dataset/mmlu

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥4🥰21
🦩 OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

An open-source framework for training large multimodal models.


OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.

OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.

pip install open-flamingo

🖥 Github: https://github.com/mlfoundations/open_flamingo

📕 Paper: https://arxiv.org/abs/2308.01390

⭐️ Demo: https://huggingface.co/spaces/openflamingo/OpenFlamingo

☑️ Dataset: https://paperswithcode.com/dataset/flickr30k

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4🥰1
LISA: Reasoning Segmentation via Large Language Model

New segmentation task -- reasoning segmentation. The task is designed to output a segmentation mask given a complex and implicit query text.

LISA раскрывает новые возможности сегментации мультимодальных LLM и позволяет решать сложные задачи рассуждения на знание реального мира.

🖥 Github: https://github.com/dvlab-research/lisa

📕 Paper: https://arxiv.org/abs/2308.00692v2

☑️ Dataset: https://github.com/dvlab-research/lisa#dataset

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍72❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🧍‍♂ Reconstructing Three-Dimensional Models of Interacting Humans

Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.

Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.

🖥 Github: https://github.com/sminchisescu-research/imar_vision_datasets_tools

📕 Paper: https://arxiv.org/abs/2308.01854v1

⭐️ Project: https://ci3d.imar.ro/

☑️ Dataset: https://paperswithcode.com/dataset/chi3d

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍212🔥2🥰1
🌉Enhancing Visibility in Nighttime Haze Images Using Guided APSF and Gradient Adaptive Convolution

Experiments demonstrate that our method achieves a PSNR of 30.72dB, outperforming state-of-the-art methods by 14
on GTA5 nighttime haze dataset.

Модель улучшение видимости ночных изображений, путем подавления свечения и усиления слабоосвещенных областей с помощью функции
APSF (Angular Point Spread Function).

🖥 Github: https://github.com/jinyeying/nighttime_dehaze/tree/main

📕 Paper: https://arxiv.org/abs/2308.01738v1

☑️ Dataset: https://www.dropbox.com/sh/7qzmb3y9akejape/AABYf2ZAqn_5vmPsOPg7KqoMa?dl=0

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍215🔥3🖕1
🎲 Anti-Exploration by Random Network Distillation, Tinkoff Research, ICML 2023

We propose a new ensemble-free offline RL algorithm called SAC-RND. We evaluate our method on the D4RL (Fu et al., 2020) benchmark, and show that SAC-RND achieves performance comparable to ensemble-based methods while outperforming ensemble-free approaches.

Ученые из Tinkoff Research открыли новый Offline-RL алгоритм, который показывает SOTA-результаты, сравнимые с ансамблевыми моделями (в некоторых случаях даже лучше), и при этом требует до 20 раз меньше времени на обучение.


🖥 Github: https://github.com/tinkoff-ai/sac-rnd

🤓 Paper: https://proceedings.mlr.press/v202/nikulin23a.html

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍95🤬1
👁‍🗨 PyTorch Toolbox for Image Quality Assessment

An IQA toolbox with pure python and pytorch.

Набор инструментов и датасетов PyTorch для оценки качества изображений, включая LPIPS, FID, NIQE, NRQM(Ma), MUSIQ, NIMA, DBCNN, WaD

🖥 Github: https://github.com/chaofengc/iqa-pytorch

📕 Paper: https://arxiv.org/abs/2308.03060v1

🖥 Colab: https://colab.research.google.com/drive/14J3KoyrjJ6R531DsdOy5Bza5xfeMODi6?usp=sharing

☑️ Dataset: https://paperswithcode.com/dataset/koniq-10k

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍4🔥2😁1
🚀 AgentBench: Evaluating LLMs as Agents.

AgentBench, a multi-dimensional evolving benchmark that currently consists of 8 distinct environments to assess LLM-as-Agent's reasoning and decision-making abilities in a multi-turn open-ended generation setting.

Комплексный бенчмарк для оценки работы LLM агентов.

🖥 Github: https://github.com/thudm/agentbench

📕 Paper: https://arxiv.org/abs/2308.03688v1

☑️ Dataset: https://paperswithcode.com/dataset/alfworld

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥2