🦙 ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs
🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.
Открытая платформа для обучения, настройки и оценки больших языковых моделей.
🖥 Github: https://github.com/openbmb/toolbench
📕 Paper: https://arxiv.org/abs/2307.16789v1
⭐️ Project: openbmb.github.io/ToolBench/
☑️ Demo: https://github.com/openbmb/toolbench#web-ui
ai_machinelearning_big_data
🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.
Открытая платформа для обучения, настройки и оценки больших языковых моделей.
git clone git@github.com:OpenBMB/ToolBench.gitai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14❤3🔥1
A benchmark for evaluating Multimodal LLMs using multiple-choice questions.
Система генерации вопросов с несколькими вариантами ответов, ориентированных на конкретные параметры оценки, включающая процессы автоматической фильтрации и ручной проверки.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍4🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework
MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.
MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.
🖥 Github: https://github.com/geekan/metagpt
📕 Paper: https://arxiv.org/abs/2308.00352v1
☑️ Roadmap: https://github.com/geekan/MetaGPT/blob/main/docs/ROADMAP.md
ai_machinelearning_big_data
MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.
MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Unified Model for Image, Video, Audio and Language Tasks
UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks.
Унифицированная модель с для задач обработки изображений, видео, аудио и языка.
🖥 Github: https://github.com/mshukor/unival
📕 Paper: https://arxiv.org/abs/2307.16184
⭐️ Project: https://unival-model.github.io/
☑️ Demo: https://huggingface.co/spaces/mshukor/UnIVAL
ai_machinelearning_big_data
UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks.
Унифицированная модель с для задач обработки изображений, видео, аудио и языка.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍8🔥4
A new method that explicitly utilizes low-level features from shallow layers to aid pixel reconstruction.
MMPreTrain - это набор инструментов для предварительного обучения с открытым исходным кодом, основанный на PyTorch. Он является частью проекта OpenMMLab.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥1🤔1
Как маленькая нейроязыковая модель победила большую облачную
Разработчики Яндекс Клавиатуры рассказали, как отказались от n-граммной модели и выбрали нейроязыковую, поделились итоговой архитектурой модели и показали, насколько получился прирост по метрике saved keys в разных группах приложениях.
🔗 Хабр: https://habr.com/ru/companies/yandex/articles/751598/
ai_machinelearning_big_data
Разработчики Яндекс Клавиатуры рассказали, как отказались от n-граммной модели и выбрали нейроязыковую, поделились итоговой архитектурой модели и показали, насколько получился прирост по метрике saved keys в разных группах приложениях.
🔗 Хабр: https://habr.com/ru/companies/yandex/articles/751598/
ai_machinelearning_big_data
👍22❤3
Qwen-7B outperforms the baseline models of a similar model size, and even outperforms larger models of around 13B parameters, on a series of benchmark datasets.
Большая языковая модель на основе трансформеров, которая предварительно обучена на большом объеме данных, включая веб-тексты, книги, кодексы и т.д.
По сравнению с моделями аналогичного размера, значительно превосходит конкурентов на ряде эталонных датасетов.
Токенизатор модели, включает более 150 к. токенов.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥4🥰2❤1
🦩 OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models
An open-source framework for training large multimodal models.
OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.
OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.
🖥 Github: https://github.com/mlfoundations/open_flamingo
📕 Paper: https://arxiv.org/abs/2308.01390
⭐️ Demo: https://huggingface.co/spaces/openflamingo/OpenFlamingo
☑️ Dataset: https://paperswithcode.com/dataset/flickr30k
ai_machinelearning_big_data
An open-source framework for training large multimodal models.
OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.
OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.
pip install open-flamingoai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4🥰1
New segmentation task -- reasoning segmentation. The task is designed to output a segmentation mask given a complex and implicit query text.
LISA раскрывает новые возможности сегментации мультимодальных LLM и позволяет решать сложные задачи рассуждения на знание реального мира.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍7❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🧍♂ Reconstructing Three-Dimensional Models of Interacting Humans
Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.
Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.
🖥 Github: https://github.com/sminchisescu-research/imar_vision_datasets_tools
📕 Paper: https://arxiv.org/abs/2308.01854v1
⭐️ Project: https://ci3d.imar.ro/
☑️ Dataset: https://paperswithcode.com/dataset/chi3d
ai_machinelearning_big_data
Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.
Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21❤2🔥2🥰1
🌉Enhancing Visibility in Nighttime Haze Images Using Guided APSF and Gradient Adaptive Convolution
Experiments demonstrate that our method achieves a PSNR of 30.72dB, outperforming state-of-the-art methods by 14
on GTA5 nighttime haze dataset.
Модель улучшение видимости ночных изображений, путем подавления свечения и усиления слабоосвещенных областей с помощью функции APSF (Angular Point Spread Function).
🖥 Github: https://github.com/jinyeying/nighttime_dehaze/tree/main
📕 Paper: https://arxiv.org/abs/2308.01738v1
☑️ Dataset: https://www.dropbox.com/sh/7qzmb3y9akejape/AABYf2ZAqn_5vmPsOPg7KqoMa?dl=0
ai_machinelearning_big_data
Experiments demonstrate that our method achieves a PSNR of 30.72dB, outperforming state-of-the-art methods by 14
on GTA5 nighttime haze dataset.
Модель улучшение видимости ночных изображений, путем подавления свечения и усиления слабоосвещенных областей с помощью функции APSF (Angular Point Spread Function).
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21❤5🔥3🖕1
🎲 Anti-Exploration by Random Network Distillation, Tinkoff Research, ICML 2023
We propose a new ensemble-free offline RL algorithm called SAC-RND. We evaluate our method on the D4RL (Fu et al., 2020) benchmark, and show that SAC-RND achieves performance comparable to ensemble-based methods while outperforming ensemble-free approaches.
Ученые из Tinkoff Research открыли новый Offline-RL алгоритм, который показывает SOTA-результаты, сравнимые с ансамблевыми моделями (в некоторых случаях даже лучше), и при этом требует до 20 раз меньше времени на обучение.
🖥 Github: https://github.com/tinkoff-ai/sac-rnd
🤓 Paper: https://proceedings.mlr.press/v202/nikulin23a.html
ai_machinelearning_big_data
We propose a new ensemble-free offline RL algorithm called SAC-RND. We evaluate our method on the D4RL (Fu et al., 2020) benchmark, and show that SAC-RND achieves performance comparable to ensemble-based methods while outperforming ensemble-free approaches.
Ученые из Tinkoff Research открыли новый Offline-RL алгоритм, который показывает SOTA-результаты, сравнимые с ансамблевыми моделями (в некоторых случаях даже лучше), и при этом требует до 20 раз меньше времени на обучение.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍9❤5🤬1
👁🗨 PyTorch Toolbox for Image Quality Assessment
An IQA toolbox with pure python and pytorch.
Набор инструментов и датасетов PyTorch для оценки качества изображений, включая LPIPS, FID, NIQE, NRQM(Ma), MUSIQ, NIMA, DBCNN, WaD
🖥 Github: https://github.com/chaofengc/iqa-pytorch
📕 Paper: https://arxiv.org/abs/2308.03060v1
🖥 Colab: https://colab.research.google.com/drive/14J3KoyrjJ6R531DsdOy5Bza5xfeMODi6?usp=sharing
☑️ Dataset: https://paperswithcode.com/dataset/koniq-10k
ai_machinelearning_big_data
An IQA toolbox with pure python and pytorch.
Набор инструментов и датасетов PyTorch для оценки качества изображений, включая LPIPS, FID, NIQE, NRQM(Ma), MUSIQ, NIMA, DBCNN, WaD
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍4🔥2😁1
🚀 AgentBench: Evaluating LLMs as Agents.
AgentBench, a multi-dimensional evolving benchmark that currently consists of 8 distinct environments to assess LLM-as-Agent's reasoning and decision-making abilities in a multi-turn open-ended generation setting.
Комплексный бенчмарк для оценки работы LLM агентов.
🖥 Github: https://github.com/thudm/agentbench
📕 Paper: https://arxiv.org/abs/2308.03688v1
☑️ Dataset: https://paperswithcode.com/dataset/alfworld
ai_machinelearning_big_data
AgentBench, a multi-dimensional evolving benchmark that currently consists of 8 distinct environments to assess LLM-as-Agent's reasoning and decision-making abilities in a multi-turn open-ended generation setting.
Комплексный бенчмарк для оценки работы LLM агентов.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥2