Machinelearning – Telegram
383K subscribers
4.44K photos
856 videos
17 files
4.88K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
💼 Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Qwen-7B outperforms the baseline models of a similar model size, and even outperforms larger models of around 13B parameters, on a series of benchmark datasets.

Большая языковая модель на основе трансформеров, которая предварительно обучена на большом объеме данных, включая веб-тексты, книги, кодексы и т.д.

По сравнению с моделями аналогичного размера, значительно превосходит конкурентов на ряде эталонных датасетов.

Токенизатор модели, включает более 150 к. токенов.

🖥 Github: https://github.com/QwenLM/Qwen-7B

📕 Paper: https://github.com/QwenLM/Qwen-7B/blob/main/tech_memo.md

☑️ Dataset: https://paperswithcode.com/dataset/mmlu

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥4🥰21
🦩 OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

An open-source framework for training large multimodal models.


OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.

OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.

pip install open-flamingo

🖥 Github: https://github.com/mlfoundations/open_flamingo

📕 Paper: https://arxiv.org/abs/2308.01390

⭐️ Demo: https://huggingface.co/spaces/openflamingo/OpenFlamingo

☑️ Dataset: https://paperswithcode.com/dataset/flickr30k

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4🥰1
LISA: Reasoning Segmentation via Large Language Model

New segmentation task -- reasoning segmentation. The task is designed to output a segmentation mask given a complex and implicit query text.

LISA раскрывает новые возможности сегментации мультимодальных LLM и позволяет решать сложные задачи рассуждения на знание реального мира.

🖥 Github: https://github.com/dvlab-research/lisa

📕 Paper: https://arxiv.org/abs/2308.00692v2

☑️ Dataset: https://github.com/dvlab-research/lisa#dataset

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍72❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🧍‍♂ Reconstructing Three-Dimensional Models of Interacting Humans

Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.

Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.

🖥 Github: https://github.com/sminchisescu-research/imar_vision_datasets_tools

📕 Paper: https://arxiv.org/abs/2308.01854v1

⭐️ Project: https://ci3d.imar.ro/

☑️ Dataset: https://paperswithcode.com/dataset/chi3d

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍212🔥2🥰1
🌉Enhancing Visibility in Nighttime Haze Images Using Guided APSF and Gradient Adaptive Convolution

Experiments demonstrate that our method achieves a PSNR of 30.72dB, outperforming state-of-the-art methods by 14
on GTA5 nighttime haze dataset.

Модель улучшение видимости ночных изображений, путем подавления свечения и усиления слабоосвещенных областей с помощью функции
APSF (Angular Point Spread Function).

🖥 Github: https://github.com/jinyeying/nighttime_dehaze/tree/main

📕 Paper: https://arxiv.org/abs/2308.01738v1

☑️ Dataset: https://www.dropbox.com/sh/7qzmb3y9akejape/AABYf2ZAqn_5vmPsOPg7KqoMa?dl=0

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍215🔥3🖕1
🎲 Anti-Exploration by Random Network Distillation, Tinkoff Research, ICML 2023

We propose a new ensemble-free offline RL algorithm called SAC-RND. We evaluate our method on the D4RL (Fu et al., 2020) benchmark, and show that SAC-RND achieves performance comparable to ensemble-based methods while outperforming ensemble-free approaches.

Ученые из Tinkoff Research открыли новый Offline-RL алгоритм, который показывает SOTA-результаты, сравнимые с ансамблевыми моделями (в некоторых случаях даже лучше), и при этом требует до 20 раз меньше времени на обучение.


🖥 Github: https://github.com/tinkoff-ai/sac-rnd

🤓 Paper: https://proceedings.mlr.press/v202/nikulin23a.html

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍95🤬1
👁‍🗨 PyTorch Toolbox for Image Quality Assessment

An IQA toolbox with pure python and pytorch.

Набор инструментов и датасетов PyTorch для оценки качества изображений, включая LPIPS, FID, NIQE, NRQM(Ma), MUSIQ, NIMA, DBCNN, WaD

🖥 Github: https://github.com/chaofengc/iqa-pytorch

📕 Paper: https://arxiv.org/abs/2308.03060v1

🖥 Colab: https://colab.research.google.com/drive/14J3KoyrjJ6R531DsdOy5Bza5xfeMODi6?usp=sharing

☑️ Dataset: https://paperswithcode.com/dataset/koniq-10k

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍4🔥2😁1
🚀 AgentBench: Evaluating LLMs as Agents.

AgentBench, a multi-dimensional evolving benchmark that currently consists of 8 distinct environments to assess LLM-as-Agent's reasoning and decision-making abilities in a multi-turn open-ended generation setting.

Комплексный бенчмарк для оценки работы LLM агентов.

🖥 Github: https://github.com/thudm/agentbench

📕 Paper: https://arxiv.org/abs/2308.03688v1

☑️ Dataset: https://paperswithcode.com/dataset/alfworld

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥2
🪄Optimizing a Text-To-Speech model using 🤗 Transformers

В этом руководстве показано как можно оптимизировать Bark, модель Text-To-Speech (TTS), на основе трех библиотек из экосистемы Hugging face: Transformers, Optimum и Accelerate.

🤗 Post: https://huggingface.co/blog/optimizing-bark

🖥 Colab: https://colab.research.google.com/github/ylacombe/notebooks/blob/main/Benchmark_Bark_HuggingFace.ipynb

⭐️ Bark: https://huggingface.co/docs/transformers/main/en/model_doc/bark#overview

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112🔥1
SSLRec: A Self-Supervised Learning Library for Recommendation

SSLRec, a novel benchmark platform that provides a standardized, flexible, and comprehensive framework for evaluating various SSL-enhanced recommenders.

SSLRec - это фреймворк основанный на PyTorch с открытым исходным кодом для рекомендательных систем, усовершенствованных с помощью self-supervised learning.

Он удобен в использовании и содержит датасеты код для обработки данных, обучения, тестирования, оценки, а также современные исследовательские модели.

SSLRec предлагает широкий набор полезных функций и простой в использовании интерфейс, упрощающий разработку и оценку рекомендательных моделей.


🖥 Github: https://github.com/hkuds/sslrec

📕 Paper: https://arxiv.org/abs/2308.05697v1

Models: https://github.com/HKUDS/SSLRec/blob/main/docs/Models.md

☑️ Datasets: https://github.com/HKUDS/SSLRec/blob/main/docs/Models.md

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍203🔥2🥰2🤯1🤩1
👨‍🎓Harvard CS50’s Artificial Intelligence with Python – Full University Course

В этом бесплатном курсе Гарвардского университета рассматриваются концепции и алгоритмы, лежащие в основе современного искусственного интеллекта.

🎞 Video
📌 Course resources

#бесплатныекурсы

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥98🥱3
Top 100+ Machine Learning Projects for 2023 [with Source Code]

В этой статье вы найдете 100+ лучших проектов и идей в области машинного обучения, которые будут полезны как начинающим, так и опытным специалистам.

📌 Projects

ai_machinelearning_big_data
👍22🔥5😁42🥰1🤯1
В июле прошли ИТ-соревнования IT’s Tinkoff Capture the Flag. На нашей памяти это одни из самых необычных соревнований

Почему это было круто?

Креативные задания, основанные на трендах массовой культуры и мемах (да, вам не показалось)
6863 команды из 13 городов России и Беларуси
Офлайн и онлайн формат
Первые соревнования по спортивному хакингу для всех ИТ-спецов

Таких заданий еще никто раньше не делал. Вот например:

«Галя, у нас отмена», — отчаянно кричит продавщица. Очередь из покупателей уходит за горизонт. «Молодой человек, второй год зову Галю, а ее все нет и нет — вон какая очередь. Может, просто взломаем программу, а?».‎ Разберитесь в магазинном софте и сделайте отмену.‎»‎
👍158🖕2
⚡️🧑‍💻 Awesome AI-Powered Developer Tools

Это список инструментов для разработчиков, основанных на искусственном интеллекте. Эти инструменты используют ИИ для помощи разработчикам в решении таких задач, как написание кода, рефакторинг, отладка, создание документации и т. д.

Githib

ai_machinelearning_big_data
16👍6🔥2🦄1