Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
633 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🥶Что такое «паралич» сети, и как его избежать?

В этой статье мы рассмотрим проблему, причины ее возникновения и показать несколько решений.

Читать...
​​💱Python Multiprocessing. Обмен данными между процессами. Передача объектов пользовательских классов

В этой статье описаны различные способы обмена данными между процессами в Python с помощью модуля Multiprocessing.

Читать...
​​⚡️RabbitMQ как способ масштабирования ML проекта

В этой статье автор расскажет о проблеме масштабирования ML проектов и предлагается использовать RabbitMQ в качестве брокера сообщений для разграничения модели и серверной части проекта.

Читать...
​​🔋Новые горизонты производства электроники и солнечных батарей: оптимизация мультикристаллических материалов с помощью ML

В данной статье я расскажу, какое решение данной проблемы было найдено исследователями, и для сравнения опишу современные используемые методы для определения кристаллографических ориентаций в мультикристаллических материалах.

Читать...
​​👥Продюсеры и консьюмеры с Apache Kafka в Python

В этой статье мы поговорим о продюсерах и консюмерах в экосистеме Kafka в коннекте с Python.

Читать...
​​MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer

Система преобразования текста в звук от FAIR с открытым исходным кодом.

👉 Code - ссылка
👉 HF - ссылка
👉 Paper - ссылка
👉 Project - ссылка
👉 Datasets - ссылка

Удачи в экспериментах!
​​🧑‍💼Какие ML-платформы нужны бизнесу, и кто их может сделать

В этой статье автор расскажет о том, какие задачи можно решить с помощью машинного обучения.

Читать...
​​🧑‍💻Пишем Ansible-модули для управления разными системами хранения данных через Swordfish

В этой статье я расскажу о проекте, который мы выполняли с инженерами компании и преподавателями университета.

Читать...
​​📁Как мы внедряли каталог данных DataHub и искали компромисс между BI, DWH и ИБ

В этой статье делюсь нашим опытом внедрения DataHub’a и планами на дальнейшее развитие инструмента.

Читать...
​​😎ИИ и прогнозирование микроэлементов для борьбы с загрязнением воды

В данной статье мы рассмотрим уникальный подход команды KIST, объединяющий в себе методы самоорганизующихся карт (SOM) для кластеризации и случайных лесов (RFC) в машинном обучении для прогнозирования свойств и поведения микроэлементов.

Читать...
​​⚡️YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

В этой статье мы попробуем разобраться, что же за магия скрывается внутри новой архитектуры.

Читать...
​​👤Adversarial suffixes или можно ли получить ответ на любой вопрос от LLM?

В этой статье мы поговорим о применении суффиксов из материалов, описанных на llm-attacks.org, к популярным open-source моделям и проверить наиболее популярные модели на устойчивость к потенциально опасным запросам.

Читать...
​​🤖Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

В данной статье показывается, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость генерации примерно в 20 раз.

Читать...
​​😶🌫Parameter-Efficient Fine-Tuning (PEFT): методы LoRA, Prefix tuning, Prompt tuning и Adapters

В этой статье мы рассмотрим общую концепцию PEFT, его преимущества и основные методы.

Читать...
​​🗣Lingua Franca — Машинный перевод с учётом именованных сущностей для вопросно-ответных систем

В данной статье мы рассмотрим наш метод машинного перевода, учитывающий именованные сущности, под названием «Lingua Franca».

Читать...
​​👀Компьютерное зрение сквозь года

В этой статье я хочу привести примеры нейросетевых моделей, характерных для различных этапов становления области компьютерного зрения (далее - CV) в том виде, в котором мы его знаем сейчас.

Читать...
​​🤖Иерархия ИИ-потребностей

В этой статье вы узнаете о том, как использовать ИИ и машинное обучение, чтобы лучше справляться с тем, что мы делаем.

Читать...
​​⚡️Два сапога — пара, а три — уже community: как алгоритмы на графах помогают собирать группы товаров

В этой статье мы обсудим кластеризацию на графах, задачу выделения сообществ, распад карате-клуба, self-supervised и unsupervised задачи — и как всё это связано с матчингом.

Читать...
​​🧠Даем нейросотрудникам на базе ChatGPT настоящую постоянную память

В этой статье мы рассмотрим один из возможных подходов к организации такой памяти для наших нейросотрудников.

Читать...
​​👤Делаем intent classifier для службы поддержки без доменного датасета на русском

В этой статье я продемонстрирую, как без собственного датасета сделать классификатор намерений пользователя для службы поддержки в сфере e-commerce.

Читать...
​​🧐Почему нельзя сделать прогноз CLTV с помощью одной модели

В статье я расскажу что это за задача CLTV и для чего ее нужно решать банкам.

Читать...