Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🤖Общаемся с базой знаний: как мы улучшили точность генеративных ответов LLM с помощью собственного RAG

В этой статье мы покажем работающие кейсы и синергию подходов, реализованных нами в рамках разработки агента вопросно ответной системы - FractalGPT QA агента.

Читать...
​​👁Машинное зрение для контроля горнодобывающей техники

В этой статье я расскажу, как с помощью нейронки можно считать циклы погрузки на фронтальных погрузчиках.

Читать...
​​👨‍🔬Дежурный data-инженер: рабочие хроники

В этой статье я расскажу о том, как data-инженер принимает вызовы технической команды по работе с платформой данных.

Читать...
​​📒RecTools – OpenSource библиотека для рекомендательных систем

В этой статье я расскажу про библиотеку RecTools, которая собрала в себе все самые необходимые модели, метрики и инструменты для построения рекомендательных систем.

Читать...
​​🐿Введение в Apache Flink: осваиваем фреймворк на реальных примерах

В этой статье рассмотрим пайплайн Kafka‑to‑Kafka, задачу дедупликации событий, использование таймеров и другие примеры.

Читать...
​​👾Компромисс смещения и дисперсии в машинном обучении

В этой статье мы рассмотрим такое понятие в машинном обучении, как компромисс смещения и дисперсии (bias-variance Tradeoff).

Читать...
​​😵Проблема множественного тестирования на практике

В этой статье я расскажу, о проблеме множественного тестирования, методах решения проблемы, и о практическом опыте работы с множественными экспериментами.

Читать...
​​🗣Русский LLM-помощник (saiga) с кэшем, используя RAG (Retrieval-Augmented Generation)

В этой статье, используя технику Retrieval-Augmented Generation ("Поисковая расширенная генерация"), мы настроим русскоязычного бота, который будет отвечать на вопросы потенциальных работников для выдуманного свечного завода.

Читать...
​​📊Обработка результатов статистических наблюдений с помощью толерантных интервалов

В этой статье хочу поделиться личным опытом использования толерантных интервалов для обработки результатов статистических наблюдений, привести некоторые примеры и дать краткое описание процедуры расчета с реализацией на языке Python.

Читать...
​​📷(Более) точное измерение динамического диапазона сенсора камеры

В этой статье поговорим о том, как (более) точно измерять динамический диапазон сенсора камеры и что с этими замерами можно сделать.

Читать...
​​😎Введение в архитектуру MLOps

В этой статье автор расскажет как ускорить разработку и внедрение новых моделей, а также обеспечить их надежную и эффективную работу на всех этапах жизненного цикла.

Читать...
​​👾Добавляем DALL-E 3 в свой ChatGPT бот в Telegram

В этом туториале мы добавим генерацию изображений с помощью DALL-E 3 в наш Telegram чат-бот.

Читать...
​​👨Использование Insightface для быстрого поиска и сравнения лиц на изображениях

В этой статье я рассмотрю кейс поиска «близнецов» в паспортных данных, которые были размещены в pdf‑файлах, насчитывающих десятки, а порой и сотни страниц.

Читать...
​​😵Обзор современных подходов персонализации диффузионных нейронных сетей

В данной статье я расскажу о современных подходах к персонализации text-to-image моделей на базе открытой архитектуры Stable Diffision, а также делюсь техническими подробностями каждого подхода и анализирую их применимость в реальных высоконагруженных системах.

Читать...
​​😶‍🌫️Как расширить компетенции аналитиков при работе с Big Data

В данной статье мы решили рассмотреть вопрос повышения эффективности работы единого хранилища данных компании.

Читать...
​​👤Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

В этой статье поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Читать...
​​Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

Всем доброго времени суток. Я давно обещала выложить сюда подробный гайд на тему того, как можно изучать Machine Learning самостоятельно, не тратя деньги на платные курсы, и, наконец, выполняю свое обещание. Надеюсь, этот гайд станет подсказкой, которая поможет найти правильное направление новичкам, которые хотят погрузиться в нашу область.

Читать...
​​👍5 уровней зрелости MLOps

В этой статье мы рассмотрим пять уровней зрелости MLOps, основанных на лучших практиках Google и Microsoft, обсудим эволюцию от ручного развёртывания до автоматизированных инфраструктур, подчеркнув преимущества, которые приносит каждый уровень.

Читать...
​​🖼Практический пример использования модели детекции изображений

В данной статье автор рассмотрит, как пользоваться моделями детекции изображений на практике.

Читать...
​​🧑‍💻Хакатоним эффективнее: как поднять удаленный сервер MLflow Tracking для команды

В этой статье я расскажу о том, как реализовать удаленный сервер MLflow Tracking, даже если у читателя нет опыта взаимодействия с удаленными виртуальными машинами (ВМ).

Читать...
​​🚀Как оптимизировать процесс привлечения клиентов B2B с помощью методов Продвинутой Аналитики

В этой статье мы поделимся примером первого практического применения Продвинутой Аналитики в процессах стратегического бизнес-планирования численности ресурсов Сети для привлечения клиентов Юридических Лиц.

Читать...