Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🧐Airflow vs NiFi: исследуем оркестратор для формирования витрин данных

В этой статье мы рассмотрим два известных инструмента: Airflow и NiFi, а также постараемся выявить их сильные и слабые стороны.

Читать...
​​📊MLOps на примере прогноза движений акций с помощью MLRun

В этой статье автор расскажет о применении MLRun в качестве инструмента MLOps.

Читать...
​​📚Введение в библиотеку Diffusers и диффузионные модели

В этой статье автор расскажет как работать с сотнями предобученных моделей класса Stable Diffusion для создания изображений и аудио.

Читать...
​​😵‍💫О точности вычислений: как не потерять данные в цифровом шуме

В этой статье я рассмотрю процесс потери точности вычислений, а также расскажу в чём же причина ошибок, если железо работает исправно, а в софте нет багов, влияющих на вычисления.

Читать...
​​🥸Kornia — библиотека компьютерного зрения

В этой статье я расскажу о библиотеке для решения задач компьютерного зрения.

Читать...
​​🖥Построение ML-пайплайна для рекомендательной системы с помощью Google Cloud Platform

В этой статье автор рассмотрит опыт по построению end-to-end рекомендательной ML-системы визуального поиска похожих товаров с помощью инструментов, предоставляемых облачной платформой.

Читать...
​​👤Как PaaS решил проблемы стандартизации разработки сервиса одной утилитой

В этой статье автор расскажет, почему этот инструмент так важен для разработчика и что он умеет, а что нет.

Читать...
​​😶🌫MLOps в билайн: как катить машинное обучение в production без ML-инженеров. Часть I

В этой статье речь пойдет о нашем опыте создания ML-платформы, которая помогает дата-сайентистам самостоятельно управлять всем жизненным циклом ML-моделей — от разработки до постановки в production.

Читать...
​​🧠Потоковая обработка данных: анализ альтернативных решений

В этой статья я хочу сделать краткое сравнение между двумя opensource-продуктами Apache Spark и Flink, а также рассказать об одной интересной особенности Spark, которую мы реализовали в коннекторе.

Читать...
​​🦙Как «воспитать ламу» и ускорить ML-эксперименты

В этой статье мы рассмотрели проведение ML-экспериментов от подготовки данных до деплоя инференс-инстансов.

Читать...
​​👤Каталог данных — почему без него непросто и как всё организовать с максимальной пользой

В этой статье автор расскажет о проблематике работы с данными (и о доверии), и о плюсах, которые даст вам каталог данных.

Читать...
​​🦾Как Guidance выводит ИИ на новый уровень: инструмент для эффективного управления моделями

В данной статье мы рассмотрим его особенности и разберемся, что же это за "зверь".

Читать...
​​💪 Тренды, новые подходы и вызовы в ML-индустрии: онлайн-митап для специалистов в области машинного обучения

Записываем в календари: 25 октября, ML Party, бесплатно по регистрации. Узнаете, как методы обучения с подкреплением позволяют повысить полезность, безопасность и правдивость генеративных моделей. Эксперты Яндекса объяснят, как они группируют предложения магазинов в карточки товаров и при чём тут HNSW и CatBoost, и расскажут о проекте на стыке ML-технологий и ecom-продукта. 

Регистрация…
​​👤Размерности качества данных: обеспечение качества данных с помощью Great Expectations

В этой статье рассматриваются шесть размерностей качества данных: полнота, согласованность, целостность, вневременная актуальность, уникальность и валидность.

Читать...
​​🧐Разметка данных при помощи GPT-4

В этой статье мы расскажем о том, как можно использовать GPT-4 с целью настройки меток для различных задач.

Читать...
​​👤YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее

В этой статье я расскажу как мы в рамках YTsaurus делали его ещё эффективнее.

Читать...
​​🎃Классификация текстов в spaCy: пошаговая инструкция

В этой статье вы узнаете, как реализовать классификатор текстов при помощи библиотеки spaCy, а также несколько полезных лайфхаков, которые помогут ускорить обработку.

Читать...
​​📊Как использовать GPU для ускорения аналитической обработки данных

В этой статье мы расскажем о трех шагах, которые помогут внедрить GPU в работу компании.

Читать...
​​👾Дообучение ruGPT-3.5 13B с LoRA

В данной статье мы разберем каждый этап обучения модели, начиная от подготовки данных и заканчивая конвертацией в формат GGML.

Читать...
​​🗣SAGE: коррекция орфографии с помощью языковых моделей

В этой статье мы расскажем, как решали эту проблему внутри SberDevices, и как это привело к созданию проекта по исследованию задачи коррекции текста.

Читать...
​​🧠Создание искусственного интеллекта для игры Баше без нейронных сетей

В данной статье я хочу раскрыть суть машинного обучения на примере создания искусственного интеллекта

Читать...