Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​💰Как оценить объем работ по миграции хранилища данных на Arenadata DB / Greenplum: методика и пример

В этой статье я расскажу о том, как можно уменьшить стоимость владения хранилищами данных, построенных на западных технологиях.

Читать...
​​⭐️Краткое руководство по работе с данными с помощью Miller

В этой статье я расскажу о Miller — автономном, легковесном и мощном интерфейсе командной строки (Command Line Interface, CLI) для работы с данными в форматах CSV, JSON и некоторых других.

Читать...
​​📌 Как обучают нейросеть, которая помогает беспилотным автомобилям планировать движение и предсказывать действия других объектов на дороге

В этой статье автор из Яндекса объясняет, как нейросети помогают беспилотным автомобилям планировать движение, как работает система восприятия, как обучать такую модель и в чём проблема подхода. Автор рассказал, в чём преимущества машинного обучения перед эвристиками и чем может помочь Reinforcement Learning. 

Читать…
​​🥸Исследование моделирования и развития гибкости на стадии проектирования производственной системы

В этой статье рассматриваются проблемы оценки гибкости для принятия решений с помощью метода оценки на основе цифрового двойника, который моделирует, прогнозирует и оценивает гибкость определенной схемы проектирования производственной системы (PSDS).

Читать...
​​📊Статистика по финансовым рынкам или будни дата-аналитика

В этой статье я покажу, как можно поиграть с данными, посмотреть статистику и понаблюдать за динамикой выбранных показателей.

Читать...
​​🛠Обслуживание моделей PyTorch с помощью TorchServe

В этой статье автор расскажет о том, как создавать и развертывать собственные модели PyTorch в производстве с помощью TorchServe.

Читать...
​​Построение пайплайна обработки данных в реальном времени с использованием Python

В этой статье мы рассмотрим как построить пайплайн обработки данных в реальном времени с использованием Python.

Читать...
​​😶🌫Построение пайплайна анализа данных в реальном времени с помощью Airbyte, Kafka и Pinot

В этой статье рассматриваются три популярных продукта с открытым исходным кодом в области данных: Airbyte, Apache Kafka и Apache Pinot, для создания пользовательского дашборда электронной коммерции, который обновляется в режиме реального времени.

Читать...
​​😵‍💫Платформа для анализа данных за вечер

В этой статье я расскажу, как всего за час (или почти) подготовить облачное окружение, создать свою небольшую платформу для анализа данных и спарсить весь Hugging Face.

Читать...
​​👁Руководство по масштабированию MLOps

В этом руководстве автор рассмотрит структуру и этапы развития для своей команды.

Читать...
​​👀Анализ и визуализация данных с помощью библиотеки Altair

В этой статье автор расскажет как с ее помощью вы можете создавать информативные и интерактивные визуализации для вашего анализа данных и проектов.

Читать...
​​✍️Пишем приложение на Python для интерактивной визуализации графов с NetworkX, Plotly и Dash

В этой статье автор расскажет как написать приложения на Python для интерактивной визуализации графов.

Читать...
​​🛣Детекция дефектов дорожного покрытия без размеченных данных: Хакатон, LiDAR, RANSAC, ICP и 44 бесcонных часов

В этой статье я расскажу о том, как мы использовали данные с LiDAR, применяли различные алгоритмы для обработки и анализа информации

Читать...
​​🧳Аналог Tableau LOD в FineBI: 15 типичных кейсов

В этой статье рассмотрел решение 15 типичных кейсов в Tableau и FineBI, провел сравнение инструментов, а также сделал вывод относительно их преимуществ и недостатков.

Читать...
​​📖Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI

В этой статье мы расскажем, что такое план запроса, как его смотреть, и что делать, чтобы уточнить узкие места в расчётах.

Читать...
​​📈Как выбрать свое направление в аналитике?

В данной статье мы рассмотрим различные виды аналитических направлений, и какое из них может быть наиболее подходящим для вас.

Читать...
​​💾Полезные методы работы с данными в Pandas. Часть 1

В этой статье мы рассмотрим различные функции и техники для таких задач, как разделение данных на интервалы, квантильное разделение, применение скользящих окон для вычислений, смещение данных для временных рядов, преобразование вложенных структур данных, нормализация сложных JSON-структур и управление многоуровневыми индексами при работе с DataFrame и Series.

Читать...
​​💾Полезные методы работы с данными в Pandas. Часть 2

В этой статье мы погрузимся в применение скользящих окон для вычислений и смещение данных для анализа временных рядов.

Читать...
​​❄️Контроль за дрейфами предсказательных моделей и Popmon

В данной статье я расскажу, что такое дрейф моделей, почему важно следить за ними, и как это можно сделать с помощью библиотеки Popmon.

Читать...
​​🤖Опенсорс-библиотеки для Python: 40+ вариантов, как упростить жизнь начинающего дата-сайентиста

В этой статье автор рассмотрит опенсорсные библиотеки Python, сгруппированные по областям практического применения.

Читать...
​​🧐Airflow vs NiFi: исследуем оркестратор для формирования витрин данных

В этой статье мы рассмотрим два известных инструмента: Airflow и NiFi, а также постараемся выявить их сильные и слабые стороны.

Читать...