Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​⚡️Применение методов CRISP-DM для анализа Big Sales Data

В этой статье автор расскажет, как можно провести операцию Reverse Engineering для оптимизации процесса продаж, и какой результат от этого можем получить.

Читать...
​​🤔Построение BI-системы: вы могли об этом забыть…

В этой статье автор расскажет, почему тестирование должно происходить на всех этих этапах, и почему у нас должны быть формализованы детальные требования, на основе которых можно оперативно составить и провести такие тесты, а также вы узнаете почему проблема с уровнем производительности всегда актуальна.

Читать...
​​👤Форматы данных и файлов: руководство для архитекторов

В этой статье автор расскажет, почему раньше для каждого Data Event создавалось по 20 полей, но их количество уже давно перевалило за сотню, и почему данные легко хранить в озере, но в строковых форматах для выполнения запроса нужно просканировать значительный объем данных.

Читать...
​​👾Как построить систему геоаналитики с применением ML

В этой статье мы рассмотрим примеры работы сервисов геоаналитики, и выясним какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Читать...
​​🤖Доменная модель песочницы данных: на чём зиждется Data Fusion

В этой статье автор расскажет, почему в корпоративной архитектуре есть множество инструментов, которые помогают правильно сконфигурировать проект, и как доменная модель может помочь вам разграничить сущности и засетапить внутренние среды для экспериментов.

Читать...
​​⚡️Data-driven рост с помощью науки о данных и машинного обучения

В этой статье автор расскажет, как машинное обучение меняет способы использования данных компаниями для обеспечения прибыльного роста, предоставляя возможность опередить своих конкурентов, и как технологические компании могут ускорить свой рост, приняв пять ведущих практик.

Читать...
​​🧑🏼‍💻Как мы организовали Data Warehouse в MANGO OFFICE

В этой статье мы рассказываем, как реорганизовали в MANGO OFFICE корпоративное хранилище данных: какие проблемы решали, какие точки роста находили и какой получился результат.

Читать...
​​😶‍🌫️Мигрируем с Qlik: как создать надежное хранилище для ваших данных

В этой статье автор расскажет об опыте миграции с такого известного BI‑инструмента, как Qlik.

Читать...
​​🔥Актуальные подходы к ETL. Или EL-T? Технологический разбор

В этой статье автор рассмотрит актуальные подходы к созданию данных решений и расскажет о двух проектах, где они были реализованы нестандартными способами.

Читать...
​​👤Как создать платформу для управления 50 000 сотрудниками в ритейле при помощи частного облака

В этой статье автор расскажет, как отслеживать эффективность сотрудников по всей стране, хранить терабайты данных и поддерживать доступность сервиса на высоком уровне.

Читать...
​​⚡️Борьба за открытый исходный код: BI-шоудаун на вебинаре «Open-source vs пропиетарный BI»

В этой статье автор расскажет, почему BI с открытым исходным кодом может быть ключевым моментом принятия решения в пользу open-source BI, и почему перед тем как писать sql запрос надо создавать правильное хранение данных.

Читать...
​​👦Объясните так, как будто мне 10 лет: простое описание популярного алгоритма кластеризации k-средних

В статье объясним всем новичкам в мире алгоритмов машинного обучения принципы работы алгоритма K-means (k-средних), пользующегося большой популярностью при решении задач кластеризаци.

Читать...
​​📊Что такое Data Science: объясняем простыми словами

В этой статье разберемся с критическим определением этой отрасли и лучше поймем ее актуальность в современном обществе.

Читать...
​​😶‍🌫️8 паттернов проектирования, которые должен знать каждый ML-разработчик

В этой статье мы рассмотрим 8 паттернов проектирования с примерами кода на Python.

Читать...
​​📊ТОП-30 ресурсов с данными для машинного обучения

В этом материале мы расскажем о некоторых ресурсах с предобработанной «датой», которую вы можете использовать в своей работе.

Читать...
​​​​😵Структурирование кредитного портфеля методами машинного обучения

В этой статье автор расскажет, зачем кредитные организации естественным образом располагают большими портфелями клиентских кредитов, и почему разбиения кредитного портфеля на более однородные по качеству кредитов под-портфели встречается в финансах уже очень давно, а также вы узнаете почему для задачи структуризации кредитного портфеля, применимость таких методов машинного обучения как кластеризация, классификация или различные версии деревьев очень ограничена.

Читать...
​​👾CI/CD в Data Science, MLOps в финтехе и тенденции в потоковой передаче данных

В этой статье автор расскажет о основах концепции CI/CD и объяснить, какую роль могут играть ее практики в улучшении аналитических процессов.

Читать...
​​🤔Как сэкономить свои нервы и деньги компании на перестроении структуры больших таблиц без простоя в PostgreSQL

В этой статье автор расскажет, как можно сэкономить время разработчика, администратора баз данных и ресурсы сервера, используя утилиту pg_rebuild_table.

Читать...
​​⚡️ClickHouse: полезные лайфхаки

В этой статье автор расскажет что такое ClickHouse и почему он считает его идеально подходящим мощным инструментом для аналитики.

Читать...
​​🧑🏼‍💻ClickHouse в ритейловом проекте

В этой статье автор расскажет, как развивается it-продукт в ритейле, откуда появилась потребность в инструменте, подобном ClickHouse, и как проходило RnD для его внедрения.

Читать...
​​👤Медленно меняющиеся измерения (SCDs) в эпоху облачного хранилища данных

В этой статье автор расскажет как работать с медленно меняющимися измерениями при использовании облачного хранилища данных.

Читать...