Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🤔Как мы делали скоринг на микросервисной архитектуре руками не-программистов

В этой статье автор расскажет, почему во многих чувствительных областях нейросети никогда не заменят человека, и почему становится стандартом постепенный переход к микросервисной архитектуре, а также вы узнаете почему ключевая проблема заключалась в совмещении разных языков программирования.

Читать...
​​😎Семантический слой для Аналитики ключевых метрик – dbt Metrics vs. Cube

В этой статье автор рассмотрит что такое семантический слой, и в чем разница между Метрикой и Витриной данных.

Читать...
​​🤫Чей DAX сильнее? …или почему каждый пользователь должен влиять на развитие платформы

В этой статье автор расскажет о том, каким образом можно развивать платформу и откуда появляются новые функции в Visiology.

Читать...
​​😲Почему Trino такой быстрый: архитектура оптимизатора SQL-запросов

В данной статье мы рассмотрим, как устроен оптимизатор запросов в массивно-параллельном аналитическом SQL-движке Trino.

Читать...
​​😎Профилирование данных из СУБД Oracle с помощью DataHub и Great Expectations. Часть 2

В этой мы рассмотрим подключение Great Expectations к DBMS Oracle, сделаем ряд проверок качества данных, а также отправим результаты проверок в DataHub.

Читать...
​​🚀Оптимизации работы Jupyter notebook при помощи параллельных вычислений

В данном статье я расскажу о возможностях применения параллельных вычислений в интерактивной среде Jupyter notebook языка Python.

Читать...
​​😎Спиливаем spill-ы

В этой статье рассмотрим, из-за чего Spill-ы в принципе возникают, разберем несколько видов Spill-ов, и как решить эту проблему.

Читать...
​​🧐ML System Design: основные способы деплоя и тестирования моделей машинного обучения в продакшене

В этой статье автор разберет популярные паттерны проектирования ML-систем, а также вы узнаете какой способ выбрать для деплоя модели в production.

Читать...
​​🚀Почему Trino такой быстрый: динамические фильтры

В этой статье автор расскажет, почему аналитические запросы часто содержат операции Join и сканируют таблицы большого размера, и как наличие динамических фильтров позволяет существенно сократить объем обрабатываемой информации, а также вы узнаете как динамические фильтры могут быть использованы, чтобы уменьшить количество данных, доставляемых до оператора Join.

Читать...
​​😎Распознаем лючки бензобаков

В этой статье автор расскажет как сделать распознавании лючка горловины топливного бака.

Читать...
​​😵‍💫Interpretability versus explainability: Интерпретируемость или объяснимость?

В этой статье автор покажет разницу между explainable AI и interpreted AI, приведет примеры и небольшой монолог на тему: "что всё-таки важнее".

Читать...
​​🤓Как мы с помощью Kubeflow Pipelines оптимизировали обучение ML-моделей

В этой статье автор расскажет чем Kubeflow Pipelines может быть полезен ML-специалисту и как в нём без потери существующей кодовой базы можно запускать готовые пайплайны.

Читать...
​​😎Эволюция метрик качества машинного перевода — Часть 1

В этой статье автор расскажет об итогах своего погружения в тему: какие существуют метрики качества машинного перевода, как они эволюционировали и какие из них на сегодняшний день наиболее адекватны.

Читать...
​​🧐Sarsa: алгоритм, основные принципы и применение

В данной статье мы рассмотрим определение SARSA и обсудим его значимость в области искусственного интеллекта и машинного обучения.

Читать...
​​🤔Прогноз покупки страховки клиентами туроператора

В этой статье автор расскажет о своем проекте, в котором можно сделать прогноз покупки страховки клиентами туроператора методами ML.

Читать...
​​😵‍💫YandexGPT в Браузере: как мы учили модель суммаризировать статьи

В этой статье автор расскажет через что пришлось пройти команде, чтобы модель начала делать то, что от неё ожидают.

Читать...
​​👤Тестирование ML-моделей. От «пробирки» до мониторинга боевых данных

Из этой статьи вы узнаете, почему важно проводить «лабораторные испытания» ML-моделей, и зачем в тестировании наработок «ученых по данным» должны участвовать эксперты из предметной области, а также — как выглядят тесты после того, как модель покинула датасайнтистскую лабораторию.

Читать...
​​🤔Применение метода взаимной информации в медицинских задачах классификации многомерных временных рядов

В данной статье автор расскажет про часть задачи, касающуюся применения полной взаимной информации, как меры ассоциации между несколькими случайными величинами.

Читать...
​​🚀Фигуры Matplotlib и стиль Cyberpunk: несколько строк кода — и готова красивая фигура

В этой статье автор рассказывает, как загрузить Matplotlib, настроить, и где его можно применять.

Читать...
​​🤔Kaggle — практическое изучение Big Data. Что это за платформа, и как она работает

В этой статье автор расскажет о том, как всё это работает, в каких соревнованиях можно участвовать и какие вообще возможности предоставляет платформа участникам.

Читать...