Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🧑‍💻Улучшаем покупательский опыт: куда развивать работающую рекомендательную систему

В этой статье автор расскажет о насущных проблемах ML-разработки, делиться подходами к их решению и рассуждает на актуальные темы.

Читать...
​​🤩Улучшаем прогнозы Facebook* Prophet с помощью LightGBM и Optuna

В данной статье автор расскажет о нескольких полезных способах улучшения качества предсказаний модели Facebook Prophet.

Читать...
​​😵PINN (Physics-informed neural networks) и с чем их едят

В этой статье автор расскажет почему реальные физические системы обсчитываются сложными численными методами за очень большое время на суперкомпьютерах.

Читать...
​​👾Эволюция метрик качества машинного перевода. Часть 2

В этой статье автор расскажет об эволюции метрик качества машинного перевода, а также об основных традиционных метриках.

Читать...
​​👨‍💻Data Engineering: концепции, процессы и инструменты

В этой статье мы рассмотрим процесс data engineering, расскажем о его базовых компонентах и инструментах, опишем роль дата-инженера.

Читать...
​​🤔Звериные алгоритмы: какими представителями животного мира вдохновлялись исследователи для создания алгоритмов

В этой статье автор расскажет про алгоритмы, названные в честь различных представителей животного мира.

Читать...
​​🐶Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 1

В этой статье автор расскажет о нынешнем положении специалистов, их проблемах и типичных запросах, с которыми они сталкиваются.

Читать...
​​👾Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана

В этой статье автор расскажет о том, как начинать с малого и быстро отказываться от слабых идей.

Читать...
​​🗣Как мы научили Алису реагировать на быстрые команды

В этой статье я расскажу, что из себя представляет новая функция, как мы её разрабатывали, с какими сложностями столкнулись.

Читать...
​​👤Как создавать качественные ML-системы. Часть 2: приручаем хаос

В этой статье поговорим о Data-centric ИИ, данных для обучения, разметке и очистке, синтетических данных и еще немного о Data Engineering и ETL.

Читать...
​​⚽️Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (5 — 3 место)

В этой статье автор рассмотрит некоторые из решений, которые принесли денежное вознаграждение и золотые медали участникам этого челленджа. 

Читать...
​​🧑‍💻Крестики-Нолики (Tic Tac Toe) с компьютером на Python. Часть 2: шаг к ML

В этой статье автор расскажет о новом программном алгоритме игры человека с компьютером в качестве «Х» или «О» игрока, избегая классического «дерева для конечного числа ходов».

Читать...
​​😶🌫Теория вероятностей в разработке: где применяется и что можно изучить для более глубокого понимания темы

В этой статье автор расскажет кому требуется теория вероятностей с сопутствующими дисциплинами и зачем.

Читать...
​​🧑‍💻Разбираем особенности алгоритмов CatBoost и LightGBM: какой от них профит

В этой статье автор расскажет расскажет вам про особенности алгоритмов CatBoost и LightGBM, для чего они нужны, в чём их фишки и как они облегчают нам работу с данными. 

Читать...
​​🎬Коллаборативная фильтрация vs Рейтинг фильма на Кинопоиске. Мой опыт написания кино рекомендательной системы

В этой статье автор рассмотрит рекомендательные алгоритмы, основанные на методе «Коллаборативной фильтрации».

Читать...
​​🐍Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python

В этой статье автор расскажет как методы уменьшения размерности данных решают проблему, предоставляя меньшее количество измерений (столбцов) при сохранении наиболее важной информации.

Читать...
​​📉Как мы снизили нагрузку на SAP HANA незаметно для пользователей

В этой статье автор расскажет как существенно сэкономить бюджет клиента и сделать период внедрения новых решений практически незаметным для пользователей.

Читать...
​​🐈Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 2

В этой статье автор расскажет, что и в какой степени влияет на качество моделей, а также для дата-сайентистов приведет код Python, который был использован для получения картинок в задании.

Читать...
​​🤖AI доступный каждому разработчику

В этой статье автор расскажет как самому разработать софт, напечатать на 3D-принтере корпуса и собрать свои устройства для взаимодействия с виртуальным ассистентом.

Читать...
​​👾LlamaIndex: создаем AI-бота без боли и страданий

В этой статье автор расскажет о Langchain - мощном инструменте для создания приложений с использованием больших языковых моделей.

Читать...
​​🧑‍💻 Какое качество можно выжать из нейросетевой модели весом менее 20 МБ

Разработчик Яндекс Клавиатуры объяснил, почему команда отказалась от n-граммной модели и выбрала нейроязыковую. Автор разбирает подходы, которые используют Samsung и Google, размышляет на тему LSTM-энкодера в 2023 году и объясняет выбор CNN-эмбеддинга.

Читать…