Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🔥Преобразование табличных данных в Python

В этой статье мы сравним четыре популярных: Pandas (любимчик публики), Polars (конкурент Pandas) , PyArrow (low level columnar) и DuckDB (в него встроен SQL).

Читать...
​​🤓BI-аналитика на коленке: делаем веб-аналитику в DataLens

В этой статье я расскажу как мы разработали open-source калькулятор размера выборки ABnTester.

Читать...
​​😶🌫Modus BI Cloud: работа с данными в облаке

В этой статье расскажу о том, как работают с данными облачные решения, например, наш Modus BI Cloud.

Читать...
​​⚡️Неструктурированные данные: примеры, инструменты, методики и рекомендации

В этой статье мы рассмотрим разные типы данных, варианты хранения и управления ими, а также различные методики и инструменты для анализа неструктурированных данных.

Читать...
​​Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (1 и 2 место)

В этой статье разберем подходы призеров Kaggle-соревнований от американской национальной футбольной лиги (NFL).

Читать...
​​Департамент информационных технологий города Москвы ищет аналитика Data Science.

Ты: любишь искать закономерности и строить прогнозные модели на основе больших данных, владеешь Python (DS-библиотек), у тебя есть знания и опыт в Machine Learning и владение различными инструментами визуализации данных?

У нас: задачи городского масштаба, конкурентная зарплата и премии, обучение и профессиональный рост!

Направляй свое резюме @sergey_job и присоединяйся к команде Департамента информационных технологий, чтобы сделать город еще комфортнее.
​​😕Overdetection или SFTE. Другие возможности применения YOLO

В этой статье покажу как «переформулировать» задачу детекции так, чтобы решать другие, более сложные задачи.

Читать...
​​🧐Опыт PT: BI на страже кибербезопасности

В этой статье автор поговорит о том, как можно применить BI, а также оценить роль, которую BI играет в цифровой трансформации компании.

Читать...
​​👱‍♂Создайте свой клон с помощью Fine-tuned LLM

В этой статье автор расскажет, как сделать так чтобы модель научилась говорить в моем стиле, подражая, используя шутки, фразочки и слова.

Читать...
​​🤔Почему ONNX так популярен в ML: конвертации, утилиты и инференс

В этой статье расскажу об ONNX и о том, почему этот формат данных широко используется.

Читать...
​​👥Как мы пришли к созданию своего BI решения на NLP для получения отчетов прямо в мессенджер

В этой статье автор расскажет что нужно для data-driven культуры, и почему доступность BI-отчетов – это проблема.

Читать...
​​🍄Классификация грибов методами ML

В данной статье я расскажу о том, как обучал различные модели машинного обучения отличать съедобные грибы от несъедобных, с какими сложностями столкнулся в процессе и какие интересные наблюдения про грибы и ML открыл по пути.

Читать...
​​🤝Как подружить Spark и S3 для обработки файлов

В этой статье мы расскажем, как нам удалось настроить взаимодействие Apache Spark и S3 для обработки больших файлов: с какими проблемами пришлось столкнуться и как нам удалось их решить.

Читать...
​​⭐️Apache Spark для Data Engineering

В этой статье автор расскажет о том, что такое Apache Spark и как он может помочь в data-engineering.

Читать...
​​🧐Как полностью устранить дублирующие записи в ClickHouse

В этой статье я расскажу, как насовсем убрать дублирующие записи в ClickHouse.

Читать...
​​🧑‍💻Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером

В статье рассказываем, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse и Data Lake и в чём специфика задач специалистов, работающих с данными.

Читать...
​​📊Опыт работы с данными или с чем может столкнуться аналитик

В этой статье автор расскажет какие встречались проекты, связанные с хранилищами и данными, какие задачи приходилось решать, а также какие навыки пригодились.

Читать...
1
​​😵Как получить real-time данные смарт-контракта, используя The Graph

В этой статье автор рассмотрит тему разработки собственных сабграфов стандарта The Graph.

Читать...
​​🛍Покупаем BI: как сформировать оптимальный пакет и сэкономить до 86 млн рублей

В данной статье я расскажу о том, каких затрат стоит ожидать компаниям при развертывании BI-инструментов, а также представлю разработанное нами альтернативное решение, которое поможет сократить затраты на владение BI и упростить процесс доставки отчетов сотрудникам.

Читать...
​​🔥Шпаргалка по Seaborn. Делаем матрицы красивыми

В этой статье мы разберем основные шаги, которые помогут сделать ваши матрицы стильными и продающими ваши результаты, используя лишь две основные библиотеки визуализации в Python - Seaborn и Matplotlib.

Читать...
​​Основные инструменты для работы в Data Engineering: введение для начинающих Data Engineer'ов

В этой статье я рассмотрю основные возможности каждого из инструментов и предоставлю ссылки на материалы, где вы сможете изучить их более подробно.

Читать...