Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​👾От логики и риторики до теории множеств и матанализа. Полезные материалы по Data Science и машинному обучению

В этой статье автор поделится полезными материалами, которые помогут найти и заполнить теоретические и практические проблемы и основательно подойти к своему профессиональному развитию.

Читать...
​​🌻ML в полях. Как упростить жизнь агрономов?

В этой статье мы обсудим, как ML-решения помогают формировать задания для агрономов, и почему точной модели не всегда достаточно, чтобы спланировать уборку полей.

Читать...
​​📝Форматы ORC и Parquet на базе HDFS

В статье мы рассмотрим тему форматов ORC и Parquet, как их правильно использовать и хранить, чтобы всем было хорошо.

Читать...
​​🛠Искусство ETL. Пишем собственный движок SQL на Spark [часть 5 из 5]

В этой статье автор расскажет об интерактивно-отладочном режиме REPL, клиенте и сервере, а также о генераторе документации.

Читать...
​​🧙Point-in-time Recovery. Как уменьшить RPO для базы данных

В этой статье мы на примере PostgreSQL разберем принципы работы баз данных и поговорим о том, как минимизировать последствия инцидентов с помощью оптимизации RPO.

Читать...
​​🚀Оптимизация работы с Camunda на основе External task

В этой статье речь пойдет об опыте перехода на паттерн external task.

Читать...
​​💾Ещё один рецепт отказоустойчивого файлового сервера средствами PaceMaker

В этой статье автор расскажет как реализовать на площадке клиента хранение пользовательских файлов для разрабатываемого сервиса.

Читать...
Анализируем отзывы пользователей с помощью датасета от Яндекса

В этой статье разработчики Яндекса рассказывают про крупнейший русскоязычный датасет отзывов на организации. Он содержит порядка полумиллиона отзывов пользователей на различные организации, собранных в январе-июне 2023 года.

Читать...
​​🧑‍💻Сам себе BI-аналитик или как навести порядок в отчётности компании

В этой статье автор расскажет как можно навести порядок в отчётности, и с какими проблемами вы можете столкнуться в процессе.

Читать...
​​🧠Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети

В этой статье автор расскажет как написать нейросеть, которая сама будет создавать нейросети для решения каких-либо задач.

Читать...
​​👤Что есть NER сервисы и как их применяют в бизнесе от А до Я

В этой статье автор рассмотрит логику и принцип работы NER.

Читать...
​​📊Становясь Пангеей: будущее современного стека для анализа данных

В этой статье я расскажу про тенденции в индустрии данных и аналитики, стратегические преимущества и проблемы, с которыми сталкиваются компании в ней, влияние основных облачных провайдеров на её будущее и роль стандартов в формировании в ней технологических экосистем.

Читать...
​​📊Как настроить сбор статистики и автоматическое отключение пользователей WireGuard в ispmanager с помощью Python и API

В статье я рассказываю о том, как достигнуть нужных себе целей и изучить пару вариантов взаимодействия с ispmamager.

Читать...
​​💻PyTriton inference server c Gradio: быстро и просто делаем демо для ML-проектов

Рассмотрим то как можно в одиночку быстро создать сервер и UI для ML приложения на Python с перспективой вывода в prod.

Читать...
​​👾Исследования возможностей нейронных сетей глубокого обучения в распознавании маскируемого трафика

В данной статье мы рассматриваем новый подход к классификации прикладных протоколов в сетевых пакетах.

Читать...
​​💾Как мы создавали self-service функционал проверки качества данных для ML-моделей

В этой статье я расскажу о том, как мы превращаем банк в «биг дата» — организацию.

Читать...
​​💰Как оценить объем работ по миграции хранилища данных на Arenadata DB / Greenplum: методика и пример

В этой статье я расскажу о том, как можно уменьшить стоимость владения хранилищами данных, построенных на западных технологиях.

Читать...
​​⭐️Краткое руководство по работе с данными с помощью Miller

В этой статье я расскажу о Miller — автономном, легковесном и мощном интерфейсе командной строки (Command Line Interface, CLI) для работы с данными в форматах CSV, JSON и некоторых других.

Читать...
​​📌 Как обучают нейросеть, которая помогает беспилотным автомобилям планировать движение и предсказывать действия других объектов на дороге

В этой статье автор из Яндекса объясняет, как нейросети помогают беспилотным автомобилям планировать движение, как работает система восприятия, как обучать такую модель и в чём проблема подхода. Автор рассказал, в чём преимущества машинного обучения перед эвристиками и чем может помочь Reinforcement Learning. 

Читать…
​​🥸Исследование моделирования и развития гибкости на стадии проектирования производственной системы

В этой статье рассматриваются проблемы оценки гибкости для принятия решений с помощью метода оценки на основе цифрового двойника, который моделирует, прогнозирует и оценивает гибкость определенной схемы проектирования производственной системы (PSDS).

Читать...
​​📊Статистика по финансовым рынкам или будни дата-аналитика

В этой статье я покажу, как можно поиграть с данными, посмотреть статистику и понаблюдать за динамикой выбранных показателей.

Читать...