Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
633 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🦾Оконные функции SQL простым языком с примерами

В этой статье речь пойдет о сервисах интеграции данных, их функциональных возможностях и ограничениях.

Читать...
​​⚡️Парсинг для взрослых или Инфраструктура для промышленного парсинга

В этой статье описан шаблон веб-приложения, который использую для создания парсеров.

Читать...
​​🛠Почему инструменты MLOps должны быть с открытым исходным кодом?

В этой статье вы узнаете, что такое MLOps, зачем вам нужны MLOps для ваших проектов машинного обучения, почему MLOps должен быть open source и примеры существующих инструментов MLOps.

Читать...
​​😶🌫Использование On-Logon триггеров в СУБД Postgres Pro Enterprise

В данной статье я расскажу о функциональности PostgreSQL, аналогичной тому, что предоставляет Oracle On Logon Trigger.

Читать...
Новый год — старт для ваших новых карьерных возможностей 🎄
6 февраля приглашаем на Зимнюю ярмарку вакансий, которая пройдёт офлайн и онлайн. Это классная возможность стать частью IT-сообщества Яндекса и познакомиться с теми, кто создаёт сервисы с многомиллионной аудиторией.

Что вас ждёт
🔸 Вакансии для стажёров
Узнаете о новых вакансиях и задачах, а также сможете лично пообщаться с командами и подать заявку туда, где понравится больше всего.
🔸 Полезные лекции
Узнаете о технологиях и кейсах из практики от экспертов Яндекса. Лекции пройдут по основным направлениям стажировки: бэкенд, фронтенд, мобильная разработка, аналитика и машинное обучение.
🔸 Нетворкинг со стажёрами Яндекса
Узнаете, как они проходили отбор, как готовились и чем планируют заниматься дальше. Сейчас в Яндексе одновременно стажируются более 600 человек — им есть что рассказать.

Как попасть на Зимнюю ярмарку вакансий
Чтобы попасть на ярмарку, нужно пройти предварительный отбор — решить задачи на Яндекс Контесте до 31 января включительно. Мы проверим решения, оценим анкеты и позовём лучших на день стажёра в Москве. Приглашения придут до 2 февраля включительно.

🍭 Закрытое шоу
Тех, кто решит все задачи из Контеста, мы пригласим на вечернее закрытое шоу «Всё в плюсе». Это соревнование между различными бизнес-группами Яндекса, в которых примут участие и стажёры, и топовые разработчики. Знакомство с различными сервисами, нетворкинг с действующими стажёрами, вечеринка с кавер-группой и диджеем — это то, что ждёт вас на шоу.

Узнать подробности и подать заявку — https://yandex.ru/yaintern/intern-day
​​👨‍💻Профессия Data Scientist и 20 вопросов на собеседовании

В этой статье автор расскажет, что такое анализ основных причин, который включает в себя профессия Data Scientist, и почему профессия Data Scientist неразрывно связана с анализом и тестированием, а также вы узнаете почему цель кросс-проверки заключается в определении набора данных для тестирования модели на этапе обучения.

Читать...
​​⭐️Уникальные стили визуализации данных в Python: от Cyberpunk до элегантности

В этой статье, я делюсь своим опытом использования уникальных библиотек Python для визуализации данных, которые могут добавить креативности и эффективности в вашу работу с данными.

Читать...
​​⭐️Обучение с подкреплением. Q-обучение. Понятное объяснение

В данной статье я попытаюсь максимально понятно и подробно объяснить, каким образом работает Q-обучение.

Читать...
​​🤔Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров

В этой статье расскажу, как мы с помощью ML решили проблему, не дававшую нашей компании перейти на автоматическую маршрутизацию курьеров.

Читать...
​​🤓Изучаем SQL в 2024 году

В этой статье я расскажу вам о пошаговой дорожной карте изучения SQL для Data Science в 2024 году с помощью бесплатных ресурсов.

Читать...
​​👥Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs

В этой статье я покажу, как устроен и как работает один из таких инструментов, созданный нами для пользователей облака, — DataSphere Jobs.

Читать...
​​🫥Решение задачи определения RUL трансформаторов с помощью машинного обучения на python

В данной статье рассмотрен распространенный подход решения задачи определения RUL силовых трансформаторов на основе моделей регрессии, так как у нас есть диагностические данные (временные ряды, сигналы) и разметка в виде значений длительности оборудования до отказа.

Читать...
​​😼Анализ данных по метеорологическим станциям с помощью Pandas

В этой статье будет рассмотрено решение задачи анализа открытых метеорологических данных сервиса.

Читать...
​​🧙Предсказать ошибку. Как методы оценки неопределенности помогают повышать качество seq2seq-моделей

В этой статье я хочу подробно рассказать об используемых методах и результатах, которые мы получили.

Читать...
​​🤔Совместимость (или нет?) MLOps-инструментов

В этой статье я буду говорить в первую очередь об Open Source решениях в мире MLOps, а также рассмотрю существующую проблему несовместимости, порассуждаю, в чем причины ее возникновения, и можно ли ее преодолеть.

Читать...
​​🥶Что такое «паралич» сети, и как его избежать?

В этой статье мы рассмотрим проблему, причины ее возникновения и показать несколько решений.

Читать...
​​💱Python Multiprocessing. Обмен данными между процессами. Передача объектов пользовательских классов

В этой статье описаны различные способы обмена данными между процессами в Python с помощью модуля Multiprocessing.

Читать...
​​⚡️RabbitMQ как способ масштабирования ML проекта

В этой статье автор расскажет о проблеме масштабирования ML проектов и предлагается использовать RabbitMQ в качестве брокера сообщений для разграничения модели и серверной части проекта.

Читать...
​​🔋Новые горизонты производства электроники и солнечных батарей: оптимизация мультикристаллических материалов с помощью ML

В данной статье я расскажу, какое решение данной проблемы было найдено исследователями, и для сравнения опишу современные используемые методы для определения кристаллографических ориентаций в мультикристаллических материалах.

Читать...
​​👥Продюсеры и консьюмеры с Apache Kafka в Python

В этой статье мы поговорим о продюсерах и консюмерах в экосистеме Kafka в коннекте с Python.

Читать...
​​MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer

Система преобразования текста в звук от FAIR с открытым исходным кодом.

👉 Code - ссылка
👉 HF - ссылка
👉 Paper - ссылка
👉 Project - ссылка
👉 Datasets - ссылка

Удачи в экспериментах!