Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
633 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​⭐️Революция в аналитике данных: погружение в мир NoSQL

В этой статье мы углубимся в особенности NoSQL, сравним его с традиционными SQL-базами данных и исследуем, как NoSQL преобразует сферу аналитики данных.

Читать...
​​👥Как сделать Spark в Kubernetes простым в использовании: опыт команды VK Cloud

В этой статье расскажу, почему мы решили делать Spark в Kubernetes, с какими сложностями столкнулись и как их обходили, а также что получили в итоге.

Читать...
​​⚡️Улучшаем динамические таблицы YTsaurus с помощью алгоритмов

В этой статье разберёмся, как работает xor‑фильтр, в чём особенность чанкового хеш‑индекса и как overload controller повышает стабильность работы.

Читать...
​​🤠Организация SQL скриптов крупного проекта

В этой статье хочу представить для широкого обсуждения опыт по организации кода поддержки структуры базы данных долговременных крупных проектов с небольшим уклоном в сторону PostgreSQL.

Читать...
​​🧠Какую базу данных выбрать для Home Assistant

В этой статье мы поговорим о том, какую СУБД (Систему Управления Базы Данными) для него лучше выбрать.

Читать...
​​🧐Особенности партиционирования в PostgreSQL и Apache Hive

В данной статье рассмотрены некоторые особенности использования языка SQL в реляционных СУБД и Apache Hive.

Читать...
​​🧙‍♂Python-волшебство: как магические методы облегчают жизнь программиста

В этой статье расскажу вам об удивительном мире магических методов в Python.

Читать...
​​🗣Делаем обучающие датасеты для больших языковых моделей

В этой статье мы рассмотрим как это делается, а главное -х какие проблемы есть на этом пути и могут ли новички вроде нас разобраться в этом.

Читать...
​​🦾Оконные функции SQL простым языком с примерами

В этой статье речь пойдет о сервисах интеграции данных, их функциональных возможностях и ограничениях.

Читать...
​​⚡️Парсинг для взрослых или Инфраструктура для промышленного парсинга

В этой статье описан шаблон веб-приложения, который использую для создания парсеров.

Читать...
​​🛠Почему инструменты MLOps должны быть с открытым исходным кодом?

В этой статье вы узнаете, что такое MLOps, зачем вам нужны MLOps для ваших проектов машинного обучения, почему MLOps должен быть open source и примеры существующих инструментов MLOps.

Читать...
​​😶🌫Использование On-Logon триггеров в СУБД Postgres Pro Enterprise

В данной статье я расскажу о функциональности PostgreSQL, аналогичной тому, что предоставляет Oracle On Logon Trigger.

Читать...
Новый год — старт для ваших новых карьерных возможностей 🎄
6 февраля приглашаем на Зимнюю ярмарку вакансий, которая пройдёт офлайн и онлайн. Это классная возможность стать частью IT-сообщества Яндекса и познакомиться с теми, кто создаёт сервисы с многомиллионной аудиторией.

Что вас ждёт
🔸 Вакансии для стажёров
Узнаете о новых вакансиях и задачах, а также сможете лично пообщаться с командами и подать заявку туда, где понравится больше всего.
🔸 Полезные лекции
Узнаете о технологиях и кейсах из практики от экспертов Яндекса. Лекции пройдут по основным направлениям стажировки: бэкенд, фронтенд, мобильная разработка, аналитика и машинное обучение.
🔸 Нетворкинг со стажёрами Яндекса
Узнаете, как они проходили отбор, как готовились и чем планируют заниматься дальше. Сейчас в Яндексе одновременно стажируются более 600 человек — им есть что рассказать.

Как попасть на Зимнюю ярмарку вакансий
Чтобы попасть на ярмарку, нужно пройти предварительный отбор — решить задачи на Яндекс Контесте до 31 января включительно. Мы проверим решения, оценим анкеты и позовём лучших на день стажёра в Москве. Приглашения придут до 2 февраля включительно.

🍭 Закрытое шоу
Тех, кто решит все задачи из Контеста, мы пригласим на вечернее закрытое шоу «Всё в плюсе». Это соревнование между различными бизнес-группами Яндекса, в которых примут участие и стажёры, и топовые разработчики. Знакомство с различными сервисами, нетворкинг с действующими стажёрами, вечеринка с кавер-группой и диджеем — это то, что ждёт вас на шоу.

Узнать подробности и подать заявку — https://yandex.ru/yaintern/intern-day
​​👨‍💻Профессия Data Scientist и 20 вопросов на собеседовании

В этой статье автор расскажет, что такое анализ основных причин, который включает в себя профессия Data Scientist, и почему профессия Data Scientist неразрывно связана с анализом и тестированием, а также вы узнаете почему цель кросс-проверки заключается в определении набора данных для тестирования модели на этапе обучения.

Читать...
​​⭐️Уникальные стили визуализации данных в Python: от Cyberpunk до элегантности

В этой статье, я делюсь своим опытом использования уникальных библиотек Python для визуализации данных, которые могут добавить креативности и эффективности в вашу работу с данными.

Читать...
​​⭐️Обучение с подкреплением. Q-обучение. Понятное объяснение

В данной статье я попытаюсь максимально понятно и подробно объяснить, каким образом работает Q-обучение.

Читать...
​​🤔Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров

В этой статье расскажу, как мы с помощью ML решили проблему, не дававшую нашей компании перейти на автоматическую маршрутизацию курьеров.

Читать...
​​🤓Изучаем SQL в 2024 году

В этой статье я расскажу вам о пошаговой дорожной карте изучения SQL для Data Science в 2024 году с помощью бесплатных ресурсов.

Читать...
​​👥Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs

В этой статье я покажу, как устроен и как работает один из таких инструментов, созданный нами для пользователей облака, — DataSphere Jobs.

Читать...
​​🫥Решение задачи определения RUL трансформаторов с помощью машинного обучения на python

В данной статье рассмотрен распространенный подход решения задачи определения RUL силовых трансформаторов на основе моделей регрессии, так как у нас есть диагностические данные (временные ряды, сигналы) и разметка в виде значений длительности оборудования до отказа.

Читать...
​​😼Анализ данных по метеорологическим станциям с помощью Pandas

В этой статье будет рассмотрено решение задачи анализа открытых метеорологических данных сервиса.

Читать...