Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
633 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​😎Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

Читать...
​​Айтишникам с большим стажем предложили давать звание «Ветерана труда». Для этого мужчинам нужно отработать 40 лет, а женщинам 35. За это полагаются льготы: ежемесячные выплаты, компенсация на оплату ЖКУ и льготные проездные.

Если закон примут, то IT-специалисты будут как врачи, учителя, пожарные или строители: 

Читать...
​​📞Почему в чат-ботах не сделают кнопку «Вызвать оператора»?

В этой статье автор рассмотрит основные причины и поделиться опытом, который заставит усомниться в необходимости этой бесхитростной фичи.

Читать...
🧐 LLM, GPT-3, STABLE-DIFFUSION: Яндекс выкатил интерактивную карту хардов ML-специалистов. А на основе трендов 2023 года сделали чек-лист для разработчиков.

По карте можно изучить, что сейчас в тренде из библиотек и методов, которые ML-специалисты стали чаще искать в 2023 году в поиске Яндекса (по сравнению с 2022-ым), и наметить себе карьерный трек — чему ещё стоит научиться и какие смежные сферы освоить.

Ну и отмечайте в чек-листе, что вы уже используете в проектах.

Смотреть…
​​👾LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

В этой статье мы проверим способность моделей решать простые математические задачи, отвечать на вопрос по заданному контексту, в котором содержатся числа и выполнять простые текстовые инструкции.

Читать...
​​⭐️Революция в аналитике данных: погружение в мир NoSQL

В этой статье мы углубимся в особенности NoSQL, сравним его с традиционными SQL-базами данных и исследуем, как NoSQL преобразует сферу аналитики данных.

Читать...
​​👥Как сделать Spark в Kubernetes простым в использовании: опыт команды VK Cloud

В этой статье расскажу, почему мы решили делать Spark в Kubernetes, с какими сложностями столкнулись и как их обходили, а также что получили в итоге.

Читать...
​​⚡️Улучшаем динамические таблицы YTsaurus с помощью алгоритмов

В этой статье разберёмся, как работает xor‑фильтр, в чём особенность чанкового хеш‑индекса и как overload controller повышает стабильность работы.

Читать...
​​🤠Организация SQL скриптов крупного проекта

В этой статье хочу представить для широкого обсуждения опыт по организации кода поддержки структуры базы данных долговременных крупных проектов с небольшим уклоном в сторону PostgreSQL.

Читать...
​​🧠Какую базу данных выбрать для Home Assistant

В этой статье мы поговорим о том, какую СУБД (Систему Управления Базы Данными) для него лучше выбрать.

Читать...
​​🧐Особенности партиционирования в PostgreSQL и Apache Hive

В данной статье рассмотрены некоторые особенности использования языка SQL в реляционных СУБД и Apache Hive.

Читать...
​​🧙‍♂Python-волшебство: как магические методы облегчают жизнь программиста

В этой статье расскажу вам об удивительном мире магических методов в Python.

Читать...
​​🗣Делаем обучающие датасеты для больших языковых моделей

В этой статье мы рассмотрим как это делается, а главное -х какие проблемы есть на этом пути и могут ли новички вроде нас разобраться в этом.

Читать...
​​🦾Оконные функции SQL простым языком с примерами

В этой статье речь пойдет о сервисах интеграции данных, их функциональных возможностях и ограничениях.

Читать...
​​⚡️Парсинг для взрослых или Инфраструктура для промышленного парсинга

В этой статье описан шаблон веб-приложения, который использую для создания парсеров.

Читать...
​​🛠Почему инструменты MLOps должны быть с открытым исходным кодом?

В этой статье вы узнаете, что такое MLOps, зачем вам нужны MLOps для ваших проектов машинного обучения, почему MLOps должен быть open source и примеры существующих инструментов MLOps.

Читать...
​​😶🌫Использование On-Logon триггеров в СУБД Postgres Pro Enterprise

В данной статье я расскажу о функциональности PostgreSQL, аналогичной тому, что предоставляет Oracle On Logon Trigger.

Читать...
Новый год — старт для ваших новых карьерных возможностей 🎄
6 февраля приглашаем на Зимнюю ярмарку вакансий, которая пройдёт офлайн и онлайн. Это классная возможность стать частью IT-сообщества Яндекса и познакомиться с теми, кто создаёт сервисы с многомиллионной аудиторией.

Что вас ждёт
🔸 Вакансии для стажёров
Узнаете о новых вакансиях и задачах, а также сможете лично пообщаться с командами и подать заявку туда, где понравится больше всего.
🔸 Полезные лекции
Узнаете о технологиях и кейсах из практики от экспертов Яндекса. Лекции пройдут по основным направлениям стажировки: бэкенд, фронтенд, мобильная разработка, аналитика и машинное обучение.
🔸 Нетворкинг со стажёрами Яндекса
Узнаете, как они проходили отбор, как готовились и чем планируют заниматься дальше. Сейчас в Яндексе одновременно стажируются более 600 человек — им есть что рассказать.

Как попасть на Зимнюю ярмарку вакансий
Чтобы попасть на ярмарку, нужно пройти предварительный отбор — решить задачи на Яндекс Контесте до 31 января включительно. Мы проверим решения, оценим анкеты и позовём лучших на день стажёра в Москве. Приглашения придут до 2 февраля включительно.

🍭 Закрытое шоу
Тех, кто решит все задачи из Контеста, мы пригласим на вечернее закрытое шоу «Всё в плюсе». Это соревнование между различными бизнес-группами Яндекса, в которых примут участие и стажёры, и топовые разработчики. Знакомство с различными сервисами, нетворкинг с действующими стажёрами, вечеринка с кавер-группой и диджеем — это то, что ждёт вас на шоу.

Узнать подробности и подать заявку — https://yandex.ru/yaintern/intern-day
​​👨‍💻Профессия Data Scientist и 20 вопросов на собеседовании

В этой статье автор расскажет, что такое анализ основных причин, который включает в себя профессия Data Scientist, и почему профессия Data Scientist неразрывно связана с анализом и тестированием, а также вы узнаете почему цель кросс-проверки заключается в определении набора данных для тестирования модели на этапе обучения.

Читать...
​​⭐️Уникальные стили визуализации данных в Python: от Cyberpunk до элегантности

В этой статье, я делюсь своим опытом использования уникальных библиотек Python для визуализации данных, которые могут добавить креативности и эффективности в вашу работу с данными.

Читать...
​​⭐️Обучение с подкреплением. Q-обучение. Понятное объяснение

В данной статье я попытаюсь максимально понятно и подробно объяснить, каким образом работает Q-обучение.

Читать...