Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🦹‍♂️Контекст, награда, много рук. Многорукие бандиты как метод принятия решений

В этой статье мы рассмотрим методологию и границы применимости классических многоруких и контекстуальных бандитов, а также реализуем контекстного бандита, в основе которого будут сэмплирование Томпсона и нейронная сеть.

Читать...
​​🧑‍💻Разработка тензорного компилятора под RISC-V CPU с помощью OpenVINO и MLIR

В этой статье я расскажу, как можно разработать тензорный компилятор для процессора на базе открытой архитектуры RISC-V.

Читать...
​​🍏Фреймворк для дизайна A/B-теста

В этой статье мы разберем использование этого фреймворка, его теоретическую и математическую основу, и также поговорим о продуктовых аспектах заведения A/B-тестов — когда продакту и аналитику заводить A/B-тест не нужно.

Читать...
🗣Как голосовой помощник научился слушать себя

В этой статье вы узнаете о том, как команда мобильного приложения Маруси отучили ее триггериться на себя и научили правильно слышать и понимать запросы; что такое самотриггерение и как решить эту проблему; как доля самотриггерений голосового помощника в потоке упала с 6% до 0,1%.

Читать…
​​💽Современные типы архитектуры данных: Погружение в различные подходы к построению хранилищ данных

В данной статье мы рассмотрим ключевые аспекты различных типов хранилищ данных, которые помогут оптимизировать процессы управления данными в вашей компании.

Читать...
​​🎩Apache Spark… Это база

В статье рассмотрим основные понятия для понимания обработки данных на Spark, разберем функционал его компонентов и сформируем DataFrame разными способами.

Читать...
​​😎Без Tableau — как в МКБ выбирали новое BI-решение для работы

В этой статье автор расскажет о том, какие у нас были критерии выбора и что же мы в итоге выбрали.

Читать...
​​🤑Выбор информационной системы для автоматизации вашей бизнес-задачи – разбираемся вместе с GlowByte

В этой статье мы расскажем о том, как сделать автоматизацию бизнес-процессов эффективной, безболезненной и успешной.

Читать...
​​🦉FineBI-g brother is still watching: как мы усовершенствовали мониторинг

В этой статье мы разработали дашборд, содержащий интересующие нас и владельцев дашбордов показатели, графики, детализированные таблицы.

Читать...
​​100 вопросов для подготовки к собесу Data Science

Доброго времени суток!

Представляю вашему вниманию чек-лист из 100 вопросов по Data Science. Вопросы покрывают 5 областей: SQL, Python, Machine Learning, статистику и собственно саму DS.

Кому это вообще может быть полезно:
желающему получить оффер в сфере DS
тому, кто уже давно дата-сайнтист, но хочется освежить какие-то алгоритмы/темы
кто хочет поменять стек на что-то в области анализа и присматривается к DS

Собрал здесь самые частые вопросы с собесов на позицию джуна Data Science, получился так сказать 95% доверительный интервал всех возможных вопросов. Так что если разобраться в этих вопросах, с большой вероятностью Авито, Тинькофф и что у нас там ещё делает DS примет вас к себе на борт.

Читать...
​​🗣Сказки про ИБ в машинном обучении

В этой статье мы рассмотрим, как злоумышленники атакуют модели машинного обучения, что они для этого делают и как от этого можно защищаться.

Читать...
​​🧑‍💻Как систематизировать работу с входящими документами в компании с помощью OCR-инструментов. Часть 1

В этой статье мы расскажем, какие задачи решали на этом проекте, рассмотрим предложения со схожим функционалом, существующие на рынке, и покажем архитектуру предобученного классификатора документооборота.

Читать...
​​👍Тонкая настройка Whisper для многоязычного ASR с помощью Hugging Face Transformers

В этой статье мы рассмотрим пошаговое руководство по дообучению Whisper для многоязычного ASR с использованием Datasets, Transformers и Hugging Face Hub.

Читать...
​​🤔ML SAST. Часть 1: как работают инструменты SAST и какие проблемы может решить применение машинного обучения?

В этой статье мы рассмотрим основные принципы и методики, применяемые в инструментах статического анализа безопасности, обозначим существующие проблемы и рассмотрим потенциал внедрения машинного обучения.

Читать...
​​🧠«Возрождение» больших данных, оптимизация инференса LLM и новинки от AMD

В этой статье вы узнаете, какие Ops-практики входят в систему MLOps, как выбрать СУБД для анализа данных и как построить платформу для DS/ML-разработчиков.

Читать...
​​🐬Python + MySQL: как подключиться к СУБД MySQL и работать с ней с помощью Python

Из этой статьи вы узнаете, как подключиться к MySQL с помощью Python и выполнить основные команды для работы с данными в таблице: установка необходимых библиотек, подключение к базе данных, создание и удаление таблицы, добавление, извлечение и удаление данных из таблицы.

Читать...
​​🐘Функции и хранимые процедуры в SQL: зачем нужны и как применять в реальных примерах

В этой статье вы узнаете, как устроены функции и хранимые процедуры и как их применять для повторного использования запросов.

Читать...
​​💪Выборочное удаление столбцов для повышения эффективности хранения в озерах данных

В данной статье мы расскажем, как сократить размер данных в рамках формата Apache Parquet за счет удаления не использующихся колонок большого размера.

Читать...
​​🧠MiVOLO: новая State-of-the-Art нейросеть с открытым исходным кодом для определения пола и возраста по фотографии

В этой статье хочу рассказать вам нашу историю о том, как изначально рутинная рабочая задача закончилась созданием открытой state-of-the-art нейросети, научной работой и новым датасетом.

Читать...
​​😉Вредные советы по подготовке датасета

В этой статье автор поделиться вредными советами по подготовке датасета для сервисов видеоаналитики.

Читать...
​​👨‍💻Как с помощью ChatGPT писать SQL-запросы. Несколько кейсов

В статье расскажу о том, как ChatGPT может сэкономить время и усилия начинающего специалиста по SQL.

Читать...