Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🫖 А какой ты data-инженер сегодня? Пройди тест!

15 января стартует курс Data-инженер от Слёрм. Учим собирать, хранить и обрабатывать большие данные.

Вы готовы к обучению? Или ещё необходимо подтянуть знания? Пройдите тест на нашем сайте и узнайте ваш уровень подготовки.

Этот тест составлен на основе учебных материалов курса. Ссылку на тест оставляем здесь

Курс подойдет для аналитиков данных, разработчиков, администраторов баз данных.

Будем рады встрече 15 января.

Реклама. ООО «Слёрм» г. Лиски, ОГРН 1193668020545 Erid: 2VtzqwCoMrK
Please open Telegram to view this post
VIEW IN TELEGRAM
​​🗣А что если обучать нейросети через речь, а не текст?

В этой статье мы подробней рассмотрим этот подход к нейросетям, его целесообразность и перспективы.

Читать...
​​🦹‍♂️Контекст, награда, много рук. Многорукие бандиты как метод принятия решений

В этой статье мы рассмотрим методологию и границы применимости классических многоруких и контекстуальных бандитов, а также реализуем контекстного бандита, в основе которого будут сэмплирование Томпсона и нейронная сеть.

Читать...
​​🧑‍💻Разработка тензорного компилятора под RISC-V CPU с помощью OpenVINO и MLIR

В этой статье я расскажу, как можно разработать тензорный компилятор для процессора на базе открытой архитектуры RISC-V.

Читать...
​​🍏Фреймворк для дизайна A/B-теста

В этой статье мы разберем использование этого фреймворка, его теоретическую и математическую основу, и также поговорим о продуктовых аспектах заведения A/B-тестов — когда продакту и аналитику заводить A/B-тест не нужно.

Читать...
🗣Как голосовой помощник научился слушать себя

В этой статье вы узнаете о том, как команда мобильного приложения Маруси отучили ее триггериться на себя и научили правильно слышать и понимать запросы; что такое самотриггерение и как решить эту проблему; как доля самотриггерений голосового помощника в потоке упала с 6% до 0,1%.

Читать…
​​💽Современные типы архитектуры данных: Погружение в различные подходы к построению хранилищ данных

В данной статье мы рассмотрим ключевые аспекты различных типов хранилищ данных, которые помогут оптимизировать процессы управления данными в вашей компании.

Читать...
​​🎩Apache Spark… Это база

В статье рассмотрим основные понятия для понимания обработки данных на Spark, разберем функционал его компонентов и сформируем DataFrame разными способами.

Читать...
​​😎Без Tableau — как в МКБ выбирали новое BI-решение для работы

В этой статье автор расскажет о том, какие у нас были критерии выбора и что же мы в итоге выбрали.

Читать...
​​🤑Выбор информационной системы для автоматизации вашей бизнес-задачи – разбираемся вместе с GlowByte

В этой статье мы расскажем о том, как сделать автоматизацию бизнес-процессов эффективной, безболезненной и успешной.

Читать...
​​🦉FineBI-g brother is still watching: как мы усовершенствовали мониторинг

В этой статье мы разработали дашборд, содержащий интересующие нас и владельцев дашбордов показатели, графики, детализированные таблицы.

Читать...
​​100 вопросов для подготовки к собесу Data Science

Доброго времени суток!

Представляю вашему вниманию чек-лист из 100 вопросов по Data Science. Вопросы покрывают 5 областей: SQL, Python, Machine Learning, статистику и собственно саму DS.

Кому это вообще может быть полезно:
желающему получить оффер в сфере DS
тому, кто уже давно дата-сайнтист, но хочется освежить какие-то алгоритмы/темы
кто хочет поменять стек на что-то в области анализа и присматривается к DS

Собрал здесь самые частые вопросы с собесов на позицию джуна Data Science, получился так сказать 95% доверительный интервал всех возможных вопросов. Так что если разобраться в этих вопросах, с большой вероятностью Авито, Тинькофф и что у нас там ещё делает DS примет вас к себе на борт.

Читать...
​​🗣Сказки про ИБ в машинном обучении

В этой статье мы рассмотрим, как злоумышленники атакуют модели машинного обучения, что они для этого делают и как от этого можно защищаться.

Читать...
​​🧑‍💻Как систематизировать работу с входящими документами в компании с помощью OCR-инструментов. Часть 1

В этой статье мы расскажем, какие задачи решали на этом проекте, рассмотрим предложения со схожим функционалом, существующие на рынке, и покажем архитектуру предобученного классификатора документооборота.

Читать...
​​👍Тонкая настройка Whisper для многоязычного ASR с помощью Hugging Face Transformers

В этой статье мы рассмотрим пошаговое руководство по дообучению Whisper для многоязычного ASR с использованием Datasets, Transformers и Hugging Face Hub.

Читать...
​​🤔ML SAST. Часть 1: как работают инструменты SAST и какие проблемы может решить применение машинного обучения?

В этой статье мы рассмотрим основные принципы и методики, применяемые в инструментах статического анализа безопасности, обозначим существующие проблемы и рассмотрим потенциал внедрения машинного обучения.

Читать...
​​🧠«Возрождение» больших данных, оптимизация инференса LLM и новинки от AMD

В этой статье вы узнаете, какие Ops-практики входят в систему MLOps, как выбрать СУБД для анализа данных и как построить платформу для DS/ML-разработчиков.

Читать...
​​🐬Python + MySQL: как подключиться к СУБД MySQL и работать с ней с помощью Python

Из этой статьи вы узнаете, как подключиться к MySQL с помощью Python и выполнить основные команды для работы с данными в таблице: установка необходимых библиотек, подключение к базе данных, создание и удаление таблицы, добавление, извлечение и удаление данных из таблицы.

Читать...
​​🐘Функции и хранимые процедуры в SQL: зачем нужны и как применять в реальных примерах

В этой статье вы узнаете, как устроены функции и хранимые процедуры и как их применять для повторного использования запросов.

Читать...
​​💪Выборочное удаление столбцов для повышения эффективности хранения в озерах данных

В данной статье мы расскажем, как сократить размер данных в рамках формата Apache Parquet за счет удаления не использующихся колонок большого размера.

Читать...
​​🧠MiVOLO: новая State-of-the-Art нейросеть с открытым исходным кодом для определения пола и возраста по фотографии

В этой статье хочу рассказать вам нашу историю о том, как изначально рутинная рабочая задача закончилась созданием открытой state-of-the-art нейросети, научной работой и новым датасетом.

Читать...