Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Основные инструменты для работы в Data Engineering: введение для начинающих Data Engineer'ов

В этой статье я рассмотрю основные возможности каждого из инструментов и предоставлю ссылки на материалы, где вы сможете изучить их более подробно.

Читать...
​​👾Надёжные сервисы на нейросетях, или почему восклицательные знаки лучше цифр

В этой статье я на примере простого сервиса для маршрутизации заявок в техподдержку покажу свой подход к созданию сервисов на нейросетях, которые не страшно напрямую использовать для общения с клиентами или в других важных процессах.

Читать...
​​📊Архитектура аналитической платформы Modus: ETL

В этой статье поговорим об архитектуре аналитической платформы и подробнее остановимся на том, как организована Modus ETL.

Читать...
​​👾Codeium и StarCoder: нейросети с автодополнением кода

В этой статьемы рассмотрим задачу генерации кода — LLMs for Code.

Читать...
​​🚘Машинное обучение для прогнозирования выхода из строя дизельных двигателей

В этой статье я в деталях расскажу о бизнес‑контексте их использования в горной отрасли, о подходах к сбору данных и их анализу.

Читать...
​​📝Автоматическая разметка данных

В данной статье мы рассмотрим подход с автоматической разметкой.

Читать...
​​8 инструментов для аннотирования изображений в 2023 году

В статье мы расскажем о лучших инструментах аннотирования, которые сделают этот процесс эффективным.

Читать...
​​🧑‍💻Как мы внедряем машинное обучение в продукты Positive Technologies

В этой статье расскажем, как ML помогает автоматизировать действия специалистов по безопасности и детектировать кибератаки.

Читать...
​​🤓Reinforcment Learning: Google Recsim

В этой статье поговорим про RL в ML с использованием Google RecSim.

Читать...
​​🗣Клонирование голоса, замена лица по фото, удаления объектов в видео и все в одном open-source проекте Wunjo AI

В этой статье я хочу поделиться с вами новостями об недавнем обновлении, рассказать какие появились новые функции в моем open-source проекте Wunjo AI v1.5.

Читать...
​​👾Предтеча ИИ и робототехники: автоматоны нашей эры и немного других механических устройств

В этой статье мы расскажем об автоматонах, устройствах и протоандроидах, созданных в нашей эре до ХХ века.

Читать...
​​🧐Архитектура аналитической платформы Modus ч.2: BI

В этой статье поговорим об общем устройстве BI-системы и подробнее остановимся на анатомии Modus BI.

Читать...
​​🗺Опыт визуализации данных на геокарте

В этой статье я хочу поделиться своим опытом решения задач, связанных с отображением данных на геокарте: как самим решением, так и инструментами, которые мы для этого использовали.

Читать...
​​😎Дружим YOLACT и RockChip: запуск инстанс-сегментации на китайском одноплатнике

В этой статье автор поделиться с вами своим опытом запуска YOLACT на edge-устройстве RockChip.

Читать...
​​😼Эволюция метрик качества машинного перевода. Часть 3

В этой статье поговорим о безреференсных нейросетевых метриках, а также выясним, какова сравнительная эффективность различных традиционных и нейросетевых метрик.

Читать...
​​😵Устранение галлюцинаций в LLM

В этой статье поговорим о том, почему LLMs говорят неправду и как это исправить.

Читать...
​​🗣7 аргументов почему UUID лучше, чем автоинкрементные идентификаторы

В этой статье мы рассмотрим, почему UUID часто являются лучшим выбором по сравнению с автоматически увеличивающимися идентификаторами.

Читать...
​​🧑‍💻Как я реплицировал данные с помощью postgres_fdw и dbt

В этой статье автор расскажет вам о собственном опыте извращенной репликаций данных между базами Postgres.

Читать...
​​😵Искусство ETL. Пишем собственный движок SQL на Spark [часть 1 из 5]

В этой статье я расскажу о разработке настоящего production ready инструмента, с интерактивным шеллом с подсветкой синтаксиса и автодополнением, который сможет работать в клиент-серверном режиме, и не только на кластере, но и локально.

Читать...
​​🤖Визуальное RPG с долговременной памятью, генерируемое из 3 нейросетей и LLamы

В этой статье автор покажет простому обывателю механизм безболезненного использования нейросетевых моделей в простых проектах при помощи Python и Hugging Face Transformers.

Читать...
​​🌳Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса

В этой статье я расскажу о простом для понимания, но в то же время достаточно эффективном алгоритме — дереве решений, а также его расширенной модификацией — случайных лесах решений, и их реализации с помощью PySpark MLib.

Читать...