Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​👨Нейро-сотрудники на основе chatGPT. Вы создаете работника и продаете его биржу труда

В этой статье автор расскажет как создать своего Нейро-сотрудника.

Читать...
​​🗓Apache Spark 3.4 для Databricks Runtime 13.0

В этой статье автор расскажет о нововведениях Apache Spark 3.4, который вошел в релиз Databricks Runtime 13.0.

Читать...
​​🗺ML для ускорения работы картографов

В этой статье автор поговорит о том, как он дополняет карту дорожными знаками, как работает с данными и формализует задачи.

Читать...
​​🔍Как найти задачу, которую можно решить с помощью машинного обучения

В этой статье мы расскажем немного об основах машинного обучения: покажем, как подобрать задачу для обучения и таким образом посмотреть на процесс через призму бизнеса.

Читать...
​​😎Дропаем ранжирующие метрики в рекомендательной системе, часть 2: двухэтапные модели

В этой статье автор расскажет о том, как мы дропаем ранжирующие метрики и улучшаем при этом качество рекомендаций.

Читать...
​​🤓Простые радости вертикального масштабирования

В этой статье мы подробно разберём, почему практика горизонтального масштабирования стала доминирующей, проверим, актуальны ли до сих пор эти обоснования, а затем исследуем некоторые преимущества архитектуры с вертикальным масштабированием.

Читать...
​​📊FineBI-g brother is watching you: как мы начали анализировать действия пользователей в Fine

В этой статье автор расскажет как он решит задачу поиска и последующего анализа действий и полномочий пользователей, а также возьмёт под контроль обновление источников.

Читать...
​​🤔Что такое CLTV и как мы в билайне с ним работаем

В этой статье мы расскажем, зачем и как внедряли CLTV в компании.

Читать...
​​🧐Генеративный ИИ — Будущее или просто Хайп?

В этой статье автор обсудит возможности генеративного ИИ, почему это не хайп и как AWS демократизирует доступ к большим языковым и базовым моделям.

Читать...
​​🎙Аугментация экспрессивных аудиоданных на основе TTS

В этой статье мы поговорим о системах клонирования голоса на основе TTS (Text-to-Speech), которые мы используем в корпоративной лаборатории человеко-машинного взаимодействия ИТМО для аугментации речевых баз данных в рамках задачи мультимодального распознавания доминантности дикторов в полилогах.

Читать...
​​🧑‍💻Model soups: альтернатива ансамблированию при файнтюнинге моделей

В этой статье мы разберемся с тем, что это такое, и кратко пробежимся по основным моментам оригинального папера.

Читать...
​​🎼Нейромузыка: может ли робот создавать треки?

В этой статье я расскажу о том, как задумывалась и создавалась Нейромузыка: как мы обучили модель писать музыкальные лупы, сочетать их между собой и подстраивать музыкальный поток под каждого пользователя.

Читать...
​​😶🌫«Квантовые облака»: как разработчики делают квантовые вычисления ближе к бизнесу

В этой статье расскажу, что такое квантовые компьютеры, как квантовый центр и сотрудники из организации, придумали эмуляторы квантового процессора, почему решили разворачивать их в облаке и что в итоге получили.

Читать...
​​🔥Преобразование табличных данных в Python

В этой статье мы сравним четыре популярных: Pandas (любимчик публики), Polars (конкурент Pandas) , PyArrow (low level columnar) и DuckDB (в него встроен SQL).

Читать...
​​🤓BI-аналитика на коленке: делаем веб-аналитику в DataLens

В этой статье я расскажу как мы разработали open-source калькулятор размера выборки ABnTester.

Читать...
​​😶🌫Modus BI Cloud: работа с данными в облаке

В этой статье расскажу о том, как работают с данными облачные решения, например, наш Modus BI Cloud.

Читать...
​​⚡️Неструктурированные данные: примеры, инструменты, методики и рекомендации

В этой статье мы рассмотрим разные типы данных, варианты хранения и управления ими, а также различные методики и инструменты для анализа неструктурированных данных.

Читать...
​​Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (1 и 2 место)

В этой статье разберем подходы призеров Kaggle-соревнований от американской национальной футбольной лиги (NFL).

Читать...
​​Департамент информационных технологий города Москвы ищет аналитика Data Science.

Ты: любишь искать закономерности и строить прогнозные модели на основе больших данных, владеешь Python (DS-библиотек), у тебя есть знания и опыт в Machine Learning и владение различными инструментами визуализации данных?

У нас: задачи городского масштаба, конкурентная зарплата и премии, обучение и профессиональный рост!

Направляй свое резюме @sergey_job и присоединяйся к команде Департамента информационных технологий, чтобы сделать город еще комфортнее.
​​😕Overdetection или SFTE. Другие возможности применения YOLO

В этой статье покажу как «переформулировать» задачу детекции так, чтобы решать другие, более сложные задачи.

Читать...
​​🧐Опыт PT: BI на страже кибербезопасности

В этой статье автор поговорит о том, как можно применить BI, а также оценить роль, которую BI играет в цифровой трансформации компании.

Читать...