Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​💪Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает.

Читать...
​​😎Как экспертиза в мониторинге событий ИБ помогает создавать качественные продукты

В этой статье мы раскроем секреты attack detection в привязке к SIEM-решениям (системам мониторинга событий ИБ и выявления инцидентов, security information and event management).

Читать...
​​😈Поймай меня, если сможешь: как найти хакера в инфраструктуре с помощью ML

В этой статье мы разберем действия red team, и расскажем, как модели машинного обучения могли бы помочь их поймать, и покажем, какими методами можно обнаружить атаку и выявить ее источник.

Читать...
​​🧐Как экспертиза в области мониторинга событий ИБ помогает создавать качественные продукты. Часть 2

В этой статье я расскажу о том, как механизм построения цепочек запускаемых процессов в MaxPatrol SIEM помогает выявлять атакующих в сети.

Читать...
​​🔮Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

Читать...
​​🚀Как я ускорила разработку корпоративных онлайн-курсов с помощью современной модели 4С/ID и использования нейросетей

В этой статье я расскажу, на каких этапах проектирования нейросети могут быть полезны, какие возникли трудности и каких результатов мы добились.

Читать...
​​😶‍🌫️Рисуем с нейросетями: тонкие корректировки в Midjourney и Lumenor.ai

В данной статье мы рассмотрим два ресурса, которые доступны онлайн и на сегодняшний день лучше всего справляются с задачей визуализации “по брифу от человека” – Midjourney и Lumenor.ai.

Читать...
​​💀Как страшненький лендинг Midjourney втрое повысил конверсию, а банальные тексты Chat GPT оказались вдвое кликабельнее

В этой статье мы расскажем, как работаем с нейросетями в контекстной рекламе, и каких результатов добиваемся.

Читать...
​​🤔Жук, нумерология, хеш или ничо? Оптимизация работы с путями

В этой статье я поделюсь с своим опытом оптимизации задачи по редактированию и поддержке в актуальном состоянии огромного количества данных типа «куда направить товар».

Читать...
​​🔮Предсказываем цены с помощью методов анализа данных и машинного обучения

В этой статье мы поговорим с вами о задаче, связанной с разработкой комплексной модели для прогнозирования цен на электроэнергию, которая позволяет обеспечить стабильность и надежность работы энергосистемы.

Читать...
​​👁Сокращаем дистанцию: как сконструировать SQL-модели в MLflow и упростить управление жизненным циклом машинного обучения

В этой статье мы разберемся в фундаментальных принципах использования на платформе простой SQL-модели и, во-вторых, решить сложную задачу — как сохранить SQL запросы (SQL-модели), используя репозиторий моделей MLflow.

Читать...
​​👽От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах

В этой статье я разберу эволюцию видеоэффектов, поделюсь наблюдениями и раскрою пару инсайдов о том, как перенести стилизацию изображения из StableDiffusion на смартфоны.

Читать...
​​🔍Анализ номинативных данных

В этой статье мы разберем подробнее понятие номинативных данных и их анализ.

Читать...
​​👤Обзор Llemma: новая математическая open-source модель

В этой статье я расскажу про обучение модели, новый датасет Proof-Pile-2 и в конце сравню ее с ChatGPT и GPT-4 на ЕГЭ заданиях по профильной математике.

Читать...
​​🚀Градиентный бустинг: как подобрать гиперпараметры модели в 5 раз быстрее, чем обычно?

В этой статье я расскажу, как используя недокументированные возможности фреймворка Apache Spark, качественно подобрать гиперпараметры для модели градиентного бустинга всего за один человеко-день вместо обычных пяти.

Читать...
​​👾Переизобретаем сжатие в распределенной базе данных

В этой статье расскажу, как мы изменили подход к сжатию данных, чем пришлось пожертвовать и почему менее эффективное «на бумаге» решение в результате превзошло наши ожидания.

Читать...
​​👥Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди

В этой статье мы поговорим о том, как правильно подобрать необходимое количество параметров и не положить кластер на коленочки.

Читать...
​​🚦 Как создавались новые Яндекс Карты высокой детализации и откуда для этого брались данные
 
В этом выпуске подкаста Yet Another Podcast технический директор и продакт-менеджер сервиса рассказывают, что такое HD-карты, зачем на дороги нанесли разметку и добавили объемные здания, как создается «Народная карта» и что ждет карты в будущем, а также поделились фишками, которые есть в Картах.
 
Смотреть тут…
​​🤖Общаемся с базой знаний: как мы улучшили точность генеративных ответов LLM с помощью собственного RAG

В этой статье мы покажем работающие кейсы и синергию подходов, реализованных нами в рамках разработки агента вопросно ответной системы - FractalGPT QA агента.

Читать...
​​👁Машинное зрение для контроля горнодобывающей техники

В этой статье я расскажу, как с помощью нейронки можно считать циклы погрузки на фронтальных погрузчиках.

Читать...